CHƯƠNG 1 GIAO THỨC TCP/IP
1.1. Một số khái niệm của mạng TCP/IP .2
1.2. Các thành phần vật lý của mạng TCP/IP .3
1.2.1. Các thiết bị tính toán (Computing devices) 3
1.2.2. Đường truyền 3
1.2.3. Các bộ giao tiếp mạng (NIC-Network Interface Card) .3
1.2.4. Bộ tập trung (Hub) 3
1.2.5. Bộ điều chế và giải điều chế (Modem) .4
1.2.6. Bộ chọn đường (Router) 4
1.2.7. Phần mềm mạng 4
1.3. Các giao thức trong TCP/IP 6
1.3.1. Giao thức dòng thời gian thực RTP (Real Time Protocol) 9
1.3.2. Giao thức UDP (User Datagram Protocol) .11
1.3.3. Giao thức điều khiển truyền tin (TCP) .12
1.3.4. Giao thức IP (Internet Protocol) 15
1.3.4.1. Khái quát về giao thức IP .15
1.3.4.2. Tầng giao diện mạng 15
1.3.4.3. Tầng Internet .16
1.3.4.4. Tầng giao vận 16
1.3.4.5. Tầng ứng dụng .16
1.3.4.6. Địa chỉ IP .18
1.4. Tiêu chuẩn H.323 20
1.4.1. Phạm vi của H.323 21
1.4.2. Các dịch vụ H.323 .22
1.4.3. Các kiểu dữ liệu được định nghĩa trong H.323 .22
1.4.4. Các thành phần trong H.323 23
1.5. Quá trình truyền dữ liệu trong TCP/IP 24
CHƯƠNG 2 TỔNG QUAN VỀ VOIP
2.1. Tổng quan về VOIP .27
2.1.1. Giới thiệu chung về VOIP .27
2.1.2. Hoạt động của VOIP .28
2.1.3. So sánh giữa VOIP và mạng chuyển mạch công cộng (PSTN) .32
2.2. Các đặc trưng của VOIP .34
2.3. Hạn chế của việc sử dụng điện thoại VOIP 36
2.4. Ứng dụng của VOIP 37
2.5. Các thành phần trong mạng VOIP .39
2.5.1. Các thiết bị đầu cuối .39
2.5.2. Gateway 40
2.5.3. Gatekeeper 41
2.5.4. Khối điều khiển và xử lý đa điểm (MCU) 42
2.5.5. Các Proxy .42
CHƯƠNG 3 BÁO HIỆU VÀ XỬ LÝ CUỘC GỌI TRONG VOIP
3.1. Giới thiệu chung 43
3.2. Định tuyến kênh điều khiển và báo hiệu cuộc gọi 44
3.2.1. Định tuyến kênh điều khiển cuộc gọi .45
3.2.2. Định tuyến kênh báo hiệu cuộc gọi 46
3.3. Các thủ tục báo hiệu .47
3.3.1. Thiết lập cuộc gọi (Giai đoạn 1) 48
3.3.2. Thiết lập kênh điều khiển (Giai đoạn 2) .51
3.3.3. Thiết lập kênh truyền thông ảo (Giai đoạn 3) .51
3.3.4. Tham số cuộc gọi 52
3.3.4.1. Thay đổi độ rộng băng tần 52
3.3.4.2. Trạng thái 54
3.3.5. Kết thúc cuộc gọi 55
CHƯƠNG 4 VẤN ĐỀ NÉN TÍN HIỆU VÀ GIẢM THIỂU ĐỘ TRỄ TRONG VOIP
4.1. Tổng quát 59
4.2. Các kỹ thuật nén tín hiệu trong VOIP 60
4.2.1. Nguyên lý chung của bộ mã hoá CELP 63
4.2.2. Nguyên lý bộ mã hoá CS-CELP 65
4.2.3. Nguyên lý bộ giải mã CS-CELP 66
4.2.4. Chuẩn nén G.729A 67
4.2.5. Chuẩn nén G.729B 68
4.2.6. Chuẩn nén G.723.1 69
4.2.7. Chuẩn nén GSM 06.10 (Global System for Mobile) .71
4.2.8. Khử tiếng vọng .72
4.3. Trễ và vấn đề giảm thiểu độ trễ 73
4.4. Vấn đề giảm thiểu hoá nguồn trễ 75
4.4.1. Tối thiểu hoá ghi âm bên truyền 75
4.4.2. Tối thiểu hoá trễ Modem .76
4.4.3. Tối thiểu hoá bộ đệm Jitter 76
4.4.4. Trễ đầu cuối đến đầu cuối .77
CHƯƠNG 5 VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ. KHẢ NĂNG ÁP DỤNG VOIP Ở VIỆT NAM VÀ TRÊN THẾ GIỚI
5.1. Giới thiệu .78
5.2. Chất lượng dịch vụ (QoS) .79
5.3. Phân cấp chất lượng 80
5.4. Vấn đề đảm bảo chất lượng dịch vụ .81
5.5. Triển khai VOIP ở Việt Nam .82
5.6. Triển khai VOIP trên thế giới 83
Kết luận
95 trang |
Chia sẻ: banmai | Lượt xem: 1900 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Nghiên cứu công nghệ truyền thoại qua Internet sử dụng giao thức TCP/IP (VoIP), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
mẫu) và gửi đi.Ở nơi thu, quá trình giải mã được thực
hiện theo chiều ngược lại để khôi phục tín hiệu tiếng nói. Do quá trình
lấy mẫu và lượng tử hoá các mẫu đó theo các mức lượng tử hữu hạn nên
sẽ xảy ra sai số lượng tử (quantizise erro), nếu số các mức lượng tử tăng
lên thì sai số lượng tử sẽ giảm đi nhưng lại yêu cầu số bit cần thiết để mã
hoá các mẫu tăng lên làm cho tốc độ bit tăng lên. Chẳng hạn với 256 mức
lượng tử thì cần 8 bit để biểu diễn chúng trong khi với 1024 mức lượng
tử thì cần 10n bit để mã hoá. Mã hoá dạng sóng có ưu điểm là bộ mã hoá
độc lập với nguồn âm, kỹ thuật mã hoá đơn giản, giá thành thiết kế rẻ, độ
trễ và công suất tiêu thụ thấp. Bộ điều chế dạng sóng đơn giản nhất là bộ
điều chế xung mã và điều chế Delta. Nhược điểm của mã hoá dạng sóng
là không thể giảm được tốc độ xuống thấp, thường chất lượng âm thanh
sẽ không cao ở tốc độ 16kbps.
Mã hoá theo nguồn âm: Nguyên tắc của các bộ mã hoá theo nguồn âm
đó là phân tích các tín hiệu âm thanh sau đó tách ra các thông số đặc
trưng của tín hiệu âm thanh, mã hoá các thông số đó và gửi đi, ở nơi thu
cũng sử dụng một cơ chế phát âm tương tự, dùng các thông số nhận được
để kích thích bộ phát âm, phát lại âm thanh như ở bên gửi. Điển hình của
70
các bộ mã hoá theo nguồn âm là bộ mã hoá dự báo tuyến tính LPC
(Linear Prediction Coder). Các bộ mã hoá dạng này có thể thực hiện mã
hoá với tốc độ rất thấp, có thể là 2kbps. Nhược điểm chủ yếu của các bộ
mã hoá theo nguồn âm là bộ mã hoá phụ thuộc vào nguồn âm phát. Hình
dưới thể hiện cơ chế phát âm của các bộ mã hoá theo nguồn âm.
¾ Bộ mã hoá
Tiếng nói gốc
Bộ tạo tín hiệu
kích thích
Bộ lọc tổng
hợp
Cực tiểu hoá
sai số
Tính trọng số
sai số
-
s*(n)
ew(n
)
e(n)
¾ Bộ giải mã
Trong đó:
u(n): tín hiệu kích thích
s(n): tín hiệu tiếng nói gốc
S*(n): tín hiệu tiếng nói tổng hợp
ew(n): tín hiệu sai số
• Phần thứ nhất: Bộ lọc tổng hợp LPC là bộ lọc toàn cục biến đổi theo thời
gian để mô hình hoá đường bao phổ ngắn hạn của dạng sóng tiếng nói.
Đầu ra của bộ lọc tổng hợp là tín hiệu tiếng nói tổng hợp.
• Phần thứ hai: Bộ tạo kích thích, bộ này sẽ cho ra dãy kích thích cấp cho
bộ lọc tổng hợp để tạo ra tiếng nói tái tạo ở máy thu. Việc kích thích sẽ
được tối ưu hoá bằng cách cực tiểu hoá sai lệch, có tính trọng số thụ cảm
giữa tiếng nói gốc và tiếng nói tổng hợp.
Bộ tạo tín hiệu
kích thích
Bộ lọc tổng
hợp
s*(n) U(n)
Tiếng nói tổng hợp
71
• Phần thứ ba: Thủ tục được sử dụng trong việc tối thiểu hoá sai lệch gồm
hai khối: tính trọng số sai số và cực tiểu hoá sai số. Tiêu chuẩn cực tiểu
hoá sai lệch được sử dụng rộng rãi nhất là sai lệch bình phương trung
bình. Trong mô hình này, tiêu chuẩn cực tiểu hoá sai số được sử dụng là:
tín hiệu sai lệch ew(n) được đưa qua một bộ lọc đánh giá trọng số sai số,
có tính trọng số thụ cảm và bộ lọc này sẽ tạo dạng phổ tạp âm theo một
cách nào đó để công suất tín hiệu sẽ tập trung nhất tại các tần số formant
của phổ tiếng nói.
Thủ tục mã hoá: bao gồm hai bước
¾ Bước 1: Thông số của bộ lọc tổng hợp được xác định từ các mẫu
tiếng nói.
¾ Bước 2: dãy kích thích tối ưu đối với bộ lọc này được xác định
bằng cách cực tiểu hoá, có tính theo trọng số thụ cảm giữa tiếng
nói gốc và tiếng nói tổng hợp. Khoảng thời gian tối ưu hoá kích
thích khoảng 4 – 7.5ms, thấp hơn khung con, việc kích thích được
xác định riêng rẽ cho từng khung con. Các tham số của bộ lọc và
tín hiệu kích thích sẽ được lượng tử hoá trước khi gửi đến phía
thu.
Thủ tục giải mã:
Cho tín hiệu kích thích đã được giải mã qua bộ lọc tổng hợp để tạo
tiếng nói khôi phục. Có nhiều phương pháp mô hình hoá sự kích thích:
phương pháp kích thích đa xung (MPE - Multi Pulse Excite), phương pháp
kích thích xung đều RPE, phương pháp dự đoán tuyến tính kích thích mã
CELP (Code Excited Linear Prediction). Trong đó phương pháp CELP hiện
nay đã trở thành một công nghệ chủ yếu cho mã hoá tiếng nói tốc độ thấp.
4.2.1. Nguyên lý chung của bộ mã hoá CELP
Tín hiệu kích thích được phân bố trong một danh sách rất lớn các nguồn
âm từ việc thống kê một số lượng rất lớn các giọng nói gồm người già, người
trẻ, giọng nam, giọng nữ được phân bố một cách ngẫu nhiên. Tại phía phát,
nguồn kích thích được lần lượt so sánh với các nguồn được lấy từ trong bảng
mẫu để xác định nguồn nào là phù hợp nhất, sau đó thông số về vị trí của nguồn
trong bảng mẫu sẽ được mã hoá và gửi đi. Đến nơi thu sử dụng các thông số
này để kích thích nguồn mẫu có cùng thứ tự trong một bảng các nguồn mẫu y
hệt bên phát nhằm khôi phục tiếng nói. Phương pháp này tương tự như việc
duyệt qua một cuốn từ điển nên yêu cầu các bộ vi xử lý rất mạnh. Co một
72
phương pháp được sử dụng để giảm công việc tính toán xuống, đó là phương
pháp sử dụng các bảng mã đại số ACELP (Algebraic CELP) trong đó các bảng
mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt. Để nâng cao hiệu quả rà
soát bảng mã, người ta sử dụng các bảng mã đại số có cấu trúc liên kết CS –
ACELP (Conjugate Structure ACELP). Đó là nguyên tắc của khuyến nghị
G729.
Khuếch đại
Khuếch đại
u(n)
+
Bộ lọc tổng
hợp
Trễ khung con
Tiếng nói
tổng hợp
s*(n)
Hình 4.1. Sơ đồ nguyên lý phương pháp tổng hợp CELP
73
4.2.2. Nguyên lý bộ mã hoá CS – ACELP
Sơ đồ khối bộ mã hoá được mô tả:
Khèi tiÒn
xö lý
Khèi tæng hîp LP
sù l−îng tö ho¸ vµ
néi suy
Bé läc
tæng hîp
++
B¶ng m·
thÝch øng
B¶ng m·
cè ®Þnh
Bé läc tæng
hîp ®é cao
T×m b¶ng
m· cè ®Þnh
§é c¶m
nhËn
Sù l−îng tö ho¸
®é khuÕch ®¹i
Sù l−îng tö
ho¸ ®é
khuÕch ®¹i
luång bit
ph¸t ®i
LPC info
LPC info
tiÕng nãi
®Çu vµo
LPC info
Gc
Gp
Hình 4.2. Sơ đồ khối Bộ mã hoá
Tín hiệu đầu vào đưa qua bộ tiền xử lý ,bộ này có hai chức năng: lọc
thông cao và tính toán tín hiệu. Tín hiệu đầu ra bộ tiền xử lý là tín hiệu đầu vào
của các khối tổng hợp tiếp sau. Sự tổng hợp dự báo tuyến tính (LP)được thực
hiện một lần trong một khung 10ms để tính các hệ số của bộ lọc dự báo tuyến
tính (LP). Các hệ số này được biến đổi thành các cặp vạch phổ (LSP) và được
lượng tử bằng phương pháp lượng tử hoá véctơ dự báo hai bước (VQ) 8 bit. Tín
hiệu kích thích được lựa chọn bằng cách cực tiểu hoá sai số, có tính đến trọng
số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp. Các tham số kích thích
(gồm :bảng mã cố định và bảng mã thích ứng) được xác dịnh qua từng khung
con 5ms (tương đương 40mẫu). Các hệ số của bộ lọc LP đã được lượng tử và
chưa được lượng tử được sử dụng cho phân khung thứ 2, còn tại phân khung
thứ nhất các hệ số của bộ lọc LP đã được nội suy sẽ được sử dụng (trong cả hai
trường hợp đã lượng tử và chưa lượng tử). Độ trễ bước mạch vòng hở sẽ được
tính toán một lần trong một khung 10ms dựa trên độ lớn tín hiệu thoại. Sau đó
các phép tính này sẽ lặp lại trong từng phân khung tiếp theo. Tín hiệu ban đầu
x(n) được tính bằng các lọc độ dư LP thông qua bộ lọc tổng hợp W(z)/A(z).
Trạng thái ban đầu của bộ lọc này là tín hiệu lỗi giữa tín hiêu dư LP và tín hiệu
74
kích thích. Sự phân tích bước của mạch vòng đóng sẽ thực hiện sau đó (để tìm
độ trễ mã thích ứng và độ khuếch đại) dùng tín hiệu ban đầu x(n) và đặc tuyến
xung h(n), bằng cách làm tròn giá trị độ trễ bước của mạch vòng hở. Độ trễ
bước được mã hoá bằng mã 8 bit trong phân khung thứ nhất, độ vi sai của độ
trễ được mã hoá bằng mã 5 bit trong phân khung thứ 2. Tín hiệu x’(n) là tín
hiệu của 2 tín hiệu: tín hiệu ban đầu x(n) và tín hiệu mã thích ứng - là tín hiệu
mã cố định. Tín hiệu này được dùng trong việc tìm tín hiệu kích thích tối ưu.
Giá trị kích thích mã cố định được mã hoá bằng mã đại số 17 bit (trong đó: chỉ
số bảng mã cố định được mã hoá bằng từ mã C1, C2-13 bit. Dấu bảng mã cố
định được mã hoá bằng từ mã S1, S2-3bit). Các bộ khuếch đại bảng mã cố định
và bảng mã thích ứng được lượng tử hoá bằng véc tơ 7 bit (Trong đó:ở bước 1
được mã hoá bằng từ mã GA1,GA2 -3 bit. Ở bước 2 được mã hoá bằng từ mã
GB1, GB2-4 bit ). Tại đây sự dự đoán trung bình động MA cho bộ khuếch đại
mã cố định. Cuối cùng, dựa vào các bộ nhớ lọc sẽ xác định được tín hiệu kích
thích.
4.2.3 Nguyên lý bộ giải mã CS-ACELP.
Sơ đồ khối của bộ giải mã được mô tả trong hình 2.4
B¶ng m· cè
®Þnh
B¶ng m· thÝch
øng
Bé läc
ng¾n
h¹n
bé xö lý
tr¹m
Gc
Gp
Hình 4.3. Sơ đồ nguyên lý của bộ giải mã CS-ACELP
Đầu tiên, các chỉ số của các tham số được trích ra từ buồng bit thu. Các
chỉ số này sẽ được giải mã để thu lại các tham số của bộ mã hoá trong 1 khung
tiếng nói 10 ms. Các tham số đó là: các hệ số LSP, 2 phần độ trễ bước (độ trễ
bước và độ vi sai của độ trễ bước), 2 vec tơ bảng mã cố định (chỉ số mã cố định
và chỉ số bảng mã cố định ) và 2 tập hợp độ khuếch đại bảng mã cố định và
bảng mã thích ứng. Các hệ số LSP được nội suy và được chuyển đổi thành các
hệ số bộ lọc LP cho mỗi phân khung. Sau đó, cứ mỗi phân khung thực hiện các
bước tiếp theo.
75
Giá trị kích thích được khôi phục là tổng của véc tơ bảng mã cố định và bảng
mã thích ứng nhân với các giá trị khuếch đại tương ứng của chúng.Tiếng nói
được khôi phục bằng cách lọc giá trị kích thích này thông qua bộ lọc tổng hợp
LP.
Tín hiệu tiếng nói khôi phục đưa qua bước xử lý trạm, bao gồm bộ lọc
thích ứng dựa trên cơ sở các bộ lọc tổng hợp ngắn hạn và dài hạn, sau đó qua
bộ lọc thông cao và bộ nâng tín hiệu.
4.2.4. Chuẩn nén G.729A.
G729A là thuật toán mã hoá tiếng nói tiêu chuẩn cho thoại và số liệu đồng
thời số hoá (DSVD). G.729A là sự trao đổi luồng bit với G.729, có nghĩa là tín
hiệu được mã hoá bằng thuật toán G.729A có thể được giải mã thông qua thuật
toán G.729 và ngược lại. Giống như G.729, nó sử dụng thuật toán dự báo tuyến
tính mã kích thích đại số được cấu trúc liên kết (CS-ACELP) với các khung
10ms. Tuy nhiên một vài thuật toán thay đổi sẽ được giới thiệu mà kết quả của
các thuật toán này làm giảm 50% độ phức tạp.
Nguyên lý chung của bộ mã hoá và giải mã của thuật toán G.729A giống
với G.729. Các thủ tục lượng tử hoá và phân tích LP của các độ khuyếch đại
bảng mã cố định và thích ứng giống như G.729. Các thay đổi thuật toán chính
so với G.729 sẽ tổng kết như sau:
Bộ lọc trọng số thụ cảm sử dụng các tham số bộ lọc LP đã lượng tử và
được biểu diễn là:
W(z) =
)/(
)(
γzA
zA với γ =0,75
Các tính toán phản ứng xung của bộ lọc tổng hợp trọng số W(z)/A(z) của
tín hiệu ban đầu và việc thiết lập trạng thái ban đầu của bộ lọc được đơn giản
hoá bằng cách thay thế:
W(z) = 56
)/(
1
yzA
Việc tìm bảng mã thích ứng được đơn giản hoá. Thay vì tìm tập trung ở
mạch vòng tổ ong, giải pháp tìm sơ đồ hình cây độ sâu trước được sử dụng.
Tại bộ giải mã, hoạ ba của bộ lọc sau sẽ được đơn giản bằng cách sử
dụng chỉ các độ trễ nguyên.
76
4.2.5. Chuẩn nén G.729B
G.729B đưa ra một nguyên lý nén im lặng tốc độ bit thấp được thiết kế
và tối ưu hoá để làm việc trung được với cả G.729 và G.729A phức tạp thấp.
Để đạt được việc nén im lặng tốc độ bit thấp chất lượng tốt, một môđun bộ dò
hoạt động thoại khung cơ bản là yếu tố cần thiết để dò các khung thoại không
tích cực, gọi là các khung tạp âm nền hoặc khung im lặng. Đối với các khung
thoại không tích cực đã dò được này, mộtmô đun truyền gián đoạn do sự thay
đổi theo thời gian của đặc tính tín hiệu thoại không tích cực và quyết định xem
có một khung mô tả thông tin im lặng mới không có thể được gửi đi để duy trì
chất lượng tái tạo của tạp âm nền tại đầu cuối thu. Nếu có một khung như thế
được yêu cầu, các tham số năng lượng và phổ mô tả các đặc tính cảm nhận
được của tạp âm nền được mã hoá và truyền đi một cách hiệu quả dùng khung
15 bit/khung. Tại đầu cuối thu, môđun tạo ra âm phù hợp sẽ tạo tạp âm nền
đầu ra sử dụng tham số cập nhật đã phát hoặc các tham số đã có trước đó. Tạp
âm nền tổng hợp đạt được bằng cách lọc dự báo tuyến tính tín hiệu kích thích
giả trắng được tạo ra trong nội bộ của mức điều khiển. Phương pháp mã hoá tạp
âm nền tiết kiệm tốc độ bit cho tiếng nói mã hoá tại tốc độ bit trung bình thấp
4kbps trong cuộc đàm thoại tiếng nói bình thường để duy trì chất lượng tái tạo.
Đối với các ứng dụng DSVD (Digital Simultaneous Voice and Data:
thoại và số liệu đồng thời số hoá) và độ nhạy tốc độ bit khác, G729B là điều
kiện tối cần thiết để giảm tốc độ bit hơn nữa bằng cách sử dụng công nghệ nén
im lặng. Khi không có tiếng nói, tốc độ bit có thể giảm, giải phóng dung lượng
kênh cho các ứng dụng xảy ra đồng thời, ví dụ như các đường truyền tiếng khác
trong điện thoại tế bào đa truy nhập phân kênh theo mã theo thời gian
(TDMA/CDMA) hoặc truyền số liệu đồng thời. Một phần đáng kể trong các
cuộc đàm thoại thông thường là im lặng, trung bình lên tới 60% của một cuộc
đàm thoại hai chiều. Trong suốt quá trình im lặng, thiết bị đầu vào tiếng ví dụ
như tai nghe, sẽ thu thông tin từ môi trường ồn. Mức và đặc tính ồn có thể thay
đổi đáng kể, từ một phòng im lặng tới đường phố ồn ào hoặc từ một chiếc xe ô
tô chuyển bánh nhanh. Tuy nhiên, hầu hết các nguồn tạp âm thường mang ít
thông tin hơn thông tin tiếng. Vì vậy trong các chu kỳ không tích cực tỷ số nén
sẽ cao hơn. Nhiều ứng dụng điển hình, ví dụ hệ thống toàn cầu đối với điện
thoại di động GSM, sử dụng việc dò tìm chu kỳ im lặng và chèn tạp âm phù
hợp để tạo được hiệu quả mã hoá cao hơn.
77
Xuất phát từ quan niệm về dò tìm im lặng và chèn tạp âm phù hợp dẫn tới
các công nghệ mã hoá tiếng mẫu kép. Các mẫu khác nhau bởi tín hiệu đầu vào,
được biểu thị là: thoại tích cực đối với tiếng nói và là thoại không tích cực đối
với im lặng hoặc tạp âm nền, được xác định bởi sự phân loại tín hiệu. Sự phân
loại này có thể được thực hiện bên trong hoặc bên ngoài bộ mã hoá tiếng nói.
Bộ mã hoá tiếng toàn tốc có thể có tác dụng trong quá trình tiếng thoại tích
cực, nhưng có một nguyên lý mã hoá khác được dùng đối với tín hiệu thoại
không tích cực, sử dụng bit ít hơn và tạo ra tỷ số nén trung bình cao hơn. Sự
phân loại này được gọi chung là bộ dò hoạt động thoại (VAD: Voice Activity
Detector) và đầu ra của bộ này gọi là mức hoạt động thoại. Mức hoạt động
thoại là 1 khi có mặt hoạt động thoại và là 0 khi không có hoạt động thoại.
Thuật toán VAD và bộ mã hoá tiếng nói không tích cực, giống với các bộ
mã hoá G.729 và G.729A, được thực hiện trên các khung của tiếng nói đã được
số hoá. Để phù hợp, kích thước các khung giống nhau được dùng cho mọi sơ đồ
và không có độ trễ thêm vào nào được tạo ra bởi thuật toán VAD hoặc bộ mã
hoá thoại không tích cực. Đầu vào bộ mã hoá tiếng nói là tín hiệu tiếng nói đến
đã được số hoá. Với mỗi khung tiếng nói đầu vào, VAD đưa ra mức hoạt động
thoại, mức này được dùng như một chuyển mạch giữa các bộ mã hoá thoại tích
cực và thoại không tích cực. Khi bộ mã hoá thoại tích cực có tác dụng, luồng
bit thoại tích cực sẽ gửi tới bộ giải mã tích cực cho mỗi khung. Tuy nhiên,
trong các chu kỳ không tích cực, bộ mã hoá thoại không tích cực có thể được
chọn để gửi các thông tin mới nhất gọi là bộ mô tả việc chèn im lặng (SID:
Silence Insertion Descriptor) tới bộ giải mã không tích cực hoặc không gửi gì
cả. Kỹ thuật này có tên là truyền gián đoạn (DTX: Discontinuous
Transmission). Với mỗi khung, đầu ra của mỗi bộ giải mã được dùng làm tín
hiệu khôi phục.
4.2.6. Chuẩn nén G.723.1
Khuyến nghị G.723.1 đưa ra một bộ mã hoá tiêu chuẩn dùng để nén tín
hiệu tiếng nói hoặc các tín hiệu audio khác của các dịch vụ đa phương tiện tại
tốc độ rất thấp, giống với phần tiêu chuẩn của họ H.323.
Về tốc độ bit: Bộ mã hoá này có hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ
mã hoá có tốc độ cao hơn sẽ có chất lượng tốt và, cộng thêm tính linh hoạt,
cung cấp cho các nhà thiết kế hệ thống. Bộ mã hóa và giải mã bắt buộc phải có
cả hai tốc độ bit này. Chúng có thể chuyển mạch được giữa hai tốc độ bit tại
bất kỳ đường biên giới nào đó của khung. Khi tín hiệu là phi thoại thì có thể
78
lựa chọn một tốc độ bit biến thiên để truyền không liên tục và điều khiển những
khoảng trống.
Tín hiệu đầu vào có thể có của bộ mã hoá này tối ưu hoá tín hiệu tiếng
nói với chất lượng cao tại các tốc độ bit đã nói ở trên với một độ hạn chế về độ
phức tạp. Bộ mã hoá này dùng để mã hoá tiếng nói và các tín hiệu audio khác
với các khung dùng kỹ thuật mã hoá phân tích bằng tổng hợp dự báo tuyến tính.
Tín hiệu kích thích, đối với bộ mã hoá tốc độ bit cao hơn, là lượng tử hoá đúng
cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization)
và đối với bộ mã hoá có tốc độ bit thấp hơn, là dự đoán tuyến tính kích thích
mã đại số (ACELP). Kích thích khung là 30ms, cộng thêm 7,5ms look-ahead,
tạo ra trễ xử lý thuật toán tổng cộng là 37,5ms. Toàn bộ trễ thêm vào bộ mã hoá
là tổng của: Trễ xử lý, trễ truyền dẫn trên các đường truyền thông tin và trễ
đệm của các giao thức ghép kênh.
Nguyên lý bộ mã hoá G.723.1
Tín hiệu PCM 64kbps đầu vào (theo luật A hoặc µ) qua bộ mã hoá này
được lấy mẫu tại tần số 8kHz, sau đó qua bộ chuyển đổi thành tín hiệu PCM
đều 16 bit đưa tới đầu vào bộ mã hoá. Tín hiệu đầu ra bộ giải mã sẽ được
chuyển đổi thành tín hiệu PCM theo đúng tín hiệu đầu vào. Các đặc tính đầu
vào/ đầu ra khác, giống như của tín hiệu PCM 64kbps (theo khuyến nghị ITU
G.711), sẽ được chuyển đổi thành tín hiệu PCM đều 16 bit tại đầu vào bộ mã
hoá, hoặc tín hiệu PCM đều 16 bit sẽ được chuyển đổi thành tín hiệu ra PCM
theo đúng quy luật của tín hiệu đầu vào ở bộ giải mã. Bộ mã hoá dựa trên
nguyên lý bộ mã hoá phân tích bằng tổng hợp dự báo tuyến tính và cố gắng cực
tiểu hóa sai số có tính trọng số thụ cảm. Bộ mã hoá thực hiện theo từng khung
240 mẫu. Điều này tương đương với chu kỳ khung là 30ms và tần số lấy mẫu là
8kHz. Tại mỗi khối, đầu tiên tín hiệu được đưa qua bộ lọc thông cao để loại bỏ
thành phần tín hiệu một chiều DC và sau đó được chia thành 4 khung con. Với
mỗi khung con sử dụng tín hiệu đầu vào chưa xử lý để tính toán bộ lọc mã hoá
dự báo tuyến tính bậc 10 (LPC). Bộ lọc LPC của khung con cuối cùng sẽ được
lượng tử hoá bằng phương pháp lượng tử hoá vectơ phân chia dự báo (PSVQ:
Predictive Split Vector Quantizer). Các hệ số LPC chưa được lượng tử sẽ được
dùng để khôi phục bộ lọc trọng số thụ cảm ngắn hạn.
Với mỗi hai phân khung (120) mẫu, sẽ sử dụng tín hiệu tiếng nói trọng số
để tính toán chu kỳ lên giọng tiếng nói mạch vòng kín, LOL. Chu kỳ lên giọng
tiếng nói được tính trong khoảng từ 18 đến 142 mẫu.
79
Sau đó tín hiệu tiếng nói sẽ được xử lý theo từng phân khung cơ bản 60
mẫu.
Sử dụng đánh giá chu kỳ lên giọng tiếng nói trước để khôi phục bộ lọc
dạng ồn sóng hài. Phản ứng xung được tạo bởi việc đấu nối bộ lọc tổng hợp
LPC, bộ lọc có tính trọng số thụ cảm formant và bộ lọc dạng tạp âm sóng hài.
Người ta sử dụng phản ứng xung này cho các phép tính toán tiếp sau.
Bộ dự đoán chu kỳ lên giọng mạch vòng kín được tính toán bằng cách sử
dụng đánh giá chu kỳ lên giọng, LOL và phản ứng xung. Người ta sử dụng bộ
dự đoán lên giọng bậc 5. Chu kỳ lên giọng sẽ được tính là gần đúng giá trị vi
sai nhỏ của đánh giá lên giọng mạch vòng hở. Thành phần thêm vào bộ dự đoán
lên giọng sau đó sẽ được loại bỏ khỏi vectơ ban đầu. Cả hai giá trị chu kỳ lên
giọng và giá trị vi sai của nó sẽ được truyền về phía bộ giải mã.
Cuối cùng, các thành phần không được dự đoán của tín hiệu kích thích
sẽ được lấy gần đúng. Đối với bộ mã hoá có tốc độ bít cao, người ta sử dụng
giá trị kích thích lượng tử hoá gần đúng cực đại đa xung (MP-MLQ) và đối với
bộ mã hoá có tốc độ bit thấp, người ta sử dụng giá trị kích thích mã đại số
(ACELP).
Nguyên lý bộ giải mã G.723.1
Bộ giải mã được thực hiện trên nguyên lý cơ bản từng khung. Đầu tiên
các chỉ số của bộ lọc LPC sẽ được giải mã, sau đó bộ giải mã sẽ khôi phục bộ
lọc tổng hợp LPC. Đối với mỗi phân khung, cả hai giá trị kích thích bản mã cố
định và giá trị kích thích bảng mã thích ứng sẽ được giải mã và đưa tới đầu vào
bộ lọc tổng hợp LPC. Bộ lọc sau thích ứng bao gồm formant và bộ lọc sau lên
giọng phía sau-phía trước (forward-backward). Tín hiệu kích thích sẽ được đưa
tới đầu vào bộ lọc sau lên giọng, đầu ra bộ lọc sau lên giọng được đưa tới đầu
vào bộ lọc tổng hợp, và đầu ra bộ lọc tổng hợp sẽ được đưa tới đầu vào bộ lọc
sau formant (formant posfilter).
4.4.7. Chuẩn nén GSM 06.10 ( Global System for Mobile )
Đầu vào bộ nén GSM 06.10 bao gồm các khung 160 mẫu các tín hiệu
PCM tuyến tính lấy mẫu tại tần số 8kHz. Chu kỳ mỗi khung là 20 ms, khoảng
một chu kỳ thanh môn đối với những người có giọng nói cực thấp, và khoảng
mười chu kỳ thanh môn đối với những người có giọng nói cực cao. Đây là
khoảng thời gian rất ngắn và trong khoảng này sóng tiếng nói thay đổi không
nhiều lắm. Độ trễ truyền dẫn thông tin được tính bằng tổng thời gian xử lý và
kích thước khung của thuật toán.
80
Bộ mã hoá thực hiện nén một khung tín hiệu đầu vào 160 mẫu (20ms)
vào một khung 260 bit. Như vậy một giây nó sẽ thực hiện nén được 13.103 bit
(tương đương với 1625 byte). Do vậy để nén một megabyte tín hiệu chỉ cần một
thời gian chưa đầy 10 phút.
Trung tâm của quá trình xử lý tín hiệu là bộ lọc. Đầu ra bộ lọc phụ thuộc
rất nhiều vào giá trị đầu vào đơn của nó. Khi có một dãy các giá trị đưa qua bộ
lọc thì dãy tín hiệu này sẽ được dùng để kích thích bộ lọc. Dạng của bộ nén
GSM 06.10 dùng để nén tín hiệu tiếng nói bao gồm hai bộ lọc và một giá trị
kích thích ban đầu. Bộ lọc ngắn hạn dự báo tuyến tính, được đặt tại tầng đầu
tiên của quá trình nén và tại tầng cuối cùng trong suốt quá trình giãn, được giả
sử tuân theo quy luật âm thanh của mũi và cơ quan phát thanh. Nó được kích
thích bởi đầu ra của bộ lọc dự báo dài hạn (LTP: long-term predictor).
4.4.8. Khử tiếng vọng
Trong mạng IP đường truyền tiếng vọng là đường tròn (round –trip) và tạo
ra do mạch hybrid (chuyển 2 dây-4 dây) ,mặt khác tín hiệu sẽ tích luỹ qua các
quá trình xử lý (mã hóa và giải mã ,đóng gói và giải đó gói ) và truyền dẫn tín
hiệu. Vì vậy tiếng vọng là một trong những yếu tố chủ yếu ảnh hưởng đến chất
lượng cuộc thoại trên mạng Internet .
Thông thường việc khử tiếng vọng được thực hiện trong các Gateway và
khối này tuân theo các khuyến nghị G.165 và G.167. Hình 1.3 sau đây mô tả
đường truyền của tín hiệu trên đó có các mạch triệt tiếng vọng.
Hình 4.4: Mạch triệt tiếng vọng
E
cho
C
anceller
Speech
Decoding
Packe
t
Buffer
Speech
Encoding
E
cho
C
anceler
Speech
Decoding
Packe
t
Buffer
Speech
Encoding
Echo -
+
Echo-
+
P
ac
ke
t T
ra
ns
m
is
si
on
TelephoneTelephone
81
4.3. Trễ và vấn đề giảm thiểu độ trễ
trong toàn bộ quá trình xử lý gói tin trong VOIP
Thứ Loại trễ
Các nguồn của trễ
Về cơ bản, có 10 bước
có thể gây ra trễ theo thứ tự xuất hiện của chúng theo thời gian được liệt kê
trong bảng sau:
tự
1 Trễ ghi âm bên truyền ( Transmitter Recording )
2 Trễ mã hoá ( Encode )
3 Trễ nén ( Compresion )
4 Trễ bộ đệm Modem ( Transmitter Modem )
5 Trễ Internet
6 Trễ bộ đệm nhận ( Receiver buffer )
7 Trễ Jitter ( Jitter buffer )
8 Trễ giải nén ( Decompression )
9 Trễ giải mã ( Decode )
10 Trễ phát lại ( Playback )
Trễ ghi âm bên truyền:
oàn bộ quá trình gửi thoại qua Internet. Không
iống
:
hoảng 15 - 30m. Đó là bởi vì dữ liệu tiếng nói thường
Đây là trễ đầu tiên trong t
g trong mạng PSTN, trong đó tín hiệu thoại gần như tức thời vì các gói
không cần phải định dạng, trong VOIP, các gói tin phải được xử lý rất cẩn thận
trước khi chúng được truyền trên Internet. Hệ thống phải ghi âm một số lượng
tín hiệu nào đó trước khi có thể bắt đầu làm mọi việc khác. Điều kiện lý tưởng
khi mà số liệu ngay lập tức được xử lý, tuy nhiên việc này gây ra nhiều phiền
toái, trễ này thường cỡ 20ms. Chúng tồn tại trực tiếp trong cấu hình PC - PC và
tồn tại ở các Gateway khi chuyển đổi từ mạng PSTN sang mạng IP trong cấu
hình PC - Phone.
Trễ mã hoá
Trễ mã hoá k
chiếm một không gian dung lượng và giải thông cần thiết rất lớn. Do đó, chúng
cần phải được nén lại trước khi truyền. Thực tế, tuy có các phần mềm khá tinh
xảo hiện nay nhằm hạn chế tối đa sự trễ này nhưng thế hệ các PC và các hệ
điều hành hiện nay được thiết kế không phải cho mục đích xử lý tiếng nói.
82
Trong vài năm tới, chúng ta hy vọng sẽ có các bộ vi xử lý riêng phục vụ cho
các ứng dụng này một cách chuyên nghiệp hơn.
Trễ do bộ vi xử lý và do quá trình đóng gói các số liệu:
à rất nhỏ (bit)
với
n trên Internet, chúng cũng không thể ngay
cơ sở hạ tầng của mạng Internet hiện nay được sử dụng
Các chip vi xử lý có đơn vị dữ liệu có thể hiểu và xử lý l
so các mãu thoại (byte). Trong khi các mẫu thoại được chia thành các mẫu
chiếm khá nhiều dung lượng, các bộ vi xử lý này không thể tính toán một cách
tức thì, bộ vi xử lý càng nhanh thì độ trễ tính toán do chúng gây ra càng nhỏ.
Hơn nữa, trong bước này số liệu tiếng nói phải được tạo khuôn dạng để có thể
truyền đi được trên Internet gọi là quá trình đóng gói dữ liệu. Các dữ liệu phải
được sắp xếp, đóng khung, thêm phần tiêu đề như địa chỉ đích, địa chỉ nguồn,
các thông số đường truyền và định tuyến ... Các bước này cũng gây ra trễ.
Trễ do Modem bên truyền:
Khi dữ liệu đã sẵn sàng truyề
lập tức truyền trên mạng được, vì nó còn phụ thuộc vào tốc độ đường truyền.
Tuy nhiên, các tín hiệu mà máy tính hiểu được là khác với các tín hiệu được
truyền trên mạng điện thoại. Các máy tính hiểu và xử lý tín hiệu số trong khi
mạng điện thoại lại chỉ cho phép truyền các tín hiệu tương tự trên nó. Do đó
cần có một thiết bị chuyển đổi từ các tín hiệu số sang dạng tương từ, đó chính
là Modem (MOdulation - DEModulation). Trong giai đoạn này, modem cũng
cần thực hiện các tính toán để các tín hiệu số có thể được chuyển dổi thành
dạng tương tự theo các quy tắc nhất định, như việc điều chế theo luật gì, ghép
kênh ra sao ... Các quá trình này cũng gây ra trễ, gọi là trễ Modem. Mặc dù các
trễ này khá thấp nhưng chúng cũng góp phần vào tổng độ trễ chung toàn hệ
thống. Hơn nữa, các trễ này không chỉ xảy ra một lần mà còn xảy ra tới bốn lần
trong một kết nối hai chiều ( 2 lần đi và lần về ). Tất nhiên, trễ modem chỉ tồn
tại trong các cấu hình có sự tham gia của PC, vì trong các cấu hình trực tiếp với
điện thoại là đầu cuối thì không cần modem vì chúng có thể được kết nối trực
tiếp vào đường điện thoại và do đó không có trễ. Trễ modem xảy ra ở bước này
gọi là trễ modem bên truyền để phân biệt với trễ modem bên nhận sau này.
Trễ Internet:
Trễ Internet do
cho tất cả các loại hình dịch vụ trên cơ sở IP chứ không riêng cho thoại. Các
ứng dụng khác như email, Web, FTP ... cùng chia sẻ băng thông của mạng, làm
cho việc truyền các gói tin trở nên chậm chạp. Trong một mạng cơ sở hạ tầng
tốt thì trễ này sẽ giảm đi đáng kể vì nó gây ra khả năng sai lỗi ít, tốc độ truyền
83
nhanh hơn, ít khả năng yêu cầu phát lại gói tin. hơn nữa trễ này còn gây ra một
vấn đề rất đặc trưng trong mạng VOIP, đó là Jitter.
Trễ bộ đệm Jitter:
m để chỉ sự đến cách nhau không đồng đều về mặt
ời gi
Khi dữ liệu đến bên nhận, nó phải được
c giải nén và mã hoá để tái tạo lại tín hiệu
ận được dưới dạng số hoá cần phải được chuyển đổi thành
ạng t
rong các nguyên nhân gây trễ trên ta đã giả thiết nghiên cứu một cách
ng q
rên Internet, chúng cần được chặt ra
itter là một khái niệ
th an của các gói tin IP. Đối với các ứng dụng khác thì việc các gói tin đến
không đều nhau thực sự không gây ảnh hưởng nhiều đến chất lượng dịch vụ vì
việc này chỉ gây ra sự chậm trễ trong việc sắp xếp lại gói tin, xử lý gói tin.
Nhưng trong VOIP, vấn đề thời gian thực sự được quan tâm hàng đầu. Các gói
tin được định tuyến theo các con đường khác nhau để đến đích, do đó không có
gì đảm bảo chúng đến đều nhau. Để giải quyết vấn đề này cần sử dụng bộ đệm (
Jitter buffer ). Do đó đây cũng là một nguồn trễ, trễ bộ đệm Jitter.
Trễ bộ đệm modem bên nhận:
Tương tự trễ modem bên truyền.
chuyển đổi lại dạng số và việc này gây ra trễ.
Trễ giải nén và mã hoá:
Ở nơi nhận, dữ liệu cần đượ
ban đầu, việc này gây ra một khoảng trễ nào đó.
Trễ phát lại:
Các gói tin nh
d ương tự để có thể phát ra âm thanh đến người nghe qua loa. Sự chuyển
đổi số - tương tự này được thực hiện bởi soundcard và phần mềm điều khiển
(driver). Đây là nguồn trễ cuối cùng mà hệ thống phải chịu, trễ này thường cỡ
150ms.
T
tổ uát cho các ứng dụng VOIP với sự có mặt của các PC, có loại trễ mang
tính khách quan, có lại trễ lại có thể khắc phục bằng thiết kế, bằng các giải
thuật và có loại trễ chỉ tồn tại trong các cấu hình với sự có mặt của PC.
4.4. VẤN ĐỀ GIẢM THIỂU HOÁ NGUỒN TRỄ.
4.4.1. Tối thiểu hoá ghi âm bên truyền
Các tín hiệu thoại, để có truyền t
thành các mảnh nhỏ, nén, mã hoá và đóng thành các khung, các khung này sau
đó lại được tổ chức thành các gói (thường gồm từ 2 – 4 khung). Các gói này
được cộng thêm các thông tin điều khiển, chẳng hạn các thông tin về địa chỉ
trạm đầu, trạm cuối, các thông tin về dịch vụ ... Các thông tin này là cần thiết
cho quá trình truyền các gói tin trên mạng thông qua các bộ định tuyến, tuy
84
nhiên các thông tin này không bao gồm thông tin về tín hiệu thoại. Do đó,
chúng làm giảm hiệu suất thực tế truyền dữ liệu. Có thể giải quyết vấn đề này
bằng cách truyền nhiều khung nhất có thể trong một gói tin nhưng điều đó lại
làm cho việc phải đợi một lượng lớn thông tin đến trước khi được xử lý, gây ra
trễ ghi âm bên truyền nhiều hơn. Như đã trình bày, tiếng nói được xử lý nhờ
các sản phẩm phần mềm gọi là bộ mã hoá/giải mã, trước khi được truyền trên
Internet. Do đó giải pháp tốt nhất là sử dụng các bộ mã hoá/giải mã có khả
năng nén tiếng nói xuống tốc độ thấp nhất có thể. Một đặc trưng quan trọng
khác của các bộ mã hoá đó là kích thước khung nhỏ nhất có thể được sử dụng.
Việc xử lý các khung càng nhỏ càng làm giảm độ trễ ghi âm vì yêu cầu thời
gian chờ tín hiệu ít hơn.
4.4.2. Tối thiểu hoá trễ modem
ể trong tổng các nguồn gây trễ vì với một
iệc khôi phục âm thanh là các bộ đệm
Trễ modem gây ra sự trễ đáng k
cuộc gọi hai chiều thì trễ modem gây ra tất cả bốn lần trễ ( hai lần trễ mỗi bên
từ tương tự ra số và từ số ra tương tự ). Do đó việc giảm thiểu sự trễ modem là
rất cần thiết sẽ giúp tiết kiệm đáng kể trễ toàn hệ thống. Các modem được đặc
trưng bởi tốc độ truyền của nó hoặc số liệu mà chúng có thể xử lý trong một
đơn vị thời gian. Các modem có tốc độ xử lý càng chậm càng làm tăng thời
gian tổng của các tính toán cần thiết để chuyển đổi từ tín hiệu số sang tín hiệu
tương tự và ngược lại. Thực tế có 3 nguồn gây trễ modem có thể tính toán
được. Đó là trễ để chuyển dữ liệu vào bộ đệm của modem, trễ tính toán và trễ
truyền lại. Trong đó trễ truyền lại kéo theo sự gia tăng của trễ bộ đệm Jitter do
số lượng các gói tin truyền thực tế tăng. Sử dụng các modem có tốc độ xử lý
cao sẽ giúp giảm trễ modem một cách đáng kể, dễ thấy nhất đó là việc làm
giảm trễ tính toán. Hơn nữa, sự sử dụng các bộ mã hoá tốc độ thấp đã đề cập ở
phần trên đã giúp cho việc giảm thiểu trễ modem hiệu quả hơn do tốc độ bit
thấp sẽ giúp cho modem xử lý nhanh hơn.
4.4.3. Tối thiểu hoá trễ bộ đệm Jitter
Trường hợp lý tưởng nhất cho v
Jitter có thể chờ ngay cả gói tin đến đích trễ nhất. Tuy nhiên điều này sẽ là tăng
độ trễ của bộ đệm Jitter đến mức không thể chấp nhận được. Vậy để thu nhỏ
thời gian chờ các gói tin, do đó sẽ làm giảm độ trễ bộ đệm Jitter, các gói đến
quá muộn sau một khoảng thời gian nào đó cần phải bỏ đi. Nếu các bộ mã
hoá/giải mã không có khả năng khôi phục hay dự đoán các gói tin bị mất dựa
85
vào các gói đã đến, các bộ mã hoá như vậy có thể được sử dụng là các bộ mã
hoá tham số. Có thể nói rằng việc sử dụng các bộ mã hoá/giải mã không tham
số như G.723.1 hay G.729 có thể khôi phục được phần nào các gói tin bị mất,
song chất lượng âm thanh của các bộ mã hoá/giải mã dạng sóng như vậy kém
hơn rất nhiều các bộ mã hoá/giải mã tham số.
4.4.4. Trễ đầu cuối đến đầu cuối
Để có thể giảm thiểu độ trễ, tăng chất lượng hội thoại thì việc tối thiểu
oá trễh ghi âm bên truyền, trễ modem và trễ bộ đệm Jitter là những biện pháp
hiệu quả để thu nhỏ trễ end to end thường hay gặp trong hệ thống VOIP. Việc
sử dụng các bộ mã hoá/giải mã tốc độ bit thấp là một giải pháp hiệu quả thường
đước chú trọng, chẳng hạn như bộ mã hoá/giải mã tham số Voxware RT24 cung
cấp một tốc độ bit thấp và khả năng khôi phục gói tin lớn đem lại một chất
lượng tốt hơn khi được triển khai trong các hệ thống VOIP.
Thứ tự Nguồn trễ Giá trị đặc trưng (ms)
trong cấu hình PC -
PC
Giá trị tương ứng
trong
cấu hình Phone -
Phone
1 Ghi âm bên truyền 150 – 300 0 20 – 15
2 Trễ mã hoá 5 5
3 Nén 5 5
4 Modem phía 38
truyền
5 – 0
5 70 – 150 70 – 150 Internet
6 Modem phía nhận 5 – 38 0
7 Bộ đệm Jitter 150 – 300 0 – 300 15
8 Giải nén 5 5
9 Giải mã hoá 10 10
10 300 Trễ phát lại 40 – 0
86
CHƯƠNG 5
VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ. KHẢ NĂNG
ÁP DỤNG VOIP Ở VIỆT NAM VÀ TRÊN THẾ GIỚI
5.1. GIỚI THIỆU.
Một trong những lý do chính khiến cho mạng điện thoại chuyển mạch
công cộng (PSTN: Public Switched Telephone Network) được gọi là mạng
chuyển mạch kênh là vì "tất cả băng thông, tất cả thời gian". Chỉ đơn giản là
đưa tín hiệu thoại vào mạng, chất lượng thoại ra sẽ phụ thuộc chủ yếu vào khả
năng duy trì trễ thấp và ổn định trên suốt dọc đường tín hiệu truyền qua. Cách
dễ nhất (và đã từng là cách duy nhất trong một khoảng thời gian dài) để đảm
bảo trễ nhỏ và ổn định (hay giới hạn jitter) là thông qua chuyển mạch kênh.
Băng thông và trễ là hai thông số chất lượng dịch vụ quan trọng nhất (QoS),
chúng xác định đặc điểm của mạng, và trong một vài trường hợp có thể nói
rằng chúng là hai thông số đáng quan tâm duy nhất.
Tuy nhiên, ngày nay, thoại không phải là dịch vụ duy nhất trên mạng
PSTN. Fax được xem như loại dịch vụ thoại có khả năng chịu lỗi cao, và nó
không phụ thuộc vào độ ổn định của trễ như thoại. Mạng dữ liệu nhạy cảm với
giới hạn băng thông hơn là với trễ nhỏ và giới hạn trôi pha. Đây là một trong
những lý do chính khiến cho trong quá khứ mạng thuần dữ liệu được xây dựng
độc lập với mạng thoại.
Ngày nay tất cả các mạng đều được sử dụng cho dịch vụ thoại, dữ liệu, và
một số còn cho cả Fax và Video. Các mạng riêng có thể được xây dựng để đáp
ứng các yêu cầu đặc biệt về băng thông hay trễ, tuy nhiên mạng công cộng lại
hấp dẫn ở khía cạnh thuận lợi cho việc kết nối. Cùng với việc Internet và Web
đang ngày càng trở nên không thể thiếu được trong cuộc sống hàng ngày, thì áp
lực cho việc sử dụng một mạng IP (Internet Protocol) toàn cầu cho tất cả các
loại dịch vụ ngày càng lớn và cấp thiết.
Bản thân IP là một mạng "cố gắng tối đa" và "không tin cậy", theo đó
mạng sẽ cố gắng chuyển giao các gói tin, nhưng nếu có gói nào bị mất giữa các
bộ định tuyến vì bất cứ một lý do gì, thì IP không có nhiệm vụ phải truyền lại
87
gói đó. Và thuật ngữ không tin cậy đối với mạng IP cũng là một vấn đề khó giải
quyết. Thêm vào đó, nếu một bộ chuyển mạch thoại bị hỏng thì tất cả các cuộc
thoại đang được chuyển mạch qua nó sẽ bị kết thúc ngay lập tức. Trong khi,
nếu một bộ định tuyến IP trên mạng hỏng, thì các gói sẽ nhanh chóng được tự
động định tuyến lại qua một tuyến khác, mặc dù có thể bị mất một vài gói.
Tại sao PSTN lại được coi là "đáng tin cậy" còn Internet lại "không tin
cậy"? Lý do chính bởi vì thuật ngữ đáng tin cậy trong ngữ cảnh này không phải
áp dụng cho các đặc tính sẵn sàng của mạng mà là khả năng mạng có thể tin
tưởng được để chuyển giao QoS cần thiết cho ứng dụng hay không. Với nghĩa
này, mạng PSTN tốt hơn mạng IP nhiều khi nó đảm bảo được QoS cho các ứng
dụng, không phải chỉ là QoS của thoại. Còn IP (Internet và Web) cung cấp dịch
vụ mạng không tin cậy giữa các bộ định tuyến.
Tuy nhiên, nếu một mạng IP không có một đảm bảo nào về QoS cho ứng
dụng, thì làm thế nào Internet có thể được sử dụng tin cậy cho thoại? Người sử
dụng có thể dễ dàng thêm các thiết bị vào mạng để có được QoS cần thiết hay
không? Và mạng sẽ đóng vai trò gì? Chương này sẽ đề cập đến các vấn đề này.
5.2. CHẤT LƯỢNG DỊCH VỤ (QoS).
QoS được định nghĩa là “khả năng của mạng đảm bảo và duy trì các mức
thực hiện nhất định cho mỗi ứng dụng theo như các yêu cầu đã được chỉ rõ của
mỗi người sử dụng”. Nhà cung cấp dịch vụ mạng đảm bảo QoS cung cấp cho
người sử dụng, và thực hiện các biện pháp để duy trì mức QoS khi điều kiện
mạng bị thay đổi vì các nguyên nhân như nghẽn, hỏng hóc thiết bị hay lỗi liên
kết... QoS cần được cung cấp cho mỗi ứng dụng để người sử dụng có thể chạy
ứng dụng đó, và mức QoS mà ứng dụng đòi hỏi chỉ có thể được xác định bởi
người sử dụng, bởi vì chỉ người sử dụng mới có thể biết được chính xác ứng
dụng của mình cần gì để hoạt động tốt. Không phải là người sử dụng tự động
có thể biết được mạng cần phải cung cấp những gì cần thiết cho ứng dụng,
nhưng cũng giống như các yêu cầu cho các ứng dụng phần mềm của máy tính
cá nhân (ví dụ "64 MB RAM, 100 MB ổ cứng trống..."), họ phải tìm hiểu các
thông tin. Chắc chắn rằng, mạng không thể tự động đặt ra QoS cần thiết cho
một ứng dụng của người sử dụng.
Về quan niệm thì QoS là một tài nguyên của mạng, hay đúng hơn là một
nhóm tài nguyên mạng, ví dụ như băng thông và trễ. QoS ở "bên trong" mạng
và mạng sẽ cung cấp QoS thích hợp cho các ứng dụng khi cần thiết.
88
Các nhà cung cấp dịch vụ mạng đưa ra thông tin đặc tả về giá trị thực tế
của các thông số QoS theo một trong hai cách sau. Với môi trường kênh ảo cố
định (PVC: Permanent Virtual Circuit), các giá trị của các tham số QoS có thể
chỉ đơn giản được ghi trên một mẩu giấy và trao cho đại diện của nhà cung cấp
dịch vụ mạng. Fax, thư điện tử, và thậm chí cả các cuộc gọi có thể được sử
dụng để cung cấp cùng một thông tin, miễn là khách hàng và nhà cung cấp dịch
vụ thống nhất được với nhau về cách thức sử dụng. QoS có hiệu lực trên PVC
khi PVC sẵn sàng. Với môi trường kênh ảo chuyển mạch (SVC: Switched
Virtual Circuit), các giá trị của thông số QoS được gửi cho nhà cung cấp dịch
vụ trong bản tin báo hiệu thiết lập cuộc gọi, nó là một phần của giao thức báo
hiệu được sử dụng để cung cấp dịch vụ chuyển mạch trên mạng. Cả hai phương
pháp đều có thể được sử dụng trong mọi cách kết hợp trên mạng. Phương pháp
PVC cho phép QoS được cung cấp rảnh rang hơn, trong khi phương pháp SVC
đòi hỏi QoS trên một kết nối cho trước được thiết lập liên tục.
Nếu một mạng được tối ưu hoàn toàn cho một loại dịch vụ, thì người sử
dụng ít phải xác định chi tiết các thông số QoS. Ví dụ, với mạng PSTN, được
tối ưu cho thoại, không cần phải xác định băng thông hay trễ cần cho một cuộc
gọi. Tất cả các cuộc gọi đều được đảm bảo QoS như đã được quy định trong
các chuẩn liên quan cho điện thoại. Nếu MODEM được sử dụng để truyền dữ
liệu trên kết nối thoại, thì các thông số được cung cấp bởi PSTN vẫn không thể
bị vi phạm. PSTN thích hợp cho thoại do bản chất của nó, tuy nhiên nó lại
không hoàn toàn phù hợp cho nhiều ứng dụng ngày nay, đặc biệt đối với khía
cạnh băng thông. Tuy nhiên, cố định tất cả các thông số QoS trong mạng PSTN
rất phù hợp cho thiết lập cuộc gọi và định tuyến khá đơn giản, hiệu quả, và
nhanh.
5.3. PHÂN CẤP CHẤT LƯỢNG.
Một cách tự nhiên, có nhiều mức QoS khác nhau cũng giống như là có
nhiều ứng dụng vậy. Các ứng dụng lại thay đổi rất lớn thậm chí cả với những
yêu cầu đơn giản về băng thông. Thoại số có thể yêu cấu bất kỳ tốc độ nào
trong khoảng từ 8 đến 64 kb/s. Video có thể chấp nhận được ở tốc độ 1,5 Mb/s,
nhưng sẽ tốt hơn nhiều nếu là 6 Mb/s. Truy nhập Web và truyền tập tin sử dụng
băng thông càng nhiều càng tốt trong phạm vi có thể, nhưng lại không cần liên
tục... Tuy nhiên, băng thông trên PSTN và của mạng dữ liệu nhận được từ các
đường thuê riêng dựa trên PSTN lại chỉ phục vụ giới hạn tại tốc độ 64 kb/s.
Một ứng dụng cần 100 kb/s thì hoặc là cố gắng hoạt động ở 64 kb/s, hoặc là bỏ
89
phí 28 kb/s trong 128 kb/s. Đây là mặt hạn chế của các mạng chuyển mạch
kênh "tất cả băng thông tất cả thời gian".
Một mạng chuyển mạch gói có thể chia băng thông ra thành nhiều phần rất
thích hợp cho các ứng dụng dữ liệu bùng nổ, nhưng đó không phải là tất cả.
Một mạng cần phải có khả năng cung cấp QoS yêu cầu cho mỗi ứng dụng,
không cần biết băng thông cần thiết là cố định hay không. Khả năng về phía
mạng cung cấp cho các ứng dụng các đảm bảo QoS, ví dụ như là đảm bảo băng
thông, được xem là phân cấp QoS của mạng.
Phân cấp là một khía cạnh quan trọng của QoS. Phân cấp xác định các
thông số QoS tốt đến mức nào mà người sử dụng có thể định rõ cho một ứng
dụng cụ thể. Nếu mạng cung cấp QoS không đủ độ mịn, thì nó có thể giới hạn
người sử dụng truy nhập vào mạng. Lấy một ví dụ đơn giản, xét một nhà cung
cấp dịch vụ mạng thiết lập nhiều loại lớp dịch vụ cho các ứng dụng của người
sử dụng. Có nhiều lúc lớp dịch vụ được dùng đồng nghĩa với QoS, nhưng ở đây
sử dụng thuật ngữ lớp dịch vụ với nghĩa là một tập hợp của các giá trị thông số
QoS có khả năng cung cấp cho một lớp, hay loại ứng dụng nào đó.
Nhà cung cấp dịch vụ có thể đưa ra một lớp dịch vụ thoại trên một mạng
gói mà nó đảm bảo băng thông 64 kb/s giữa các điểm cuối và trễ 100 ms với
jitter nhỏ hơn 10 ms. Điều này tốt, miễn là tất cả người sử dụng thoại đều cần
64 kb/s. Nhưng nếu một ứng dụng thoại mới chỉ yêu cầu 8 kb/s thôi thì sao?
Hay thậm chí chỉ 4 kb/s. Bởi vì người sử dụng được đảm bảo ở 64 kb/s, nên
lượng băng thông này nói chung phải được chia ra từ toàn bộ băng thông trên
mạng. Như thế bởi vì mạng có thể không bao giờ chỉ ra khi nào 64 kb/s có thể
được yêu cầu. Theo đó, người sử dụng trả cho phần băng thông không sử dụng,
và nhà cung cấp dịch vụ dự trữ băng thông để có thể dùng để cung cấp cho
những người sử dụng khác.
Phân cấp QoS tốt hơn sẽ cho phép người sử dụng thoại, thậm chí trong
cùng lớp dịch vụ, xác định băng thông họ yêu cầu chính xác hơn. Sự chính xác
này muốn đạt được thì phải trả giá bằng độ phức tạp của mạng, đây là lý do
chính cho việc giới hạn các giá trị thông số QoS và đặt ra các lớp dịch vụ trong
giai đoạn đầu.
5.4. VẤN ĐỀ ĐẢM BẢO CHẤT LƯỢNG DỊCH VỤ.
Điều gì sẽ xảy ra nếu mạng không thành công trong việc đảm bảo và duy
trì QoS chính xác cho một ứng dụng cho trước? Điều này tuỳ thuộc vào sự thoả
90
thuận giữa người sử dụng và nhà cung cấp dịch vụ trong trường hợp dịch vụ
được quản lý bởi hợp đồng, hay là giữa nhà cung cấp dịch vụ và bộ phận điều
chỉnh trong trường hợp dịch vụ bảng giá.
Đảm bảo chất lượng cũng là phần quan trọng của hợp đồng cho các dịch
vụ mạng giữa khách hàng (đại diện cho người sử dụng) và nhà cung cấp dịch
vụ. Thông thường thì khách hàng phải trả tiền hàng tháng cho các dịch vụ. Đảm
bảo chất lượng có thể thiết lập một hệ thống phạt dưới hình thức giảm bớt giá
tiền dịch vụ một tháng nếu nhà cung cấp dịch vụ không cung cấp đúng chất
lượng yêu cầu trong tháng đó. Trong những trường hợp nghiêm trọng nếu vấn
đề về mạng xảy ra trong toàn bộ tháng đó, khách hàng có thể nhận được dịch
vụ miễn phí.
5.5. TRIỂN KHAI VOIP Ở VIỆT NAM.
Với ưu thế giá cước rẻ, chất lượng cuộc gọi chấp nhận được, điện thoại
qua Internet đã thu hút được nhiều khách hàng
Trung bình mỗi ngày , điện thoại VoIP thu hút 15.207 cuộc gọi; lưu
lượng là 53.187 phút và thời gian trung bình mỗi cuộc là 3,5 phút, hệ thống
mạng lưới hoạt động tốt và liên tục. Trong 3 tháng đầu thử nghiệm chỉ có một
lần xảy ra sự cố suy giảm chất lượng luồng trung kế đường Hà Nội-Thành phố
Hồ Chí Minh trong buổi sáng 3/1/2001. Về việc này, Tổng cục Bưu điện đã có
ý kiến đóng góp cho Vietel sử dụng một luồng 2M cáp quang để cung cấp dịch
vụ trong thời gian chờ khắc phục sự cố. Cũng theo báo cáo từ Vietel, tỷ lệ mất
gói là 0%; tỷ lệ trễ sau quay số từ 9-15s, độ khả dụng đạt 99%; tỷ lệ hoàn thành
cuộc gọi đạt trên 65%, các cuộc gọi không hoàn thành bao gồm cả các cuộc gọi
không có người nhấc máy, máy bị gọi bận...
Hiện nay, sản lượng dịch vụ đường dài VoIP tăng dần và dao động ở mức
3.9 đến 4.2 triệu phút/tháng, chiếm hơn 38% trong tổng sản lượng điện thoại
đường dài Hà Nội-Thành phố Hồ Chí Minh, tương đương khoảng 1,4% sản
lượng điện thoại đường dài liên tỉnh. Doanh thu từ dịch vụ này đưa lại khoảng
7.5 tỷ đồng/tháng, chiếm khoảng 26% doanh thu điện thoại đường dài Hà Nội-
Thành phố Hồ Chí Minh, tương đương gần 2 % tổng doanh thu điện thoại
đường dài liên tỉnh. Số thuê bao hàng tháng sử dụng dịch vụ điện thoại IP của
Vietel tại Hà Nội và Thành phố Hồ Chí Minh dao động từ 70.000 đến 90.000.
Song song với Vietel, công ty SPT cũng xây dựng đề án cung cấp dịch vụ
đường dài trong nước, quốc tế trên cơ sở công nghệ VoIP, công ty NETNAM
cũng có đơn xin phép cung cấp dịch vụ điện thoại IP Phone to Phone. Và gần
91
đây nhất, Tổng công ty Bưu chính Viễn thông Việt Nam cũng xin phép mở dịch
vụ VoIP trong nước và quốc tế. Như vậy, trong tương lai không xa sẽ có nhiều
doanh nghiệp cùng tham gia cung cấp dịch vụ cho người sử dụng và thúc đẩy
cạnh tranh dịch vụ này trên thị trường.
Cùng với Vietel sẽ có công ty VDC cùng kinh doanh dịch vụ này và là một
đối tác cạnh tranh. Từ nay cho đến khoảng thời gian đó, Tổng công ty Bưu
chính Viễn thông Việt Nam và Vietel đang khẩn trương thống nhất về việc kết
nối, giá cước, phân chia cước trong lĩnh vực kinh doanh VoIP.
Tuy vậy, về lâu dài Việt Nam cần xây dựng mạng đường trục IP có khả
năng đáp ứng tất cả các loại hình dịch vụ tiếng nói, hình ảnh và đa phương tiện.
5.6. TRIỂN KHAI VOIP TRÊN THẾ GIỚI.
Các công ty điện thoại truyền thống trên thế giới thu được một khoản lợi
nhuận bình quân trong một năm từ các dịch vụ thoại vào khoảng 250 tỷ USD,
và hiện nay họ đang nhằm vào một kho báu vô chủ là giao thức Internet trên cơ
sở hệ thống điện thoại. Điện thoại IP đang phát triển mạnh mẽ trong giới khách
hàng kinh doanh. Theo con số điều tra gần đây của Cahners In-Stat Group thì
trên một nửa trong số 128 công ty mua công nghệ đã sẵn sàng chuyển hướng
vào các mạng IP. Các công ty sử dụng các mạng IP đang tăng nhanh, chiếm
một số tỷ lệ là 54% so với sử dụng các mạng Frame Relay (37%) và ATM
(28%)
Tuy nhiên mức độ triển khai điện thoại IP ở các nước trên thế giới là rất
khác nhau, từ việc cho phép không điều kiện đến việc cấm hoàn toàn dịch vụ
này. Tại các nước phát triển như Mỹ, Uc, Canada, Singapore, dịch vụ điện
thoại IP loại PC-PC và PC-Điện thoại đều được cho phép không điều kiện.
Trong khi đó, các nước đang phát triển không cho phép triển khai dịch vụ này
một cách rộng rãi. Có hai nguyên nhân chủ yếu làm cản trở quá trình triển khai
dịch vụ này:
- Mức độ tự do hoá thấp hay không cho phép cạnh tranh với nhà khai thác
chính.
- Do cơ sở hạ tầng yếu kém không đảm bảo được chất lượng.
Nhằm từng bước triển khai VoIP, hầu hết các nước phát triển đều tập trung
vào việc xây dựng các mạng đường trục đáp ứng được các yêu cầu đối với việc
truyền thông đa phương tiện. Khi đó thông tin trên mạng sẽ không còn phân
biệt là tín hiệu thoại, dữ liệu hay hình ảnh nữa. Các mạng IP đường trục này
cũng là một thành phần cấu thành nên cơ sở hạ tầng thông tin quốc gia.
92
Điện thoại IP là một xu thế không thể tránh khỏi, đang phát triển và dần
dần thay thế điện thoại thông thường. Theo đánh giá của công ty IDC, trong
năm 2006 thị trường điện thoại IP đạt khoảng 4,7 tỷ phút với mức tăng trưởng
bình quân hàng năm là 92 %.
93
Kết Luận
Mạng điện thoại qua Internet sử dụng giao thức IP (Internet Protocol) có
nhiều ưu điểm so với mạng điện thoại truyền thống PSTN (Public Switching
Telephone Network) như: chi phí thấp, cơ cấu mạng đơn giản, có thể khai thác
cơ sở hạ tầng mạng IP sẵn có. Với việc số hoá tín hiệu và việc sử dụng công
nghệ chuyển mạch gói để truyền thông tin trên mạng cho phép tiết kiệm băng
thông, tài nguyên trên mạng. Ngày nay Internet phát triển rộng khắp trên thế
giới và cả ở Việt Nam. Vì vậy VOIP sẽ là một công nghệ đem lại nhiều lợi ích
cho người sử dụng và các nhà cung cấp dịch vụ.
Tuy nhiên, VOIP cũng có những mặt hạn chế và gặp nhiều khó khăn
trong việc triển khai trên diện rộng. Do hoạt động trên nền IP và cơ sở hạ tầng
còn yếu kém nên chất lượng dịch vụ không được bảo đảm. Các yếu tố như trễ,
trượt, mất gói ... đã làm giảm chất lượng dịch vụ.
Để phát triển công nghệ VOIP cần có chính sách đầu tư, nâng cấp hạ
tầng mạng, sử dụng các hỗ trợ để đảm bảo chất lượng dịch vụ. Trong tương lai,
điện thoại Internet sẽ thay thế được công nghệ hiện nay với chất lượng dịch vụ
đảm bảo và giá thành hạ.
94
TÀI LIỆU THAM KHẢO
1. Mạng máy tính và các hệ thống mở - Nguyễn Thúc Hải – NXB Giáo
Dục 1999.
2. Giáo trình hệ thống mạng máy tính CCNA – Nguyễn Hồng Sơn –
NXB Giáo dục 2001.
3. Nghiên cứu công nghệ truyền tín hiệu thoại trên mạng Internet. Các
dịch vụ và ứng dụng trong Viễn Thông (Luận văn thạc sĩ) – Lê Thanh
Hào - Đại học Bách Khoa 2000.
4. Kỹ thuật điện thoại qua IP & Internet (IP Telephone & Internet
Telephone) NXB LĐXH 08/2003.
5. Công nghệ IP và ứng dụng điện thoại qua giao thức Internet - Tạp
chí Bưu điện 8 -2004.
6. Tổng quan về VOIP và các giao thức điều khiển trạm trung chuyển
MGCP – Hoàng Trọng Minh - Khoá luận tốt nghiệp ngành ĐTVT Đại
học Quốc Gia HN 2002.
7. Nghiên cứu công nghệ VOIP - Nguyễn Công Bánh - Đồ án tốt nghiệp
ngành ĐTVT Đại học Bách Khoa Hà Nội 2003.
8. Voice Over IP – L.Baker – Asian Communications. August 1998.
9. VocalTec Internet Phone 5 .
10. ITU-T H.245.
11. G.723.1 – Dual rate speech coder for mutimedia communications
transmitting at 5.3 and 6.3 kbit/s.
12. G.729A – Reduced complexity 8 kbit/s. CS-CELP speech codec.
13. G.729B – A science compression scheme for G.729 optimized for
terminals conforming to Recommendation V.70.
14.
95
Các file đính kèm theo tài liệu này:
- cong nghe dien thoai TCP_IP.pdf