Truyền hình cáp sử dụng các kênh truyền nằm trong phạm vi dải thông ở cận dưới của băng VHF. Các kênh được chia thành các băng VHF thấp, VHF giữa, VHF cao và siêu băng.
Ưu điểm cuả truyền hình cáp là có thể sử dụng các kênh kề nhau để truyền tín hiệu trong tất cả các phạm vi mà không xuất hiện hiện tượng nhiễu đồng kênh, tuy nhiên các tín hiệu phải điều khiển ở độ tuyến tính cao để tránh hiện tượng điều biến tương hỗ.
Cáp quang được ứng dụng rộng rãi trong công nghiệp truyền thông. Môi trường truyền của cáp quang là bức xạ hồng ngoại với các thành phần điện từ có tần số cực cao. Ưu điểm của hệ thống cáp quang là độ rộng dải thông lớn.
Tín hiệu số rất phù hợp với đường truyền dẫn quang, có thể truyền trong khoảng cách xa với các trạm bù, dùng phương pháp điều xung mã PCM để điều chế nguồn tín hiệu có tốc độ bit cao, độ suy hao thấp, thời gian trễ thấp.
Để truyền tín hiệu video số bằng cáp quang phải sử dụng mã kênh truyền. Tín hiệu video sau khi được biến đổi sang dạng số được mã hoá bằng mã sơ cấp.
Việc sử dụng mã kênh truyền khắc phục được các nhược điểm:
- Hạn chế thành phần một chiều và thành phần tần số thấp để có thể đấu nối tín hiệu từ mạch này sang mạch khác bằng biến áp hoặc qua tụ.
- Thuận lợi cho việc tái tạo xung nhịp ở đầu thu.
- Phát hiện lỗi.
95 trang |
Chia sẻ: aloso | Lượt xem: 2056 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đồ án Xử lý tín hiệu truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
p nhất cung cấp cho rất nhiều ứng dụng truyền thông, truy cập, điều khiển dữ liệu âm thanh số như : điện thoại hình, thiết bị đầu cuối đa phương tiện (multimedia), thư điện tử và cảm nhận từ xa. MPEG- 4 cho khả năng truy cập rộng rãi và hiệu suất nén rất cao.
V.2.2. Sự phân loại ảnh MPEG
Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B và ảnh P.
V.2.2.1. ảnh I: (Intra - Coded Picture)
Các ảnh I được mã hoá theo mode Intra để có thể giải mã mà không cần sử dụng dữ liệu từ bất cứ một ảnh nào khác. Đặc điểm của phương pháp mã hoá này như sau:
+ Chỉ loại bỏ được sự dư thừa không gian.
+ Dùng các điểm trong cùng một khung để tạo dự báo.
+ Không có bù chuyển động.
+ Các thông tin được mã hoá rõ ràng nên số lượng bít yêu cầu lớn.
Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh hay một chuỗi ảnh. Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm.
V.2.2.2. ảnh P ( Predictive Code Picture)
ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):
+ Dự báo Inter một chiều.
+ ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả), ảnh tham chiếu này có thể là ảnh I hoặc ảnh P gần nhất.
+ Có sử dụng bù chuyển động. Thông tin ước lượng chuyển động của các khối nằm trong véc tơ chuyển động (motion vecto). Véc tơ này xác định Macro block nào được sử dụng từ ảnh trước.
Do vậy ảnh P bao gồm cả những MB (Macro Block) mã hoá Inter (I-MB) là những Macro block chứa thông tin lấy từ ảnh tham chiếu và những MB mã hoá Intra là những MB chứa thông tin không thể mượn từ ảnh trước.ảnh P có thể được sử dụng làm ảnh tham chiếu tạo dự báo cho ảnh sau.
V.2.2.3. ảnh B (Bidirectionally Predicted Pictures)
ảnh B là ảnh được mã hoá có bù chuyển động từ các ảnh I hoặc P ở phía trước và ở phía sau (ảnh dự đoán hai chiều).
Việc sử dụng thông tin lấy từ ảnh trong tương lai hoàn toàn có thể thực hiện được vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sàng truy cập tới ảnh phía sau.
ảnh B cho tỉ lệ nén cao nhất và có thêm các ưu điểm sau:
+ Giải quyết được các vấn đề thay đổi ảnh cũng như không dự đoán được sự thay đổi về nội dung hình ảnh.
+ Việc sử dụng bù chuyển động từ hai ảnh cho S/N lớn hơn nếu như chỉ sử dụng bù chuyển động từ một ảnh.
+ Vì ảnh B không sử dụng là ảnh so sánh cho các ảnh khác, nó có thể mã hóa với số lượng bit thấp và không gây lỗi trễ đường truyền.
V.2.3. Nhóm ảnh (GOP)
Gồm cấu trúc các ảnh I, B và P. Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Trong đó, ảnh P, B không phải là một ảnh hoàn chỉnh mà chỉ chứa sự khác biệt giữa ảnh đó và ảnh xuất hiện trước nó (đối với P) hay sự khác biệt với cả khung hình xuất hiện trước và sau nó (đối với B). Để có khuôn hình hoàn chỉnh, ảnh I và B cần phải có dữ liệu từ các ảnh lân cận. Mỗi nhóm ảnh bắt buộc phải bắt đầu bằng ảnh I hoàn chỉnh sau đó là các ảnh P và B. Nhóm ảnh có thể mở hoặc đóng.
Chuỗi ảnh MPEG thường có cấu trúc IBBPBBPBBI nhưng thứ tự truyền dẫn và thứ tự hiển thị ảnh là khác nhau do khi tạo ảnh B cần thông tin từ cả hai khung xuất hiện trước và sau. Như vậy, ảnh xuất hiện trước phải được truyền trước. Khi hiển thị phải đúng theo thứ tự nguồn. Để thực hiện điều này, lớp ảnh của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh để trợ giúp hiển thị .
Trong MPEG có các cấu trúc nhóm ảnh điển hình như sau:
F1
F2
F3
F4
F5
F6
F7
F8
F9
F10
Khung theo tiêu chuẩn
CCIR_ 601
I
B
P
B
B
P
B
B
I
B
Cấu trúc IBBPBBPBBI
Khung
đã nén
I
B
I
I
B
P
I
p
Cấu trúc IB
Cấu trúc IBP
Cấu trúc IP
Hình 3.14: Các cấu trúc nhóm ảnh trong tiêu chuẩn MPEG
F1
F2
F3
F4
F5
F6
F7
F8
F9
F10
P4
B5
B6
P7
B8
B9
I10
B3
I1
B2
Hình 3.15: Thứ tự truyền dẫn và thứ tự hiển thị ảnh
Thứ tự khung gốc
Thứ tự hiển thị
P4
B5
B6
P7
B8
B9
I10
B3
I1
[[[[
B2
Thứ tự truyền dẫn
V.2.4. Cấu trúc dòng bit video MPEG
Cấu trúc số liệu video MPEG 1 và MPEG 2 gồm 6 lớp :
Khối (Block): Là đơn vị cơ bản cho Biến đổi cosin rời rạc DCT (Discrete Cosine Transform), bao gồm 8x8 điểm ảnh tín hiệu chói hoặc tín hiệu màu.
Khối Macro MB (Macro Block): Là nhóm các khối DCT tương ứng với thông tin của một cửa sổ 16x16 điểm ảnh gốc. Có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng.
Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau.Phần header của slice chứa thông tin về vị trí của nó trong ảnh và tham số quét lượng tử (quantized scaling factor). Kích cỡ của slice quyết định bởi mức bảo vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi. Hệ số một chiều DC được định vị tại điểm bắt đầu mỗi slice.
ảnh (Picture): Lớp ảnh cho bên thu biết về loại mã hoá khung I, P, B. Phần Header mang thứ tự truyền tải của khung để bên thu hiển thị khung theo đúng thứ tự, ngoài ra còn có một số thông tin bổ sung như thông tin đồng bộ, độ phân giải và vecto chuyển động.
Nhóm ảnh GOP (Group Of Picture): Gồm cấu trúc các ảnh I, B và P. Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Phần Header chứa 25 bit thời gian và chế độ điều khiển cho máy ghi hình VTR (Video Tape Recoder) và thông tin thời gian.
Chuỗi Video(Video Sequence): lớp chuỗi gồm phần Header, một hoặc một số nhóm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence end Code).Thông tin quan trọng nhất của phần Header là kích thước (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng đòi hỏi bộ đệm dữ liệu bên thu. Thông tin chuỗi ảnh và phần Header của chuỗi là dòng bit đã mã hoá, còn gọi là dòng video cơ bản.
Dòng sơ cấp
Lớp chuỗi ảnh
(sequence layer)
Lớp nhóm ảnh
(GOP layer)
Đặc điểm MB
Vecto chuyển động
Khối Y
Khối Y
Khối Y
Khối Y
Khối Cb
KhốiCR
Lớp MB
(macrok block) layer)
Lớp lát
(slice layer)
Lớp khung
(frame layer)
Lớp khối DCT
(block layer)
Sequence end code
Slice header
Frame header
GOP header
Sequence header
Chuỗi Video #1
Chuỗi Video #2
Chuỗi Video #n
GOP #p
GOP #p+1
GOP #p+2
GOP #p+3
GOP #p+4
GOP #p+5
Khung I
Khung B
Khung P
Khung B
Khung I
Khung B
MB
MB
MB
MB
MB
MB
MB
MB
MB
MB
Các hệ số DCT
EOB
8x8 điểm chói
Dữ liệu khung CCIR_601
Hình 3.16 : Cấu trúc lớp dữ liệu trong MPEG
V.2.5. Nguyên lý nén MPEG
Nguyên tắc hoạt động :
Hoạt động của bộ mã hoá phụ thuộc vào loại hình ảnh, là mã hoá tại thời điểm đang xét. Nén MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh. Dạng thức đầu vào là Rec-601 4:2:2 hoặc 4:2:0 được nén liên ảnh trước tạo ra tạo ra được ảnh khác biệt ở đầu ra bộ cộng, ảnh này sau đó lại được nén trong ảnh qua các bước biến đổi: biến đổi DCT, lượng tử hoá, mã hoá. Cuối cùng ảnh này được trộn cùng với vectơ chuyển động đưa đến bộ khuếch đại đệm sẽ thu được ảnh đã nén .
Xét ví dụ bộ nén dùng ảnh I và P trong cấu trúc GOP. ảnh thứ nhất trong nhóm phải được mã hoá như ảnh loại I. Trong trường hợp này, sau khi lấy mẫu lần đầu, tín hiệu video được truyền đến block biến đổi DCT cho các MB riêng, sau đó đến block của bộ lượng tử hoá và mã hoá entropy. Tín hiệu ra từ bộ lượng tử hoá được đưa đến bộ lượng tử hoá ngược và biến đổi DCT ngược, sau đó được lưu vào bộ nhớ ảnh. Bộ nhớ ảnh bao gồm ảnh xuất hiện trong bộ giải mã sau khi giải mã ảnh truyền loại I.
Trong trường hợp mã hoá ảnh loại P, mạch nén chuyển động làm việc. Trên cơ sở so sánh ảnh đang xét và ảnh trong bộ nhớ sẽ xác định được các vectơ chuyển động, sau đó dự báo ảnh. Sự chênh lệch giữa ảnh đang xét và ảnh của nó lại được biến đổi DCT, lượng tử hoá , mã hoá entropy. Tín hiệu ra từ bộ lượng tử hoá được đưa đến bộ lượng tử hoá ngược và biến đổi DCT ngược, sau đó được lưu vào bộ nhớ ảnh.
Tốc độ bit của tín hiệu video được nén không cố định, phụ thuộc vào nội dung ảnh đang xét. Tại đầu ra bộ giải mã dòng bit phải cố định để xác định tốc độ cho dung lượng kênh truyền do đó bộ nhớ đệm phải đủ lớn .
Sơ đồ khối bộ mã hoá
4:2:2 4:2:0
S
IDCT
Lượng tử hoá
Mã hoá entropy
Trộn
Khuếch đại đệm
Giải lượng tử hoá
DCT
S
ảnh so sánh
ảnh dự đoán
Xác định vectơ chuyển động
Bảng lượng tử
Điều khiển tốc độ bit
Vectơ chuyển động
Điều khiển nhóm ảnh
Video nén
Video
+
+
Hình 3.17: Sơ đồ khối quá trình mã hoá MPEG
Sơ đồ khối bộ giải mã
Nhớ đệm
Giải mã entropy
Giải lượng tử hoá
Biến đổi DCT ngược
S
Nhớ ảnh
Dự báo ảnh
Số liệu điều khiển
Video
Video nén
ã
Hình 3.18: Sơ đồ khối quá trình giải mã MPEG
Quá trình giải mã theo lý thuyết là ngược lại với quá trình mã hoá.
Giai đoạn 1 là tách mã hoá entropy ra. Sau đó tách số liệu ảnh (hệ số biến đổi DCT) ra khỏi các vectơ chuyển động. Số liệu sẽ được giải lượng tử hoá và biến đổi DCT ngược. Trong trường hợp ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi sẽ nhận được ảnh ở đầu ra hoàn chỉnh bằng cách trên. Nó được lưu trong bộ nhớ ảnh và được sử dụng để giải mã các ảnh tiếp theo .
Trong trường hợp ảnh loại P sẽ được thực hiện giải lượng tử hoá và biến đổi DCT ngược với việc sử dụng các vectơ chuyển động và lưu vào bộ nhớ ảnh sớm hơn. Trên cơ sở đó, xác định được dự báo đang xét. Ta nhận được ảnh ra sau khi cộng dự báo ảnh và kết quả biến đổi DCT ngược, ảnh này cũng được lưu vào bộ nhớ để có thể sử dụng như là chuẩn khi giải mã các ảnh tiếp theo .
V.2.6. Tiêu chuẩn nén MPEG 1
Tiêu chuẩn MPEG-1 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 11172-1)
Phần 2: Nén video (ISO/IEC 11172-2)
Phần 3: Nén Audio (ISO/IEC 11172-3)
Phần 4: Kiểm tra (ISO/IEC 11172- 4)
Để giảm mức độ phức tạp và giá thành bộ giải mã, trong MPEG 1 một số tham số được mặc định thành hằng số như sau:
Tham số
Giá trị cực đại
Độ rộng ảnh
768 điểm
Chiều cao ảnh
576 dòng
Tốc độ ảnh
30 ảnh/s
Số lượng MB (Macroblock)
396
Giải vevto chuyển động
± 64 điểm
Kích thước bộ đệm đầu vào
327.680 bit
Tốc độ bit
1,8 Mbps
Bảng 3.1 : Các tham số mặc định trong chuẩn MPEG-1
Sử dụng cả hai dạng thức nén:
- Nén Intra: biến đổi DCT, lượng tử hoá, mã hoá VLC cho ảnh I.
- Nén Inter: ước lượng chuyển động, tạo dự báo có bù chuyển động cho ảnh B và ảnh P.
MPEG 1 có một số tiêu chuẩn cơ bản như sau:
- Chỉ có một cấu trúc lấy mẫu 4:2:0.
- Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặc định và cỡ 4095 x 4095 dùng tham số đầy đủ.
- Độ chính xác mẫu đầu vào 8 bit.
- Độ chính xác lượng tử hoá và DCT: 9 bit.
- Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC.
- Lượng tử thích nghi cho lớp macroblock (16x16 điểm).
- Độ chính xác cực đại của hệ số DC là 8 bit.
- Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi.
- Sử dụng khung P và B.
- Độ chính xác dự báo chuyển động là nửa điểm.
- Tốc độ bit tối đa là 1,85 Mbps khi dùng tham số mặc định cho ảnh 720x576 và 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095.
MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìm kiếm nhanh thuận ngược theo dòng bit đã nén, phát lại ngược dòng video và khả năng dời bỏ dòng bit nén.
Hệ thống nén MPEG-1
Bộ phân loại Inter-Intra
DCT
Bộ cảm nhận đặc tính mã hoá
Mã hoá VLC và ghép kênh
Bộ nhớ đệm
Lượng tử hoá
Lượng tử hoá thích nghi
Giải lượng tử hoá
ICDT
Dự báo có bù chuyển động
Ước lượng chuyển động
Lưu trữ ảnh tương lai
Lưu trữ ảnh quá khứ
Dòng
video vào
DCT: Biến đổi cosin rời rạc
ICDT:Biến đổi cosin rời rạc ngược
Tham số lượng tử
Vecto chuyển động
Write Previous
Loại ảnh(I,B,P)
Thông tin về
loại ảnh(I,B,P)
INTER/INTRA
Write Future
Hình 3.19 : Sơ đồ khối bộ mã hoá MPEG I
INTER/INTRA
INTER/INTRA
Tham số lượng tử
Vecto chuyển động
INTER/ INTRA
Loại ảnh
Hình 3.20 : Sơ đồ khối bộ giải mã MPEG 1
Bộ nhớ đệm
Giải mã và tách kênh
IDCT
Giải lượng tử hoá
Lưu trữ ảnh quá khứ
Lưu trữ ảnh tương lai
Dự báo có bù chuyển động
INTER/ INTRA
INTER/INTRA
Vecto chuyển động
Dòng video ra
Dòng
bít
Vecto chuyển động
Tham số lượng tử
Loại ảnh
(I,B,P)
Loại ảnh (I,B,P)
Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng như các tham số quy định bước lượng tử và vecto chuyển động. Vecto chuyển động này được bên thu sử dụng để tạo dự báo có bù chuyển động tương tự như phía phát.
Giá trị sai số dự báo từ bên thu sau khi giải lượng tử và biến đổi DCT ngược được cộng với giá trị dự báo. Kết quả thu được ảnh cần hồi phục.
V.2.7. Tiêu chuẩn nén MPEG 2
Tiêu chuẩn MPEG-2 (ISO/IEC 13818) là sự phát triển tiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR- 601 qui định.
MPEG 2 gồm 4 phần:
- Phần 1: Hệ thống (ISO/IEC 13818-1): xác định cấu trúc ghép kênh audio, video và cung cấp đồng bộ thời gian thực.
- Phần 2: Video (ISO/IEC 13828-2): xác định những thành phần mã hóa đại diện cho dữ liệu video và phân loại xử lý giải mã để khôi phục lại khung hình ảnh.
- Phần 3: Audio (ISO/IEC 13818-3): mã hóa và giải mã dữ liệu âm thanh.
- Phần 4: Biểu diễn (ISO/IEC 13818-3): định nghĩa quá trình kiểm tra các yêu cầu của MPEG-2 .
So với MPEG-1 thì MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh và độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit. Khả năng co giãn dòng bit của MPEG-2 cho phép giải mã một phần dòng bit mã hóa để nhận được ảnh khôi phục có chất lượng tuỳ thuộc mức độ yêu cầu.
Sau đây là một số đặc điểm chủ yếu của tiêu chuẩn này :
Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình.
Cú pháp dòng bit MPEG-2 là sự mở rộng của dòng bit MPEG-1.
Nén video MPEG-2 tương hợp với nén video MPEG-1. Được thể hiện qua 4 hình thức tương hợp :
Tương hợp thuận: bộ giải mã MPEG-2 có khả năng giải mã dòng bit (hoặc một phần dòng bit MPEG-1).
Tương hợp ngược: bộ giải mã MPEG-1 có khả năng giải mã được một phần dòng bit MPEG-2.
Tương hợp lên: bộ giải mã độ phân giải cao có khả năng giải mã được dòng bit của bộ mã hoá có độ phân giải thấp.
Tương hợp xuống: bộ giải mã độ phân giải thấp có thể giải mã được một phần dòng bit của bộ mã hóa độ phân giải cao.
MPEG-2 hỗ trợ khả năng co giãn (scalability): co giãn không gian, co giãn tỷ lệ tín hiệu và tạp âm SNR (Signal to Noise Ratio), co giãn phân chia số liệu...
Ngoài ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm:
+ Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 và 4:2:0.
+ Hệ số DC được mã hóa với độ chính xác đặc biệt.
+ Bảng lượng tử riêng biệt cho các thành phần chói và màu nên lợi dụng được đặc điểm của mắt người ít nhạy cảm hơn với tín hiệu màu.
+ Cho phép cả hai dạng quét: quét xen kẽ và quét liên tục.
+ Có khả năng hồi phục lỗi.
Cú pháp đầy đủ của MPEG-2 được thể hiện qua các tập con gọi là profile, phù hợp với các lĩnh vực áp dụng. Mỗi profile lại bao gồm từ 1 đến 4 mức độ hạn chế về độ phân giải không gian, tốc độ bit.
V.2.7.1. Cấu trúc dòng bit video MPEG-2
Dòng bit MPEG-2 về cơ bản tương hợp với MPEG-1, tức là cũng gồm cấu trúc 6 lớp .
Tên gọi và chức năng các lớp được liệt kê lại như sau:
Lớp
Chức năng
Lớp chuỗi (Sequence Layer)
Đơn vị nội dung
Lớp nhóm ảnh (GOP Layer)
Đơn vị truy nhập ngẫu nhiên dòng video mã hóa.
Lớp ảnh (Picture Layer)
Đơn vị mã hóa cơ bản
Lớp lát (Slice Layer)
Đơn vị tái đồng bộ
Lớp Macro Block (MB Layer)
Đơn vị bù chuyển động
Lớp khối (Block Layer)
Đơn vị chuyển đổi DCT
Bảng 3.2 : Dạng lớp của cú pháp dòng bit MPEG-2
- Lớp chuỗi là đại diện mã hóa cho một chuỗi ảnh (Video Sequence).
- Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên. ảnh bắt đầu của chuỗi bao giờ cũng là một ảnh I. ảnh I này cung cấp điểm truy cập vào dòng bit mã hóa.
- Lớp lát có chức năng hồi phục đồng bộ. Khi dòng bit có lỗi, bộ giải mã có thể bỏ qua slice có lỗi và bắt đầu bằng một slice mới. Mỗi lát chứa một hoặc một số MB.
- Mỗi macro block (MB) là một đơn vị được ước lượng chuyển động và có vecto chuyển động riêng trong phần header của nó.
- Lớp khối là lớp thấp nhất. Mỗi khối là một đơn vị DCT gồm 64 hệ số (1 hệ số DC và 63 hệ số AC) của khối ảnh I hoặc khối sai số dự báo (ảnh P, B).
So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng. Do đó có 2 hướng đi trong dòng bit MPEG-2 như hình vẽ dưới đây: hoặc theo quy trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2.
Đầu đề chuỗi
Sequence header
Chuỗi mở rộng Extended Sequence
MPEG-1
ISO/IEC 11172-2
Dòng bit
Hình 3.21 : Cú pháp dòng bít MPEG-2
Chuỗi Header
GOP mở rộng
GOP Header
Chuỗi mở rộng
ảnh mở rộng
Header ảnh
Lớp MB
Lớp Slice
Lớp Block
Hình 3.22: Cấu trúc dòng bit video MPEG 2
V.2.7.2. Đặc tính và mức
Phạm vi ứng dụng của MPEG-2 rất rộng. Mỗi ứng dụng đòi hỏi mức độ phức tạp khác nhau. Bởi vậy, MPEG-2 định nghĩa các mức (Level) và các tập con (Profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit và level xác định các tham số hạn chế độ phân giải không gian, tốc độ bit.
Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) và high (cao). Kích cỡ ảnh quy định bởi 4 mức tương ứng sau:
Level
Cỡ khung
Low
352x288 (bằng 1/4 cỡ ảnh TV chuẩn)
Main
720x576 (cỡ ảnh TV chuẩn)
High-1440
1440x1152
High
960x576 hoặc 1920x1152
Bảng 3.3 : Mức ảnh trong MPEG-2
Có 5 profile là: Simple (đơn giản), Main (chính), SNR scalable (co giãn SNR), Spatial scalable (có khả năng co giãn không gian) và High profile.
Nén Audio
I. Cơ sở của nén Audio
Nén tín hiệu audio được thực hiện dựa trên cơ sở là mô hình tâm lý thính giác của con người, sự hạn chế về mặt cảm nhận và hiện tượng che lấp các thành phần tín hiệu âm.
I.1. Mô hình tâm lý thính giác.
Hệ thống thính giác của con người HAS (Human Auditory System) có đặc điểm như một bộ phân tích phổ. Nó chia dải phổ âm thanh nghe thấy thành các băng tần gọi là các “băng tới hạn” (critical bands) như một dãy các bộ lọc thông dải. Các băng này có bề rộng dải thông là 100 Hz với các tần số dưới 500 Hz và tăng theo tần số tín hiệu với các tần số lớn hơn 500 KHz. Bề rộng dải thông này tăng tới vài KHz khi tần số tín hiệu lớn hơn 10 KHz. Có thể mô hình hoá hệ thống cảm nhận của con người bằng 26 bộ lọc thông dải liên tiếp có bề rộng dải thông như đã nói ở trên.
Khi tín hiệu âm thanh bao gồm các tần số gần kề nhau, hệ thống thính giác của con người (HAS) sẽ tổ hợp chúng thành một nhóm có năng lượng cân bằng. Ngược lại, nếu âm thanh bao gồm nhiều tần số khác biệt nhau, chúng sẽ được xử lý tách biệt và độ lớn âm thanh được xác định.
Độ nhạy của HAS giảm tại các tần số cao và tần số thấp. Điều này có nghĩa rằng đối với các mức âm thấp thì sự thay đổi trong cảm nhận của con người là rất quan trọng và sẽ giảm dần tại các mức âm cao.
I.2. Sự che lấp tín hiệu Audio
Hệ thống thính giác của con người còn có một đặc điểm vô cùng quan trọng, đó là tính che lấp “masking”. Có hai dạng che lấp, đó là: che lấp thời gian và che lấp tần số. Tiến hành thực nghiệm đối với hệ thống thính giác, người ta đã xây dựng được đặc tuyến che lấp trong miền thời gian và trong miền tần số.
Che lấp tần số:
Sự che lấp về mặt tần số là hiện tượng một âm thanh nghe thấy ở tần số này bỗng trở nên không cảm nhận được do ngưỡng nghe thấy bị dâng lên vì sự có mặt của một âm thanh ở tần số khác có cường độ mạnh hơn.
Sự che lấp về tần số được minh hoạ bằng hình vẽ sau đây:
500
1k
5k
10k
20k
50
100
110
100
90
80
70
60
50
40
30
20
10
Mức áp suất âm_SPL (dB)
Tần số (Hz)
Ngưỡng
tuyệt đối
Tín hiệu không nghe thấy
Ngưỡng nghe được bị biến đổi bởi âm che lấp
10
0
Kết quả che lấp tạo bởi âm 1KHz,
65 dB
Kết quả che lấp tạo bởi
âm 1KHz,
45 dB
Hình 3.23 :Ngưỡng nghe thấy tuyệt đối và ngưỡng che phủ tần số
Để tai người có thể nghe thấy, bất cứ một âm thanh ở tần số đơn nào cũng phải có mức áp suất âm lớn hơn một giá trị ngưỡng xác định. Tập hợp tất cả các giá trị ngưỡng này đối với tất cả các âm đơn trong dải tần nghe được tạo nên một đường cong gọi là “ngưỡng nghe thấy tuyệt đối” (absolute hearing threshold), là đường đậm nét ở hình vẽ trên. Tất cả các âm thanh nằm dưới đường cong này đều không có khả năng được con người cảm nhận.
Do sự xuất hiện của một âm thanh có cường độ cao ở một tần số nào đó, sẽ làm đường cong này sẽ biến đổi đi. Trong ví dụ trên, âm 1 KHz với mức áp suất âm 45 dB đã làm ngưỡng nghe thấy tuyệt đối dâng lên 27dB. Điều này có nghĩa những tạp âm dưới 27 dB là không nghe thấy.
Nếu mức âm 1 KHz tăng lên tới 65 dB thì mức che phủ sẽ tăng lên tới 55dB, giá trị vi sai lúc này chỉ còn 10 dB và có thể được mã hoá chỉ bằng 2 bít.
Việc che phủ tần số trước và sau cũng rất quan trọng. Như trên hình vẽ, âm 1 KHz cũng làm ngưỡng nghe thấy của các âm tần số xung quanh dâng lên. Sự che phủ tần số phía sau quan trọng hơn và tăng theo mức âm. Điều này cho phép giảm độ chính xác mã hoá cho những tần số tín hiệu xung quanh âm che phủ. Những âm đơn tần xung quanh 1 KHz có mức âm nhỏ hơn đường cong che phủ sẽ không có khả năng cảm nhận và không cần thiết phải mã hoá mà vẫn không làm ảnh hưởng tới chất lượng cảm nhận của con người. Hệ thống nén dựa trên đặc điểm này được gọi là hệ thống nén theo thính giác.
Sự che phủ thời gian:
50
100
150
200
300
-50
0
110
100
90
80
70
60
50
40
30
20
10
Mức cảm nhận (dB)
Thời gian(ms)
250
0
Tín hiệu che lấp
Che phủ trước
Che lấp liên tục
Che phủ sau
Hình 3.24 : Sự che lấp về thời gian
Sự che phủ thời gian là hiện tượng tai người chỉ cảm nhận được âm sau khi âm đó bắt đầu khoảng 200 ms và có cảm tưởng âm thanh còn kéo dài khoảng 200ms nữa sau khi âm thanh đã dứt. Ngoài ra, thính giác cũng không phân biệt được khoảng ngừng nhỏ hơn 50 ms giữa hai âm thanh giống nhau đi liền nhau.
I.3. Nén Audio theo tiêu chuẩn AC-3:
I.3.1. Giới thiệu:
Theo tiêu chuẩn nén Audio AC-3, tín hiệu Audio được lấy mẫu với tần số 48 MHz và được khóa với xung đồng hồ (Clock) 27 MHz.
Nếu tín hiệu đầu vào là tín hiệu tương tự, tần số lấy mẫu của bộ biến đổi A/D bằng 48 MHz. Nếu tín hiệu đầu vào là tín hiệu số và tần số lấy mẫu ban đầu khác 48 KHz, bộ mã hóa Audio phải chuyển đổi sang tốc độ 48 KHz. Tốc độ lấy mẫu tại đầu vào của bộ mã hóa Audio phải đồng bộ với xung đồng hồ của tín hiệu Video để đảm bảo sự làm việc của toàn hệ thống.
Tín hiệu đầu vào nói chung được lượng tử hóa tối thiểu là 16 bit, tuy nhiên hệ thống nén Audio có thể tải tín hiệu Audio có độ phân giải tới 24 bit. Về nguyên tắc, đầu ra của bộ mã hóa Audio là dòng cơ sở ES (Elementary Stream) và sau đó được tạo thành dòng cơ sở đóng gói PES (Packetized Elementary Stream) ở công đoạn tiếp theo.
Mã hóa Audio
Đóng gói
Điều chế RF
Giải mã Audio
Mở gói
PES
Giải điều chế RF
Kênh truyền
Audio vào
Audio ra
Dòng ES
Dòng PES
RF
Hình 3.25 : Hệ thống Audio trong truyền hình số
Song tùy từng hãng sản xuất, bộ mã hóa có thể đảm bảo nhận cả công việc đóng gói dòng dữ liệu. Trong trường hợp đó, tín hiệu tại đầu ra của bộ mã hóa đã có dạng PES.
I.3.2. Nén Audio theo chuẩn AC-3:
Chuẩn nén Audio số theo chuẩn AC-3 được quy định trong ATSC Doc. Mục đích chính của nén Audio là biểu thị tín hiệu Audio bằng một số lượng bit ít đến mức có thể, trong khi vẫn bảo toàn được chất lượng cần thiết cho mỗi ứng dụng. Nén Audio có hai ứng dụng chủ yếu: nén để sử dụng hiệu quả nhất độ rộng dải thông và giảm tối thiểu nhu cầu lưu trữ. Trong hệ thống truyền hình hai ứng dụng này đều hết sức cần thiết.
Nén Audio bao gồm 3 công đoạn chính:
Công đoạn thứ nhất: Tín hiệu Audio thay vì được biểu diễn trong miền thời gian được chuyển đổi qua miền tần số. ở miền này, công nghệ nén thực hiện hiệu quả hơn dựa trên cơ sở “ tâm lý âm thanh”. Các hệ số tần số được lượng tử hóa thô (Coarsely) bởi lẽ tạp do lượng tử hóa cũng sẽ có cùng tần số như tín hiệu Audio. Tỉ lệ S/N cũng không đòi hỏi cao nhờ phương pháp “che mặt nạ” dựa trên hiệu ứng “ tâm lý âm thanh”.
Công đoạn thứ hai: Phép hoạch định bit (Bit Allocation) dựa trên mô hình “tâm lý âm thanh” của con người, xác định giá trị S/N cần thiết đối với mỗi hệ số tần số.
Công đoạn thứ ba: Các hệ số tần số được lượng tử hóa thô với mức độ chính xác cần thiết và tạo nên dòng cơ sở ES.
Đơn vị cơ sở của tín hiệu Audio đã được mã hóa được gọi là khung đồng bộ AC-3 (AC-3 Sync Frame), mỗi khung chứa 1536 mẫu Audio. Dữ liệu cơ sở ES có chứa thông tin cần thiết cho phép bộ giải mã mở gói giải lượng tử và tái tạo lại các hệ số tần số ban đầu. Băng lọc tổng hợp (Synthesis Filterbank) thực hiện quá trình ngược lại của băng lọc phân tích (Analysis Filterbank) và chuyển đổi các hệ số tần số mới được tái tạo, trở lại dạng tín hiệu trong miền thời gian ban đầu.
Băng lọc phân tích
Hoạch định bit
Lượng tử hóa
Băng lọc tổng hợp
Giải lượng tử
Hoạch định bit
Kênh truyền
Audio vào
Audio ra
Hệ số tần số
Dòng ES
Hình 3.26: Sơ đồ khối hệ thống nén và giải nén Audio
Dòng ES
Quá trình chuyển đổi tín hiệu Audio từ miền thời gian sang miền tần số đòi hỏi tín hiệu Audio được đóng vào từng khối (Block), mỗi khối có 512 mẫu bao gồm 256 mẫu mới và 256 mẫu trước đó.
Mỗi mẫu Audio được chứa trong hai Block, như vậy số lượng mẫu được xử lý tăng gấp đôi. Sự chồng lấn (Overlapping) lên nhau của các khối nhằm tránh khả năng nghe rõ của hiệu ứng nhân tạo (Artifacts). Các khối Audio mới được hình thành sau mỗi 5,33ms. ( 256.T = )
Mỗi nhóm gồm 6 khối mã lại thành một khung đồng bộ AC-3 với 6 khối x 256 mẫu = 1536 mẫu.
Cú pháp dòng bit (Bit Stream Syntax)
Dòng bit Audio bao bao gồm sự lặp lại của các khung dữ liệu Audio được gọi là khung đồng bộ AC-3 (AC-3 Sync Frame). Mỗi khung đồng bộ AC-3 chứa các thông tin:
- Thông tin đồng bộ SI (Synchronization Information)
Thông tin về dòng bit BSI (Bit Stream Information)
32 ms dữ liệu Audio đã mã hóa.
Mã kiểm tra độ dư thừa có chu kỳ CRC (Cyclic Ređunancy Check)
Các khung đồng bộ có cùng độ dài (cùng dung lượng bit) và chứa khối Audio đã mã hóa.
Khung đồng bộ có thể được coi như một đơn vị truy cập Audio (Audio Access Unit)
Trong SI có một từ mã đồng bộ 16 Bit, có chỉ thị về tốc độ lấy mẫu (trong hệ thống truyền hình số, tốc độ lấy mẫu bằng 48 KHz) và chỉ thị về kích thước của khung Audio (tốc độ Bit).
Mỗi khung đồng bộ AC-3 được kết thúc bởi 16 Bit mã sửa sai CRC. Bộ giải mã sử dụng mã này để xác định khả năng dòng dữ liệu có bị thiếu hụt hoặc tổn hại. Ngoài ra mạch giải mã còn có thể sử dụng cờ báo lỗi (Error Flag) của hệ thống truyền tải để phát hiện lỗi.
Trong trường hợp giải mã sai, mạch giải mã có thể sửa lại hoặc là cắt bỏ.
Chuẩn hóa âm lượng:
Trong các hệ thống truyền hình số, việc tạo nên sự đồng đều về âm lượng cho tất cả các chương trình là hết sức cần thiết. Người xem thường rất khó chịu nếu âm lượng thay đổi mỗi khi chuyển chương trình, hoặc giữa các tiết mục của cùng một chương tình.
Một trong những âm thanh thường gặp ở tất cả các chương trình là giọng nói. Phấn đấu để đạt được một sự hài hòa tương đối về âm lượng khi đối thoại giữa các chương tình khác nhau là mục tiêu cần phải đạt được.
Chuẩn nén Audio AC-3 có khả năng thực hiện mục tiêu đó. Dòng cơ sở AC-3 có chứa các chỉ số về mức khi đối thoại (Dialnorm)
Máy thu truyền hình số ( và tất cả các bộ giải mã AC-3 khác) có khả năng sử dụng chỉ số Dialnorm này để tự điều chỉnh mức âm thanh đầu ra.
Như vậy các chương trình khác nhau đều có cùng một mức âm thanh đối thoại như nhau.
Trong phần thông tin về dòng Bit BSI (Bit Stream information) của khung đồng bộ (AC-3 Sync Frame) có chứa trường chỉ thị mức đối thoại trung bình của chương trình Audio đã mã hóa.
SI
BSI
AB0
AB1
AB2
AB3
AB4
AB5
AUX
CRC
SI
BSI
Hình 3.27: Khung đồng bộ AC-3 (AC-3 Sync Frame)
Có hai phương pháp chính để đảm bảo giá trị Dialnorm được đặt chính xác:
Lựa chọn mức đối thoại thích hợp cho tất cả các chương trình và điều chỉnh mức âm thanh của các chương trình gốc phù hợp với mức này khi mã hóa AC-3. Phù hợp với mức Dialnorm đồng nghĩa với việc một số chương trình không bao giờ đạt tới mức 100% và một số khác phải đảm bảo không bị vượt quá mức 100%.
Cho phép tất cả các chương trình được mã hóa với các mức có sẵn. Sự khác biệt về mức được sửa thông qua việc điều chỉnh giá trị mã hóa các Dialnorm của mỗi chương trình.
Phương pháp này thực tế hơn bởi thiết bị điều khiển từ xa bằng máy tính cho các thiết bị mã hóa trở nên thông dụng hơn.
Chương trình chính, chương trình kết hợp và dịch vụ đa ngôn ngữ:
Dòng cơ sở AC-3 chỉ chứa đựng nội dung của một chương trình Audio. Để truyền tải nhiều dịch vụ Audio phải sử dụng nhiều dòng cơ sở.
Mỗi dòng cơ sở được truyền tải với một PID (Program Identification) duy nhất. Mỗi loại hình dịch vụ Audio được mã hóa thành các dòng cơ sở ES riêng biệt. Loại hình dịch vụ được truyền tải trông mỗi dòng ES được xác định bởi trường bit Bsmod (Bsmod Bit Field). Có hai loại hình dịch vụ chính (Main Service) và 6 loại hình dịch vụ kết hợp (Associated Servise). Mỗi loại hình dịch vụ kết hợp có thể được gắn với một hoặc nhiều dịch vụ chính.
Dịch vụ chính CM:
Dịch vụ chính CM chứa đựng toàn bộ chương trình Audio bao gồm : đối thoại, âm nhạc, kỹ xảo. Dịch vụ CM thường bao gồm 1 đến 5,1 kênh Audio, các ngôn ngữ khác nhau được cung cấp bởi các dịch vụ CM khác nhau.
Dịch vụ chính ME:
Dịch vụ ME chứa đựng âm nhạc và kỹ xảo âm thanh của một chương trình Audio. Dịch vụ ME có thể bao gồm 1 đến 5,1 kênh Audio. Phần đối thoại gốc của chương trình gốc được loại ra, thay vào đó là chương trình D của dịch vụ kết hợp. Nhiều chương trình D với các ngôn ngữ khác nhau được kết hợp trong một dịch vụ ME duy nhất.
Dịch vụ kết hợp VI:
Dịch vụ VI thường là ngôn ngữ kể chuyện miêu tả tòan bộ nội dung hình ảnh của chương trình. Trong trường hợp này VI là một kênh Audio duy nhất.
Dịch vụ kết hợp HI:
Dịch vụ kết hợp HI chỉ bao gồm một kênh đối thoại duy nhất để phục vụ các đối tượng khiếm thính. Những người này thường không nghe rõ nội dung đối thoại thì trong chương trình có kèm theo âm nhạc và kỹ xảo âm thanh.
Dịch vụ kết hợp D:
Dịch vụ kết hợp D được sử dụng khi có nhu cầu truyền đồng thời nhiều kênh Audio bằng các ngôn ngữ khác nhau. Khi sử dụng dịch vụ D, dịch vụ thường là ME (âm nhạc và kỹ xảo). Nếu dịch vụ chỉ có một kênh duy nhất, dịch vụ ME và dịch vụ D cùng được giải mã để có thể cấu thành chương trình Audio hoàn chỉnh.
Dịch vụ C:
Dịch vụ kết hợp C tương tự như dịch vụ D, ngoại trừ việc thay vì truyền tải chương trình bình luận tùy chọn. Dịch vụ C có thể là một kênh duy nhất, chứa đựng nội dung bình luận. CM và C được giải mã đồng thời sẽ cho phép người khán giả nghe được thêm chương trình bình luận.
Dịch vụ kết hợp E:
Dịch vụ kết hợp E cho phép cài thêm những thông báo khẩn cấp. Bất kể khi nào dịch vụ E có mặt, mạch giải mã ngừng giải mã dòng dịch vụ chính và chỉ giải mã dịch vụ D. Dịch vụ E có thể được sử dụng bởi tổ chức phất thanh, truyền hình như một kênh ưu tiên cho dù không phải là các kênh thông tin khẩn cấp.
Dịch vụ VO:
Dịch vụ VO tương tự như dịch vụ E, ngoại trừ việc thay vì dịch vụ E thay thế hoàn toàn dịch vụ Audio chính, dịch vụ VO được giải mã đồng thời với dịch vụ chính và chỉ trộn vào kênh giữa của dịch vụ Audio chính.
Tốc độ Bit
Cú pháp của chuẩn nén Audio AC-3 cho phép tốc độ Bit thay đổi từ 32 Kbps tới tối đa 640 Kbps cho mỗi dòng cơ sở ES.
Tốc độ Bit sử dụng trong truyền hình số bị giới hạn nhằm làm giảm kích thước bộ đệm đầu vào (Input Buffer) của bộ giải mã và giá thành máy thu.
Dịch vụ Audio chính hoặc Audio kết hợp (gồm các thành phần cấu thành một chương trình hoàn chỉnh) có tốc độ tối đa 384 Kbps. Dịch vụ Audio kết hợp đơn kênh giải mã đồng thời với dịch vụ chính có tốc độ Bit tối đa 128 Kbps.
Dịch vụ kết hợp hai kênh thoại giải mã đồng thời với dịch vụ chính có tốc độ Bit nhỏ hơn hoặc bằng 192 Kbps. Ngoài ra tốc độ Bit của toàn hệ thống bao gồm dịch vụ chính và tất cả các dịch vụ kết hợp được truyền và giải mã đồng thời không được lớn hơn 512 Kbps.
I.3.3. Các đặc tính của AC-3 :
Nén Audio theo chuẩn AC-3 được sử dụng rộng rãi trong lĩnh vực phát thanh truyền hình số mặt đất ATSC và gần đây kể cả những nước đã lựa chọn tiêu chuẩn truyền hình số mặt đất DVB-T như Australia, Singapore thay vì dùng chuẩn nén Audio MPEG cũng chọn AC-3.
Những đặc tính quan trọng của tiêu chuẩn nén Audio số AC-3 bao gồm:
Đạt được tốc độ dòng số liệu từ 32 đến 640 Kbit/s .
Chu kỳ khung là 32 ms cho kênh 48 KHz ( 384x4x20,83 ms = 24 ms).
Hệ số tỉ lệ là 4,5 bit trên một băng.
Phân phối bit theo phương thức thích ứng trước.
Chế độ mono cho mã hóa kênh 5,1.
Mở rộng trong các ứng dụng của người sử dụng.
Tiêu chuẩn nén AC-3 có nhiều ứng dụng trong thực tế như HDTV, CATV, DVB, Multimedia, Internet…
Có khả năng trộn tín hiệu theo yêu cầu của người nghe âm thanh stereo hay mono .
Mức âm lượng ổn định khi chuyển kênh, chuyển giữa các chương trình, các chương trình đa kênh và stereo.
Chương IV: Truyền dẫn tín hiệu số
I. Hệ thống ghép kênh và truyền tải
I.1. Hệ thống truyền tín hiệu MPEG 2
Hệ thống MPEG-2 sử dụng cấu trúc dữ liệu dạng gói như dữ liệu của các mạng truyền thông. Các gói dữ liệu luôn luôn bao gồm phần đầu đề (Header) và phần tải (Payload).
- Phần header chứa thông tin cần thiết để xử lí dữ liệu ở phần payload (ví dụ như thông tin phân loại ảnh trong phần header gói ảnh).
- Kích thước phần payload có thể cố định hoặc thay đổi .
Payload
Packet header
Hình 4.1: Cấu trúc gói dữ liệu
Packet payload
Trong tiêu chuẩn MPEG-2, dòng bit tại đầu ra bộ mã hoá Video/Audio được gọi là dòng sơ cấp ES (Elementary Stream) có đơn vị truy cập là một ảnh nếu là dòng sơ cấp Video và là một khung audio trong dòng Audio cơ bản.
Các dòng ES sẽ được đóng gói trở thành dòng cơ bản đóng gói PES (Packetized Elementary Stream). Cũng như mọi dạng gói thông tin khác, PES bao gồm phần header và phần payload. Phần payload của PES có độ dài thay đổi. Các gói PES sau đó được chia ra thành các gói nhỏ hơn có độ dài cố định gọi là gói truyền tải TSP (Transport Stream Packet).
Mỗi loại gói cấu trúc nên một dạng dòng dữ liệu sử dụng cho những ứng dụng khác nhau. Các gói PES cấu thành dòng chương trình (Program Stream). Nếu chúng được chia nhỏ thành các gói TSP thì tạo thành dòng truyền tải (Transport Stream).
ở phía phát thực hiện đóng gói và ghép kênh. Còn bên thu sẽ mở gói và giải mã.
Hình 4.2 : Cấu trúc phân lớp hệ thống MPEG-2
Mã hoá/ nén
Định dạng nguồn
Bộ đóng gói
Ghép kênh tạo dòng chương trình
Ghép kênh tạo dòng truyền tải
Giải nén/ giảimã
Giải định dạng nguồn
Bộ mở gói
Phân kênh dòng chương trình
Phân kênh dòng
truyền tải
Audio, Video, Data
Lớp nén (Compress layer)
Lớp hệ thống (System layer)
Mã hóa nén
MPEG-2
Giải nén, giải mã
MPEG-2
Dòng cơ sở
ES
Dòng cơ sở đóng gói PES
Dòng chương trình PS
Dòng truyền tải TS
MPEG-2 trong lớp tăng cường của mình là System Layer, xác định cú pháp kết nối các dòng video, audio riêng lẻ thành các dòng chương trình (Program Stream) hoặc dòng truyền tải (Transport Stream) cũng như các thông tin cần thiết cho phân kênh và đồng bộ tại bên thu. Cuối lớp hệ thống (System Layer), các thông tin đồng bộ tham chiếu SCR (System Clock Reference) và tem thời gian trình diễn (Presentation Time Stamp) được xen vào dòng bít.
I.2. Dòng dữ liệu đóng gói, dòng chương trình và dòng truyền tải
- Dòng dữ liệu đóng gói PES (Packetized Elementary Stream)
Dòng Video, Audio cơ bản qua bộ đóng gói sẽ được phân tách thành các gói PES với kích cỡ bất kỳ. Nội dung của PES khởi nguyên từ dữ liệu âm thanh, hình ảnh MPEG-2 gốc.
Sau khi được đóng gói, các dòng video, audio cơ bản (Elementary Stream) trở thành các dòng được đóng gói PES (Packetized Elementary Stream).
Cấu trúc gói PES trong tiêu chuẩn MPEG-2 như sau:
Số Byte
Mục đích
3
SC
Bắt đầu mã
1
SI
Xác định dòng
2
PL
Độ dài gói
2
BS
Dung lượng bộ đệm
Hình 4.3 : Cấu trúc gói PES
Dữ liệu phần Payload
Gói có dung lượng max là 8 Kbyte
8 byte
header
SC SI PL BS
- Dòng chương trình PS (Program Stream) và dòng truyền tải TS (Transport Stream)
Audio
Audio
Video
PES header packet header (header gói)
Gói PES a) Dòng chương trình
Audio
Audio
Video
TS header hay trasnpart header b) Dòng truyền tải
PES header Gói TS
Video
Video
Audio
Hình 4.4 : So sánh dòng chương trình và dòng truyền tải
+ Dòng chương trình:
Dòng chương trình bao gồm các gói PES có độ dài thay đổi. Dòng chương trình được cấu thành từ sự ghép nối các dòng video và audio đóng gói (PES), được thiết kế để truyền trên các kênh tương đối ít bị nhiễu ví dụ trong các ứng dụng CD-ROM.
+ Dòng truyền tải :
Nếu chia các gói PES có độ dài khác nhau thành các gói TS có độ dài không đổi (mỗi gói TS được bắt đầu bằng TS header) và truyền các gói này đi, ta sẽ có dòng truyền tải TS (Transport Stream).
Các gói TS có độ dài không đổi là 188 byte, trong đó có chứa thông tin định thời, đồng bộ cũng như công cụ chuẩn xác độ jitter để đảm bảo truyền dẫn xa. Dòng TS có khả năng chống lỗi cao, được thiết kế để truyền trên các kênh truyền có nhiễu như: kênh truyền hình thông thường (thông qua trạm mặt đất) cũng như các kênh truyền hình cáp.
Hình dưới đây mô tả quá trình ghép kênh Audio, Video tạo thành dòng truyền tải:
Hình 4.5 : Định dạng dòng truyền tải MPEG-2
Chuỗi Video # n-1
Chuỗi Video # n
Chuỗi Video # n+1
Chuỗi Audio # n-1
Chuỗi Audio # n
Chuỗi Audio # n+1
Video
Audio
Video
Audio2
Audio1
Dữ liệu
Video
Video
Audio
Video
Audio
Dòng chương
trình #1
Dòng chương
trình #2
Dòng chương
trình #3
188 byte
188 byte/gói
188 byte/gói
Gói PES ( độ dài thay đổi, lớn hơn 64 kbit )
Gói PES ( độ dài thay đổi, lớn hơn 64 kbit )
Dòng sơ cấp Video đã đóng gói
Dòng sơ cấp Video
Các gói truyền tải Video
Dòng sơ cấp Audio
Dòng sơ cấp Audio đã đóng gói
Các gói truyền tải Audio 1
Dòng truyền tải đa chương trình
I.3. Ưu điểm của dòng truyền tải MPEG-2
- Cấp phát dung lượng động:
Các gói TS với độ dài cố định tạo khả năng linh hoạt trong việc cấp phát dung lượng kênh giữa các số liệu video, audio cũng như các số liệu phụ.Mỗi gói TS được nhận dạng với số PID thuộc TS header.
- Khả năng co giãn:
Một kênh có dải thông rộng hơn có thể được khai thác tối đa bằng cách sử dụng nhiều dòng sơ cấp ES tại đầu vào bộ ghép kênh. Tính chất này rất có giá trị khi phân phối trên mạng cũng như cung cấp khả năng liên vận hành. Hai lĩnh vực liên vận hành cần được quan tâm là:
+ Dòng truyền tải MPEG-2 có thể được truyền trên tất cả các hệ thống thông tin.
+ Hệ thống truyền tải MPEG-2 cũng có thể truyền các dòng bít đã tạo ra bởi các hệ thống thông tin khác.
- Khả năng mở rộng:
Cấu trúc dòng truyền tải cho phép mở rộng được khả năng phục vụ các dịch vụ trong tương lai. Các dòng bit sơ cấp mới có thể được ghép thêm vào dòng truyền tải mà không cần sửa đổi cấu tạo phần cứng phiá phát, chỉ cần gắn thêm các PID mới, khả năng tương hợp ngược vẫn đảm bảo.
- Khả năng chống lỗi và đồng bộ:
Các gói TS có độ dài không đổi tạo nền tảng cho việc kiểm soát lỗi gây ra bởi đường truyền và việc khôi phục lại đồng bộ giữa các dòng bít sơ cấp video, audio đang ghép kênh chung (dựa vào thông tin trong phần header).
- Tính linh hoạt của dòng truyền tải :
Dòng truyền tải MPEG-2 rất linh hoạt, thể hiện dưới hai khía cạnh sau:
+ Các chương trình được định nghĩa như bất kỳ sự kết hợp nào của các dòng bít sơ cấp. Các dòng bít sơ cấp có thể xuất hiện trong một hoặc nhiều chương trình khác nhau. Các chương trình cũng có thể được sửa đổi phù hợp với một số yêu cầu đặc biệt.
+ Nhiều chương trình khác nhau có thể ghép kênh trong cùng một hệ thống truyền tải. Tại phía thu (phía giải mã) chúng sẽ được tách ra dễ dàng.
II. Kỹ thuật điều chế và giải điều chế
II.1. Giới thiệu
Khi phát một luồng số trên kênh vô tuyến, các tín hiệu băng gốc số phải được biến đổi thành các tín hiệu băng tàn vô tuyến. Quá trình này gọi là quá trình điều chế. Quá trình tái tạo lại tín hiệu số từ các tín hiệu trong băng tần vô tuyến gọi là quá trình giải điều chế .
Quá trình điều chế số bao gồm việc khoá chuyển biên độ, tần số hay pha của sóng mang.
Có 3 phương pháp điều chế để truyền dẫn số là điều biên, điều tần, điều pha.
Nếu truyền dòng số bằng điều chế biên độ theo dòng tín hiệu xung có-không thì ta sẽ chứng kiến sự dịch chuyển biên độ sóng cao tần lúc cao, lúc thấp theo tín hiệu số cần truyền.
Nếu truyền dòng số bằng điều chế tần số theo dòng tín hiệu xung có-không thì ta sẽ thấy tần số sóng cao tần lúc cao, lúc thấp tuỳ theo biên độ của dòng xung.
Nếu truyền dòng số bằng điều pha theo dòng tín hiệu xung có-không thì ta sẽ thấy pha của tín hiệu cao tần cũng có sự dịch chuyển.
Mỗi phương pháp điều chế có ưu nhược điểm riêng nên việc lựa chọn phụ thuộc vào tiềm năng thông tin, công suất phát và độ rộng kênh. Việc lựa chọn phải đảm bảo :
+ Tốc độ số liệu cực đại.
+ Xác suất lỗi cực tiểu.
+ Công suất phát cực tiểu.
+ Độ rộng kênh cực tiểu.
+ Khả năng chống nhiễu cức đại.
+ Mức độ phức tạp cực tiểu.
Trong kỹ thuật truyền hình số, người ta sử dụng điều chế khoá chuyển pha và khoá chuyển biên kết hợp gọi là điều chế cầu phương hay điều chế biên độ vuông góc (QAM).
II.2. Khoá dịch biên (ASK)
Sóng điều biên được thiết kế để thay đổi biên độ sóng mang tỷ lệ với băng gốc và thường được tạo ra bằng cách nhân sóng mang hình sin với tín hiệu băng gốc.
Bộ ghép kênh
Sóng đã điều chế
A(t) = S(t). cos(w0t + q)
Tín hiệu gốc
S(t)
Sóng mang
cos(w0t + q)
Hình 4.6 : Sơ đồ nguyên lý điều biên
1
0
1
-1
0
S(t)
A(t)
Hình 4.7 : Khoá ASK tắt-bật
Sóng điều biên A(t) có thể được viết bằng biểu thức sau:
A(t) = S(t). cos(w0t + q)
trong đó S(t) là tín hiệu băng gốc, và sóng mang là cos(w0t + q).
Ta xét một xung đơn cực là tín hiệu băng gốc như chỉ ra ở hình 4.7. Khi xung là 1, sóng mang được đưa ra, khi xung là 0, sóng mang không được đưa ra. Điều biên theo kiểu này được gọi là ASK tắt-bật hoặc khoá tắt-bật (Ook).
1
0
1
-1
0
S(t)
S(t)
Hình 4.8 : ASK đảo pha (PRK)
-1
Xét một xung lưỡng cực là tín hiệu băng gốc. Khi xung là 1, chiều biên độ sóng mang ngược với khi xung là -1. Nói cách khác, pha được đảo. Điều biên theo kiểu này được gọi là ASK đảo pha hay khóa đảo pha (PRK).
II.3. Khoá dịch pha (PSK)
Sóng điều pha có thể nhận được bằng cách thay đổi pha sóng mang tỷ lệ với tín hiệu băng gốc và có thể được diễn tả bằng:
P(t) = cos{w0t + q + (S(t).DF)/2}
ở biểu thức trên, D(j)=2/p là sai pha giữa các ký hiệu lân cận, S(t) là tín hiệu băng gốc nhiều mức, nhận các mức là ±1, ±2, ±3, ... ±n. Nếu n=2, DF=p thì sóng mang điều chế có dạng:
1
0
S(t)
P(t)
Hình 4.9a: 2PSK (BPSK)
-1
1
-1
Hình4.9b: Sơ đồ pha 2PSK
P(t) = cos{w0t + q + S(t).p/2}
ở đây, vì tín hiệu băng gốc S(t) là xung NRZ lưỡng cực nhận 2 giá trị như ở hình 4.9a, nên dạng sóng đã điều chế có dạng giống như ASK đảo pha. Sơ đồ điều chế này sử dụng một trong hai pha lệch nhau 1800 và được gọi là 2PSK hoặc PSK nhị phân (BPSK). Hình 4.9b cho thấy một sơ đồ pha của tín hiệu 2PSK.
0
S(t)
P(t)
Hình4.10a: 4PSK (QPSK)
-1
1
-3
3
1
-1
Hình4.10b: Sơ đồ pha 4PSK
3
-3
Nếu n=2, DF=p và tín hiệu băng gốc là một xung NRZ lưỡng cực nhận 4 giá trị, thì một dạng sóng đã điều chế như ở hình 3.6. Sơ đồ điều chế này sử dụng một trong 4 pha lệch nhau 900, được gọi là 4PSK hoặc PSK cầu phương (QPSK).
Hình 4.10b biểu diễn sơ đồ pha tín hiệu 4PSK. Giống như 2PSK, nếu tín hiệu băng gốc không bị hạn băng, thì tín hiệu 4PSK cũng dịch chuyển tức thời trên vòng tròn đơn vị.
Bên cạnh 2PSK và 4PSK, còn có PSK nhiều pha. Hình 4.11 đưa ra các sơ đồ pha đối với 8PSK và 16PSK.
Hình 4.11: Sơ đồ pha 8PSK và 16PSK
(a) 8PSK
(b) 16PSK
II.4. Điều chế biên độ vuông góc (QAM)
Sóng điều chế biên độ vuông góc có thể nhận được bằng cách thay đổi đồng thời thông số biên độ và pha, nó thực hiện truyền dẫn có hiệu quả các mã nhiều mức.
a. Biểu diễn tín hiệu cầu phương
Trước khi miêu tả điều chế biên độ cầu phương, ta hãy xét sự biểu diễn cầu phương của các tín hiệu. Một tín hiệu hình sin cos(w0t + q) có pha xác định được trình bày bằng định lý cộng của hàm lượng giác như sau:
cos(w0t + q) = cosq.cosw0t - sinq.sinw0t
Trong biểu thức này:
- cosw0t và sinw0t là các tín hiệu hàm sin có hiệu sốpha là 900 và cắt nhau vuông góc trong biểu đồ pha.
- cosq và tương ứng sinq là các hệ số của chúng có thể biểu diễn tất cả các điểm tín hiệu của sóng điều chế nhiều mức bằng cách chọn thích hợp các hệ số này.
b. Biểu diễn điều pha QAM
Bây giờ ta xét biểu thứccầu phương của 4PSK. Sóng 4PSK E(t) có thể được biểu diễn là tổng của hai tín hiệu hình sin vuông góc với nhau như sau:
E(t) = e1(t) + e2(t) = {S1(t). cosw0t + S2(t). sinw0t}/
Nếu e1(t) và e2(t) là các sóng điều biên có hai giá trị thì có thể kết hợp chúng để tạo thành các sóng điều chế có 4 điểm tín hiệu. Vì quỹ tích véc tơ của các tín hiệu bị hạn băng không dịch chuyển trên đường tròn đơn vị nên các sóng thu được khác với tín hiệu 4PSK chuẩn. Tuy nhiên vì chúng có cùng một biên độ cố định tại thời điểm tách sóng nên ta có thể coi chúng như là PSK.
Tín hiệu nhận được bằng cách kết hợp hai sóng điều biên (AM) vuông góc với nhau được gọi là sóng điều biên cầu phương (QAM). Sóng QAM có hai ưu điểm, nó có thể biển diễn được từ hai tín hiệu điều chế biên độ cơ sở và có thể chọn một điểm bất kỳ trên biểu đồ không gian tín hiệu như là một điểm tín hiệu.
c. QAM nhiều trạng thái
QAM cho phép sắp xếp ngẫu nhiên các điểm tín hiệu cũng như dễ dàng thực hiện điều chế và giải điều chế tín hiệu nhờ tính chất cầu phương của các tín hiệu. Ngoài ra, cách sắp xếp thường được sử dụng khi thuộc tính C/N đòi hỏi khá cao. Hình 4.12 cho thấy một cách sắp xếp các điểm tín hiệu đối với 16 mức. Ta thường gọi cách sắp xếp này là 16 QAM. QAM nhiều trạng thái có thể được tạo thành bởi hai tín hiệuđiều chế biên độtrực giao có n mức, vì vậy có 2n điểm tín hiệu.
Khi n=2 thì QAM giống hệt cách sắp xếp tín hiệu của 4PSK. Khi n=4 thì điều chế là 16-QAM, khi n=8 hoặc 16 thì điều chế tương ứng là 64-QAM hoặc 256-QAM.
Hình 4.12: Biểu đồ không gian tín hiệu QAM nhiều trạng thái
Các mức
Các mức
n2 QAM
III. Các phương thức truyền dẫn tín hiệu truyền hình số
Có 3 phương thức để truyền dẫn tín hiệu truyền hình số là:
Truyền qua cáp quang.
Truyền qua vệ tinh.
Truyền qua mặt đất.
III.1. Truyền hình cáp
Truyền hình cáp sử dụng các kênh truyền nằm trong phạm vi dải thông ở cận dưới của băng VHF. Các kênh được chia thành các băng VHF thấp, VHF giữa, VHF cao và siêu băng.
Ưu điểm cuả truyền hình cáp là có thể sử dụng các kênh kề nhau để truyền tín hiệu trong tất cả các phạm vi mà không xuất hiện hiện tượng nhiễu đồng kênh, tuy nhiên các tín hiệu phải điều khiển ở độ tuyến tính cao để tránh hiện tượng điều biến tương hỗ.
Cáp quang được ứng dụng rộng rãi trong công nghiệp truyền thông. Môi trường truyền của cáp quang là bức xạ hồng ngoại với các thành phần điện từ có tần số cực cao. Ưu điểm của hệ thống cáp quang là độ rộng dải thông lớn.
Tín hiệu số rất phù hợp với đường truyền dẫn quang, có thể truyền trong khoảng cách xa với các trạm bù, dùng phương pháp điều xung mã PCM để điều chế nguồn tín hiệu có tốc độ bit cao, độ suy hao thấp, thời gian trễ thấp.
Để truyền tín hiệu video số bằng cáp quang phải sử dụng mã kênh truyền. Tín hiệu video sau khi được biến đổi sang dạng số được mã hoá bằng mã sơ cấp.
Việc sử dụng mã kênh truyền khắc phục được các nhược điểm:
Hạn chế thành phần một chiều và thành phần tần số thấp để có thể đấu nối tín hiệu từ mạch này sang mạch khác bằng biến áp hoặc qua tụ.
Thuận lợi cho việc tái tạo xung nhịp ở đầu thu.
Phát hiện lỗi.
III.2. Truyền hình số mặt đất
Nhược điểm của truyền hình số mặt đất:
Kênh bị giảm chất lượng do hiện tượng phản xạ nhiều đường.
Giá trị tạp do con người tạo ra cao.
Do phân bố khá dày trong phổ tần đối với truyền hình, giao thoa giữa truyền hình số và truyền hình tương tự là vấn đề cần xem xét…
Truyền hình số mặt đất có hiệu quả sử dụng phổ tần cao hơn và chất lượng tốt hơn so với phát sóng tương tự hiện tại:
Trên dải tần của một kênh truyền hình tương tự có thể phát một chương trình truyền hình có độ phân tích cao HDTV hoặc nhiều chương trình có độ phân tích thấp.
Trong phạm vi phủ sóng chất lượng ổn định, khắc phục được các vấn đề như hình ảnh có bóng, tạp nhiễu, tạp âm…
Dung lượng chứa âm thanh lớn.
Có thể chuyển đổi từ phát chương trình có hình ảnh và âm thanh chất lượng cao sang nhiều chương trình chất lượng thấp hơn và ngược lại.
Cấu trúc của hệ thống phát sóng truyền hình số mặt đất DTTB bao gồm:
Biến đổi tín hiệu Audio, Video thành các dữ liệu số.
Mã hoá nguồn dữ liệu số.
Gói và đa hợp Audio, Video và các dữ liệu phụ vào một dòng dữ liệu.
Điều chế tín hiệu phát băng dòng dữ liệu, bao gòm cả mã hoá truyền dẫn, mã hoá kênh và các kỹ thuật hạ thấp xác suất lỗi, chống lại suy giảm chất lượng do pha đinh, tạp nhiễu .
Thu: Mở gói, giải mã, hiển thị và đưa tiếng ra máy thu.
III.3. Truyền hình vệ tinh
Ưu điểm của hệ thống truyền hình vệ tinh:
Một đường truyền vệ tinh có thể truyền các tín hiệu với khoảng cách rất xa.
Đường truyền vệ tinh không bị ảnh hưởng bởi địa hình, địa vật.
Thiết lập một đường truyền qua vệ tinh được thực hiện trong thời gian ngắn.
Với một vệ tinh có thể đặt vô số trạm thu trên mặt đất.
Ngoài ra truyền hình vệ tinh còn có khả năng phân phối chương trình với các hệ thống liên kết khác.
Trong trạm phát lên vệ tinh sử dụng điều chế pha và chủ yếu dùng điều chế QPSK. Quá trình điều chế của trạm này được thực hiện ở tần số trung tần 70 MHz nghĩa là pha của sóng 70 MHz bị thay đổi theo tín hiệu số đã nén và ghép lại (dòng truyền tải MPEG 2). Pha biến đổi theo từng nhóm như [00],[01],[10],[11].
Kết luận
Sau khi phân tích nội dung “Xử lý tín hiệu truyền hình số”, ta nhận thấy rằng:
Truyền hình số mở ra một khả năng đặc biệt rộng rãi và có rất nhiều ưu điểm so với truyền hình tương tự .Tín hiệu số có thể thay thế hoàn toàn tín hiệu tương tự nhất là trong việc xử lý và lưu trữ. Bên cạnh đó thì nhờ công nghệ nén số, ta có thể truyền nhiều chương trình truyền hình trên một kênh thông tin thông thường (8 MHz) hoặc 1 tín hiệu truyền hình số phân giải cao.
ở việt Nam, truyền hình số đang bắt đầu áp dụng trong các đài phát. Do điều kiện kinh tế nên chúng ta chưa thể thay thế hoàn toàn hệ thống truyền hình tương tự sang hệ thống truyền hình số. Hy vọng rằng trong những năm tới chúng ta có thể số hoá hoàn toàn hệ thống truyền hình, đưa mạng truyền hình việt Nam hoà vào hệ thống truyền hình các nước trên thế giới.
Em xin chân thành cảm ơn sự quan tâm và sự chỉ bảo tận tình của cô giáo Nguyễn Thuý Anh đã giúp em hoàn thành đồ án này.
Do thời gian và kiến thức còn hạn chế nên trong quá trình thực hiện đồ án không tránh khỏi những sai sót. Em rất mong được sự góp ý của các thầy, cô giáo.
Em xin chân thành cảm ơn!
Các file đính kèm theo tài liệu này:
- 28774.doc