Truyền hình số

PHẦN I - TRUYỀN HÌNH TƯƠNG TỰ CHƯƠNG I: TỔNG QUAN VỀ HỆ THỐNG TRUYỀN HÌNH 1.1. GIỚI THIỆU CHUNG Truyền hình là hệ thống biến đổi hình ảnh và âm thanh kèm theo thành tín hiệu điện, truyền đến máy thu, nơi thực hiện biến đổi tín hiệu nay thành dạng ban đầu và hiển thị lên màn dưới dạng hình ảnh. Truyền hình dựa trên đặc điểm của mắt người về cảm nhận ánh sáng, để truyền đi thông tin cần thiết. Hệ thống truyền hình ra đời và phát triển, đến nay được chia thành: ã Truyền hình tương tự Truyền hình đen trắng: Ra đời năm 1920 và được xem như hoàn tất vào năm 1945, với sự ra đời của ông vidicon, dựa trên đặc tính quang trở của chất bán dẫn. Nó bao gồm 3 hệ là: FCC, OIRT,và CCIT. Truyền hình màu: Ra đời khi truyền hình đen trắng đã hoàn thiện và sự phát triển của nó gắn liền với lí thuyết 3 màu. Hệ này bao gồm các hệ là: Hệ NTSC: Ra đời năm 1950, được hình thành tại Mĩ, có tính tương hợp đầu tiên trên thế giới. Và đến năm 1954, hệ NTSC được phát trên kênh FCC, có độ rộng dải tần tín hiệu chói là :4,5Mhz(thực tế là 4,2Mhz). Hệ PAL: Ra đời năm 1966 ở tây Đức, là hệ được coi như cải tiến từ hệ NTSC và được phát triển trên kênh CCIT có độ rộng dải tần tín hiệu chói là 5,5Mhz(thực tế là 5,2Mhz). Hệ SECAM:R a đời năm 1965 ở Pháp, được phát triển trên kênh OIRT có độ rộng dải tần tín hiệu chói là 6,5Mhz. Nhận xét: Truyền hình đen trắng là hệ thống truyền hình trong đó thực hiện phân tích hình ảnh cần truyền thành các mẫu rời rạc rồi truyền lần lượt các mẫu đó. Thông tin được truyền đi là thông tin về độ chói của các điểm ảnh, tại đầu thu,sẽ khôi phục lại hình ảnh truyền đi thành một ảnh đen trắng. Còn truyền hình màu là hệ thống thừa hưởng tất các tính chất của truyền hình đen trắng và nó chỉ khác ở chỗ truyền hình màu truyền đi các thông tin về màu sắc của ảnh sao cho phía thu có thể khôi phục được thành ảnh có màu sắc thực tế.

docx115 trang | Chia sẻ: banmai | Lượt xem: 4111 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
72-1) Phần 3: Nén audio (ISO/IEC-11172-1) Phần 4: Kiểm tra (ISO/IEC-11172-1) Tiêu chuẩn này nghiên cứu cách thức ghép nối một hoặc vài dữ liệu chứa thông tin thời gian để hình thành nên một dòng dữ liệu. Nó cung cấp quy tắc đồng bộ hóa quá trình phát lại cho một cho một vài ứng dụng video rộng. Tiêu chuẩn này được coi như là dạng thức dữ liệu máy tính( gôm các điểm ảnh). Cũng như các dữ liệu máy tính (ảnh và văn bản ), ảnh video chuyển động có khả năng truyền và nhận bằng máy tính và mạng truyền thông. Chúng cũng có thể lưu trữ trong các thiết bị lưu trữ như đĩa CD, đĩa Winchester và ổ quang. Tiêu chuẩn này cung cấp cả các ứng dụng đối xứng và không đối xứng: Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giải nén nhiều lần để truy nhập thông tin, ví dụ như : trò chơi game. Trong ứng dụng đối xứng, quá trình nén và giải nén cần bằng nhau, ví dụ như: điện thoại hình, thư điện tử. Để đạt được hiệu suất nén cao mà vẫn giữ tốt chất lượng ảnh khôi phục, tiêu chuẩn này sử dụng cả công nghệ nén trong ảnh và liên ảnh để loại bỏ cả sự dư thừa về không gian và thời gian. Do tiêu chuẩn này được phát triển cho lưu trữ dữ liệu nên đòi hỏi có sự truy cập ngẫu nhiên. Cách thức tốt nhất cho truy cập ngẫu nhiên là mã hoá intra frame đơn thuần. Song sự dư thừa về mặt thời gian chưa được loại bỏ nên hiệu suất nén thấp. Do vậy, trong tiêu chuẩn này, có sự cân bằng giữa nén trong ảnh và nén liên ảnh bằng cách sử dụng công nghệ nén sau đây: Bù chuyển động Dự báo Nội duy Biến đổi cosin rời rạc lượng tử hóa Mã hóa độ dài thay đổi Huffman Tức là có sự kết hợp giữa hai công nghệ nén DPCM và tranfor coding. Thuật toán MPEG-1 sử dụng bù chuyển động khối để giảm sự dư thừa thời gian với véctơ chuyển động cho mỗi khối kích thước 16*16 điểm ảnh. Bù chuyển động sử dụng cho cả dự báo không nhân quả và dự báo nhân quả. Dự báo nhân quả tạo dự báo cho ảnh hiện hành từ ảnh trước đó. Dự báo không nhân quả tạo dự báo cho ảnh hiện hành dựa trên ảnh quá khứ lẫn ảnh tương lai. Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo. Sau đó công nghệ mã chuyển đổi chuyển khung sai số này sang miền tần số để nén các hệ số nhờ lượng tử hoá và mã hoá Huffman trước khi truyền tải và lưu trữ. Tiêu chuẩn này có phạm vi ứng dụng rộng rãi cho dạng thức CSIF (common soure intermediate fomat). SCIF là một định dạng nguồn dữ liệu đầu vào của các bộ nén do CCIT quy định phù hợp với hai dạng quét TV 525/60 và 625/50. Dạng thức này gắn với cấu trúc lấy mẫu 4:2:0 được quy định như sau: CCIT -601 525 CSIF525 4:2:0 CCIT -601 625 CSIF625 4:2:0 Số pixel/dòng tích cực Chói Y Điểm màu Cr ,Cb 720 360 352 176 720 360 352 176 Tần số lấy mẫu(Mhz) điểm chói Y Điểm màu Cr, Cb 13,5 6,75 6,75 3,38 13,5 6,75 6,75 3,38 Số điểm ảnh/dòng tích cực Điểm chói Y Điểm màu Cr, Cb 480 480 240 120 576 576 288 144 Tần số khung hình 30 30 25 25 Cỡ ảnh 4:3 4:3 4:3 4:3 Sơ đồ quá trình biến đổi sang định dạngCSIF và kích thước mảng các điểm ảnh Y Cr Cb Cb Cr Cb Cr Cb Cr Y Y CCIR-601 ChØ mµnh lÎ ChØ mµnh lÎ ChØ mµnh lÎ Läc phËp ph©n dßng Läc phËp ph©n dßng Läc phËp ph©n mµnh Läc phËp ph©n mµnh CSIF 720x480 (720x576) 720x240 (720x288) Läc phËp ph©n mµnh 360x240 (360x288) 360x480 (360x576) 180x120 (180x144) 180x240 (180x288) 360x240 (360x288) 360x480 (360x576) Hình 4.5. Quá trình biến đổi định dạng CSIF và kích thước mảng các điểm ảnh Như vậy với tiêu chuẩn nén này, dòng dữ liệu truyền hình chuẩn theo CCIT phải được biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converier). Điều này được thực hiện bằng cách sử dụng bộ lọc thập phân (horizontal decimation filter) cho tín hiệu chói mành lẻ và bộ lọc thập phân dòng và mành cho tín hiệu màu Cr,Cb mành lẻ. Quá trình giải mã, bộ thu phải dự báo mành chẵn từ mành lẻ được nội suy theo dòng và mành giải mã. /256 vị trí điểm được tính *Các pixel kề nhau của hệ số lọc thập phân n-3 n-2 n-1 n n+1 n+2 n+3 X(-29) X(0) X(88) X(113) X(0) X(88) X(-29) Hình 4.6. Tính toán giá trị cho các điểm ảnh trong lọc thập phân Giá trị pixel tại vị trí n, được tính bằng cánh nhân tất cả các vị trí pixel tại vị trí từ (n-3) đến (n+3) với các hệ số lọc trong hình vẽ. Tổng các tích trên được chia cho 256, kết quả cho giá trị pixel mới tại vị trí n. Tiếp theo tính cho pixel vị trí n+2 theo chu trình trên. ở máy thu cần phải biến đổi ngược lại. Tương tự cách tính trên theo chiều thẳng đứng cho tín hiệu màu Cr, Cb, ta có được kết quả bộ lọc thập phân theo mành. Để giảm mức độ phức tạp và giá thành, bộ giải mã trong MEG-1sẽ có một số tham số được mặc định như sau: Tham số Giá trị cực đại Độ rộng ảnh 768 điểm Chiều cao ảnh 576 dòng Tốc độ ảnh 36 ảnh/s Số lượng MB 396 Véc tơ miền chuyển động ±64 điểm kích thước bộ đệm đầu vào 327 680bit tốc độ bit 1,8 Mbps Cấu trúc dòng bit của tiêu chuẩn này cung giống với tiêu chuẩn MPEG gồm 6 lớp. Sử dụng cả hai dạng nén intra(Biến đổi DCT, lượng tử hoá, mã hoá VLC cho ảnh I). Và nén inter (ước lượng chuyển động, tạo dự báo có bù chuyển động cho ra ảnh B và ảnh P. MPEG-1 Có một số tham số cơ bản sau: Chỉ có cấu trúc lấy mẫu 4:2:0 Kích cỡ điểm ảnh tối đa là 720 pixel với 576 dòng sử dụng các tham số mặc định và kích cỡ 4095x4095 dùng làm tham số đầy đủ. Độ chính xác mẫu đầu vào 8 bit Độ chính xác lượng tử hoá và mã hoá DCT:9bit. Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC. Lượng tử hoá thích nghi cho các MB(16x16 điểm) Độ chính xác cực đại của hệ số DC là 8bit. Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi. Sử dụng khung P và B Độ chính xác dự báo chuyển động là 1/2 điểm ảnh. Tốc độ bít tối đa là 1,58 Mbit/s khi dùng tham số mặc định cho ảnh 720x576 và 100Mbit/s khi dùng tham số đầy đủ cho ảnh 4095x 4095. MPEG-1 có thể cho phép sự truy cập ngẫu nhiên các khung video, tìm kiếm nhanh thuận ngược theo dòng bit đã nén, phát ngược lại dòng video và khả năng rời bỏ dòng bit nén. 4.2.6. Nén video theo tiêu chuẩn MPEG-2 4.2.6.1. giới thiệu chung * Tiêu chuẩn này còn gọi là ISO/IEC 13818 là sự phát triển tiếp theo của MPEG-1, ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR-601 quy định. Tiêu chuẩn này gồm 4 thành phần : Phần 1: Hệ thống (IOS/IEC 13818-1) xác định cấu trúc ghép kênh audio , video và cung cấp đồng bộ thời gian thực. Phần 1: Video(IOS/IEC 13818-2) xác định các thành phần mã hoá đại diện cho dữ liệu video và phân loại xử lí giải mã để khôi phục lại hình ảnh . Phần 3: Audio (IOS/IEC 13818-3) mã hoá và giải mã dữ liệu âm thanh. Phần 4: Các hệ thống kiểm tra(IOS/IEC 13818-4) So với MPEG-1 thì MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh và độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng giải mã một phần dòng bit mã hoá để nhận được ảnh khôi phục có chất lượng tuỳ thuộc vào mức độ yêu cầu. Đặc điểm của tiêu chuẩn MPEG-2 Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video có độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình . Cú pháp dòng bít MPEG-2 là sự mở rộng của dòng bit MPEG-1. *Tính tương hợp thuận: Bộ giải mã MPEG-2 có khả năng giải mã dòng bit MPEG-1 hoặc một phần dòng bít của MPEG-1. *Tính tương hợp ngược: Bộ giải mã MPEG-1 có khả năng giải mã một phần dòng bít của MPEG-2. *Tương hợp lên: Bộ giải mã độ phân giải cao có khả năng giải mã được dòng bít của bộ mã hoá có độ phân giải thấp. *Tương hợp xuống: Bộ giải mã độ phân giải thấp có khả năng giải mã được một phần dòng bít của bộ mã hoá có độ phân giải cao. MPEG-2 hỗ trợ khả năng co giãn: Co giãn không gian, co giãn SNR(signal to noi radio), co giãn phân chia số liệu… Một trong những đặc điểm quan trọng nhất của MPEG-2 là sự phù hợp với nhiều ứng dụng video. Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu chuẩn, truyền hình có độ phân giải cao, hoặc truyền dẫn tín hiệu truyền hình thông qua các mạng viễn thông. Tính co giãn của dòng bit MPEG-2 là khả năng giải mã được một phần dòng bit của chính nó độc lập với phần còn lại của dòng bít đó nhằm khôi phục video với chất lượng hạn chế(hạn chế độ phân giải thời gian, độ phân giải không gian, hoặc hạn chế SNR). Dựa trên đặc tính co giãn, dòng bít được chia thành 2 hay nhiều lớp. Tập con nhỏ nhất của cú pháp dòng bit, có thể giải mã một cách độc lập được gọi là lớp cơ bản. Các lớp còn lại gọi là lớp nâng cao. Có nhiều loại co giãn khác nhau như: Co giãn không gian: Dòng bit gồm hai hay nhiều lớp video khác nhau có cùng độ phân giải không gian. Co giãn SNR: Dòng bit gồm hai hay nhiều lớp có cùng độ phân giải không gian nhưng tỉ số tín hiệu / nhiễu là khác nhau. Co giãn thời gian: Dòng bít gồm hai hay nhiều lớp video có cùng độ phân giải không gian nhưng độ phân giải thời gian là khác nhau. Co giãn phân chia số liệu: Dòng bit video được chia thành hai phần. Phần ưu tiên cao (lớp cơ bản ) gồm các hệ số DCT tần thấp, và phần ưu tiên thấp( lớp nâng cao) gồm các hệ số DCT tần số cao. Loại co giãn này chính là một dạng cơ bản của co giãn tần số. Tiêu chuẩn MPEG-2 đã chính thức quy định hai loại co giãn là co giãn không gian và co giãn SNR. Còn các loại co giãn khác mới chỉ ở dạng dự thảo. 4.2.6.2. Cấu trúc dòng bit video MPEG-2 Cấu trúc dòng bít video MPEG-2 có dạng phân lớp và là sự mở rộng cú pháp của cấu trúc MPEG-1. Trước hết nó bao gồm các chức năng của MPEG-1, có nghĩa là chúng tương hợp nhau. Do đó cả hai hướng đi trong dòng bit MPEG-2 , cho phép hoặc theo quy trình của MPEG-1, hoặc theo các chức năng mở rộng thêm riêng của MPEG-2. Chuỗi header MPEG-1 ISO/IEC 11172-2 Chuỗi mở rộng Dòng bit Hình 4.7. Hai hướng đi trong cú pháp dòng bit MPEG-2 Ta có thể chọn một trong hai hướng đi, nhưng hướng mở rộng phải thể hiện được mọi lợi ích của MPEG-1, chấp nhận độ phức tạp cao và nó thể hiện ở hình vẽ sau: Chuỗi header Chuỗi mỏ rộng GOP header GOPmỏ rộng Header ảnh ảnh mở rộng Lớp slice Lớp MB Lớp Block Hình 4.8. Cấu trúc dòng bít video MPEC-2 Chuỗi video được mã hoá bằng sequence header, sau đó là chuỗi mở rộng(nếu có) và các nhóm ảnh. Nếu phần chuỗi mở rộng không được xác định (không có mã báo có thành phần mở rộng) các lớp tiếp theo sẽ thực hiện một quy trình như MPEG-1. Header của nhóm ảnh (GOP) có chức năng tương tự như chức năng của MPEG-1 Và không có chức năng đặc biệt trong extension header của GOP. Các thông số quan trọng dùng để mã hoá ảnh mở rộng được định nghĩa trong extension header ảnh. Vì có cả hai loại ảnh, liên tục và xen kẽ nên cấu trúc cần phải được xác định rõ field trên hay lield hoặc frame. Lớp slice không bị ảnh hưởng đáng kể. Slice bao gồm tất cả các MB trong một ảnh. Cấu truc slice tổng quát không cần mã hoá các vùng nhất nào đó trên ảnh (không có slice tồn tại trên vùng này) cũng là một bộ phận của extension MPEG-2. *Dạng lớp của cu pháp MPEG-2được tóm tắt trong bảng sau Lớp Chức năng Lớp chuỗi đơn vị nội dung Lớp nhóm ảnh Đơn vị truy nhập ngẫu nhiên dòng video mã hoá Lớp ảnh Đơn vị mã hoá cơ bản Lớp lat(slice) Đơn vị tái đồng bộ Lớp MB Đơn vị bù chuyển động Lớp khối Đơn vị chuyển đổi DCT Lớp chuỗi: Đại diện mã hoá cho một chuỗi ảnh Lớp nhóm ảnh: Cung cấp điểm truy cập ngẫu nhiên. ảnh bắt đầu của một nhóm ảnh bao giờ cũng là ảnh I. ảnh I này cung cấp điểm truy cập vào dòng bit mã hoá . Lớp lat: Có chức năng hồi phục đồng bộ . Khi dòng bít có lỗi, bộ giải mã có thể bỏ qua slice có lỗi và bắt đầu bằng một slice mới. Mỗi mảng có chứa một hoặc nhiều MB. Lớp MB: Là một đơn vị ước lượng chuyển động và có vectơ chuyển động riêng trong phần heacder của nó. Lớp khối: Là lớp lớn nhất, mỗi khối là một đơn vị DCT gồm 64 hệ số( một hệ số DC và 63 hệ số AC) của khối I hoặc sai số dự báo ảnh (ảnh P,B). Phạm vi ứng dụng của , MPEG-2 là rất rộng. Mỗi ứng dụng đòi hỏi một mức độ phức tạp khác nhau. Bởi vậy MPEG-2 định nghĩa các mức (level) và các đặc tính hay các tập con (profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit còn level xác định các tham số hạn chế độ phân giải không gian, tốc độ bít. Trong MPEG-2 có 5 định nghĩa về profile: Simple profile: Số bước nén thấp, chỉ cho phép mã hoá ảnh P và ảnh B, việc tách các điểm loại B sẽ làm giảm bộ nhớ dùng cho giải mã chuỗi. Profile chính: Cho phép sử dụng tất cả các loại ảnh, nhưng không tạo các mức bất kì. Chất lượng ảnh tốt hơn profile đơn giản, nhưng tốc độ ảnh không thay đổi. Profile phân cấp theo SNR: Tiêu chuẩn MPEG-2 cho phép phân cấp theo tỉ số tín hiệu trên tạp âm. Tính phân cấp theo tỉ số S/N có nghiã là chất lượng ảnh và tỉ số S/N có tính thoả hiệp. Profile phân cấp theo không gian: Tính phân cấp theo không gian có nghĩa là có sự thoả hiệp đối với độ phân giải. Chuỗi ảnh được chia thành 2 lớp tương ứng với độ phân giải khác nhau của ảnh. Lớp thấp hơn bao gồm ảnh có độ phân giải thấp (ví dụ truyền hình T C), lớp cao hơn bao gồm ảnh có độ phân giải cao hơn( ví dụ truyền hình độ phân giải cao_HDTV). Profile cao: Cho phép đối với cả 2 loại thanh mức và chuẩn 4:2:2 của tín hiệu video. Nó bao gồm toàn bộ các công cụ của profile trước cộng thêm khả năng mã hoá các tín hiệu màu khác nhau cùng một lúc. Như vậy, nó là một hệ thống hoàn hảo được thiết kế cho toàn bộ các ứng dụng mà không bị giới hạn bởi tốc độ bit cao. MPEG-2 bao gồm 4 mức: Mức thấp: ứng dụng với tốc độ phân giải của MPEG-1, có nghĩa là bằng 1/4 độ phân giải của truyền hình tiêu chuẩn. Mức chính : ứng dụng với độ phân giải của truyền hình tiêu chuẩn. Mức cao 1440: Độ phân giải của HDTV với 1440 mẫu/dòng. Mức cao: Độ phân giải HDTV với 1920 mẫu/ dòng . Level Cỡ khung Low 352x288(bằng 1/4 cỡ ảnh TV tiêu chuẩn) Main 720x576 (cỡ ảnh TV chuẩn ) High-1440 1440x1152 High 960x576 hoặc 1920x1152 Như vậy, việc kết hợp 4 mức và 5 profile ta được một tổ hợp 20 khả năng và hiện nay đã có 11 khả năng được áp dụng. Chúng được minh hoạ trong hình sau, trong đó: dòng trên cùng là tỉ lệ lấy mẫu, tiếp theo là ghi các điểm theo chiều ngang x theo chiều dọc; dòng dưới nữa là tốc độ cao nhất của dòng dữ liệu sau khi nén; dòng cuối cùng là các loại ảnh được sử dụng để nén. profile Level đơn giản chính Phân cấp theo SNR Phân cấp theo không gian Cao Thấp 4:2:0 352x228 4Mbit/s 4:2:0 352x228 4Mbit/s I,P,B Chính 4:2:0 720x576 15Mbit/s I,P 4:2:0 720x576 15Mbit/s I,P,B 4:2:0 720x576 15Mbit/s I,P,B 4:2:0 720x576 20Mbit/s I,P,B Cao-1440 4:2:0 1440x1152 60Mbit/s I,P,B 4:2:0 1440x1152 60Mbit/s I,P,B 4:2:0,4:2:2 1440x1152 80Mbit/s I,P,B Cao 4:2:0 1920x1152 80Mbit/s I,P,B 4:2:0,4:2:2 1920x1152 100Mbit/s I,P,B Ngoài hai tiêu chuẩn đã xét, hiện nay còn nhiều tiêu chuẩn khác đã và đang được nghiên cứu và sử dụng như:MPEG-2 4:2:2P@ML, MPEG-7…. Chúng được ứng dụng vào các ứng dụng cao hơn, hiệu quả hơn. CHƯƠNG V: NÉN TÍN HIỆU AUDIO Tín hiệu audio số PCM được sử dụng trong TV, truyền thông đa phương tiện cũng như trong nhiều ứng dụng khác. Các dòng lấy mẫu với tần số là 48 khz và độ phân giải 16 bít thì dòng số tạo ra sẽ có tốc độ là 1,54 Mbit/s. Một hệ thống âm thanh surround cung cấp cho dòng số tốc độ 4,5 Mbit/s. Bởi vậy yêu cầu phải có một phương pháp nén hiệu quả cho lưu trữ dữ liệu thời gian dài cũng khi phân phối dữ liệu qua các kênh co bề rộng dải thông hẹp. Việc nén audio hiện nay được tổ hợp trên các ứng dụng đa fương tiện trên cơ sở là máy tính, cho sự phân phối chương trình trên đĩa CD-ROM và mạng. Nó cũng được sử dụng trong truyền dẫn qua vệ tinh quảng bá. 5.1: Cơ sở của của nén tín hiệu audio Nén tín hiệu audio được thực hiện dựa trên cơ sở là mô hình tâm sinh lí thính giác của con người, sự hạn chế về mặt cảm nhận, hiện tượng che lấp các tín hiệu âm. 5.1.1. Mô hình tâm sinh lí thính giác Hệ thống thính giác của con người (Humam audio system _HAS) có đặc điểm như một bộ phân tích phổ. Nó chia giải phổ âm thanh nghe thấy thành các băng tần gọi là các băng tới hạn như một dãy các bộ lọc thông dải. Các băng tần này có bề rộng dải thông là 100Hz với các tần số lớn hơn 10Khz. Có thể mô hình hoá hệ thống cảm nhận của con người bằng 26 bộ lọc thông dải liên tiếp có bề rộng dải thông như đã nói. Khi tín hiệu âm thanh bao gồm các tần số gần kề nhau, hệ thống thính giác của con người(HAS) sẽ tổ hợp chúng thành một nhóm có năng lượng cân bằng. Ngược lại, nếu có âm thanh bao gồm nhiều tần số khác biệt nhau, chúng sẽ được sử lí tách biệt và độ lớn âm thanh được xác định. Tính nhạy của HAS giảm tại các tần số cao và các tần số thấp. Điều này có nghĩa là đối với các mức âm thanh thấp thì sự thay đổi trong cảm nhận của con người là rất quan trọng và sẽ giảm dần tại các mức âm cao. 5.1.2. Sự che lấp tín hiệu audio Hệ thống thính giác của con người còn có một đặc điểm vô cùng quan trọng, đó là tính che lấp “Masking”. Có hai dạng che lấp là : che lấp thời gian và che lấp tần số . Tiến hành thực nghiệm đối với hệ thống thính giác người ta xây dựng được đặc tuyến che lấp trong miền thời gian và trong miền tần số . Che lấp tần số Sự che lấp về mặt tần số là hiện tượng một âm thanh nghe thấy ở tần số này bỗng trở lên không cảm nhận được do ngưỡng nghe thấy bị dâng lên vì sự có mặt của âm thanh ở tần số khác có cường độ mạnh hơn. Để tai người có thể nghe thấy bất cứ một âm thanh ở một tần số đơn nào cũng phải có một mức áp suất âm thanh lớn hơn một giá trị ngưỡng nhất định. Tập hợp tất cả các giá tri ngưỡng này đối với tất cả các âm đơn trong giải tần nghe được tạo nên một đường cong gọi là : ngưỡng nghe tuyệt đối- là đường đậm nét được minh hoạ trên hình vẽ. Tất cả các âm thanh nằm dưới đường cong này đều không có khả năng được con người cảm nhân. Mức thanh áp( dB) Kết quả che lấp tạo bởi âm 1khz 65 dB Ngưỡng nghe được bị biến đổi bởi âm che lấp Kết quả che lấp tạo bởi âm 1khz 45 dB Ngưỡng nghe Tuyệt đối 90 80 70 60 50 40 30 20 10 0 50 100 500 1k 5k 10k 20k tần số Hình 5.1. Đặc tuyến che lấp đối với hệ thống thính giác trong miền tần số Sự xuất hiện của một âm thanh có cùng độ cao ở một tần số nào đó sẽ làm cho đường cong này biến đổi đi. Trong hình vẽ trên, âm 1Khz với mức thanh áp 45dB làm cho ngưỡng nghe thấy tuyệt đối dâng 27dB. Điều này có nghĩa là những tạp âm dưới 27dB đều không nghe thấy. Nếu sử dụng thang lượng tử 6dB/ bước nhảy thì chỉ cần 3 bit để mã hoá âm này vì giá trị vi sai ở đây là : 45-27= 18 dB. Nếu mức âm này tăng lên tới 65dB thì mức che phủ sẽ tăng lên 55dB, giá trị vi sai lúc này chỉ còn 10dB và có thể mã hoá chỉ bằng 2 bít. Việc che phủ tần số trước và sau cũng rất quan trọng như trên hình vẽ, âm 1Khz cũng làm cho ngưỡng nghe thấy của các âm tần số xung quanh dâng lên. Sự che phủ tần số sau quan trọng hơn và tăng theo mức âm. Điều này cho phép giảm độ chính xác mã hoá cho những tần số tín hiệu xung quanh âm che phủ. Những âm đơn tần số xung quanh 1Khz có mức âm nhỏ hơn đường cong che phủ sẽ không có khả năng cảm nhận và không cần thiết phải mã hoá mà vẫn không làm ảnh hưởng tới chất lượng cảm nhận của con người. Hệ thống nén dựa trên đặc điểm này được gọi là hệ thống nén theo thính giác. Sự che phủ thời gian Đó là hiện tượng tai người chỉ cảm nhận được âm sau khi âm đó bắt đầu khoảng 200ms và có cảm tưởng âm thanh còn kéo dài khoảng 200ms nữa sau khi âm thanh đã dứt. Ngoài ra, thính giác cũng không phân biệt được những khoảng ngừng nhỏ hơn 50ms giữa hai âm thanh giống nhau đi liền nhau. 5.1.3. Công nghệ giảm tốc độ nguồn dữ liệu audio số Công nghệ mã hoá nguồn được sử dụng để loại bỏ đi sự dư thừa trong tín hiệu audio số (khi giá trị vi sai mẫu –xấp xỉ gần giá trị không). Còn công nghệ che lấp dựa trên mô hình tâm sinh lí thính giác của con người có tác dụng loại bỏ đi các mẫu không có giá trị cảm nhận( các mẫu không nghe thấy). Có hai công nghệ nén cơ bản là: Mã hóa dự báo miền thời gian: Sử dụng mã hoá vi sai các giá trị chênh lệch giữa các mẫu liên tiếp nhau để loại bỏ sự dư thừa thông tin cá nhân nhằm thu được dòng số có tốc độ thấp. Mã hoá chuyển đổi miền tần số: Công nghệ này sử dụng các khối của các mẫu PCM tuyến tính biến đổi từ miền thời gian thành một số nhất định các băng tần trong miền tần số. Hiện tượng che lấp quan trọng nhất xảy ra trong miền tần số. Để lợi dụng đặc điểm này, phổ của tín hiệu audio được phân tích thành nhiều băng phụ có độ phân giải thời gian và tần số phù hợp với độ rộng các băng tần tới hạn của HAS. Mỗi băng phụ chứa một số thành phần âm rời rạc. Cấu trúc bộ mã hoá audio cơ bản như sau: Dãy bộ lọc Mô hình tâm lí thính giác Lượng tử hoá và mã hoá Phân bố bít ghép kênh Dòng bít mã hoá tín hiệu đầu vào Hình 5.2. Cấu trúc bộ mã hoá Audio Có ba cách thực hiện dãy bộ lọc.Đó là: a) Đa băng tần: Phổ của tín hiệu được chia thành các băng tần phụ có độ rộng bằng nhau tương tự như khi chia phổ tần thành các băng tần tới hạn của hệ thống HAS. Với các tần số nhỏ hơn 500Hz một băng con sẽ chứa vài băng tần tới hạn. Trong công nghệ nén audio, sử dụng một loại bộ lọc bộ lọc băng con. Ví dụ PQMF- bộ lọc gương đa pha bình phương. Bộ lọc này có độ chồng phổ thấp và thường được sử dụng cho các mẫu gần kề về mặt thời gian. Trong tiêu chuẩn nén AUDIO MPEG một khung audio gồm 1152 mẫu được chia thành 32 băng con, mỗi băng con có 36 mẫu. b) Dãy chuyển đổi: áp dụng thuật toán DCT có cải biên (MDCT) được dùng để biến đổi tín hiệu audio miền thời gian thành một số lượng lớn các băng con(từ 256 đến 1024 ) trong miền tần số . c) Dãy bộ lọc cân bằng: tín hiệu vào trước tiên được chia thành 32 băng con nhờ các bộ lọc PQMF. Sau đó áp dụng phép biến đổi MDCT cho mỗi 18 mẫu của băng con. Kết quả sẽ thu được 576 băng rất hẹp(41,76 Hz tại tần số lấy mẫu 48Khz). Việc kết hợp này có độ phân giải thời gian khoảng 3.8ms. Bộ lọc trong dãy phải được xác định phù hợp với một số tác nhân quan trọng. Dãy bộ lọc có độ phân tích thấp (nghĩa là băng tần rộng) sẽ cho số lượng băng con nhỏ. Trong mỗi băng con sẽ chứa hầu hết các thành phần âm của phổ tín hiệu audio khiến tác dụng che lấp giảm và sẽ cần rất nhiều bit để mã hoá các thành phần tín hiệu trong các băng con. Tuy nhiên, số lượng các băng con thấp sẽ giảm được mức độ phức tạp mã hóa/ giải mã mà vẫn giữ được độ phân giải tốt về thời gian. Nếu dãy bộ lọc có độ phân tích cao, sẽ cho số lượng lớn các băng con. Khi đó, một số băng con không chứa thành phần âm sẽ không cần phải mã hoá. Bề rộng băng tần hẹp cho khả năng mô phỏng tốt hơn các băng tới hạn của HAS. Tuy nhiên, có độ phân giải thời gian thấp dẫn đến hiện tượng có tiếng tạp âm lanh canh khi mã hoá tín hiệu audio ngắn. Do vậy, có thể sử dụng dãy bộ lọc thích nghi có khả năng chuyển đổi từ dãy bộ lọc có độ phân giải cao sang dãy bộ lọc có độ phân giải thấp khi mã hoá tín hiệu audio ngắn. Đặc tuyến của quá trình xử lí dãy bộ lọc bao gồm các yếu tố: Độ phân giải thời gian =ộ dài mẫu khối bộ lọc* 20,83 us. Với tần số lấy mẫu 48Khz, khoảng cách thời gian giữa các mẫu liên tiếp sẽ là 20,83 us. Ví dụ trong mã hoá AC-3 độ phân giải thời gian là 128*20,83=2,66ms. Độ phân giải tần số = bề rộng phổ cực đại / tổng số băng con. Với tần số lấy mẫu 48Khz, bề rộng phổ tần tối đa là 24 Khz. Ví dụ trong mã hoá AC-3, độ phân giải tần số là: 24000/256=95,75 Hz. Độ dài khung dữ liệu= số băng con trong một khối*số mẫu trong khối *20,83us. Ví dụ trong tiêu chuẩn MPEG lớp một, độ dài khung dữ liệu là 32*12*20,83=8us. 5.1.4. Sự phân phối bít Một phép phân tích mô hình tâm sinh lí thính giác chính xác tín hiệu PCM đầu vào sử dụng thuật toán biến đổi (fourier transform- FFT) được thực hiện để xác định nội dung tần số và năng lượng của nó. Từ ngưỡng nghe được và đặc tính che phủ tần số của HAS, người ta tính toán được đường cong che lấp như minh họa hình dưới đây. Biên độ( đồng bộ) đường bao phổ tín hiệu đường cong che phủ được tính toán Sự phân phối bit 120 100 80 60 40 20 0 2k 4k 6k 8k 10k 12k 14k tần số(hz) Hình 5.3. Đường cong che lấp Hình dạng và kích thước đường cong che lấp phụ thuộc vào nội dung tín hiệu. Trong ví dụ trên, có thể thấy sai số giữa đường bao phổ tín hiệu và đường cong che lấp giảm xuống, điểm có giá trị max là 40dB. Giá trị sai lệch max này quyết định số lượng bít cần thiết ( thông thương lượng tử hoá cơ bản là 6dB/ bit), để mã hoá tất cả các thành phần phổ tần tín hiệu audio . Qua trình phân bố bít cần đảm bảo tạp âm lượng tử hoá thấp hơn ngưỡng nghe được. Trong hình, tai vung tần số lớn hơn 12Khz, đường cong che lấp cao hơn đường bao phổ tín hiệu nên không cần phân phối bit để mã hoá vùng tín hiệu này. Từ đường cong che lấp, ngưỡng che lấp của mỗi băng con được xác định. Chúng quy định năng lượng tạp âm lượng tử cực đại có thể chấp nhận được cho mỗi băng con, tại đó tạp âm bắt đầu trở lên nghe thấy. Sau khi ước lượng ngưỡng che lấp cho mỗi băng tân con, các tham số xếp loại được sử dụng để biến đổi bước lượng tử của mỗi băng con, tức biến đổi cấu trúc tạp âm lượng tử sao cho phù hợp nhất. Cuối cùng, mã hoá Huffman được sử dụng. Lượng tử hoá: Lượng tử hoá các băng tần con trong phô tín hiệu audio là một qua trình không đồng bộ . Tức là mỗi băng con được lượng tử với một bước lượng tử khác nhau phù hợp với mức năng lượng cũng như mức độ che lấp của băng tần. Bước lượng tử được xác định nhờ bộ phân phối bit. Ghép kênh dữ liệu: Các khối (hay là các nhóm ) 12 mẫu dữ liệu từ đầu ra bộ lượng tử hoá được ghép kênh cùng với tham số xếp loại tương ứng của chúng và thông tin phân phối bit để hình thành lên khung dữ liệu audio trong dong bít mã hoá . 5.2. CÁC TIÊU CHUẨN Mà HOÁ AUDIO 5.2.1. Tiêu chuẩn nén MPEG-1 Phần audio xác định ba lớp mã hoá tín hiệu PCM, có tốc độ lấy mẫu 32; 44,1; hoặc 48Khz. Tốc độ dữ liệu nén ánh xạ thời gian- tần số Mã hoá khớp nối Tạo thang lượng tử – mã hoá Tạo frame bộ nhớ Mô hình tâm sinh lí nghe Frame không gói ánh xạ thời gian- tần số Khôi phục Dữ liệu phụ Dữ liệu phụ Sơ đồ giải mã MPEG-1 Mẫu audio PCM Sơ đồ mã hoá và giải mã tiêu chuẩn MPEG-1 Hình 5.4. Sơ đồ mã hoá và giải mã tiêu chuẩn MPEG - 1 Dòng bit mã hoá Sơ đồ mã hoá MPEG-1 Dữ liêu phụ Băng lọc gồm 32 băng con Tạo thang độ lượng tử hoá Ghép kênh Phân bố bit Hệ số thang độ Phân bố bit động và hệ số thang độ/ mã hoá Ngưỡng che 512-1024 điểm FFT 0 31 0 31 0 31 Hình 5.5. Bộ mã hoá MPEG đối với tín hiệu audio Lớp I là thuật toán cơ sở, lớp II, và III bao gồm nhiều phần nâng cao của lớp I. Tiêu chuẩn này định nghĩa hai mô hình tâm sinh lí nghe dùng cho tất cả các lớp nén. Mô hình I kết hợp để làm đơn giản bộ mã hoá .MPEG-1 lớp Idung cho FFT cho mẫu có cửa sổ 512 để phân tích chính xác nội dung tần số và năng lượng của tín hiệu audio đến. Cửa sổ 512 này đủ lớn để bao một khung32 mẫu. Tuy nhiên MPEG-1 lớp II và III dùng FFT của mẫu cửa sổ 1024 để phân tích, nhưng không bao hoàn toàn khung audio của 1152 mẫu. Đó là sự kết hợp thực tế và độ phức tạp. TRong mô hình tâm sinh lí nghe 2, cửa sổ phân tích bằng FFT của mẫu là 1024, được dùng cho tất cả các lớp. Các frame của MPEG lớp II và III khác nhau, nhưng có độ dài cố định để làm đơn giản việc giải mã dòng bít. Lớp II và III xử lí dữ liệu audio trong các frames của512 mẫu. *Lớp I CRC Gro Gr1 Gr2 Gr11 Frame header 1 khung cña audio Ph©n phèi bit HÖ sè thang ®é D÷ liÖu phô 1 2 31 Cấu trúc lớp I cho trong hình dưới đây, và nó có các đặc điểm sau: Hình 5.6. Cấu trúc khung mức 1 Audio MPEG -100 Tốc độ dữ liệu:32 đến 448kb/s. Tín hiệu vào chia thành các frame chứa 384 mẫu/kênh Tạo 8ms- frame@ 48Khz 32 băng tần con có kích thước bằng nhau, tạo các khối 12 mẫu (32.12= 384 mẫu) Hệ số thang độ 6bit/ băng, khác nhau cho mỗi kênh Vị trí bít tiến thích nghi Mỗi mẫu các băng tần con được lượng tử hoá( độ chính xác được chỉ thị bằng bộ tính toán vị trí) Kênh đơn hoặc kênh kép, stereo hoặc joint stereo ( mã hoá kết hợp kênh phải và kênh trái của tín hiệu stereo audio ) Hầu hết thích hợp cho các ứng dụng như ghi âm hoặc trong studio, vì kích thước frame chỉ dài 8ms, *Lớp II Loại này là kết quả nâng cao của lớp I, tỉ nén cao hơn, tốc độ bít xấp xỉ xung quanh 128kb/s. Các đặc trưng cơ bản của lớp II: Tốc độ dữ liệu :32 đến 384 Kb/s Tín hiệu vào chia thành các frame, chứa 1152 mẫu/kênh 32 băng tần có kích thước bằng nhau, tạo các khối 36 mẫu(32.36=1152 mẫu) Tạo 24 ms@48 kHz(384.3.20,83=24ms) Hệ số thang độ 6 bit/băng(dải động120 đồng bộ) mỗi băng khác nhau, các nhóm gồm 12,24,36 mẫu để loại trừ méo âm thanh. vị trí bit tiến_thích nghi, frame 24ms cố định và sử dụng lượng tử hóa bit chia nhỏ Kênh đơn hoặc kép, stereo hoăcjoin stereo Dùng rộng rải tiêu chuẩn MPEG trong CD-ROM, DVB, DAB, DBS, multimedia… *Lớp III Lớp III cho chất lượng âm thanh tốt nhất với tốc độ bit thấp. Filter bank chuyển thời gian thành tần số , cho độ phân giải cao; Độ phân giải thời gian và phổ thích nghi choin sao tốt hơn với nhiều nội dung của tín hiệu vào. Tốc độ bit dao động xung quanh 64kb/s, các đặc trưng chính gồm: Tốc độ dữ liệu:32 đến 320 kb/s tín hiệu vào được chia thành các frame, chứa 1152 mẫu/ kênh Tạo frame 24ms@ 48kb/s 32 Băng tần con có kích thước bằng nhau, được chia tiếp thành 18 băng MDCT , có khả năng chuyển mạch khối tức thời thành Các hệ số thang độ được dùng để cải thiện cấu trúc và mức nhiễu lượng tử , Vị trí bit tiến_thích nghi Mã hoá VRC các giá trị lượng tử Kênh đơn hoặc kênh kép, stereo hoặc join stereo Dùng cho tốc độ bit thấp, ví dụ như ISDN, viễn thông, thiết bị vệ tinh, audio chất lượng cao qua intrenet 5.2.2. Tiêu chuẩn nén MPEG-2 Tiêu chuẩn MPEG-2 được ứng dụng cho: Chất lượng audio trong phạm vi rộng, có tốc độ bít từ thấp đến cao(32 đến 1066 kb/s). Phạm vi rộng được thực hiện nhờ chia MPEG-2 audio frame thành hai phần: Dòng bít sơ cấp, tương thích với MPEG-1 Dòng bít mở rộng Với lớp III, tại 64 kb/s/ kênh, 5 kênh audio đầy đủ băng tần có thể được mã hoá với 320 kb/s Mã hoá đến 6 kênh audio , bao gồm 1kênh phụ nâng cao tần số thấp, để làm âm thanh tròn nhiều kênh. Sự mở rộng trên có thể thực hiện được nhờ cộng thêm vào mỗi lớp: - 1 /2 Tốc độ lấy mẫu (16,22,05,24 kb/s) - Dung lượng đa kênh (tốc độ bit đa kênh mở rộng đến 1Mb/s, cho phép đạt chất lượng cao). Các dữ liệu này được cấy vào không gian dữ liệu phụ của cấu trúc MPEG-1 audio frame, Tiêu chuẩn MPEG-2 audio tương thích xuống tiêu chuẩn MPEG-1. Tuy nhiên bộ giải mã MPEG-1 chỉ có thể giải mã các kênh trái và kênh phải của dòng dữ liệu MPEG-2 audio . Tât cả các lớp của MPEG-1 và MPEG-2 giống nhau. Tại tần số lấy mẫu thấp, độ phân giải tần số khoảng 21Hz với tần số lấy mẫu 24 Khz . Nó cho phép các băng tần có hệ số thang độ phù hợp tốt hơn với độ rộng băng tần tới hạn và cho chất lượng audio tốt hơn tại các tốc độ thấp, mặc dù độ rộng băng tần tín hiệu audio được giảm tối đa là 12 khz. Ngoài ra, còn nhiều tiêu chuẩn nén tín hiệu audio khác như: Tiêu chuẩn AC-3 ứng dụng trong hệ thống HDV. Nó có những ứng dụng đặc biệt bổ xung cho những tiêu chuẩn đã xét. 5.3.KẾT LUẬN CHUNG Tiêu chuẩn MPEG biểu diễn phương pháp mã hoá tín hiệu audio và video. Ưu điểm quan trọng nhất của tiêu chuẩn là khả năng mã hoá tín hiệu video có dạng bất kỳ và khả năng tăng cao dung lượng kênh truyền. Ưu điểm này khiến cho tiêu chuẩn MPEG được chấp nhận ở nhiều nước sử dụng tiêu chuẩn truyền hình 625dòng/ 50Hz và 525 dòng/60 Hz. Kết quả nghiên cứu cho thấy phương pháp nén MPEG cho phép làm giảm tốc độ bit tín hiệu video có độ phân giải tiêu chuẩn (625 và 525 dòng) xuống còn khoảng 5Mbit/s mà vẫn đảm bảo chất lượng cho studio. Đối với tín hiệu HDTV/ATV, tốc độ bit được nén xuống còn khoảng 20 Mbit/s. Dung lượng kênh truyền hình tiêu chuẩn khi sử dụng điều chế số là 20 đến 40 Mbit/s( phụ thuộc vào phương pháp điều chế và mức độ bảo vệ sai số truyền ). Điều đó có nghĩa là trong kênh, truyền được một số chương trình truyền hình độ phân giải cao-HDTV. Việc hạn chế theo lớp tín hiệu cho phép truyền đồng thời tín hiệu truyền hình có độ phân giải tiêu chuẩn và độ phân giải cao. Cần phải thấy rằng phương pháp nén MPEG là phương pháp nén có mất thông tin, có nghĩa là nó gây ra méo ảnh. Có thể minh hoạ sự suy giảm chất lượng ảnh hồi phục theo hiệu suất nén MPEG như trên hình vẽ sau: 10 Chất lượng ảnh Tốc độ bit(Mbít/s) 20 5 10 15 25 30 35 1 2 3 4 5 6 7 8 9 MPEG-1 MPEG-2 MP@ML IBD 40 MPEG-2 4:2:2@ML IB Hình 5.7. Sự suy giảm chất lượng ảnh phục hồi theo hiệu suất nén MPEG Thực tế, MPEG không phải là phương pháp nén ảnh duy nhất. Nếu dùng phương pháp nén : Biến đổi thành phần hoặc mã hoá dạng sóng ba chiều, có thể đạt kết quả như trên hoặc có thể tốt hơn. Các phương pháp này hiện nay còn tiếp tục được nghiên cứu nhưng trong tương lai gần nhất ít nhất cũng chưa cạnh tranh được với thuật toán DCT của MPEG. Hiện nay, tiêu chuẩn MPEG -2 được sử dụng nhiều trong các thiết bị truyền hình số (VTR, CAMERA, dựng hình kĩ xảo….) và thông tin đa phương tiện và đang có xu hướng phát triển mạnh ở Việt Nam. Chắc chắn trong một thời gian ngắn nữa vấn đề nén số liệu MPEG-2 sẽ trở lên thông dụng ở VN. Do đó, các kĩ thuật hiện đại, việc nén các số liệu thông tin đã đạt được những tỉ số nén rất cao trong khi vẫn đảm bảo chất lượng tín hiệu được người sử dụng chấp nhận được. Tuy nhiên, khi nâng cao tỉ số nén cần phải quan tâm trước hết phải yêu cầu về chất lượng của hình ảnh , âm thanh… Rõ ràng đối với số liệu video thì tỉ số nén cao hơn rất nhiều so với tỉ số nén có thể đạt được với số liệu thông thường và đặc biệt với số liệu âm-chỉ có thể đạt được với tỉ số từ 4:1 đến 8:1. Do đó những ràng buộc riêng của từng loại dữ liệu. Hy vọng trong tương lai sẽ có nhiều tiêu chuẩn nén hoàn hảo hơn nữa được quốc tế hoá vừa cho tỉ số nén cao vừa cho chất lượng tốt. CHƯƠNG VI: CÁC TIÊU CHUẨN TRUYỀN HÌNH SỐ 6.1.GIỚI THIỆU CHUNG “Truyền hình số mặt đất “ nguyên văn tiếng anh là Digital Terrestral Television Broadeasting - DTTB ( Quảng bá truyền hình số mặt đất ) Sự tiến bộ của công nghệ truyền hình số trong việc mã hoá hình ảnh và âm thanh , sản xuất và lưu trữ chương trình là độc lực thúc đẩy kỹ thuật truyền dẫn và phát sóng phải có sự phát triển tương ứng để có thể phát triển nhu cầu ngày càng cao của công chúng Truyền dẫn và phát sóng truyền hình số có thể chia thành 3 lĩnh vực - Truyền hình số qua vệ tinh - Truyền hình số qua cáp quang ( thường có độ rộng băng tần 8 MHz ) . - Truyền hình số mặt đất ( qua kênh vô tuyến VHF / UHF ) 6.2.CÁC TIÊU CHUẨN TRUYỀN HÌNH SỐ Sự cạnh tranh trên quy mô toàn cầu để làm chủ tương lai của truyền hình số , đã xảy ra một cuộc chiến quyết liệt giữa các hộ tiêu chuẩn mà mỗi bên tham chiến đều lên cương lĩnh , “ cung cấp thông tin , quảng bá , giải trí cho mọi người “ mọi nơi bất cứ lúc nào . Trong cuộc chiến đấu các hệ tiêu chuẩn chính này bao gồm hệ ASTC của Mỹ , hệ ISDB của Nhật và DVB - T của Châu Âu đưa ra hàng loạt công nghệ như độ nét , tính đa kênh , âm thanh Surround , những ứng dụng về quảng bá dữ liệu độ thu khi di động ... Nhưng theo những nghị quyết vừa đưa ra thì yếu tố quyết định nhất vẫn là khả năng của thành phần điều chế trong mỗi hệ . - Tiêu chuẩn ATSC ( Advanced Television Systems committee ) được dùng ở Mỹ , Canada , và một số nước , dùng trên kênh 6MHz ( hoặc 7 MHz , 8 MHz ) . Hệ này dùng điều chế đơn tần 8 - VSB ( Vestigial Sideband ) , tối ưu hoá trong việc cung cấp nhịp BIT thoả mãn yêu cầu HDTV ( ứng dụng cầu đến nhịp BIT cao nhất ) . Việc chọn 8 - VSB chủ yếu dựa trên quan điểm dịch vụ DTV phải tối ưu với các máy thu cố định dùng anten định hướng đặt ngoài trời . - Tiêu chuẩn DVB - T ( Digital video broadcasting - Terrestrial ) của Châu Âu dùng cho kênh 8 MHz hoặc 6MHz , 7MHz dùng hệ điều chế đa tải tần CoFPM , tối ưu về tính mềm dẻo . Nó thích ứng được những điều kiện truyền và thu khó khăn chẳng hạn đường truyền đa lộ trình tĩnh và động , máy thu sách tay và di động dùng anten vô hướng đồng thời có thể dùng mạng phát đơn tần SFN ( Single frequency Network ) - Tiêu chuẩn ISDB ( Intergrated Service Digital Broadcast ) tiêu chuẩn này Nhật Bản tự nghiên cứu , có tham vọng vượt mặt qua hai tiêu chuẩn ATSC và DVB , nó qui tụ những điểm mạnh của cả hai hệ trên . Tiêu chuẩn này dùng kiểu điều chế BST - OFDM ( Band Seymented Transmission OFDM ) một phiên bản của Co FDM có nhiều mức dịch vụ cho máy thu cố định sách tay , di động Sau đây ta sẽ so sánh 3 tiêu chuẩn phát sóng truyền hình số này : 6.2.1.Các thông số cơ bản STT Thông số DVB – T ISDB - T ATSC 1 Dùng bit : MPEG - 2 4:2:0 (tiêu chuẩn máy thu ) Tốc độ bit MPEG-2TS MPEG-2TS MPEG-2TS 2 Loại nén Audio MPEG-2 Layer II (AC-3) MPEG-2AAC AC-3 3 Độ rộng kênh (MHZ) 6; 7 ; 8 6; 7 ; 8 6 4 Điều chế số COFDM (Mỗi tải con điều chế QAM) OFDM Segments 8-USB 5 Tỉ số sai bit Thấp Thấp Cao 6 Khả năng thu trong nhà với anten để bàn Tốt Tốt Kém (Phải định hướng ) 7 Khả năng thu di động với tốc độ dịch chuyển 270km/s Khá tốt Rất tốt không 8 Khả năng lập mạng phát sóng đơn tần(SFN) Tốt Tốt Không 9 Khả năng tương hợp với truyền hình cáp và vệ tinh. Tốt Tốt Không 6.2.2. Các thông số phát sóng Đối với phát sóng truyền hình số 3 tiêu chuẩn này đều sử dụng định dạng dòng truyền tải ( Ts ) cơ bản là MPEG - 2 4 : 2 : 0 ( lấy mẫu theo định dạng 4: 2 : 0 , nén MPEG - 2 với nhiều lớp khác nhau , tốc độ dòng bít truyền một chương trình có thể thay đổi từ 4 đến 9 Mb/s ) với một kênh sóng có độ rộng 8 MHz ( tiêu chuẩn Việt Nam đang sử dụng ) có thể truyền được gần 3 chương trình truyền hình số ( mỗi chương trình có tốc độ bít là 4 Mb/s ) . Tất cả 3 tiêu chuẩn đều có khả năng ghép nhiều chương trình truyền hình trên một kênh sóng ( từ 1 đến 4 với chất lượng tốt ) . Riêng chuẩn ATSC có thiên hướng truyền một chương trình truyền hình độ phân giải cao HDTV . Tín hiệu audio đi kèm cũng sử dụng kỹ thuật nén để có thể ghép được nhiều đường audio trên cùng một kênh ( có thể ghép từ 2® 6 dòng dữ liệu Audio , ví dụ chuẩn 5.1 có 5 dòng dữ liệu Audio và một dòng dữ liệu phụ ) . Với truyền hình số có thể truyền âm thanh theo định dạng nhiều đường moro, stereo hoặc surround . Phần chủ yếu trong máy phát số là bộ điều chế số . Ba tiêu chuẩn phát sóng số sử dụng 3 loại điều chế số khác nhau : Co FDM , OFDM Segments , 8 - VSB . Hai loại điều chế này thực chất có quan hệ rất gần gũi Tỉ số sai bít BER ( Bit Error Rate ) đây là thông số cơ bản để đánh giá chất lượng chung kênh số ; BER là một hàm của nhiều thông số như C/N , tốc độ truyền dòng Ts , tốc độ mã hoá , độ dài khoảng bảo vệ .... Tỷ số sai số BER có thể được xác định trên một đơn vị thời gian nhằm đánh giá tình trạng hoạt động của mộ máy phát , thiết bị truyền dẫn trong một khoảng thời gian . Cường độ trường phát sóng số nói chung là thấp hơn so với cường độ trường đối với máy phát hình kỹ thuật tương tự . Mỗi tiêu chuẩn đều đặc trưng ngưỡng cường độ khác nhau ( ngưỡng cường độ trường là giá trị mà từ đó trở nên có thể thu hình tốt , thấp hơn ngưỡng sẽ không thu hình được ) . Một số tiêu chuẩn truyền hình số cho phép thu di động rất tốt ( ISDN - T và DVB - T cho phép thu khi đi tàu xe chạy với tốc độ trên 270 km/s . Khả năng quan trọng của truyền hình số là có thể phát sóng một tần số trong một phạm vi địa lý rất rộng ( như một quốc gia ) với nhiều chương trình truyền hình ( mạng đơn tần SFN ) , ví dụ như tiêu chuẩn ISDB - T và DVB - T . 6.3. LỰA CHỌN TIÊU CHUẨN TRUYỀN HÌNH SỐ VIỆT NAM 6.3.1. Đặt vấn đề Trải qua nhiều năm nghiên cứu , thử nghiệm , phát sóng truyền hình số trên mặt đất đã trở thành hiện thực . Nhiều nước đã thông báo việc lựa chọn tiêu chuẩn và kế hoạch triển khai trên thức tế . Tuy nhiên do có sự tồn tại của 3 tiêu chuẩn , mỗi tiêu chuẩn đều có những mặt mạnh và mặt yếu riêng nên nhiều nước vẫn trong giai đoạn xem xét , nghiên cứu , thử nghiệm trước khi có quyết định cuối cùng . Việc lựa chọn tiêu chuẩn truyền hình số mặt đất cuối cùng phải phù hợp với đặc thù và nhu cầu của mỗi quốc gia , trong đó có tính đến yêu cầu phủ sóng , chính sách phân hạch tần số , điều kiện kinh tế , địa lý , chính trị . Như ta đã biết thế giới hiện nay có 3 tiêu chuẩn truyền hình số mặt đất là DVB - T , ATSC , và ISDB - T cùng song song tồn tại . DVB - T sử dụng phương pháp điều chế OFDM , ATSC điều chế theo phương pháp 8 - VSB và ISDB - T dùng phương pháp BST - OFDM . ISDB - T là một biến thể của tiêu chuẩn DVB - T cùng sử dụng một phương pháp điều chế OFDM nên thực tế các cuộc tranh luận thường tập trung vào hai tiêu chuẩn DVB - T và ATSC - T mà cốt lõi là hai phương thức điều chế OFDM và 8 - VSB . Cả hai tiêu chuẩn DVB - T và ATSC đều dựa trên phương pháp mã hoá hình ảnh MPEG - 2 . Chỉ khác nhau ở phương thức truyền tải đến người xem . DVB - T mạnh hơn ATSC ở chỗ có khả năng thu di động và tính linh hoạt . ATSC và DVB - T đều sử dụng gói truyền tải MPEG - 2 theo tiêu chuẩn quốc tế : mã ngoài read solomon , mã trong trell is code . Để giảm thiếu khả năng sai sót về dữ liệu cả hai đều dùng phương pháp trái ngẫu nhiên hoá dữ liệu trước khi mã hoá . Xét về tổng thể , cả hai tiêu chuẩn đều rất tiên tiến , có khả năng phát chương trình truyền hình có độ phân giải cao hay một vài chương trình có độ phân dải tiêu chuẩn số hoá trên một kênh truyền hình mặt đất . Hai tiêu chuẩn đều có khả năng sử dụng được cho các dải phổ khác nhau của các tiêu chuẩn số phát sóng mặt đất B/G , D/K ... hay nói cách khác ATSC và DVB - V đều có khả năng áp dụng cho các dải tần 6, 7 , 8 MHz 6.3.2. So sánh lựa chọn tiêu chuẩn Có nhiều thông số để đánh giá so sánh hai tiêu chuẩn ATSC và DVB - T trong đó có các thông số sau : Tỷ lệ công suất đỉnh so với công suất trung bình Can nhiễu của truyền hình tương tự cùng kênh Tráo dữ liệu và mã sửa sai Khả năng chống lại can nhiễu đột biến Khả năng chống lại phản xạ nhiễu đường Khả năng thu di động Khả năng tiết kiệm dải phổ Mang đơn tần và phủ sóng vùng lõm Điều chế có phân cấp Can nhiễu đối với kênh lân cận Khả năng tận dụng mạch tương tự sẵn có Tính tương thích với các loại hình dịch vụ khác Sau đây chúng ta xem xét từng yếu tố cụ thể : 6.3.2.1 . Tỉ lệ công suất đỉnh so với công suất trung bình Các kết quả nghiên cứu trong gần như suốt thời gian phát sóng ( 99,99% ) tỉ số công suất đỉnh trên công suất trung bình của tín hiệu DVB - T cao hơn tín hiệuATSC 2,5 dB . Như vậy để chống lại can nhiễu do kênh lân cận với cùng một điều kiện phát sóng thì máy phát DVB - T cần có công suất cao hơn ATSC 2,5 dB ( cỡ 1,8 lần ) 6.3. 2.2 . Can nhiễu của truyền hình tương tự cùng kênh DVB - T có khả năng chống lại can nhiễu cùng kênh của tín hiệu pal dải hẹp ở bất kỳ tần số nào với công suất gần bằng công suất tín hiệu có ích . Còn ATSC dựa vào các bộ lọc đặc biệt để chống can nhiễu . Tuy nhiên các bộ lọc này lại làm giảm tỷ số tín hiệu tạp đi 3 dB và chỉ có thể chống được can nhiễu cùng kênh của tín hiệu NTSC . Đối với các tín hiệu video khác như PAL , SECAM các bộ lọc này không phát huy được tác dụng hoặc phải thiết kế các bộ lọc khác . Với can nhiễu ở tần số bất kỳ , khả năng chống can nhiễu của hệ ATSC kém DVB - T từ 10 đến 15 dB . Đây là điểm khác nhau quan trọng giữa hai hệ , bởi lẽ trong quá trình quá độ từ truyền hình tương tự chuyển sang truyền hình số thì truyền hình số và truyền hình tương tự phải song song cùng tồn tại trên một diện tích phủ sóng, thậm trí cùng một tần số. 6.3.2.3 . Tráo dữ liệu và mã sửa sai. ATSC dùng mã RS ( 207, 187 ) có khả năng sửa tới 10 byte lỗi, tráo dữ liệu với độ sâu = 52 trong khi DVB - T dùng mã RS ( 204 - 188 ) có khả năng sửa 8 byte và tráo dữ liệu có độ sâu bằng 12. Nhờ mã khoá kênh mạch ATSC đòi hỏi giá trị S/N ít hơn DVB - T khoảng 1.5 dB. Như vậy trên lí thuyết với tác dụng của mã sửa sai và sự khác biệt về tỉ lệ công suất đỉnh trên công suất trung bình để đạt được cùng một diện phủ sóng như nhau thì máy phát DVB - T cần có công suất lớn hơn khoảng 4dB so với ATSC. Tuy nhiên , kết quả thử nghiệm thực tế Australia đã khẳng định hầu như không có sự khác biệt về công suất giữa máy ATSC và DVB - T để đạt được cùng một diện phủ sóng . 6.3.2.4. Khả năng chống lại can nhiễu đột biến. Can nhiễu đột biến thưòng xẩy ra trên dải tần số VHF và các kênh thấp của UHF. Hiện tượng phóng điện trên đường dây điện cao thế cũng là một loại nguồn nhiễu đột biến. ATSC có ưu thế hơn so với DVB - T điều chế 64 - QAM và tỷ lệ mã sửa sai 2/3 . Tuy nhiên kết quả này thay đổi theo bản chất của từng loại nhiễu . ATSC xử lý nhiễu đột biến bằng cách biến đổi nhiễu đột biến trong thời gian ngắn thành các nhiễu đột biến hơn với thời gian nhiễu ngắn hơn . Việc biến đổi được thực hiện bằng các bộ tráo dữ liệu có độ sâu lớn hơn nhiều so với hệ DVB - T . DVB - T cũng trải rộng nhiễu đột biến nhưng với phương thức khác hơn . Năng lượng của nhiễu đột biến được trải rộng bằng FFT . Trên toàn bộ chu kỳ symbol ( hàng chục ngàn bít ) rộng hơn nhiều so với ATSC . 8K - DVB - T trải năng lượng nhiễu trên chu kỳ Symbol dài gấp 4 lần so với modul 2 K . Chính vì vậy 8K DVB - T có khả năng chống nhiễu đột biến tương tự như ATSC . 6.3.2.5 . Khả năng chống lại phản xạ nhiều đường DVB - T với phương thức điều chế 2K sóng mang có thể xử lý tín hiệu phản xạ lớn hơn 30 ms với công suất đúng bằng công suất tín hiệu trực tiếp . Modul 8K sóng mang thậm trí còn chịu được phản xạ lớn hơn 120ms . ATSC không bao giờ có lại khả năng chống lại phản xạ ở mức 0 dB và chỉ có thể xử lý tín hiệu phản xạ yếu và nhỏ hơn 2ms . Trên lĩnh vực này DVB - T ưu việt hơn hẳn so với ATSC . DVB - T với phương thức 8K có khả năng xử lý tín hiệu Dopper tốt hơn ATSC khoảng 20 lần . Một điều đáng nói nữa là khả năng chống lại can nhiễu của hệ ATSC không hề được cải thiện khi tăng công suất máy phát . 6.3.2.6 . Khả năng thu di động DVB - T có thể thu di động nhờ khả năng xử lí được phản xạ nhiều đường và phản xạ có cường độ mạnh ( 0 dB ) Với tốc độ bít thấp mode 2K DVB - T đã thử nghiệm thành công với máy phát có công suất phát không lớn lắm và tốc độ di chuyển 300Km/s . Còn với ATSC 8 - VBS khả năng thu di động là không thể thực hiện được . Tuy nhiên để có thể thu di động cần có sự trả giá về tốc độ dữ liệu thông thường đối với dịch vụ thu di động người ta thường dùng phương pháp điều chế QPSK hoặc 16 - QAM , có tỉ lệ mã sửa sai là 1/2 và tốc độ dữ liệu từ 6 đến 12 Mbps . 6.3.2.7. Khả năng tiết kiệm dải phổ Phương pháp điều chế OFDM có khả năng tiết kiệm dải phổ hơn một chút so với 8 - VSB có băng tần có sườn rất dốc . Tuy nhiên do việc cần dùng khoảng bảo vệ để khắc phục phản xạ nhiều đường nên dung lượng dữ liệu của hệ thống lại giảm . Với cùng điều kiện , dung lượng dữ liệu của OFDM kém hơn 8 - VSB từ 1,9 Mbps đến 4,7 Mbps tuỳ thuộc vào việc lựa chọn khoảng bảo vệ bằng 1/2, 1/8, 1/16 hay 1/32 . Trong trường hợp sử dụng mạng đơn tần có thể dùng một tần số ( kênh ) duy nhất để phủ sóng một diện tích lớn , DVB- T lại có khả năng tiết kiệm đáng kể dải phổ . 6.3.2.8. Mạng đơn tần và vấn đề phủ sóng vùng lõm DVB - T có những khả năng mà ATSC không thể có như việc sử dụng những máy phát sóng có công suất nhỏ làm việc trên một tần số để phủ sóng vùng lõm . Mạng đơn tần là mạng nhiều 2 hay gồm nhiều máy phát sóng cùng một tín hiệu , trên cùng một tần số . Thời gian truyền tín hiệu cao tần từ hai điểm phát xạ khác nhau tới cùng một điểm thu nên thường xảy ra hiện tượng tương tự như phản xạ mạnh trong thời gian dài . DVB - T có thể xử lý tín hiệu phản xạ có công suất đúng bằng tín hiệu có ích ( 0 dB ) điều mà ATSC không thể thực hiện được . 6.3.2.9. Điều chế phân cấp DVB - T có khả năng thực hiện điều chế phân cấp . Điều chế có phân cấp cho phép phát sóng đồng thời tín hiệu truyền hình có độ phân dải cao và độ phân dải tiêu chuẩn . Hơn nữa trong trường hợp nhiễu quá mạnh , những máy thu HDTV có thể hiện thị tạm thời hình ảnh theo tiêu chuẩn SDTV . Điều này còn làm giảm thiểu hiệu ứng Cliff khi tín hiệu yếu thay vì không thu được gì cả . Điều chế có phân cấp được thực hiện bằng cách : tín hiệu được điều chế phân cấp ở chất lượng cao là sản phẩm của sự kết hợp giữa hai cấp điều chế thấp hơn . 6.3.2.10. Can nhiễu với kênh lân cận Kết quả thực nghiệm ở úc năm 1998 đã chỉ rõ : DVB - T với 64 - QAM tỷ lệ sửa sai 2/3 có khả năng chịu được can nhiễu của các kênh lân cận tương tự ATSC trên 6 MHz . Với các tỷ lệ mã sửa sai và phương pháp điều chế khác , DVB - T có khả năng chịu được can nhiễu tốt hơn . 6.3.2.11. Khả năng tận dụng mạch tương tự hiện có Cho đến nay cả hai tiêu chuẩn ATSC và DVB - T đều có khả năng ứng dụng cho các kênh 6,7,8 MHz mặc dù ATSC vốn được thiết kế cho kênh 6 MHz và DVB - T được thiết kế cho 7 , 8 MHz . Tuy nhiên hệ ATSC với phương pháp điều chế 8 - VSB đòi hỏi máy phát phải có độ tuyến tính cao và trễ nhau nhỏ hơn 50ms trong khi DVB - T không quá khắt khe . Vì vậy việc chuyển đổi các máy phát hình tương tự thành máy phát hình số theo tiêu chuẩn dvb- T có tính khả thi cao hơn so với tiêu chuẩn ATSC . 6.3.2.12. Tính tương thích với các loại hình dịch vụ khác ATSC với phương pháp điều chế 8 - VSB trên thực tế chỉ là một tiêu chuẩn truyền hình số mặt đất trong khi DVB - T với phương pháp điều chế OFDM là thành viên của đại gai đình truyền hình số bao gồm các lĩnh vực truyền hình số vệ tinh DVB- S , truyền hình số cáp DVB - C . Máy thu số thích hợp tiêu chuẩn DVB hoàn toàn có khả năng nhận tín hiệu từ mọi phương tiện truyền thông . Hơn nữa cần nhấn mạnh thêm DVB - S , DVB - C và một số tiêu chuẩn khác đã được công nhận trên toàn thế giới . KẾT LUẬN Ở Việt Nam công nghệ số hoá đã và đang xâm nhập vào từng công đoạn của Truyền hình. Trong tương lai không xa trên thế giới nói chung và ở Việt Nam nói riêng tiến tới một hệ thống Truyền hình hoàn toàn kỹ thuật số là một điều tất yếu. Vì vậy như đã trình bày ở trên tiêu chuẩn ATSC và DVB - T đều có tính cạnh tranh. Tuy nhiên để so với hoàn cảnh hiện nay của nước ta thì DVB - T là tiêu chuẩn Truyền hình số được lựa chọn và hợp lý nhất. Với thời gian thực hiện là 3 tháng, được sự hướng dẫn tận tình của Thầy giáo Nguyễn Ngọc Văn cùng với sự nỗ lực của bản thân đến nay em đã hoàn thành xong đồ án tốt nghiệp. Tuy nhiên do thời gian có hạn, tài liệu tham khảo và khả năng tham khảo còn nhiều hạn chế cho nên đồ án có nhiều chỗ không được chi tiết và không tránh khỏi được nhiều sai sót. Kính mong sự góp ý của các Thầy cô giáo Trường Đại Học Bách Khoa Hà Nội. Một lần nữa em xin chân thành cảm ơn sự hướng dẫn của Thầy giáo Nguyễn Ngọc Văn đã giúp em hoàn thành đồ án này.

Các file đính kèm theo tài liệu này:

  • docxBK 1026.docx