Tương hợp ngược là tất cả các Tivi màu có cùng tiêu chuẩn truyền hình thì không cần thay đổi, điều chỉnh gì để thu được chương trình truyền hình đen trắng và ảnh hiện trên màn hình chỉ là ảnh đen trắng.
-> Các điều kiện để thực hiện tính kết hợp
a.Các thông số của hệ truyền hình màu và truyền hình đen trắng có cùng tiêu chuẩn (phương pháp quét ảnh, phổ ảnh, số dòng quét trong một ảnh v.v)
b.Trong tín hiệu truyền hình màu đầy đủ phải có tất cả các thành phần chứa trong tín hiệu đầy đủ của hệ truyền hình đen trắng. Để cho Tivi đen trắng thu tín hiệu truyền hình màu được tốt thì tín hiệu độ chói của ảnh màu phaỉ giống tín hiệu hình ở truyền hình đen trắng.
92 trang |
Chia sẻ: Dung Lona | Lượt xem: 1225 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tìm hiểu về hệ thống truyền hình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
oá 8bit – 625 dòng ) có tốc độ bit bằng 216 Mbit/s. Dải phổ cần thiết để truyền tín hiệu này có bề rộng không dưới ( 3/4) x 216 ằ 162 MHz.
Nếu truyền qua vệ tinh băng C với tiêu chuẩn 40MHz/ Transponder thì phải cần 4 Transponder ghép liền nhau.
Trong studio truyền tín hiệu bằng cáp, Rắc nối chất lượng cao và với khoảng cách ngắn, việc nén dải tần chỉ mang tính kinh tế, nên việc truyền tín hiệu có thể thực hiện được mà không cần nén. Song sẽ rất khó khăn, thặm chí không thể thực hiện được việc truyền tín hiệu video số qua vệ tinh với độ rộng dải tần một kênh 27 MHz hoặc qua hệ thống truyền hình quảng bá trên mặt đất với tiêu chuẩn 7 á 8 MHz cho một kênh truyền hình tiêu chuẩn. Do vậy nén video là công đoạn không thể thiếu được để khắc phục những khó khăn về yêu cầu dsải baưng tần cho phép.
ii. thực chất của nén video
Bản chất của nén video là một quá trình trong đó lượng số liệu biểu diễn lượng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ những số liệu dư thừa trong tín hiệu video. Các chuỗi ảnh truyền hình có nhiều phần tử giống nhau. Vậy tín hiệu truyền hình có chứa nhiều dữ liệu dư thừa, ta có thể bỏ qua mà không làm mất thông tin hình ảnh. Đó là quá trình xoá dòng xoá mành, vùng ảnh tĩnh hoặc chuyển động rất chậm, vùng ảnh nền giống nhau hoặc khác nhau rất ít. Thường thì chuyển động trong ảnh truyền hình có thể dự báo, do đó chỉ cần truyền các thông tin biến đổi. Các hệ thống nén sử dụng đặc tính này của tín hiệu video và các đặc trưng của mắt người ( là kém nhậy với sai số trong hình ảnh có nhiều chi tiết và các phần tử chuyển động). Quá trình sau nén là giãn ảnh để tạo lại ảnh gốc hoặc một xấp xỉ ảnh gốc.
Mô hình nén ảnh
Tầng đầu tiên của bộ mã hoá video, tín hiệu video được trình bầy dưới dạng hiệu quả để nén hiệu quả nhất. Điểm cốt yếu là phải xác định cái gì được mã hoá. Sự biểu diễn có thể chứa nhiều mẩu thông tin để mô tả tín hiệu hơn chính là bản thân tín hiệu, nhưng hầu hết các thông tin quan trọng chỉ tập trung trong một phần nhỏ của sự mô tả này. Trong cách biểu diễn hiệu quả, chỉ có phần nhỏ dữ liệu là cần thiết để truyền cho việc tái tạo lại tín hiệu video.
Biểu diễn thuận lợi
Lượng tử hoá
Gán từ mã
Mã hoá video
xử lý
kênh
Biểu
diễn
thuận lợi
Giải
lượng tử
Giải
từ mã
Nguồn
Video
khôi phục
Giải mã video
Hình 2- 1 : Mô hình hệ thống nén video
Hoạt động thứ hai của bộ mã hoá là lượng tử hoá giúp rời rạc hoá thông tin được biểu diễn. Để truyền tín hiệu video qua một kênh số, những thông tin biểu diễn được lượng tử hoá thành một số hữu hạn mức. ở công đoạn này xẩy ra sai số, sai số này được gọi là sai số hệ thống.
Hoạt động thứ 3 là gán các từ mã. Các từ mã này là một chuỗi các bit dùng để biểu diễn các mức lượng tử hoá. Các quá trình sẽ ngược lại trong bộ giải mã video.
Mỗi hoạt động cố giắng loại bỏ phần dư thừa trong tín hiệu video và lợi dụng sự giới hạn của hệ thống nhìn của mắt người. Nhờ bỏ đi phần dư thừa, Các thông tin giống nhau hoặc có liên quan đến nhau sẽ không được truyền đi. Những thông tin bỏ đi mà không ảnh hưởng đến việc nhìn cũng sẽ không được truyền đi.
2.Độ dư thừa dữ liệu
Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượng thông tin cho trước. Cần phải phân biệt giữa số liệu và thông tin. Thực tế giữa số liệu và thông tin không đồng nhất với nhau. Số liệu( và do đó là tín hiệu) chỉ là phương tiện để truyền tải thông tin. Cùng một lượng thông tin cho trước có thể biểu diễn bằng các lượng số liệu khác nhau, nó bao gồm số liệu hoặc từ không cho thông tin thích hợp lẫn xác định đã biết.
Độ dư thừa số liệu là trung tâm trong nén ảnh số. Độ dư thừa dữ liệu không phải là một khái niệm trìu tượng mà là một thực tế có thể định lượng đưọc bằng toán học.
Nếu r1 và r2 là lượng số liệu trong hai tập hợp số liệu cùng được dùng để biểu diễn một lượng thông tin cho trước thì độ dư thừa số liệu tương đối của tập hợp số liệu thứ nhất so với tập hợp số liệu thứ hai có thể được định nghiã như sau :
RD = 1- 1/CN
Trong đó CN : thường được gọi là tỷ số nén, CN = r1/r2.
Trong trường hợp r1 = r2 thì CN = 1 và RD = 0, có nghĩa là so với tập hợp số liệu thứ hai thì tập hợp số liệu thứ nhất không dư thừa. Khi r2<< r1 thì CN tiến tới vô cùng và RD tiến tới 1, có nghĩa là độ dư thừa số liệu tương đối của tập hợp số liệu thứ nhất là khá lớn hay tập hợp số liệu thứ hai đã được nén quá nhỏ.
ở đây có sự kết hợp giữa tỷ lệ nén và chất lượng hình ảnh. Tỷ lệ nén càng cao sẽ làm giảm chất lượng hình ảnh và ngược lại. Chất lượng và quá trình nén có thể thay đổi tuỳ theo đặc điểm của hình ảnh nguồn và nội dung ảnh. Đánh giá chất lượng ảnh, người ta tính số bit cho một điểm trong ảnh nén ( Nb)). Nó được xác định là tổng số bit ở ảnh nén chia cho tổng số điểm :
Nb = số bit nén / số điểm
Trongnén ảnh số có ba loại dư thừa số liệu :
2.1.Dư thừa mã ( Coding Redundency )
Nếu các mức của tín hiệu video được mã hoá bằng các symbol nhiều hơn cần thiết thì kết quả có độ dư thừa mã. Để giảm độ dư thừa mã, trong nén ảnh thường sử dụng các mã có độ dài thay đổi (VLC) như mã Huffman, mã RLC ... lượng thông tin về hình ảnh có xác xuất cao sẽ được mã hoá bằng từ mã ít bit hơn so với lượng thông tin có xác xuất thấp hơn.
2.2.Dư thừa trong pixel (Interpixel Redundancy)
Giá trị của bất kỳ pixel nào đó cũng có thể được dự báo từ các pixel lân cận nó, nên thông tin từ các pixel riêng là tương đối nhỏ. Sự tham gia của một pixel riêng vào ảnh là dư thừa.
Nhiều tên (bao gồm : dư thừa không gian, dư thừa hình học, dư thừa trong ảnh) được đạt ra để phân biệt sự phụ thuộc này của pixel. Ta dùng độ dư thừa của pixel để chỉ tất cả các tên trên
Để giảm độ dư thừa trong pixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy phải được biến đổi thành một dạng có hiệu quả hơn. Trong các phương pháp nén ảnh người ta thường sử dụng phương pháp biến đổi Cosin rời rạc(DCT) để biến đổi pixel từ miền không gian sang miền tần số, bằng cách này sẽ giảm được độ dư thừa dữ liệu trong pixel ở miền tần số cao.
2.3.Dư thừa tâm sinh lý
Bằng trực quan ta thấy, sự thu nhận cường độ sáng của mắt người thay đổi chỉ giới hạn trong một phạm vi nhất định. Hiện tượng này xuất phát từ sự thật là mắt người không đáp ứng với cùng độ nhậy của các thông tin thì thấy thông tin đơn giản có tầm quan trọng ít hơn thông tin khác trong vùng nhìn thấy. Thông tin này được gọi là độ dư thừa tâm sinh lý nhìn. Nó có thể được loại bỏ mà không ảnh hưởng đáng kể đến chất lượng ảnh.
khác với độ dư thừa mã và độ dư thừa trong pixel, độ dư thừa tâm sinh lý có liên quan đến thông tin định lượng, nó quan trọng tới việc lượng tử hoá. Điều đó có nghĩa là ánh xạ một khoảng rộng các giá trị đầu vào lên một số hữu hạn các giá trị đâù ra. Đó là toán tử không đảo ngược ( mất thông tin) cho kết quả nén số liệu có tổn hao.
iii.các phương pháp nén
Các hệ thống nén là sự phối hợp của rất nhiều các kỹ thuật xử lý nhằm giảm tốc độ bit của tín hiêụ số mà vẫn đảm bảo chất lượng ảnh. Có hai kỹ thuật nén là nén không tổn hao và nén có tổn hao.
1.Nén không tổn hao.
Nén không tổn hao là quá trình nén không mất thông tin, cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén. Đây là quá trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vào chi tiết ảnh được nén. Hệ số nén của phương pháp này luôn luôn nhỏ hơn 2 : 1
Các kỹ thuật nén không mất thông tin bao gồm :
1.1.mã hoá với độ dài từ mã thay đổi(VLC).
Phương pháp này còn được gọi là mã hoá Huffman và mã hoá entropy, dựa trên tính thống kê của tín hiệu, khả năng xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã ngắn cho các từ mã có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại. Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tạo lại giá trị tín hiệu ban đầu. Mã hoá và giải mã Huffman có thể được thực hiện một cách dễ dàng bằng cách sử dụng các bảng tìm kiếm.
1.2.Mã hoá với độ dài của từ mã động (RLC).
Phương pháp này dựa trên sự lặp lại của cùng một giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị lặp lại. Chỉ có các mẫu có giá trị khác 0 mới được mã hoá. Số mẫu có giá trị bằng 0 sữ được truyền đi cùng dòng quét. Cuối cùng các chuỗi 0 được tạo ra bằng quá trình giải tương quan như phương pháp DCT hay DPCM.
2.Nén có tổn hao
Nén có tổn hao chấp nhận mất mát một ít thông tin để gia tăng hiệu quả nén, nó rất thích hợp với nguồn thông tin là hình ảnh và âm thanh. Nó cho tỷ lệ nén ảnh cao để có thể truyền dẫn, phát sóng. Đồng thời cũng cho một tỷ lệ nén thích hợp cho xử lý và lưu trữ ảnh trong studio.
Nén tổn hao thực hiện trong ba bước :
- Bước 1 : Biến đổi tín hiệu từ miền thời gian sang miền tần số bằng cách sử dụng các thuật toán biến đổi cosin rời rạc DCT. Bước này thực hiện việc giảm độ dư thừa của pixel trong ảnh, tuy nhiên quá trình này không gây tổn hao tín hiệu.
-Bước 2 : Thực hiện lượng tử hoá các hệ số DCT, làm tròn các số liệu. Việc mất mát số liệu xẩy ra ở giai đoạn làm tròn này.
-Bước 3 : Nén số liệu đã biến đổi và làm tròn bằng cách mã hoá entropy, ở đây dùng các mã không tổn hao như mã Huffman, RLC...
iv.các loại mã dùng trong nén
1.Mã RLC( Run-Length Coding)
RLC là loại mã xây dựng trên cơ sở sử dụng số lần lặp lại của các điểm ảnh. RLC tách chuỗi giá trị giống nhau và biểu diễn như là một tổng. Khi dãn giá trị này tạo lại số lần biểu diễn tổng. Kỹ thuật này chỉ có thể áp dụng cho các chuỗi symbol tuyến tính. Do đó, khi áp dụng cho số liệu ảnh hai chiều, hình ảnh được tách thành một chuỗi các dòng quét.
Một loại cải biên của mã RLC là mã VLC ( mã có độ dài thay đổi được ) mã này dùng để biểu diễn các giá trị symbol cũng như độ dài chạy. Cách thực hiện là tính phân phân bố xác suất của các độ dài chạy và các giá trị symbol.
RLC không thích hợp trực tiếp cho các ảnh tự nhiên có tông ảnh liên tục được mã hoá bằng một quá trình số hoá tuyến tính, vì RLC phải nén tập số liệu có bước chạy tương đối lớn giống nhau, trong khi đó ảnh có tông liên tục có tần số không gian thấp, việc thay đổi các vùng rộng được làm đầy bằng các giá trị pixel giống nhau là tương đối nhỏ. RLC tự nó sữ không cho các mức nén có ý nghiã.
RLC được dùng kết hợp với các kỹ thuật khác như các chuẩn nén JPEG, MPEG sữ cho kết quả nén tốt. RLC được dùng cho các hệ số lượng tử hoá tốt hơn là dùng trực tiếp cho số liệu ảnh.
2.Mã Shannon-Fano.
Mã này dựa trên xác suất xuất hiện của những symbol nguồn bên trong một lượng thông tin qua xác suất của chúng. Với những symbol có xác suất xuất hiện càng lớn thì từ mã dùng để mã hoá chúng càng ngắn.
3.Mã Huffman
Mã Huffman thuộc loại mã entropy hoặc mã thống kê. Tư tưởng chính là dùng mã VLC, sử dụng ít bit để mã hoá các giá trị hay xẩy ra, và nhiều bit để mã hoá các giá trị ít xẩy ra. Từ đó tốc độ bit sẽ giảm đáng kể.
Nói chung, mã Huffman sẽ đạt hiệu suất thấp nếu xác suất xuất hiện các phần tử gần nhau. Ngược lại đạt hiẹu xuất cao nếu xác suất xuất hiện cách xa nhau.
Trên thực tế mã Huffman được phát triển trên một tập ảnh, nhưng sau đó được áp dụng trên các ảnh khác, mỗi ảnh có phân bố xác suất symbol riêng của nó. Do đó mã Huffman không cần tối ưu cho ảnh đặc biệt nào.
4.Mã dự đoán (DPCM).
Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DCPM). Phương pháp này không mã hoá biên độ thông tin ở mỗi mẫu, mà chỉ mã hoá các thông tin có biên độ chênh lệch giữa mẫu đã cho và mẫu dự báo.Do phân bố chênh lệch về biên độ điểm ảnh có đồ thị hình chuông xung quanh điểm 0. Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác nhau này là không lớn lắm, do vậy để mã hoá nó chỉ cần giảm một số ít bit là đủ.
Phương pháp mã hoá dự đoán còn sử dụng đặc điểm của mắt người và cho phép dùng đặc trưng phi tuyến về lượng tử hoá.
Sau đây là sơ đồ mã hoá và giải mã DCPM :
Sơ đồ bộ mã hoá:
ồ
Bộ lượng tử
Bộ
dự đoán
ồ
Mã hoá
entropy
Kênh
Tín hiệu
Video số
Giải mã
entropy
Bộ dự
đoán
ồ
Đầu ra
giải mã
Kênh tín
hiệu
+
e e
- +
+
+
+++
Sơ đồ bộ giải mã :
Hình 2-2 : Sơ đồ bộ giải mã và mã hoá
Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ được giử đi theo chu kỳ nhất định, cho phép cập nhật các giá trị chính xác. Mã hoá DCPM cũng sử dụng thêm các kỹ thuật dự đoán va lượng tử hoá thích nghi để hoàn thiện thêm kỹ thuật nén này.
4.1.DCPM trong mành ( intraframe DCPM ).
tín hiệu dự báo được tạo từ các mẫu nằm trong cùng một mành, các mẫu được biến đổi nằm trên cùng một dòng quét ( mã giữa các pixel ) và cùng với các dòng quets lân cận ( mã giữa các dòng ).
Việc tạo tín hiệu dự báo của DPCM trong mành dựa trên mối liên kết giữa các điểm ảnh. Các công trình nghiên cứu cho thấy hệ số liên kết giảm nhanh khi đi xa điểm ảnh quan sát theo chiều ngang ( các pixel trên cùng một dòng ) và theo chiều đứng ( các pixel của dòng kề nhau ) do đó khi tạo tín hiệu dự báo cần chú ý đến các mẫu tín hiệu nằm kề nhau.
Tín hiệu dự báo có thể là hàm tuyến tính hoặc có thể là hàm phi tuyến của các mẫu lân cận. Việc tạo tín hiệu dự báo phi tuyến đòi hỏi thiết kế mạch phức tạp hơn, do đó trong thực tế không dùng cho tín hiệu video.
4.2.DCPM giữa các mành.
Tín hiệu dự báo được tạo trên cơ sở các mẫu nằm ở các mành kề nhau trước đó. Phương pháp DPCM giữa các mành tận dụng quan hệ chặt chẽ giữa mành của các ảnh tĩnh và mành trước đó của các ảnh động.
Nghiên cứu thống kê và cấu túc ảnh cho thấy rằng sự khác nhau giữa các ảnh kề nhau là không lớn lắm. Để tạo lại một ảnh trung thực chỉ cần truyền các điểm ảnh làm biến đổi và khôi phục lại ( tại phía thu ) tất cả các điểm ảnh còn lại từ mành trước hoặc ảnh trước trong bộ nhớ.
Phương pháp DPCM giữa các mành thuận lợi cho truyền hình thoại. Vì tín hiệu truyền hình thoại có đặc điểm là ảnh chuyển động ít, tốc độ chuyển động chậm, do đó vùng ảnh rộng, ít thay đổi giữa các mành kề nhau.
Phương pháp cơ bản của DPCM giữa các mành là mã hoá trực tiếp vi sai giữa các mành kề nhau.
Đặc trưng lượng tử là phi tuyến nên sự chênh lệch nhỏ giữa các mức sẽ được khôi phục với độ chính xác cao hơn so độ chênh lệch lớn. Điều đó khẳng định việc khôi phục một cách chính xác các vùng ảnh rộng, chuyển động chậm ( mà trên đó tất cả các méo rất dễ nhận biết ).
Ngược lại, tại vùng ảnh có nhiều chuyển động, khi khôi phục lại sẽ kém chính xác hơn vì do đặc điểm của mắt người, độ phân giải của ảnh có thể thấp hơn.Các loại DPCM thường dùng nhất :
4.2.1.Intraframe DVCPM
Đây là phương pháp lấy mẫu từ phần ảnh chuyển động, chỉ truyền các phần ảnh chuyển động và khôi phục các điểm ảnh còn lại bằng trị trung bình các anhr được truyền.
4.2.2.Phương pháp làm đầy có chọn lọc ( Selective replenishment )
Phương pháp đan chéo các mành còn gọi là phương pháp làm đầy có chọn khi ảnh truyền ít chuyển động và tốc độ thấp. Phương pháp này dựa trên nguyên tắc chỉ truyền phần điểm ảnh được chọn ở mỗi mành và nhận ảnh có độ chiếu sáng lâu.
4.2.3.Phương pháp chia thành những phần ảnh chuyển động và tĩnh.
Phương pháp này là sự kết hợp của phương pháp làm đầy có chọn lọc và phương pháp lấy mẫu từng phần trong ảnh chuyển động cùng với DPCM giữa mành với dự báo một phần tử. Mỗi ảnh được chia thành phần tử chuyển động và phần tử tĩnh, đối với phần ảnh tĩnh dùng phương pháp làm đầy có chọn lọc, đối với các phần tử ảnh động thì sử dụng phương pháp lấy mẫu từng phần.
5.Mã chuyển vị ( Transform Coding )
Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt được hiệu quả bởi vì không tận dụng hết được mối quan hệ giữa các khối điểm trong ảnh số. Phương pháp mã chuyển vị là một cách có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó.
Trong hệ thông PCM tuyến tính và DPCM người ta căn cứ vào biên độ tín hiệu để thực hiện, còn trong mã chuyển vị thì dựa vào việc chuyển đổi tín hiệu từ miền thời gian sang miền tần số. ở đây không dùng phép biến đổi Fourier vì nó không phù hợp, mà người ta dùng phép biến đổi tuyến tính.
Phương pháp gồm các bước như sau :
ỉChia ảnh thành các khối tiểu ảnh với kích thước n ´ n
ỉBiến đổi tuyến tính các phần tử (mẫu) của tín hiệu mỗi tiểu ảnh
ỉMã hoá các phần tử của tín hiệu.
Tạo ảnh
n´n ảnh con
Biến đổi thuận
Lượng tử hoá
Symbol
encoder
ảnh đã nén
ảnh vào
N´N
Symbol
decoder
Biến đổi
ngược
Tạo hợp
n´n ảnh con
ảnh đã
giải nén
ảnh đã nén
Hệ thống mã hoá và giải mã mã chuyển vị :
a) Mã hoá
b) Giải mã
Hình 2-3 : Hệ thống giải mã và mã hoá mã chuyển vị
Trong mã chuyển vị, bước đầu tiên là phải chọn một chuyrnt đổi thích hợp để giảm sự đối lập giữa các điểm trong khối một cách hiệu quả. Mặc dù bản thân quá trình chuyển đổi này không làm giảm tốc độ bit đi chút nào nhưng nó có hiệu quả trong việc giảm dữ liệu trong quá trình lượng tử hoá. Hay nói cách khác, quá trình chuyển đổi thành mã chuyển vị không hề xẩy ra nén dữ liệu mà chỉ là bước chuẩn bị cho việc giảm dữ liệu trong quá trình lượng tử hoá. Sau khi chọn được biến đổi trực giao thì bước quan trọng nhất là xác định bit chỉ định và thiết kế hệ thống lượng tử hoá cho các hệ số này để toàn bộ quá rình nén dữ liệu được thực hiện tại đây. Bước cuối cùng là sử dụng mã en trropy để giảm tốc đọ dữ liệu.
Mục đích của việc chia ảnh thành các ảnh con n ´ n là để tách liên kết các pixel của từng ảnh con hoặc gói càng nhiều thông tin và một số ít các hệ số biến đổi.
Sau đó trạng thái lượng tử hoá tách có chọn lọc hoặc lượng tử hoá thô hơn các hệ số mang tin ít nhất. Các hệ số này ít ảnh hưởng tới chất lượng ảnh con được khôi phục. Quá trình mã hoá xác định các hệ số lượng tử hoá được thực hiện bằng mã VLC.
Chọn chuyển vị ( biến đổi ) : các hệ thống mã chuyển vị ( biến đổi ) trên cơ sở biến đổi Karhuman loeve (KLT), DFT,DCT, Walsh-Hadamard (WHT). Việc chọn một chuyển vị cụ thể cho 1 ứng dụng nhất định phụ thuộc vào mức sai số khôi phục của nó và có thể tính bằng máy tính. Có thể nén trong khi lượng tử hoá các hệ số biến đổi ( nhưng ngoài thời gian chuyển vị ).
Hầu hết các hệ thống mã chuyển vị trên thực tế đều dựa trên cơ sở DCT, nó cho phép phối hợp tốt giữa khả năng gói thông tin và độ phức tạp tính toán.
Một đặc tính quan trọng của DCT so với các biến đổi cosin khác là : nếu như biến đổi DFT sẽ dẫn đến liên kết không liên tục trong nội dung cần chuyển vị các thành phần tần số cao và nếu các hệ số này được trung chuyển, lượng tử hoá sẽ gây ra hiện tượng Gibbs và gây ra sai số. Còn DCT không tạo ra sự rời rạc trong liên kết, do đó nó hạn chế được sai số do Gibbs gây ra.
Phương pháp này tập trung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh gốc và lượng thông tin chỉ trong một số ít các hệ số chuyển vị. Như vậy số bit dùng cho quá trình chuyển vị sẽ ít đi.
Một lý do nữa là do hệ thống thị giác của con người không nhận biết được hoàn toàn các chi tiết của ảnh khi các chi tiết đó biến đổi nhanh so với các chi tiết biến đổi chậm, do vậy để mã hoá các hệ số chuyển vị ở tần số cao ta chỉ cần một số ít bit mà chất lượng hình ảnh vẫn cao.
Trong hệ chuyển vị hai chiều cho các ảnh số, dựa tên cơ sở tương quan giữa các mẫu trên dòng hình. Trước tiên một khối được chia thành nhiều khối hình chữ nhật với kích thước p ´q. Sau đó các khối này được chuyển vị và các hệ số thu được sau quá trình chuyển vị được lượng tử hoá và mã hoá.
Phương pháp chuyển vị xuất hiện méo do việc chia ảnh thành các khối ảnh con, kết quả gây nhoè và phản xạ ở các khối ảnh con.
v.nén trong ảnh
1.Nguyên lý nén trong ảnh.
Sơ đồ nguyên lý quá trình nén trong ảnh
Điều khiển tốc độ
Tiền xử lý
DCT
thuận
Lượng
tử hoá
Mã hoá
entropy
Mạch
trộn
Khuếch
đại đệm
Tín hiệu
ảnh nén
Nguồn ảnh
Bảng lượng tử
Hình 2- 4 : Sơ đồ nguyên lý nén trong ảnh
Nén trong ảnh là loại nén nhằm làm giảm bớt thông tin dư thừa trong miền không gian. Nén trong ảnh sử dụng cả hai quá trình nén có tổn hao và nén không tổn hao để giảm bớt dữ liệu trong một ảnh. Quá trình này không sử dụng các ảnh trước và sau ảnh đang xét.
Thuật ngữ ảnh ở đây cần được hiểu một cách chính xác, bởi vì trong kỹ thuật nén ảnh cho phép sử dụng hoặc mành ( field ) hoặc ảnh ( frame ) như một anhr gốc. Nếu kỹ thuật nén dùng mành thì nén trong ảnh sẽ tạo ra hai ảnh trong mỗi ảnh.
2.Tiền sử lý
Trước khi thực hiện biến đổi DCT cả ảnh được chia thành các khối lớn riêng biệt không chồng nhau (khối MB). Mỗi MB bao gồm 4 Block các mẫu tín hiệu chói (Y) và 2:4 hoặc 8 block các mẫu tín hiệu số mầu (CR,CB). Số các block phụ thuộc vào các loại chuẩn video.
2
3
4
5
2
3
6
7
2
3
6
10
7
11
a) 4:2:0(4:1:1) b)4:2:2 c) 4:4:4
a) Cấu trúc các block tín hiệu chói (quét liên tục)
b) Cấu trúc block tín hiệu chói (quét xen kẽ)
Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh kích thước 8´8 được lấy từ một ảnh màn hình theo chiều từ trái sang phải từ trên xuống dưới.
Cấu trúc của MB cũng phụ thuộc vào loại quét ảnh. Nếu quét liên tục thì các block bao gồm các mẫu từ các dòng liên tục ( quét theo ảnh frame ). Ngược lại trong trường hợp quét xen kẽ, trong một block chỉ gồm các mẫu của một nửa ảnh (nén theo mành-field). Việc chia thành ảnh con chỉ thực sự có ý nghĩa cho bước chuyển vị tiếp theo.
3.Biến đổi cosin rời rạc (DCT)
Công đoạn đầu tiên của hầu hết các quá trình nén là xác định các thông tin dư thừa trong miền không gian của một mành hoặc một ảnh của tín hiệu video. Nén không gian dược thực hiện bởi phép biến đổi DCT (Discrete cosine trasform). DCT biến đổi dữ liệu dưới dạng biên độ thành dữ liệu dưới dạng tần số. Mục đích của quá trình biến đổi là....
hoặc gói càng nhiều năng lượng của ảnh con vào một phần nhỏ các hệ số hàm truyền. Việc mã hoá và truyền chỉ thực hiện đối với các hệ số năng lượng này, và có thể cho kết quả tốt khi tạo lại tín hiệu video có chất lượng cao.
DCT đã trở thành tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi nó có đặc tính gói năng lượng tốt, cho kết quả là số thực và có thuật toán nhanh để thực hiện chúng.
Các phép tính DCT được thực hiện trong phạm vi các khối 8´8 mẫu tín hiệu chói Y và các khối tương ứng của tín hiệu mầu. Việc chia hình ảnh thành các block đã được thực hiện ở khối tiền xử lý.
Hiệu quả của việc chia này rất rễ thấy và đó là một trong các hướng quan trọng của mã hoá có chất lượng cao. Nếu tính toán DCT trên toàn bộ frame thì ta xem toàn bộ frame có độ dư thừa là như nhau. Nhờ đặc tính thay đổi của các ảnh khác nhau và các phần khác nhau của cùng một ảnh, ta có thể cải thiện một cách đáng kể việc mã hoá nếu biết tận dụng. Vì vậy, để sử dụng các đặc tính thay đổi của các phần tử dư thừa trên cơ sở mở rộng không gian cuỉa ảnh, DCT được tính trên các MB và mỗi MB được xử lý riêng biệt.
Để hiểu hết ứng dụng của DCT trong nén ảnh, ta tìm hiểu thuật toán biến đổi cosin rời rạc. DCT là toán tử dùng để tính các thành phần tần số của một tín hiệu được lấy mẫu tại một tốc độ lấy mẫu. DCT của một tín hiệu hai chiều có thể tính được bằng cách dùng các DCT một chiều riêng biệt.
3.1.DCT một chiều
DCT một chiều biến đổi một bảng số biểu diễn các biên độ tín hiệu của các điểm khác nhau theo thơì gian hoặc không gian thành một bảng khác của các số, mỗi số biểu diễn biên độ của một thành phần tần số nhất định từ tín hiệu gốc. Bảng kết quả các số chứa đựng cùng số giá trị như bảng gốc : phần tử thứ nhất là trung bình của tất cả các mẫu trong bảng đầu vào và được coi như hệ số điều chế-hệ số DC; còn các phần tử còn lại, mỗi phần tử biểu diễn biên độ của một thành phần tần số đặc trưng của bảng đầu vào và được gọi là hệ số AC.
Tần số được biểu diễn bằng mỗi phần tử trong bảng kết quả là một hàm chỉ số bảng cho phần tử đó. Nội dung tần số của tập mẫu tại mỗi tần số được tính bằng trung bình có trọng số của tập toàn thể. Trọng số xấp xỉ cho mỗi đầu vào được xác định bằng cách : nhân chỉ số hiện tại của bảng kết quả với số thứ tự và chỉ số của mẫu đầu vào. Điều này có tác dụng tạo ra một chuỗi các hệ số có trọng số là xấp xỉ của một sóng cosin, có tần số tỷ lệ với chỉ số của bảng kết quả. Hàm tính các hệ số có trọng số của mẫu được tính theo công thức sau:
C(k,m) = C(k). Cosin[(2m + 1) kp/2N];
C(K) = 1 Nếu k = 0
1 Nếu k = các giá trị khác
k – chỉ số bảng kết quả
m – chỉ số của bảng mẫu
N - độ lớn của bảng của bảng của mẫu (block có N = 8 )
Hàm trung bình có trọng số được cho sau đây (DCT một chiều)
Với X(k) là bảng kết quả
x(m) là bảng mẫu
Hàm biến đổi ngược ( DCT một chiều ngược )
Mã hóa DCT thực hiện chia dải phổ thành 8 dải băng nhỏ hơn, tương ứng với mỗi dải băng tần có một hệ số đặc trưng cho năng của tín hiệu trong dải băng tần đó.
3.2.DCT hai chiều
Để đạt được mức dải tương quan cao hơn nội dung của một ảnh có thể sử dụng phép biến đổi DCT hai chiều cho khối 8´8 giá trị các điểm chói. Việc biến đổi DCT hai chiều dựa trên cơ sở sắp xếp các mẫu f(i,j) với i = 0, 1...7;
Trong đó :
Phương trình trên là một liên kết của hai phương trình DCT một chiều một cho tần số ngang và một cho tần số đứng. Đặc điểm của hệ số DCT hai chiều là hệ số nằm ở góc trái trên cùng là hệ số (0,0) là hệ số điều chế của tín hiệu video trong ma trận 8´8
Còn các hệ số khác, dưới giá trị thành phần một chiều biểu thị các tần số cao hơn theo chiều dọc. các hệ số về phía phải của các thành phần một chiều biểu thị các tần số cao hơn theo chiều ngang. Hệ số trên cùng ở cận phải (0,7) sẽ đặc trưng cho tín hiệu có tần số cao nhất theo phương nằm ngang của ma trận 8´8 và hệ số hàng cuối cùng bên trái (7,0) sẽ đặc trưng cho tín hiệu có tần số cao nhất theo phương thẳng đứng. Còn các hệ số khác ứng với những phối hợp khác nhau của các tần số theo chiều dọc và ngang.
Phép biến đổi DCT hai chiều là hoàn toàn đảo ngược và luôn có thể tạo lại các giá trị mẫu f(i,j) trên cơ sở các hệ số F(u,v) thoả mãn công thức sau (với điều kiện độ chính xác về tính toán đủ lớn) :
Như vậy, biến đổi DCT giống như biến đổi Fourier và các hệ số F(u,v) cũng giống nhau về ý nghĩa. Bản thân phép biến đổi DCT không nén được số liệu, từ 64 mẫu ta nhận được 64 hệ số. Sau đó thay đổi phân bố giá trị các hệ số đối với phân bố các giá trị mẫu.
4.Lượng tử hoá
Bước tiếp theo của quá trình nén là lượng tử hoá các hệ số F(u,v) sao cho giảm được số lượng bit cần thiết. Vì các hệ số có các giá trị khác nhau, cho nên các hệ số riêng có thể tính bằng các phương pháp khác nhau.
Q(u,v)
F0,0 F0,1 ...
F1,0 F1,1 ...
...
....
...
Lượng tử hoá theo
trọng số
Bảng lượng tử
8´8
F(u,v) F00/Q00 Fq(u,v)
Hình 2- 5 :
Các hệ số ứng với tần số thấp có giá trị lớn hơn, và như vậy nó chứa phần năng lượng chính của tín hiệu, do đó phải lượng tử hoá với độ chính xác cao. Riêng hệ số một chiều đòi hỏi độ chính xác cao nhất, vì nó biểu hiện độ chói trung bình của từng khối phần tử ảnh.
Bất kỳ một sai sót nào trong quá trình lượng tử hoá, hệ số một chiều đều có khả năng nhận biết rễ dàng, vì nó làm thay đổi độ chói trung bình của khối. Ngược lại, với các hệ số tương ứng với tần số cao và có giá trị nhỏ thì biểu diễn bằng tập các giá trị nhỏ hơn hẳn các giá trị cho phép. Quá trình này có thể thực hiện bằng cách cho những khoảng cách giữa các bước lượng tử hoá thay đoỏi theo hệ số.
Lượng tử hoá được thực hiện bằng việc chia các hệ số F(u,v) cho các hệ số ở vị trí tương ứng trong bảng lượng tử Q(u,v) để biểu diễn số lần nhỏ hơn các giá trị cho phép của hệ số DCT. Các hệ số có tần số thấp được chia cho các giá trị nhỏ, các hệ số ứng với tần số cao được chia cho các giá trị lớn hơn sau đó các hẹ số được làm tròn ( bỏ đi các phần thập phân ).
Các giá trị F(u,v) sẽ được mã hoá trong các công đoạn tiếp theo.
Cần phải xác định là trong quá trình lượng tử hoá có trọng số, có xẩy ra mất thông tin, gây tổn hao. Đây là bước gây tổn hao duy nhất trong kỹ thuật nén. Mức độ tổn hao phụ thuộc vào gái trị các hệ số trên bảng lượng tử. Nhiễu lượng tử đối với tín hiệu mầu khó nhìn thấy hơn đối với tín hiệu chói, cho nên có thể thực hiện lượng tử hoá thô tín hiệu mầu.
Như vậy, khối DCt đóng vai trò quang trong trong quá trình lượng tử hoá khi thiết kế hệ thống nén video vì nó ảnh hưởng trực tiếp đến việc khôi phục chất lượng hình ảnh tốt hay xấu. Việc dùng các mã biến đổi sao cho thu được kết quả tốt tuỳ thuộc vào thành phần tần số biến đổi chi tiết ánh sáng tùng vùng trong miền không gian ảnh. Các ảnh càng chi tiết thì hệ số thành phần tần số cao càng lớn, Nếu hệ sopó trong các bảng lượng tử tương ứng quá thấp có thể dẫn đến tràn bộ đệm. Một thông tin hồi tiếp về bộ đệm cho phép điều khiển một hệ số cân bằng, qua đó điều khiển tối ưu trạng thái của bộ đệm. Hệ số cân bằng này chỉ đưa vào các thành phần AC mà thôi. Hệ số cân bằng là một hằng số trong một cấu trúc khối cơ bản chứa đựng hai khối mầu và một số thay đổi về khối chói phụ thuộc vào cấu trúc ảnh ban đầu.
5.mã hoá entropy
Các giá trị lượng tử hoá có thể chỉ biểu diễn nhờ các từ mã có độ dài cố định hay đồng đều, tức là các giá trị lượng tử hoá biểu diễn cùng một số bit. Tuy nhiên hiệu quả mã hoá không cao. Để cải thiện người ta dùng mã hoá entropy. Mã hoá entropy dùng đặc tính thống kê của tín hiệu được mã hoá.
Khi dùng mã hoá entropy có hai vấn đề được đặt ra :
Thứ nhất : mã hoá entropy làm tăng độ phức tạp và yêu cầu bộ nhớ lớn hơn so với mã độ dài cố định.
Thứ hai : mã hoá entropy gắn liền với tính không ổn định của tín hiệu video sẽ làm tốc độ bit thay đổi theo thời gian. Do đó cần có một cơ cấu điều khiển bộ đệm khi mã hoá nguồn tốc độ bit biến đổi được ghép với kênh có tốc độ không đổi.
VI.nén liên ảnh
1.Mô hình.
Một tính chất của tín hiệu video là chứa thông tin dư thừa trong miền thời gian. Có nghĩa là, trong một chuỗi ảnh liên tục lượng thông tin chứa trong mỗi ảnh sẽ thay đổi rất ít từ ảnh này sang ảnh khác. Tính toán sự dịch chuyển vị trí của nội dung hình ảnh là một phần rất quan trọng trong kỹ thuật nén liên ảnh. Mô hình nén liên ảnh như sau
Bù chuyển
động
Nén trong
ảnh
ảnh nén
Nguồn
ảnh
Một chuỗi video là một chuỗi ảnh tính được hiện ra với tốc độ nhanh sẽ cho cảm giác chuyển động liên tục. Mặc dù các frame có sự khác nhau, cần thiết phải có một tốc độ frame cao để đạt được cảm giác chuyển động thực sự. Từ đó tạo ra nhiều độ dư thừa tạm thời giữa các frame kề nhau. sự bù chuyển động chính là để loại bỏ phần dư thừa này. Sau quá trình bù chuyển động, để tăng hiệu quả nén cần sử dụng kỹ thuật nén trong ảnh để xử lý độ dư thừa trong không gian trong phần thừa của bù chuyển động.
2.Xấp xỉ và bù chuyển động
Nhiều thay đổi về cường độ sáng từ frame này đến frame kế tiếp là do chuyển động của đối tượng. Trong mã bù chuyển động, frame hiện tại được dự báo từ frame trước đó bằng cách xấp xỉ chuyển động giữa hai frame và bù chuyển động đó. Sự khác nhau giữa frame hiện tại và frame trước đó gọi là phần dư thừa của bù chuyển động và phần dư thừa này sẽ được mã hoá.
Đối với mỗi chuỗi video bình thường, đặc trưng về phần năng lượng của phần dư thừa thấp hơn rất nhiều so với năng lượng trong tín hiệu video gốc do loại bỏ thành phần dư thừa tạm thời. Mã hoá phần dư thừa thay vì mã hoá video giúp đảm bảo thông tin dư thừa tạm thời không bị mã hoá lặp lại.
Như vậy, việc xác địng phần ảnh động là “ xấp xỉ chuyển động “. Quá trình khôi phục một ảnh bằng cách dùng các phần tử ảnh trước cùng với thông tin về chuyển động chính là bù chuyển động. Sự đánh giá chuyển động có thể là toàn frame. Để thực hiện tối ưu, chia mỗi frame thành các khối ( 8´8 pixel ) sau đó mới đánh giá chuyển động cho từng khối.
Việc đánh giá chuyển động toàn frame sẽ gây ra hai vấn đề sau :
Thời gian dùng để theo dõi một vùng ảnh rộng của ảnh cho vector chuyển động được tính toán.
Các khối chuyển động dẫn đén việc xác định cái gì để đặt vào không gian trống ( do khối chuyển động )
Sử dụng xấp xỉ và bù chuyển động là để thay hai yêu cầu trong hệ thống mã / giải mã. Đầu tiên bộ giải mã phải lưu ảnh trước trong khi tạo lại ảnh
tiếp theo. Sau đó, bộ mã hoá phải tạo lại mỗi ảnh sau khi mã hoá nó để dự báo cho bộ giải mã tạo ảnh như thế nào. Điều này cần thiết vì bộ giải mã không có bất kỳ một ảnh gốc nào có thể tạo lại các khối bù chuyển động.
Một phương pháp dự đoán để tìm ra các chi tiết ảnh thay thế giữa hai khung hình liền nhau và tạo ra một vetor chuyển động chỉ rõ vị trí của chi tiết ảnh này trong khung hình tương ứng. Theo đó, vetor chuyển động sẽ phối hợp với tất cả các khối được nén trong khung hình trước đó mà khối các điểm ảnh này được lặp lại tại một vị trí mới.
Vị trí khối 8´8 pixel Vị trí khối trước đó Vùng tìm kiếm
Vector chuyển động Vị trí
khối hiện tại
Hình 2-6 : Vector chuyển động giữa hai khung hình liền nhau
Có nhiều phương pháp khác nhau để xác định vector thay thế, một trong những phương pháp này có tên gọi là phối hợp các khối ( block matching). Khối số liệu điểm ảnh được lựa chọn, gọi là khối tham chiếu, trong khung hình hiện tại chuyển động trong khung hình trước đó. Các giá trị DCT tham chiếu được so sánh với các giá trị khối 8´8 điểm trong vùng tìm kiếm để tìm ra khối thích hợp nhất, tương ứng khi sự sai khác là nhỏ nhất. Khi đó vector xác định khoảng cách giữa vị trí phối hợp đã tìm thấy được tạo ra. Thông tin số liệu về vector chuyển động được truyền tới cùng với hệ số DCT sai lệch.
Dể giảm quá trình tính toán vector chuyển động độ phân giải của ảnh có thể giảm xuống theo cả 2 chiều chiều ngang và chièu đứng bằng cách này mà có thể giảm số bit cần sử lý và dự đoán các phần chính được thay thế trong khung hình. Ví dụ một ảnh có độ phân giải đầy đủ là 720 ´ 480 có thể giảm đến mức 360´240. ảnh với độ phân giải thấp có thể dùng cho vùng dự đoán lớn hơn. Đầu tiên một dự đoán chuyển động gần đúng sẽ được tiến hành trên các ảnh có độ phân giải thấp naỳ. sau đó một phép dự đoán vector chuyển động chính xác sẽ thực hiện tính toán vị trí thay thế chính xác của đối tượng giữa 2 khung hình. Quá trình dự báo sẽ thực hiện qua nhiều bước để thu được dự báo chính xác cuối cùng.
Đối với các đối tượng chuyển động nhỏ có thể bỏ qua trong giai đoạn dự báo chuyển động gần đúng do đó dự đoán vector sẽ mang sai số. Trường hợp này sẽ sử dụng các khối nhỏ hơn. Với 1 vùng thay thế có kích thước lớn sai số trong quá trình phối hợp sẽ trở lên lớn hơn giữa các khối có cùng mức xám xong không có liên hệ về chuyển động. Hơn nữa nhiều những kiểu chuyển động trong bức ảnh có thể tạo ra sự xung đột trong vùng tìm kiếm. Để giải quyết vấn đề này có sự phân chia trong việc phối hợp các khối.
3.Tốc độ chuyền sau khi nén
Ta có mối quan hệ giữa tốc độ truyền C, băng tần kênh truyền W :
W³3/4C (W:Mhz; C: Mbit/s).
Dưới đây là thống kê tốc độ truyền của các loại ảnh :
-ảnh tĩnh 1,2 á 9,6 Kbit/s
-ảnh chuyển động chậm 12á40 Kbit/s
-Truyền hình thoại 58á 2000 Kbit/s
-ảnh truyền hình đen trắng 70á 108 Mbit/s
-Truyền hình mầu 216 Mbit/s
-Truyền hình HDTV 1,1 á 2,3 Gbit/s
Sau khi sử dụng các thuật toán nén video thì tốc độ truyền của tín hiệu hình được giảm đi đáng kể có nghĩa là độ rộng dải thông cũng giảm đi.
C = 2á13 Mbit/s
Dải thông W = 1,5 á 9 Mhz
Như vậy do ưu điểm trên cho nên việc truyền tín hiệu truyền hình số có nén video đang được sử dụng rộng rãi cho hiệu quả kinh tế và kỹ thuật cao chất lượng đường truyền cao tiết kiệm băng tần.
vii.các chuẩn mpeg
1.Giới thiệu chung về chuẩn MPEG
Chuẩn MPEG (Moving Picture Expert Group) là chuỗi chuẩn video với mục đích mã hoá tín hiệu hình ảnh và âm thanh cho DSM ( Digital Storage Media) ở tốc độ 1,5 á 50 Mbit/s và được biết đến như là MPEG1, MPEG2, MPEG4... các chuẩn MPEG tiến tới tối ưu hoá cho các ứng dụng viudeo động và các đặc điểm của nó cũng bao gồm một thuật toán cho việc nén dữ liệu Audio với tỷ lệ là 5:1 cho tới 10:1.
Trong chuẩn MPEG người ta định nghĩa các loại ảnh khác nhau cho sự linh hoạt để cân nhắc giữa hiêụ quả mã hoá và truy cập ngẫu nhiên
1.1.ảnh loại I( Intra picture)
Là loại ảnh được mã hoá riêng. ảnh I có chứa đựng dữ liệu để tái tạo lại toàn bộ hình ảnh vì chúng được tạo thành bằng thông tin của chỉ một ảnh. ảnh I cho phép truy cập ngẫu nhiên tuy nhiên đạt được tỷ lệ nén thấp.
1.2.ảnh loại P ( Predicted Picture )
Là ảnh mã hoá có bù chuyển động từ ảnh I hoặc ảnh P phía trước ( ảnh dự đoán trước ) ảnh P cung cấp các hệ số nén cao hơn ảnh I.
1.3.ảnh loại B( Bidirectional Predicted Picture )
Là ảnh được mã hoá sử dụng bù chuyển động từ các ảnh I và ảnh P phía trước và ở phía sau ( ảnh dự đoán hai chiều ). ảnh B cho tỷ lệ nén cao nhất.
1.4.Nhóm ảnh GOP
Đối với chuẩn MPEG chất lượng ảnh không những phụ thuộc vào tỷ lệ nén trong từng khuông hình mà còn phụ thuộc độ dài nhóm ảnh.Nhóm ảnh GOP là khái niệm cơ bản của MPEG . GOP là đơn vị mang thông tin độc lập của MPEG.
Công nghệ MPEG sử dụng 3 loại ảnh I,P,B. trong đó ảnh P,B không phải là hai ảnh hoàn chỉnh, mà chỉ chứa thông tin về sự khác biệt giữa ảnh đó và ảnh trước nó ( đối với ảnh P), hay sự khác biệt với cả hai ảnh trước và sau nó (đối với ảnh B) để có một khuông hình hoàn chỉnh, ảnh P và B cần có dữ liệu từ các ảnh lân cận, vì vậy MPEG đã đưa ra khái niệm GOP.
Mỗi GOP bắt buộc phải bắt đầu bằng một ảnh hoàn chỉnh I và tiếp sau đó là một loạt các ảnh P và B. Nhóm ảnh có thể mở hoặc đóng.
Nhóm ảnh mở luôn bắt đầu bằng một ảnh I và kết thúc ở một ảnh trước ảnh I tiếp theo, có nghĩa là ảnh cuối cùng của GOP dùng làm ảnh đầu tiên của GOP tiếp theo làm ảnh chuẩn.
Thứ tự hiện ảnh 1 2 3 4 5 6 7 1 2 3 4
Thứ tự truyền 1 3 4 2 6 7 5 1 3 4 2
ảnh 1 B B P B B I 1 B B P
GOP GOP Cấu trúc GOP mở Cấu trúc GOP đóng
Đối với cấu trúc khép kín, việc dự đoán ảnh không sử dụng thông tin của GOP khác. Trong trường hợp này theo quy định, ảnh cuối cùng của một GOP bao giờ cũng là ảnh P.
Nhóm ảnh được xác định bởi 2 thông số m và n. Thông số m xác định số khung hình P và khung hình B xuất hiện giữa hai khung hình I gần nhau nhất. Số n xác định số khung B giữa hai khung P.
Tỷ lệ nén video của MPEG phụ thuộc rất nhiều vào độ dài của GOP. tuy nhiên GOP dài thường gây khó khăn cho quá trình tua, định vị, sửa lỗi ... Do đó tuỳ thuộc vào từng khâu ( sản xuất, dựng, truyền dẫn, phát sóng vv.. ) mà ta chọn độ dài GOP thích hợp. Trong sản xuất hậu kỳ, nếu yêu cầu truy cập ngẫu nhiên vào bất cứ ảnh nào, điều đó có nghĩa là yêu cầu truy nhập chính xác đến từng ảnh, GOP khi đó chỉ có ảnh loại I, trường hợp này sẽ cho tỷ lệ nén rất thấp. Để tăng tỷ lệ nén, số lượng ảnh P và B phải tăng lên, lúc này sẽ không cho phép việc dựng hình cũng như làm kỹ xảo trên chuỗi ảnh đó. Trong trường hợp này GOP có thể bao gồm 12 ảnh.
1.5.Cấu trúc dòng bit MPEG video
Cấu trúc dòng bit video bao gồm 6 lớp :
a.Khối : khối 8´8 các điểm ảnh tín hiệu chói và tín hiệu mầu dùng cho phương pháp nén DCT.
CR Y CB
Khối điểm
8´8 Macroblock
Mảng
Khung
Nhóm ảnh
Hình 2-7 : Kiến trúc dòng bit video
b.Cấu trúc khối(macroblock) : một cấu trúc khối là một nhóm các khối tương ứng với lượng thông tin chứa đựng trong kích thước 16´16 điểm trên bức ảnh. Cấu trúc khối cũng xác định lượng thông tin chứa trong đó sẽ thay đổi tuỳ theo cấu trúc mẫu được sử dụng. Thông tin đầu tiên trong cấu trúc khối mang dạng của nó ( là cấu trúc Y hay CR,CB ) và các vector bù chuyển động tương ứng.
c.mảng ( Slice ) : mảng bao gồm một vài cấu trúc khối kề nhau. Kích thước lớn nhất của mảng có thể bao gồm toàn bộ bức ảnh và kích thước nhỏ nhất của mảng là một cấu trúc khối. Thông tin đầu của mảng chứa đựng vị trí của mảng trong toàn bộ ảnh và hệ số cân bằng lượng tử. Kích thước thông tin đầu của mảng được xác định bằng số lỗi cho phép xuất hiện trong mảng đối với một ứng dụng nhất định, theo đó bộ giải mã có thể bỏ qua các mảng có nhiều lỗi và xác định tính hiệu quả của phương pháp nén ảnh, theo đó hệ số cân bằng lượng tử có thể được điều chỉnh thường xuyên với việc sử dụng mảng có kích thước nhỏ hơn. Hệ số DC tham chiếu ( dùng trong mã hoá DPCM ) sẽ được so sánh chuẩn tại đầu mỗi mảng.
d.ảnh : lớp ảnh cho phép bộ giải mã xác định loại của ảnh được mã hoá là ảnh I,P hay ảnh B. Thông tin đầu dùng để chỉ thứ tự truyền khung để bộ giải mã có thể sắp xếp các ảnh theo một thứ tự đúng. Thông tin đầu của ảnh còn chứa các thông tin đồng bộ, độ phân giải và phạm vi của vector chuyển động.
e.Nhóm ảnh : nhóm ảnh là tổ hợp của nhiều các khung I, P và B. Cấu trúc của nhóm ảnh được xác định bởi hai tham số m,n. Mỗi nhóm ảnh bắt đầu bằng khung I và xác định điểm bắt đầu để tìm kiếm và biên tập. Thông tin gồm 25 bit chứa mã định thời và điều khiển.
f.Doạn video : đoạn video bao gồm thông tin đầu, một số nhóm ảnh và thông tin kết thúc đoạn. Thông tin đầu của đoạn video chứa kích thước mỗi chiều của ảnh, kích thước điểm ảnh, tốc độ bit của dòng video số, tần số ảnh và bộ đệm tối thiểu cần có. Đoạn video và thông tin đầu tạo thành một dòng bit được mã hoá gọi là dòng cơ bản (Elementary Stream ).
1.6.Nguyên lý nén dòng bit
Với các loại ảnh như đã nói ở trên, việc mã hoá theo loại nào là tuỳ thuộc vào nhà thiết kế. Tuy nhiên cấu trúc của bộ mã hoá MPEG có thể theo sơ đồ sau :
*Nguyên tắc hoạt động của mạch mã hoá MPEG :
Cách hoạt động của bộ mã hoá phụ thuộc vào loại hình ảnh mã hoá tại thời điểm đang xét. Nén MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh. Dạng thức đầu vào là Rec-601 4:2:2 hoặc 4:2:0 được nén liên ảnh trước tạo ra ảnh khác biệt ở đầu ra bộ cộng. ảnh này sau đó lại được nén trong ảnh qua các bước : biến đổi DCT, lượng tử hoá, mã hoá. Cuối cùng, ảnh này được trộn với vector chuyển động đưa đến bộ khuếch đại đệm sẽ thu được ảnh đã nén.
Tốc độ bit của tín hiệu video được nén không cố định, phụ thuộc vào nội dung ảnh đang xét. Ngược lại, tại đầu thu của bộ mã hoá, dòng bit phải cố định để xác định tốc độ cho dung lượng kênh truyền. Do đó, tại đầu ra bộ mã hoá phải có bộ nhớ đệm đủ lớn. Bộ mã hoá phải kiểm tra trạng thái đầy của bộ nhớ đệm. Khi số liệu trong bộ nhớ đệm gần bằng dung lượng cực đại, thì các hệ số biến đổi DCT được lượng tử hoá ít chính xác hơn. trong trường hợp ngược lại, có nghĩa là bộ nhớ đệm chứa số liệu quá ít, thì việc lượng tử hoá các hệ số sẽ tăng lên.
Quá trình giải mã theo lý thuyết là quá trình ngược lại với quá trình mã hoá ở trên.
Điều khiển tốc độ bit
4:2:2
4:2:0
S
DCT
Lượng tử hoá
Mã hoá
entropy
Trộn
Khuếch
đại đệm
Giải lượng
tử hoá
IDCT
S
ảnh dự
đoán
ảnh so
sánh
Xác định vector chuyển động
Video
Bảng lượng tử
+ + +
Vector chuyển động Điều khiển nhóm ảnh
Hình 2-8 : Sơ đồ khối của quá trình mã hoá MPEG
2.Tiêu chuẩn MPEG-1
Là tiêu chuẩn nén một ảnh động có kích thước 320´240 và tốc độ bit còn từ 1Mbit/s đến 1,5Mbit/s dùng cho ghi hình trên băng từ vad đĩa quang (CD) đồng thời truyền dẫn trong các mạng ( mạng maý tính ).
2.1.Cấu trúc video MPEG
Để phù hợp với hệ thống quét hình hiện nay (525/60 và 625/50 ) cần có định dạng chung cho nguồn tín hiệu dùng cho bộ mã hoá nén số liệu và các xác định riêng khác phù hợp với mỗi hệ thống. Định dạng chung cho nguồn tín hiệu gọi là CSIF ( Common Source Intermediate Format ).
Bảng 1 : là các thông số cho định dạng CSIF đối với các tiêu chuẩn truyền hình.
CCIR-601
525
CSIF -525
4:2:0
CCIR-601
625
CSIF-625
4:2:0
Số điểm ảnh trên dòng tích cực
Điểm chói Y
Điểm mầu CR,CB
720
360
352
176
720
360
352
176
Tần số lấy mẫu (MHz)
Điểm chói Y
Điểm mầu CR,CB
13,5
6,75
6,75
3,38
13,5
6,75
6,75
3,38
Số dòng tích cực
Điểm chói Y
Điểm mầu CR,CB
480
480
240
120
576
576
288
144
Tần số khung hình
30
30
25
25
Cỡ ảnh
4:3
4:3
4:3
Bảng 1. Định dạng CSIF cơ bản
2.2.Cấu trúc dòng bit của MPEG 1
Để biểu diễn các đặc điểm của chuỗi bit, tiêu chuẩn MPEG 1 đưa ra một loạt các thông số. Cấu trúc phân lớp : dòng bit được phân lớp thành các lớp như : Sequence ( chuỗi ảnh ), GOP ( nhóm ảnh ), Picture ( ảnh ), Slice, Macroblock (MB), Block ( khối ). Cấu tạo và chức năng của mỗi lớp được chỉ ra trong bảng 2.
Bảng 2 :
Lớp
Cấu tạo
Chức năng
Sequence
Gồm nhiều GOP
Dòng bit video
GOP
Gồm từ(1án) ảnh bắt đầu bằng ảnh I
Đơn vị truy xuất
Picture I, P, B
Gồm nhiều Slice
Đơn vị mã hoá cơ bản
Slice
Gồm nhiều MB
Đơn vị tái đồng bộ để phục hồi
MacroBlock (MB)
Với 4:2:2 gồm 4 block Y, 1 block CR, 1block CB
Đơn vị bù chuyển động
Block
Gồm 8´8 pixel
Đơn vị tính DCT
Các tham số chính của tiêu chuẩn MPEG -1 được minh hoạ trong bảng. Phương pháp nén MPEG -1 cho phép truy cập ngẫu nhiên các khung video tìm kiếm thuận và nghịch trên dòng tín hiệu nén, biên tập và phát lại trên dòng tín hiệu nén. MPEG -1 là tập con của MPEG -2 nên tất cả các bộ giải mã MPEG –2 đều có thể giải mã được dòng tín hiệu MPEG –1.
3.Tiêu chuẩn MPEG-2.
MPEG-2 hướng tới các ứng dụng rộng rãi hơn và có tốc độ bit cao hơn MPEG-1 bao gồm các ứng dụng DSM (lưu trữ số ), các hệ thống tivi hiện tại như (PAL, NTSC, SECAM ), cáp, thu lượm tin tức điện tử, truyền hình trực tiếp qua vệ tinh, EDTV ( truyền hình mở rộng ), HDTV ( truyền hình độ phân giải cao )...
3.1.Cấu trúc dòng bit video MPEG-2
Cấu trúc dòng bit video MPEG-2 có dạng
Phân lớp và là sự mở rộng cú pháp của cấu trúc
MPEG-1. Trước hết nó bao gồm các chức năng
Của MPEG-1, có nghĩa là chúng tương hợp nhau.
Một trong những khác biệt giữa MPEG-2 và
MPEG-1 là ở chỗ MPEG-2 có khả năng xử lý chuỗi
video xen kẽ. Sơ đồ mã hoá có thể thích ghi với sự
lựa chọn field hoặc frame, trong đó MPEG-1 chỉ có
Chuỗiheader
Phần mở rộng
GOP header
GOP mở rộng
Header ảnh
ảnh mở rộng
Lớp Slice
Lớp MB
Lớp Block
một mode cố định.
Hình bên chỉ ra cấu trúc dòng bit video
Chuỗi tín hiệu video được mã hoá bắt đầu bằng
Sequence Header, sau đó là chuỗi moẻ rộng ( nếu có)
và các nhóm ảnh. Nếu phần chuỗi mở rộng không
được xác định các lớp tiếp theo khi đó thực hiện một
qui trình như MPEG-1 và đó là tương hợp thuận. Khi
có thêm phần mở rộng thì phải có thêm các đặc
tính mở rộng để mã hoá hữu hiệu hơn.
Header của nhóm ảnh (GOP) có chức năng tương
tự như header của MPEG-1 và không có chức năng
đặc biệt trong header mở rộng của GOP . Các thông
số quan trọng dùng để mã hoá ảnh mở rộng được
định nghĩa trong header mở rộng của ảnh.Vì có 2
loại ảnh, liên tục và xen kẽ nên cấu trúc ảnh cần phải
được xác định field trên hay field dưới hoặc frame.
Các lớp dưới Slice không bị ảnh hưởng đáng kể. Slice bao gồm tất cả các MB trong một ảnh. Cấu trúc Slice tổng quát không cần mã hoá các vùng nhất định nào trên ảnh ( không có slice tồn tại trong vùng này ) cũng là một bộ phận của bộ phận MPEG-2 mở rộng.
3.2.Profile và level.
Profile là công cụ của MPEG-2 đã được tiêu chuẩn hoá nhằm phục vụ những nhu cầu sử dụng khác nhau, nói một cách khác profile là tập hợp các Syntax của toàn dòng bit.
Mỗi một Profile nói chung đều có những levels khác nhau. Main Profile, Main level, cho phép tốc độ bit tối đa bằng 15Mbit/s, trong khi Main Profile, High levels cho phép tốc độ bit tối đa bằng 80 Mbit/s.
Bảng sau cho ta biết các thông số chính Profile và Levels của MPEG-2
Bảng thông số chính Profile và Levels của tín hiệu chuẩn MPEG-2
Profile
Levels
Đơn giản
(Simple)
Chính
(Main)
Phân cấp
theo SNR
Phân cấp
theo không gian
Cao
(High)
Thấp
(Low)
4:2:0
325´288
4Mbit/s
4:2:0
325´288
4Mbit/s
I,P,B
Chính
(Main)
4:2:0
720´576
15 Mbit/s
I,P
4:2:0
720´7615 Mbit/s
I,P,B
4:2:0
7206
15 Mbit/s
I,P,B
4:2:0
720´576
20 Mbit/s
I,P,B
Cao-1440
(High 1440)
4:2:0
1440´1152
60 Mbit/s
I,P,B
4:2:0
1440´1152
60 Mbit/s
I,P,B
4:2:0;4:2:2
1440´1152
80 Mbit/s
I,P,B
Cao(high)
4:2:0
1920´1152
80 Mbit/s
I,P,B
4:2:0;4:2:2
1920´1152
100 Mbit/s
I,P,B
3.3.Tính phân cấp.
MPEG-2 Coder và Decoder không nhất thiết phải có cùng chất lượng. Tính phân cấp cho phép các bộ giải mã MP đơn giản, rẻ tiền, có khả năng giải mã một phần của dòng bit và như vậy có khả năng tạo lại hình ảnh tuy chất lượng thấp hơn các bộ giải mã toàn bộ dòng bit.
Tiêu chuẩn MPEG cho phép phân cấp theo tỷ số tín hiệu trên tạp âm (SNR) và theo độ phân giải. Tịnh phân cấp theo tỷ số tín hiệu trên tạp âm (SNR Scalability) có nghĩa là chất lượng hình ảnh và tỷ số tín hiệu trên tạp âm có tính thoả hiệp.
Một bộ giải mã có tốc độ bit thấp hơn có thể có đầy đủ độ phân giải nhưng tỷ số tín hiệu trên tạp âm thấp hơn so với bộ giải mã có tốc độ bit cao.
Các bộ mã hoá làm việc theo một trong số mười một khả năng giải mã bất kỳ Profile Levels nào ở về phía trái và/hoặc thấp hơn nó. Phần lớn các thiết bị được chế tạo cho Main Profile, Main Levels.
3.4.MPEG-2, 4:2:2 P@ML
Trong bảng trên các chuẩn đều lấy mẫu theo chuẩn 4:2:0 và cho tốc độ bit thấp rất phù hợp cho truyền dẫn và phát sóng. Tuy nhiên nó không thoả mãn yêu cầu chất lượng cho công đoạn sản xuất hậu kỳ. Chuẩn 4:2:0 không thể cho một hình ảnh chất lượng Studio sau một vài thế hệ gia công tín hiệu bởi phép nội suy tín hiệu hiệu mầu sử dụng tốc độ bit 15Mbit/s với GOP nhỏ chất lượng hình ảnh sẽ kém. GOP lớn sẽ gây khó khăn cho tất cả các thiết bị có chuyển đổi tín hiệu trong thời gian xoá mành.
Từ năm 1994 nhiều nhà sản xuất và sử dụng thấy cần phải có tiêu chuẩn MPEG-2 , 4:2:2 P@ML ( Profile, Main Levels ) với tốc độ đạt 50 Mbit/s có thể đáp ứng được nhu cầu chất lượng trong các ứng dụng chuyên nghiệp.
Tháng 1 năm 1996, MPEG-2, 4:2:2 Profile, Main Levels trở thành tiêu chuẩn quốc tế. Nó hơn hẳn MP2ML trên nhiều khía cạnh : tốc độ bit bằng 50Mbit/s và có thể đáp ứng cả hai tiêu chuẩn video 4:2:0 và 4:2:2 hệ thống này có đặc điểm chính sau đây :
-Có độ mềm dẻo cao và tính khai thác hỗn hợp. Có khả năng giải mã trong phạm vi 15á50 Mbit/s với bất kỳ loại phối hợp nào giữa các ảnh I,P và B
-Chất lượng cao hơn hẳn MP@ML.
-Độ phân giải mầu tốt hơn MP@ML
-Xử lý hậu ký sau khi nén và giải nén.
-Nén và giải nén nhiều lần.
-Nhóm ảnh nhỏ, thuận tiện cho công nghệ dựng hình.
-Có khả năng biểu thị tất cả các dòng tích cực của tín hiệu video
-Có khả năng biểu thị thông tin trong khoảng thời gian xoá mành.
Kết luận :Trên đây là những vấn đề tổng quan nhất về hệ thống truyền hình tương tự và hệ thồng truyền hình số nói chung. Tuy nhiên, mỗi quốc gia lại đưa ra những tiêu chuẩn riêng, song chúng đều dựa trên các nguyên lý trên. Nước ta cũng đang phát triẻn một hệ thống truyền hình số riêng, và chọn DVB làm chuẩn phát sóng. Hiện nay thế giới đang có xu hướng đưa ra một số tiêu chuẩn chung nhất để có thể trao đổi chương trình, bán thiết bị trên toàn cầu và Việt Nam cũng đang trong xu hướng hoà nhập ấy.
Các file đính kèm theo tài liệu này:
- 6271.doc