Luận văn Ứng dụng kỹ thuật nén video số trong sản xuất chương trình truyền hình

Trong quá trình thực hiện luận văn này, em đã cố gắng tìm hiểu, tham khảo tài liệu và nghiên cứu các thiết bị sản xuất chương trình truyền hình, sắp xếp các kiến thức này có tính hệ thống. Tín hiệu truyền hình số là loại dữ liệu có tốc độ lớn nên cần có băng thông rộng. Với tốc độ của các kênh truyền hiện nay thì việc truyền tín hiệu truyền hình số rất khó khăn. Một yêu cầu được đặt ra lμ lμm sao giảm được tốc độ tín hiệu để phù hợp với tốc độ kênh truyền. Giải pháp được đưa ra là nén tín hiệu truyền hình số.

doc77 trang | Chia sẻ: aloso | Lượt xem: 2162 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Ứng dụng kỹ thuật nén video số trong sản xuất chương trình truyền hình, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
giãn phân chia số liệu chính lμ một dạng cơ bản của co giãn tần số. Tiêu chuẩn MPEG-2 đã qui định chính thức hai loại co giãn: co giãn không gian vμ co giãn SNR. Các loại co giãn khác chỉ mới ở dạng dự thảo. 2.3.2.4. MPEG-2: Profile vμ Level Phạm vi ứng dụng của MPEG-2 rất rộng. Mỗi ứng dụng đòi hỏi mức độ phức tạp khác nhau. Bởi vậy, MPEG-2 định nghĩa các mức (level) vμ các tập con (profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit vμ level xác định các tham số hạn chế độ phân giải không gian, tốc độ bit. Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) vμ high (cao). Kích cỡ ảnh quy định bởi 4 mức t−ơng ứng sau: Level Cỡ khung Low Main High-1440 High 352x288 (bằng 1/4 cỡ ảnh TV chuẩn) 720x576 (cỡ ảnh TV chuẩn) 1440x1152 960x576 hoặc 1920x1152 Bảng 4 : Mức ảnh trong MPEG-2 Có 5 profile lμ: Simple (đơn giản), Main (chính), SNR scalable (co giãn SNR), Spatial scalable (có khả năng co giãn không gian) vμ High profile. Tổng cộng có 12 tổ hợp profile, level. Trong đó: ♦ MP @ ML (Main profile @ Main level): Lấy mẫu 4:2:0 Độ phân giải: 720*576 Tốc độ bit: 15Mbps Dạng ảnh: I, P, B ứng dụng vμo việc số hóa truyền hình tiêu chuẩn (Standard television). ♦ MP @ HL (Main profile @ High level): Lấy mẫu 4:2:0 Độ phân giải: 1920x1152 Tốc độ bit: 80Mbps Dạng ảnh sử dụng: I, P, B ứng dụng vμo HDTV (truyền hình số có độ phân giải cao). ♦ Sau nμy có bổ sung 4:2:2P @ ML (4:2:2 profile @ Main level) áp dụng vμo lĩnh vực sản xuất ch−ơng trình truyền hình (studio) vì các lý do sau: ∗ Chất l−ợng cao: độ phân giải mμu tốt hơn so với MP @ ML (lấy mẫu 4:2:0), chất l−ợng tổng quát cao hơn do sử dụng tốc độ bit lớn hơn. ∗ Có khả năng sao chép nhiều lần mμ vẫn đảm bảo chất l−ợng y nh− video gốc. ∗ Tính linh hoạt: nhóm ảnh (GOP) ngắn hơn nên thuận tiện cho việc dμn dựng, biên tập ch−ơng trình truyền hình. ∗ Tính kinh tế: giá thμnh l−u trữ vμ truyền dẫn giảm, có khả năng t−ơng hợp giữa các thiết bị của nhiều hãng sản xuất khác nhau. Các tham số cơ bản của 4:2:2P vμ ML: ∗ Cấu trúc lấy mẫu: 4:2:2 ∗ Độ phân giải ảnh: 720*576 ∗ Tốc độ dòng bit: 20Mbps ∗ Dạng ảnh sử dụng: I, P, B 2.3.3. Chuẩn nén MPEG-4 MPEG-4 là một chuẩn quốc tế (còn có tên gọi là ISO/ IEC 14496) được phát triển bởi nhóm MPEG (nhóm chuyên gia về ảnh động). Khuyến nghị MPEG-4 hoàn thành vào năm 1998 và trở thành chuẩn quốc tế vào đầu năm 1999. MPEG-4 phiên bản 2 trở thành chuẩn quốc tế vào đầu năm 2000. Một vài mở rộng được thêm vào chuẩn này từ thời gian đó, trong đó có MPEG-4 AVC. MPEG-4 khác hẳn so với MPEG-2. MPEG-2 mã hoá một dòng Video ngay cả khi nó chứa đồ hoạ và văn bản chồng lấn. MPEG-4 phân tách đồ hoạ, văn bản chồng lấn thành các dòng riêng rẽ và sau đó chúng được hợp lại ở phía bộ giải mã. 2.3.3.1. Các phần của chuẩn MPEG-4: Chuẩn MPEG-4 bao gồm nhiều chuẩn nhỏ được gọi là các phần, cấu trúc như sau: Phần 1: Các hệ thống - Mô tả đồng bộ và ghép kênh Video và Audio Phần 2: Hình ảnh - Bộ mã hoá/ giải mã dữ liệu hình ảnh. ASP là một trong những Profile của phần này. Phần3: âm thanh - Tập các bộ mã hoá/ giải mã tín hiệu Audio, bao gồm AAC và các công cụ mã hoá Audio/ tiếng nói khác. Phần 4: Tương thích - Mô tả thủ tục kiểm tra sự tương thích các phần khác nhaus của chuẩn. Phần 5: Phần mềm tham khảo - Cung cấp phần mềm trình diễn và làm rõ các phần của chuẩn. Phần 6: DMIF (cấu trúc tích hợp vận chuyển đa phương tiện) - Định nghĩa một giao diện giữa ứng dụng và mạng/ phương tiện lưu trữ. Phần 7: Phần mềm tham khảo tối ưu - Cung cấp các ví dụ về cách tạo các ứng dụng (liên quan đến phần 5). Các phần gần đây được thêm vào là: Phần 8: Vận chuyển trên mạng IP - Phương pháp vận chuyển nội dung MPEG-4 trên mạng IP. Phần 9: Phần cứng tham khảo - Cung cấp các trình diễn thiết kế phần cứng sử dụng các phần khác nhau của chuẩn. Phần 10: Mã hoá Video tiên tiến (AVC) - Bộ mã hoá/ giải mã tín hiệu Video tương tự như chuẩn ITU-T H.264. Phần 11: Mô tả cảnh hay còn được gọi là BIFS, có thể được sử dụng cho các nội dung 3D và các phụ đề. Phần 12: Định dạng File thông tin ISO cơ bản- Một định dạng file để lưu giữ nội dung thông tin. Phần 13: Các mở rộng bảo vệ và quản lý sở hữu trí tuệ - IPMP. Phần 14: Định dạng File MP4 (dựa trên phần 12). Phần 15: Dịnh dạng File AVC (cũng dựa trên phần 12). Phần 16: AFX (cấu trúc hoạt hoạ mở rộng) và MuW (định dạng nhiều người dùng). Phần 17: Định dạng phụ đề định thời văn bản. Phần 18: Nén và tạo dòng font chữ (cho các font OpenType). Phần 19: Dòng cấu trúc bề mặt tổng hợp. Phần 20: Trình diễn cảnh LASeR. Phần 21: Mở rộng cấu trúc đồ hoạ MPEG-J (GFX). Phần 22: Khuyến nghị định dạng font chữ mở (OFFS) dựa trên OpenType 2.3.3.2. Nguyên tắc mã hoá và giải mã MPEG-4 MPEG-4 là sản phẩm của nhóm MPEG được thành lập tháng 1/1988 với nhiệm vụ phát triển các chuẩn xử lý, mã hoá và hiển thị các ảnh động, audio và các tổ hợp của chúng. Sản phẩm đầu tiên của nhóm này là MPEG-1 được sử dụng cho việc mã hoá các dữ liệu nghe nhìn với tốc độ 1,5 Mbps. Sản phẩm thứ hai của nhóm là MPEG-2 nổi tiếng hiện nay, mang tính tổng quát hơn và đang được áp dụng cho một loạt các ứng dụng nghe nhìn trong phạm vi tốc độ từ 3 – 40 Mbps. Không giống các chuẩn MPEG trước đó, ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ hoạ, văn bản… và được tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thông qua các giác quan trong thực tế. Các pixels này được mã hoá như thể tất cả chúng đều là các phần tử ảnh video ảnh động. Tại phía thu của người sử dụng, quá trình giải mã diễn ra ngược lại với quá trình mã hoá không khó khăn. Vì vậy có thể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền thông phát lại chương trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất chương trình này không thể loại bỏ được. Với MPEG-2, bạn có thể bổ xung thêm các phần tử đồ hoạ và văn bản vào chương trình hiển thị cuối cùng (theo phương thức chồng lớp), nhưng không thể xoá bớt các đồ hoạ và văn bản có trong chương trình gốc. Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi. Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau. Cũng như xác định, tách và xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này. Hình 2.12. Sự tổng hợp khung hình trong MPEG-4 Trên hình 2.12 thể hiện một trường hợp điển hình của tổ hợp khuôn hình MPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng dẫn và audio) được đặt vào một hệ thống toạ độ không gian 3 chiều (3-D) đối với vị trí người xem giả định. Các thiết bị mã hoá và giải mã video đều áp dụng sơ đồ mã hoá như nhau cho mối đối tượng video VO (Video Object) riêng biệt (hình 2.13), nhờ vậy người sử dụng có thể thực hiện các hoạt động tương tác riêng với từng đối tượng (thay đổi, di chuyển, kết nối, loại bỏ, bổ xung các đối tượng…) ngay tại vị trí giải mã hay mã hoá. Video Information Video Object Composition Video Object Formation VO 0 Coding VO 1 Coding VO n Coding MUX VO 0 Decoding VO 1 Decoding VO n Decoding DMUX User Interaction Video Output User Interaction Bitstream Hình 2.13: Cấu trúc bộ mã hoá và giải mã video MPEG-4 Các bộ phận chức năng chính trong thiết bị MPEG-4 tại đầu thu bao gồm: Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene. Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian. Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động. Bitstream Video Out Shape Decoding Motion Decoding Texture Decoding Motion Compensation VOP Memory Reconstructed VOP Compositor DEMULTIPLEXER Shape Information Hình 2.14. Nguyên lý giải mã video MPEG-4 tại đầu thu Hình 2.14 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4. Nhiều đối tượng như người, bản đồ, bản tin, được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hoá bởi bộ mã hoá đối tượng video VO (Video Object) và sau đó được truyền đi trên mạng. Tại vị trí thu, những đối tượng này được giải mã riêng nhờ bộ giải mã riêng VO và gửi khung hình gốc, hay để xử lý các đối tượng tạo ra một khung hình khác. Ngoài ra, người sử dụng có thể download các đối tượng khác từ các thư viện cơ sở có sẵn dữ liệu để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc. Để có thể tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả khung hình riêng, được gọi là định dạng nhị phân cho khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác. Trong MPEG-4 tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá riêng của nó – video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo đồ hoạ - thay vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình. 2.3.3.3. MPEG-4 profile Chuẩn MPEG-4 bao gồm nhiều tính năng ưu việt khác nhau, không phải bất kỳ ứng dụng nào cũng đòi hỏi tất cả các tính năng của MPEG-4. Để sử dụng công cụ MPEG-4 một cách hiệu quả nhất, mỗi thiết bị chuẩn MPEG-4 sẽ chỉ được trang bị một số tính năng phù hợp với một phạm vi ứng dụng nhất định và để tạo điều kiện cho người sử dụng lựa chọn công cụ MPEG-4, các thiết bị MPEG-4 chia thành các nhóm công cụ gọi là các profile, mỗi nhóm chỉ chứa một vài tính năng cần thiết của chuẩn mã hoá thích hợp cho một phạm vi nào đó. Điều này cho phép người sử dụng dễ dàng lựa chọn bộ công cụ hỗ trợ các tính năng mà họ cần từ vô số các bộ công cụ MPEG-4 khác nhau. Mỗi profile lại có các mức khác nhau, thể hiện mức độ phức tạp xử lý tính toán dữ liệu của công cụ đó (thông qua việc định rõ tốc độ bit, con số tối đa của các đối tượng trong khung hình, độ phức tạp của quá trình giả mã audio…). 2.3.3.4. MPEG-4 AVC/H.264 (Part 10). MPEG-4 Part 10 mới được thêm vào gần đây, cũng được gọi là MPEG-4 AVC (mã hoá Video tiên tiến) hay H.264, đưa ra khả năng nén với tỷ lệ lớn hơn. Nó có thể cung cấp chất lượng Video DVD với tốc độ bit nhỏ hơn 40% so với MPEG-2 và hứa hẹn thích hợp cho Video chuyển động đầy đủ qua các kết nối không dây, vệ tinh, và Internet ADSL. Nó cũng là một trong các bộ mã hoá/ giải mã Video đã được lựa chọn cho HD DVD Laser Blue Ray. H.264 cũng sử dụng các dư thừa không gian, thời gian và tâm lý thị giác để cải thiện hiệu suất nén Video. Các cấu trúc thêm so với MPEG-2 chứa trong H.264 bao gồm: Dự đoán chuyển động kích thước khối thay đổi với các kích thước khối nhỏ tới 4x4 pixel. Bù chuyển động độ chính xác 1/ 4 mẫu cho chuyển động mềm mại hơn. Các vector chuyển động qua các biên ảnh tương phản với ảnh tham chiếu được giải mã trước đó. Bù chuyển động nhiều ảnh tham chiếu, so với chỉ một ảnh trước đó trong các bộ mã hoá/ giải mã đã có. Tách thứ tự tham chiếu từ thứ tự hiển thị cho độ mềm dẻo cao hơn và loại bỏ các trễ phụ liên kết với mã hoá dự đoán hai hướng. Tách các phương pháp thể hiện ảnh với khả năng tham chiếu ảnh. Dự đoán lượng giá cho phép tín hiệu dự đoán bù chuyển động được lượng giá và bù một lượng xác định bởi bộ mã hoá. Điều này có thể cải thiện hiệu suất nén rất lớn cho các cảnh chứa các bóng mờ, và cũng có thể được sử dụng mềm dẻo cho các mục đích khác. Cải thiện suy luận chuyển động "bỏ qua" và "trực tiếp" để mã hoá tốt hơn Video chứa chuyển động toàn cục. Dự đoán không gian có hướng cho mã hoá Intra, ngoại suy các cạnh của các phần được giải mã trước đó của ảnh hiện thời và dùng nó trong các miền của ảnh được mã hoá Intra. Điều này cải thiện chất lượng của dự đoán tín hiệu, và cũng cho phép dự đoán từ các miền lân cận không được mã hoá sử dụng mã hoá Intra. Lọc tách khối lặp để giảm lỗi khối. Nén Video sử dụng H.264/ AVC tạo ra Video ở tốc độ bit thấp hơn điển hình 2 đến 4 lần so với MPEG-2 và chuẩn nén MPEG-4 trước đó, ở các mức chất lượng Video tương ứng. Sơ đồ hoạt động của bộ mã hoá và giải mã H.264 Bộ mã hoá có thể được chia làm 2 phần chính (phân theo 2 dòng dữ liệu) đó là: phần thuận (từ trái qua phải) và phần tái tạo (từ phải qua trái). Bộ mã hoá (phần thuận) hoạt động như sau: Một khung hình hay một mành đầu vào Fn được xử lý ở các đơn vị một khối macroblock. Khi chế độ mã hoá theo thời gian được tiến hành: ở hình 3.4, Fn được so sánh với khung hình tham khảo biểu diễn bởi F’n-1 trên hình, tiến hành quá trình ước lượng chuyển động ME. Độ sai khác thu được khi ước lượng chuyển động giữa vị trí macroblock hiện tại với macroblock được chọn tham khảo biểu diễn dưới dạng một vector chuyển động. Dựa trên vector chuyển động, quá trình bù chuyển động theo thời gian (MC) diễn ra (tại nút P). Khi chế độ mã hoá theo không gian được tiến hành, Fn được tiến hành bù chuyển động theo khung hình tại nút P, với các hình ảnh tham khảo là các khung hình đã được tái tạo trước đó F’n. Dự đoán P được trừ từ các macroblock tham khảo cho các macroblock hiện tại để tạo ra macroblock Dn thể hiện độ sai khác (độ dư thừa dữ liệu). Dn được biến đổi (T) và lượng tử hoá Q, cho đầu ra là các hệ số X. Các hệ số đầu ra được sắp xếp lại và mã hoá entropy. Sau cùng các hệ số, các vector chuyển động, các thông tin header cho từng macroblock tạo dòng bit qua nén sẵn sàng cho qua NAL (Network Abstraction Layer) để truyền dẫn và lưu trữ. NAL X Dn D’n + + - + P Trong ảnh Liên ảnh uF’n Fn (Hiện tại) F’n (Xây dựng lại) ME MC Chọn dự đoán trong ảnh Dự đoán trong ảnh Bộ lọc T Q T-1 Q-1 Xếp lại thứ tự Mã hoá Entropy F’n-1 (Tham chiếu) Hình 2.15. Sơ đồ nguyên lý của bộ mã hoá Bộ mã hoá (phần tái tạo lại): Các hệ số X được thay đổi lại tỉ lệ (Q-1) và biến đổi ngược (T-1) tạo phần sai khác D’n đã qua giải mã. Quá trình dự đoán bù chuyển động P được thêm vào D’n tái tạo một macroblock (uFn); sau khi được đưa qua bộ lọc macroblock này được lưu lại làm khung ảnh tham khảo F’n cho các khung hình mã hoá tiếp sau. Bộ giải mã hoạt động như sau: Bộ giải mã nhận một chuỗi bit nhị phân đã được nén từ NAL. Tiến hành giải mã entropy luồng bit nén thành các hệ số lượng tử X. Mã hoá run-level và sắp xếp lại được thiết lập (lúc này theo chiều nghịch). X được thay đổi lại tỉ lệ (Q-1) và biến đổi ngược (T-1) tạo phần sai khác D’n đã qua giải mã. Sử dụng các thông tin về header đã giải mã, bộ giải mã tái tạo ra các block dự đoán P. NAL X D’n + + Liên ảnh uF’n Trong ảnh P F’n-1 (Tham chiếu) F’n (Xây dựng lại) MC Bộ lọc Dự đoán trong ảnh T-1 Q-1 Xếp lại thứ tự Giả mã Entropy P được thêm vào D’ để tái lập ra macroblock uF’n. Macroblock được tái tạo qua bộ lọc sẽ được lưu lại và sử dụng để tạo nên khung hình được giải mã F’n. Hình 2.16. Sơ đồ nguyên lý bộ giải mã H.264 ME: ước lượng chuyển động MC: bù chuyển động T (transform): Biến đổi Q (Quantisation): Quá trình lượng tử hóa Trên hình vẽ ta thấy có bộ lọc được sử dụng. Bộ lọc tích hợp này giúp cải thiện chất lượng cho ảnh được tái tạo (để sử dụng cho quá trình dự đoán về thời gian), không áp dụng cho các macroblock được tái tạo cho quá trình dự đoán trong khung hình. 2.4. So sánh và nhận xét khái quát về các chuẩn nén MPEG Từ phần lý thuyết về các chuẩn nén MPEG đã nghiên cứu ở trên ta có một số nhận xét sau: MPEG-1: được sử dụng như là chuẩn cho Video CD. Thông thường định dạng này có kích thước khung hình là 252 x 240, tốc độ bit không đổi khoảng 1Mb/s. Chất lượng không phù hợp cho lĩnh vực sản xuất chương trình. MPEG-2 : hiện được sử dụng phổ biến trong sản xuất và truyền dẫn Audio /Video số trong truyền hình (mặt đất, vệ tinh và cáp) cũng như trên đĩa DVD. MPEG-2 cho chất lượng cao hơn nhiều so với MPEG-1 do sử dụng các kỹ thuật nén ít tổn thất dữ liệu ảnh hơn. ở chế độ mặc định MPEG-2 thường sử dụng độ phân giải 720 x 480. MPEG-4: Chất lượng nén rất tốt. So với MPEG-2, MPEG-4 cho dung lượng file nén nhỏ hơn với cùng bit rate và cùng dữ liệu nguồn. Khả năng phân cấp và phân chia độc lập các khung hình thành các đối tượng khiến cho MPEG-4 trở thành một công cụ hữu hiệu trong việc tạo thuận lợi cho các ứng dụng trên Internet nói riêng và trên môi trường mạng nói chung đó là các ứng dụng : * Truyền thông multimedia theo dòng, trong đó dòng audio và video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượng nhờ loại bỏ những đối tượng (hình ảnh, âm thanh) không cần thiết khỏi dòng dữ liệu và đồng bộ các thông tin được nhúng trong dòng dữ liệu đó. * Lưu giữ và phục hồi dữ liệu audio và video : do MPEG-4 phân chia các khung hình thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung (đối tượng) mong muốn sẽ được thực hiện một cách dễ dàng và nhờ vậy các ứng dụng lưu giữ hay phục hồi thông tin trên cơ sở nội dung MPEG-4 sẽ được thuận lợi hơn. * Truyền thông báo đa phương tiện : Các thông báo dưới dạng text, audio và video MPEG-4 sẽ được truyền đi với yêu cầu băng thông ít hơn, và có khả năng tự điều chỉnh chất lượng cho phù hợp với khả năng băng thông của thiết bị giải mã. * Thông tin giải trí : những sự trình diễn nghe nhìn tương tác có thể được triển khai trên cơ sở chuẩn MPEG-4 sẽ làm giảm yêu cầu về băng thông và làm cho thế giới ảo trở nên sinh động và giống như thực tế trên các trang web. Kết luận chương 2: Chương 2 của luận văn đã trình bày chi tiết sự cần thiết và ý nghĩa thực tiễn của các chuẩn nén MPEG-1, MPEG-2, MPEG-4, nhằm mục đích xây dựng công nghệ nén ứng dụng trong sản xuất chương trình Truyền hình ở chương 3. Các tính chất quan trọng của các chuẩn nén MPEG-1, MPEG-2 được trình bày trong luận văn sẽ làm nền tảng để xây dựng chuẩn nén tiên tiến hơn như MPEG-4/H.264 đưa vào sử dụng trong thực tiễn. Chương 3: ứng dụng kỹ thuật nén video số trong sản xuất chương trình truyền hình Chương 3 của luận văn sẽ trình bày một số ứng dụng của kỹ thuật nén video trong sản xuất chương trình Truyền hình, cụ thể là đối với các thiết bị ghi hình, để từ đó đưa ra định hướng lựa chọn các thiết bị ghi hình tiên tiến hơn trong sản xuất chương trình với các chuẩn nén cao hơn. 3.1. Giới thiệu dây chuyền sản xuất chương trình truyền hình Dây chuyền sản xuất chương trình truyền hình là một hệ thống kỹ thuật liên hoàn nhằm tạo ra một sản phẩm nghệ thuật theo ý đồ của đạo diễn, nhằm mục đích truyền tải các thông tin (hình ảnh và âm thanh) đến người xem một cách hiệu quả nhất. Về mặt kết cấu, người ta có thể khái quát dây chuyền sản xuất chương trình truyền hình thành ba khâu chính : Tiền kỳ, hậu kỳ và phát sóng. Khâu tiền kỳ : Đây là khâu đầu tiên của dây truyền sản xuất chương trình truyền hình, công việc chính của khâu này là thu nhận các thông tin về hình ảnh và âm thanh từ các nguồn thu tín hiệu khác nhau. Ví dụ như từ vệ tinh, từ trường quay (Studio) hoặc từ các đường truyền tin khác (cáp quang, viba...) Khâu hậu kỳ : Đây là khâu chính của dây chuyền sản xuất chương trình truyền hình, các thông tin thu nhận được từ khâu tiền kỳ sẽ được xử lý, gia công sắp xếp theo ý đồ của đạo diễn nhờ các thiết bị dựng hình chuyên dụng. Các thiết bị này có thể được tổ chức thành các phòng riêng biệt và có cấu hình thiết bị khác nhau tuỳ thuộc vào mục đích xử lý hình ảnh, âm thanh hoặc nhiều vấn đề khác nhau trong đó có yếu tố kinh tế. Khâu phát sóng : đây là khâu cuối cùng của dây chuyền sản xuất chương trình truyền hình, khâu này sẽ tiếp nhận tín hiệu từ các nguồn thành phẩm hoặc thu nhận các chương trình truyền hình trực tiếp từ phòng tổng khống chế. Tại đây tín hiệu sẽ được phân bố, truyền tải đến các trạm phát hình mặt đất hoặc phát lên vệ tinh để truyền tín hiệu đến người xem hoặc các trạm thu lại tín hiệu truyền hình. Dây chuyền sản xuất chương trình truyền hình có thể được biểu diễn bằng sơ đồ tổng quát như trên hình 3.1: [5] Khâu tiền kỳ Khâu hậu kỳ Khâu phát sóng Thu tín hiệu từ vệ tinh Truyền hình lưu động Trường quay (Studio) Các nguồn truyền tin khác Các phòng dựng hình Các phòng lồng tiếng Trạm phát mặt đất Trạm phát lên vệ tinh Hệ thống truyền tin khác Phòng tổng khống chế Hình 3.1: Sơ đồ khối tổng quát của hệ thống sản xuất chương trình truyền hình 3.2. Giới thiệu một số thiết bị tiền kỳ và hậu kỳ trong công nghệ sản xuất chương trình truyền hình. 3.2.1. Camera truyền hình Camera truyền hình giữ một vai trò rất quan trọng trong dây truyền sản xuất chương trình truyền hình. Vì nó chính là thiết bị đầu tiên quyết định tới chất lượng hình ảnh của chương trình truyền hình, nếu chất lượng camera không tốt thì các thiết bị kế tiếp dù có chất lượng cao cũng không thể tạo ra hình ảnh có chất lượng cao. ơ 3.2.2. Máy ghi hình Máy ghi hình là thiết bị lưu giữ tín hiệu trên băng từ hoặc đĩa VCD, DVD. Nó đã tồn tại và phát triển cùng với sự lớn mạnh và chuyển biến của kỹ thuật truyền hình. Máy ghi hình được sản xuất từ nhiều hãng như Sony, JVC, Panasonic, Ampex... Mỗi hãng đều có một đặc trưng riêng về thiết kế mạch điện tử cũng như hệ cơ khí nhưng đều theo một định dạng chung. Mỗi định dạng lại có nhiều thế hệ máy, đặc biệt trong những năm gần đây, cùng với sự phát triển của công nghệ mới trong các lĩnh vực điện tử, tin học, thông tin viễn thông, VTR cũng có nhiều thay đổi. Phân loại VTR (hình 3.2) VTR là loại thiết bị có định dạng ghi riêng và không ngừng đổi mới, đặc biệt trong những năm gần đây. Thế hệ VTR tương tự chỉ có 1-2 định dạng nhưng đến thế hệ VTR số có tới hàng chục định dạng. Các hãng sản xuất đã chú ý đến tính tương thích mỗi khi thay đổi định dạng nhưng chỉ áp dụng được chế độ Playback còn chế độ Rec phải tuân theo định dạng chuẩn. VTR có thể phân loại theo hai nhóm chính : VTR số và VTR tương tự. Ghi trực tiếp VTR Format VTR Digital VTR Analog Component Composite Digital Betacam Betacam SX DVCam DVC PRO D-VHS Component Composite CTDM FDM Betacam SP Ghi dưới màu VHS SVHS Umatic Hình 3.2: Phân loại VTR Không sản xuất Không sản xuất a. Máy ghi hình tương tự Các hệ máy ghi hình tương tự còn tồn tại một số nhược điểm : Hệ thống cơ khí phức tạp, sử dụng nguyên lý băng từ và đầu từ chuyển động. Tín hiệu ghi trên băng là tín hiệu tương tự vì vậy khi in sao băng nhiều lần thì chất lượng tín hiệu bị suy giảm. Máy ghi hình tương tự luôn cần đến những điều chỉnh tinh vi và phức tạp làm hạn chế sự phát triển của sản xuất chương trình. b. Máy ghi hình số Một số ưu điểm của VTR số - Xử lý tín hiệu số đem lại rất nhiều ưu điểm mà xử lý tín hiệu tương tự không thể có được. Tỷ số S/N cao, chất lượng ảnh số tốt hơn rất nhiều và cho phép số lần in sang băng lên tới hàng chục lần vẫn đảm bảo chất lượng. - Phương pháp ghi tín hiệu số thành phần đảm bảo chất lượng, tránh được hiện tượng can nhiễu giữa tín hiệu chói và màu. - Máy ghi hình số có một số chức năng mà máy ghi hình tương tự không thể có. Ví dụ : Trong chế độ A/B roll, khi máy ghi hình tương tự phải dùng tới 02 máy phát và 01 máy ghi thì máy ghi hình số chỉ cần 01 máy phát và 01 máy ghi bằng chức năng Preread (đọc tín hiệu trước khi ghi tín hiệu mới trên băng). - Các hệ thống điều chỉnh tự động AFC và APC trong máy ghi hình số đảm bảo đọc và ghi chính xác, giảm được thời gian cân chỉnh bằng tay, đảm bảo sự ổn định trong quá trình ghi và phát tín hiệu. 3.2.3. Bàn dựng hình Đây là thiết bị chuyên dụng dùng để điều khiển máy ghi hình, bàn kỹ xảo...bằng chế độ điều khiển từ xa. Bàn dựng hình có chức năng điều khiển máy ghi hình : Play, Stop, Rew, FF.... Nhưng đặc biệt có các chế độ dựng hình xử lý các tín hiệu hình và tiếng trên băng phục vụ cho khâu hậu kỳ. 3.2.4. Thiết bị kỹ xảo * Kỹ xảo hình (Mix video): Đây là thiết bị dùng để kết hợp các đường tín hiệu hình đầu vào, sau đó tạo ra các hiệu ứng của hình ảnh theo yêu cầu của biên tập, đạo diễn. Các kỹ xảo thường sử dụng : MIX, KEY, WIPE... Hiện nay có các bàn kỹ xảo hình ứng dụng kỹ thuật số, vì vậy rạo ra rất nhiều các hiệu ứng sinh động lôi cuốn người xem. * Kỹ xảo tiếng (Mix audio) : Đây là một kỹ thuật cơ bản đối với một kỹ thuật điều chỉnh âm thanh để tạo ra các chương trình theo yêu cầu hiện nay. Công việc này đòi hỏi kiến thức nhất định về thiết bị trộn âm qua đó có thể áp dụng vào thực tế công việc. Các chức năng trên một bàn trộn âm: Một bàn trộn âm thường chia làm 3 phần chính : - Power Suply : (phần cấp nguồn) phần này thông thường được mặc nhiên là có và rất ít khi được thể hiện trên sơ đồ. - Input Module: (khối các kênh đầu vào) chia làm hai nhóm : Đầu vào Mono và đầu vào Stereo. - Master Module: (khối trộn âm và đưa tín hiệu ra) khối này chia thành 3 phần : + Phần khống chế đầu vào và đầu ra + Phần quản lý các nhóm của tín hiệu . Không có với các Mix loại nhỏ + Phần quản lý các đầu vào phụ. 3.3. Kỹ thuật nén video áp dụng cho các thiết bị ghi hình số 3.3.1. Giới thiệu Trong phạm vi nghiên cứu ứng dụng kỹ thuật nén tín hiệu video số trong sản xuất chương trình truyền hình, luận văn tập trung tìm hiểu một loại thiết bị ghi hình đó là Máy ghi hình. Để đến người xem truyền hình, ngoài các chương trình truyền hình trực tiếp, các chương trình còn lại đều dùng VTR để phát lại. Các băng phát sóng phải qua các khâu tiền kỳ, hậu kỳ, phát sóng. Hiện nay, tại các Đài truyền hình trong cả nước, các khâu này đều dùng VTR đủ các loại, ít nhất là hai loại (S VHS, DVC PRO) với các đài địa phương. ở các đài lớn chủng loại máy còn nhiều hơn, có đài lên tới gần chục loại (BTC SP, BTC SX, D BTC, DVCAM…). Điều này cho thấy: cần đầu tư từng khâu như thế nào để có tính hệ thống, ổn định, đảm bảo chất lượng cho dây chuyền SXCT. Kỹ thuật nén dữ liệu có ý nghĩa lớn liên quan đến đường truyền và lưu trữ tín hiệu. Đài truyền hình Việt Nam luôn đi đầu trong những bước thay đổi thiết bị VTR để đáp ứng nhu cầu trao đổi chương trình với các đài trong nước, do đó có nhiều định dạng VTR số với nhiều mục đích sử dụng đã ra đời dần thay thế cho các thế hệ VTR tương tự. Trong VTR số, nén dữ liệu, hay còn gọi là giảm tốc độ bit – BRR (Bit Rate Reduction) còn có nhiều ý nghĩa đặc trưng khác nhau đặc biệt là vấn đề kết cấu máy. Sử dụng công nghệ giảm tốc độ bit sẽ thực hiện thành công những thiết kế chủ yếu của VTR số, đó là : gọn, tin cậy, cho thời lượng ghi băng dài, giá cả hợp lý, đảm bảo được chất lượng và các tính năng của máy. Để rõ hơn tác dụng của BRR, hãy xét một ví dụ đối với định dạng Betacam số có tỷ lệ nén 1:2. Nếu không dùng BRR, phải tăng tốc độ băng lên gấp hai lần. Với độ rộng băng 1/2 inch, so sánh cùng một thời lượng ghi, nếu tốc độ băng tăng gấp đôi thì các vệt từ phải hẹp hơn. Điều này dẫn đến cần tăng gấp đôi số đầu từ hoặc tăng gấp đôi tốc độ đầu từ. Từ đó dẫn đến tăng độ phức tạp của mạch điện và tăng công suất tiêu thụ. Trường hợp tốc độ đầu từ tăng còn làm cho nhiễu âm tăng lên. Đây là điều không thể chấp nhận cho các ứng dụng ở các thiết bị ghi hình. Các điều kiện này cũng làm cho đường dẫn băng phức tạp hơn, yêu cầu có sự điều chỉnh phức tạp và phải rất chính xác với dung sai cơ khí rất khắt khe. Tất cả điều này sẽ dẫn đến tăng giá thành sản xuất, giá bán sản phẩm và tăng chi phí bảo dưỡng các máy ghi hình. Mặt khác do tốc độ băng tăng, tiêu phí băng sẽ tăng và sẽ tăng giá thành chạy băng. Những vấn đề này không thể chấp nhận được với các VTR định dạng số yêu cầu có hiệu quả sử dụng cao. Sử dụng công nghệ BRR sẽ khắc phục được tất cả các vấn đề trên, khiến cho VTR sẽ được phát triển mạnh mẽ, bền vững, dễ dàng bảo dưỡng và cho một chất lượng ghi hình cao. Để thấy được tính ưu việt của các định dạng VTR số có sử dụng công nghệ nén tín hiệu video ta hãy xét một số định dạng cụ thể của VTR. 3.3.2. Các định dạng VTR hiện nay Với sự phát triển công nghệ mới trong các lĩnh vực điện tử, công nghệ tin học, thông tin viễn thông, VTR cũng có nhiều thay đổi. Không kể VTR số composite, từ năm 1994 trở lại đây có tới hàng chục định dạng số. Các định dạng ra đời và lại thay đổi nhằm tiến tới mục đích thích hợp với hệ thống dựng phi tuyến, hoà nhập vào mạng truyền dữ liệu và nâng cao chất lượng hình ảnh. Có thể phân các định dạng VTR số theo kích thước băng từ: 1/2 inch và 1/4 inch. Ngoài những loại máy đã được dùng ở các Đài trong nước, hãng Sony mới cho ra hệ máy MPEG IMX Recorder (phát triển thêm là hệ e-VTR) và HDCAM Recorder (phát triển lên là hệ máy CineAlta). Với nhiều hệ máy như vậy, các nhà chế tạo đã chú ý tới tính tương thích (compability) tức là chỉ chuyển format ghi nhưng máy vẫn phát được các format khác. Điều này giúp cho quá trình chuyển thế hệ máy được từ từ, ít biến động. Định dạng BTC SP Năm 1982, Betacam được giới thiệu như một cuộc cách mạng trong lĩnh vực sản xuất chương trình truyền hình, đánh dấu một bước ngoặt quan trọng trong lịch sử phát triển của ghi hình từ tính. Vào năm 1987 định dạng BTC SP được mở rộng với những tiến bộ của băng hạt kim loại và đạt được những cải thiện có ý nghĩa về chất lượng video và audio. Thành công này đã mở rộng đến ứng dụng ENG, trong sản xuất hậu kỳ và phát sóng. Một trong nhiều thay đổi quan trọng là chuyển từ kỹ thuật ghi analog composite sang kỹ thuật ghi analog component. Tiếp theo là các vấn đề cải thiện về thiết kế để khắc phục nhược điểm của thế hệ ghi hình trước đó như dùng băng có độ rộng 1/2 inch (giảm so với thế hệ máy Umatic đang dùng lúc đó là 3/4 inch), giao diện đầu vào mở rộng, có sửa sai lệch gốc thời gian (Time Base Correct – TBC), ghi / đọc tín hiệu mã hoá thời gian (Time code – TC)... Với những thay đổi như vậy, BTC SP đã được thừa nhận là chuẩn quốc tế trong lĩnh vực ENG, trong quảng bá và sản xuất hậu kỳ, được sử dụng với số lượng nhiều trên thế giới. Cho tới nay, BTC vẫn là một chuẩn về cấp chất lượng để một số định dạng VTR số lấy làm ngưỡng so sánh. Cấu trúc vệt từ trên băng Betacam SP được chỉ ra trên hình 3.2 b. Định dạng BTC SX - Sony BTC SX của Sony sử dụng băng 3/4 inch, số hoá theo tiêu chuẩn 4:2:2 với tỷ số nén 10:1 thuật toán nén MPEG-2 được sử dụng trong BTC SX đưa tốc độ dữ liệu video xuống còn 18Mbps. BTC SX giảm được một nửa sự hao tốn băng so với thiết bị BTC SP. Do vậy thời gian ghi dài hơn: băng nhỏ có độ dài tới 60 phút và băng to có độ dài tới 180 phút. So với BTC SP thì BTC SX đã giảm được chi phí băng xuống 1/2. Tư liệu ghi trên băng BTC SX có thể được copy từ băng sang ổ cứng với tốc độ nhanh gấp 4 lần tốc độ bình thường. Bảng 5 dưới đây trình bày các thông số cơ bản của BTC SX. [2] Thông số Giá trị Định dạng video Thành phần Chuẩn nén MPEG-2, 4 :2 :2P@ML, tỷ lệ nén 10 :1 Độ rộng của băng 1/2 inch (12,65 mm) Tốc độ băng 2,34 inch/s (59,6 mm/s) Thời gian ghi/phát 60 phút(băng S), 180 phút (băng L) Số vệt từ/Frame 12(625/50) và 10 (525/60) Tần số lấy mẫu video - Y 13,5 MHz Tần số lấy mẫu video - C 6,75 MHz Số bít Video / mẫu 8 Tốc độ lấy mẫu Audio 48 KHz Số bít Audio/mẫu 16 Tốc độ dữ liệu video và audio 21 Mb/s Mã sửa sai Reed Solomon Độ rộng vệt từ video 0,8 mils Tốc độ của trống 79,925 vòng/s Sự phân bố vệt từ trên băng BTC SX được chỉ ra trên hình 3.4 : c. Định dạng DVCam – Sony Định dạng DVCAM là bước phát triển trong lĩnh vực chuyên dụng của định dạng DV tiêu chuẩn quốc tế. Định dạng DVCAM sử dụng tín hiệu kỹ thuật số 8 bit để ghi với tỉ lệ nén 5:1 và tỉ lệ lấy mẫu 4 :1 :1 (hệ NTSC)/4 :2 :0 (hệ PAL). Công nghệ nén độc đáo đã đem lại hình ảnh chất lượng tuyệt đẹp. Định dạng DVCAM có độ rộng track là 15mm (lớn hơn 10mm của định dạng DV) mang lại độ tin cậy cao hơn trong dựng chuyên nghiệp. Bên cạnh đó là chất lượng âm thanh kỹ thuật số cực hay, với phạm vi linh hoạt và tỉ lệ tín hiệu trên nhiễu (S /N) cao, có thể so sánh ngang với chất lượng CD. DVCam có tính tương thích với các băng 1/4 inch thông dụng như DV, DVCPRO. Các sản phẩm DVCAM cũng có tính hệ thống, đáp ứng mọi nhu cầu của sản xuất chương trình truyền hình : ghi/dựng lưu động, ghi/dựng trường quay, dựng tuyến tính/phi tuyến tính với thiết kế được ứng dụng kỹ thuật mới. [6] Một số thông số chính của DVCAM được trình bày trong bảng 6 : Thông số Giá trị Định dạng Video Thành phần, nén Tốc độ lấy mẫu video - Y 13,5 MHz với 720 điểm ảnh/1 dòng Tốc độ lấy mẫu video- CR, CB 6,75MHz (với 360 điểm ảnh/1 dòng với hệ PAL 4 :2 :0) và 3,375 MHz (với 180 điểm ảnh/1 dòng với hệ NTSC 4 :1 :1) Nén video Theo phương thức M-JPEG Intra-frame sử dụng thuật toán nén DCT và mã hoá VLC, tỷ lệ nén 5 :1 Tốc độ dữ liệu video sau khi nén 12Mbps Tốc độ lấy mẫu audio 48 KHz Số bit audio/mẫu 16 Độ rộng băng 1/4 inch Tốc độ băng 28,221 mm/s Số bit lượng tử 8 Tốc độ dòng bit 25 Mbps Tốc độ quay của trống 150 vòng/s Thời gian ghi/phát 184 phút (Standard) và 40 phút (Mini) Một số tính năng đặc biệt : - Khả năng dựng Preread - Thao tác ClipLink - Có PC card cho Memory Stick - Có hệ thống dựng Lap-top gọn nhẹ cho dựng lưu động Giao diện : - Analog : Composite/Component/S-Video/Audio XLR - Digital : SDI/SDTI (QSDI)/SDTI-CP Phân bố vệt từ trên băng DVCAM (hình 3.5): Mỗi vệt từ xiên có bốn khối dữ liệu : video, audio, mã phụ và một mã thông tin vệt từ và chèn (ITI). Bốn khối phân cách nhau nhờ giải bảo vệ và do hệ thống trống có các đầu xoá lướt nên các khối có thể dựng tách biệt với nhau. d. Định dạng DVCPRO – Panasonic DVCPRO là một hệ thống ghi chuyên nghiệp dựa trên cơ sở DVC, hệ thống này đáp ứng cả định dạng của camcorder và trong hệ thống studio dựng. Tín hiệu video số thành phần tiêu chuẩn 4 :1 : 1 với tần số lấy mẫu tín hiệu chói 13,5 MHz có nén trong khung hình. Hai kênh số audio với tần số lấy mẫu 48 KHz, độ phân giải 16 bit. [2] Các thông số cơ bản của DVCPRO được chỉ ra trong bảng 7 : Thông số Giá trị Định dạng Video Thành phần; chuẩn lấy mẫu 4:1:1 ; tỷ lệ nén 5 :1 DCT (Intra-frame) Độ rộng băng 1/4 inch Tốc độ băng 1,33 inch/s Thời gian ghi lớn nhất 63 phút (băng M), 123 phút (băng L) Kênh video 1 Tổng số đầu trên trống quét 6 Số kênh audio 2 Tần số lấy mẫu video Y 13.5 MHz Tần số lấy mẫu tín hiệu màu - C 3.375 MHz Số bit lượng tử video 8 Số bit lượng tử audio 16 Tần số lấy mẫu Audio 48KHz Tốc độ dữ liệu video 162 Mbit/s Tổng tốc độ dữ liệu video sau khi nén 32,4 Mbit/s Độ rộng vệt từ video 0,71 mils Tốc độ quay của trống 150 vòng/s Tốc độ ghi video 201 inch/s Cấu trúc vệt từ trên băng DVCPRO được trình bày trên hình 3.6 : e. Định dạng MPEG IMX IMX là định dạng dùng băng 1/2 inch được Sony cho ra đời năm 2000. Do ra đời sau nên định dạng này có tính tương thích với các thế hệ trước như BTC SP, BTC SX, D BTC và ứng dụng được công nghệ mới. Giải pháp kỹ thuật của định dạng IMX có tính hệ thống nhằm tạo ra một thế giới MPEG, làm cầu nối giữa Tape - Disk – Server. Có giao diện SDTI-CP, qua đó MPEG Elementary Stream được chuyển tới các thiết bị MPEG như các hệ thống dựng NLN, Server mà không cần mã hoá và giải mã. Qua IMX, các hệ máy dùng băng 1/2 inch có thể hoà nhập vào môi trường MPEG. Các thông số chính của IMX được chỉ ra trong bảng 8: Thông số Giá trị Độ rộng băng 12,65 mm Vật liệu băng Băng hạt kim loại Thời gian ghi/phát lại Tối đa 220 phút (băng cỡ to), tối thiểu 71 phút (băng cỡ nhỏ) Tốc độ băng 53,776 mm/s Số track/1frame 8 Tính tương thích Phát lại được các băng BTC Sp, BTC SX, DBTC Chuẩn nén video MPEG-2, 4:2:2@ ML, Intra Frame Coding Tốc độ dòng bit video 50 Mbps Số dòng tích cực/1 frame 608 Tần số lấy mẫu tín hiệu Y 13,5 MHz Tần số lấy mẫu tín hiệu R-Y, B-Y 6,75 MHz Mức lượng tử video 8 bit/1 sample Mã sửa sai Reed Solomon Tần số lấy mẫu Audio 48 KHz Mức lượng tử audio 16 hoặc 24 bit / 1 mẫu Số kênh audio 8 hoặc 4 * Một số chức năng chính - Thực hiện phát thay đổi tốc độ : Trong dải -1 đến +3 lần tốc độ bình thường với các băng IMX, D BTC, BTC SP và trong dải -1 đến +2 lần với băng BTC SX. - Tìm hình với tốc độ cao : + Băng IMX : ± 78 lần tốc độ bình thường + Băng D BTC : ± 50 lần + Băng BTC SX : ± 78 lần + Băng BTC SP : ± 42 lần - Có chức năng đánh dấu các cảnh quay - Dựng Preread * So sánh với định dạng BTC SX Định dạng IMX có cùng chuẩn nén với BTC SX : MPEG-2, 4 :2 :2 Profile @ML BTC SX IMX GOP 2 frame 1 frame ECC (Inner/Outer) 112/50 150/54 Tracks/GOP 12/2 Frame 8/1 frame Tape Speed (mm/s) 59,575 53,776 Bit rate (Mbps) 18,7 50 Track Pitch (mm) 32 21,7 Recording time (min) 194/60 220/71 Track total length (mm) 108,772 122,09 Bảng 9. So sánh thông số của MPEG IMX với BTC SX f. Định dạng HDCAM HDCAM có biểu tượng cuộn phim màu vàng với tên kèm theo : CineAlta, được Sony cho ra đời vào năm 1997, là một định dạng có độ tin cậy và bền vững cao, chất lượng hình ảnh rất cao, dùng băng 1/2 inch. Với tôn chỉ vì nghệ thuật, HDCAM thực hiện quét liên tục 24 frame với khả năng thời gian thực, đạt hiệu quả và tính linh hoạt của kỹ thuật số độ phân giải cao. HDCAM duy trì được chất lượng hình ảnh cao khi in sao băng cho cả tín hiệu quét liên tục và quét xen kẽ. Các sản phẩm mang nhãn CineAlta cũng cho một cầu nối giữa film 24 frame và môi trường số 24P (picture), cũng có thể chuyển ghi với 25P/30P hoặc chuyển 50Hz/60 Hz. Một frame của phim sẽ tương ứng từng frame HD quét liên tục hoặc có thể chuyển ngược từ 24P sang phim. Môi trường CineAlta cũng giao tiếp được với thế giới đồ hoạ máy tính, đảm bảo tính phong phú, linh hoạt trong sản xuất hậu kỳ. Phải nói rằng CineAlta là hệ thống cho các sản phẩm có độ phân giải cao và đặc biệt nó tạo được điểm hội tụ của phim điện ảnh, HDTV, truyền hình quảng bá, DVD, Internet, E-Cinema và các phương tiện điện , thiết bị số khác. Một số đặc điểm chính : * Tốc độ băng. Xấp xỉ 80,6 mm/s (với tần số 50 Hz) * Các loại băng sử dụng : BCT – 124 HDLC, với 149 phút BCT – 40 HDC, với 48 phút * Tính tương thích : phát lại các định dạng băng BTC SP, BTC SX, MPEG IMX. * Tần số lấy mẫu: Y – 74,25 MHz (cả Pal và NTSC) R-Y/ B-Y : 37,125 MHz * Tỷ lệ khuôn hình : 16 :9 * Mã hoá : 10 bit/1 mẫu (video) * Mã kênh : S-I-NRZI PR-IV * Mã sửa sai : Reed- Solomon * Che lỗi : Adaptive three dimension * Tần số lấy mẫu audio: 48 KHz * Mã hoá : 20bit/ 1 mẫu (audio) Phân bố vệt từ trên băng HDCAM được chỉ ra trên hình 3.7: * Tổng kết các thông số của các định dạng VTR Bảng 10 tổng kết lại các thông số chính của các định dạng BTC SP, BTC SX, DVCAM, DVCPRO, IMX, HDCAM. Trong mỗi định dạng đều tóm tắt các thông số chính theo các mục : Giới thiệu các thông số chung của các định dạng Các thông số thuộc phần Video Những thông số thuộc phần Audio Định dạng BTC SP BTC SX DVC PRO DVCAM IMX HDCAM Độ rộng băng (mm) 12,65 12,65 1/4 inch 1/4 inch 12,65 12,65 Loại băng Oxide, MP MP MP ME MP MP Thời gian ghi (min) 100 (L) 32 (S) 60 (S), 180 (L) 63 (M) 123 (L) 184 (standard) 40 (mini) 220 (L) 71 (S) 124 (L) 40 (S) Tốc độ băng (mm/s) 101,51 59,6 33,8 28,221 53,776 80,6 Tốc độ dữ liệu (Mbps) - 18 25/50 25 50 140 Định dạng video Analog component 4 :2 :2 component 4 :1 :1 component 4:1:1 Component 4 :2 :2 Component 4 :2 :2 Component Tần số lấy mẫu tín hiệu Y và C (MHz) - 13.5 CR- 6,75  CB- 6,75 13.5 CR-3,375  CB-3,375 13,5 CR-6,75  CB-6,75 13,5 CR-6,75  CB-6,75 74,25 CR-37,125 ; CB-37,125 Mã hoá video (số bit/mẫu) - 8(10) 8(10) 8(10) 8(10) 10(8) Phương pháp nén - MPEG-2 MPEG-2 MPEG-2 MPEG-2 MPEG-2 Tỷ lệ nén - 1 :10 1 :5 1 :5 1:3,3 1:7 Tần số lấy mẫu audio (KHz) - 48 48 32 (48) 48 48 Mã hoá audio (số bit/mẫu) - 16 16 12(16) 16(24) 20 3.3.3. Vấn đề lựa chọn VTR trong sản xuất chương trình truyền hình trong thời gian tới. Khi xem xét tới quá trình phát triển VTR và qua thực tế sử dụng VTR ở các Đài truyền hình cho thấy một số vấn đề sau: Chủng loại VTR được dùng ở các Đài truyền hình là khá nhiều, các Đài địa phương đầu tư thiếu tính hệ thống và không theo chỉ đạo chung. Điều này gây khó khăn trong việc trao đổi chương trình, trong đầu tư bảo dưỡng, sửa chữa thiết bị. Từ năm 2003 hãng Sony đã ngừng sản xuất một số loại như BTC SP. Như vậy BTC SP là thế hệ analog cuối cùng. Về sử dụng VTR ở VTV, theo tìm hiểu thì tôi thấy: Quá trình đầu tư chuyển đổi thế hệ máy là hợp lý. Các hệ thống dựng tuyến tính đầu tư giảm dần, để thay vào các hệ thống dựng phi tuyến. Đầu vào đáp ứng hầu hết các format ghi, còn đầu ra phát sóng dùng BTC SP, chỉ một loại PVW 2600P. Hướng phát triển VTR trong những năm gần đây là D VTR như Betacam SX, DVCAM, DVC PRO đây là những định dạng được sử dụng rộng rãi nhất tại VTV cũng như các đài địa phương. Và những năm tiếp theo thì hướng lựa chọn vẫn là D VTR, nhưng vấn đề là lựa chọn loại nào cho khâu nào trong dây chuyền SXCT cho phù hợp với sự phát triển của công nghệ. Đây là một vấn đề cần xem xét kỹ, bởi vì nếu đầu tư không tối ưu sẽ khó thay đổi ngay mà phải đợi hết một thế hệ máy. Một vấn đề có tính quyết định nữa là kinh phí đầu tư và hệ thống thiết bị hiện đang dùng. Cuối cùng để có cái nhìn tổng thể, luận văn đưa ra biểu đồ quan hệ tương đối giữa chất lượng thiết bị và giá thành để có sự lựa chọn phù hợp. Giá thành Chất lượng S VHS BTC SP DVCAM DVC Pro BTC SX MPEG IMX HDCAM Hình 3.8: Quan hệ giữa chất lượng và giá thành của các định dạng VTR Từ bảng tổng kết các thông số chính của các định dạng VTR và qua biểu đồ quan hệ giữa chất lượng thiết bị và giá thành ta thấy các VTR số đã và đang chứng tỏ ưu thế trong các Studio truyền hình so với các VTR tương tự S VHS, BTC SP. Đối với các D VTR thì chất lượng của từng định dạng VTR số qua từng giai đoạn cũng có sự khác nhau. Để làm cơ sở cho định hướng lựa chọn, luận văn đưa ra một số các đặc điểm chính liên quan đến chất lượng khi xem xét đến các thiết bị ghi hình. Đó là độ ổn định, chất lượng tín hiệu, các tính năng mới, tính hệ thống và vấn đề bảo dưỡng/sửa chữa thiết bị. * Độ ổn định được thể hiện ở kết cấu cơ khí và hệ thống tự động điều chỉnh các motor (servo system). * Chất lượng tín hiệu được đánh giá bằng cách xử lý tín hiệu Video/Audio ghi vào băng kết hợp tốc độ băng/đầu từ. * Các tính năng mới: Một số tính năng đáng kể như : Dựng Pre-read, phát thay đổi tốc độ, chức năng cho phép quản lý các dữ liệu trên băng,... * Tính hệ thống được xem xét trước hết là tính chuẩn định dạng từ tiền kỳ, hậu kỳ, truyền dẫn phát sóng và giao tiếp mạng. Tiếp đến là khả năng đồng bộ với các thiết bị khác trong dây chuyền, ví dụ như đầu tư mua hệ thống dựng A/B roll phải tính đến các thiết bị liên quan như bàn dựng và kỹ xảo. Một điều không thể thiếu khi lựa chọn VTR là phải tính đến khả năng bảo dưỡng/sửa chữa. Vấn đề này liên quan đến hãng sản xuất thiết bị có truyền thống chú trọng đến việc cung cấp Service Manual, Maintenance Tools, Sqareparts. Qua tìm hiểu việc sử dụng VTR ở Đài Truyền hình Việt Nam cũng như tại Trường Cao đẳng truyền hình, tôi thấy với các đặc điểm Độ ổn định, chất lượng tín hiệu, tính năng mới, mức độ có khác nhau nhưng các máy D VTR đều đạt được; Các đặc điểm tính hệ thống và khả năng bảo dưỡng/sửa chữa hãng Sony cho nhiều điểm ưu việt hơn các hãng khác. Các sách hướng dẫn và sơ đồ máy của Sony được trình bày khá mạch lạc và có tính nhất quán ở các loại máy. Với tất cả các vấn đề đã tìm hiểu, phân tích ở trên luận văn đưa ra định hướng phát triển VTR trong thời gian tới là dùng định dạng HDCAM của hãng Sony thay thế cho các định dạng VTR tương tự như BTC SP hay một số định dạng D VTR khác có cấp chất lượng kém hơn. Đây là kết luận của cả quá trình khảo sát thực tế, của nghiên cứu mang tính lý thuyết và ứng dụng các loại định dạng VTR có ở trong nước và trên thế giới. Qua phân tích ở các phần trên về lý thuyết định dạng VTR số, về các đặc điểm cơ bản của định dạng HDCAM thì ta thấy định dạng này đáp ứng được tất cả các yêu cầu như : Độ ổn định, Chất lượng tín hiệu, Các tính năng mới, Tính hệ thống và vấn đề bảo dưỡng/sửa chữa thiết bị. 3.4. Định hướng áp dụng công nghệ nén tiên tiến như MPEG-4/H2.64 cho các thiết bị ghi hình số trong tương lai gần. Qua tìm hiểu các thiết bị ghi hình số ta thấy hầu hết hiện nay các thiết bị này đều sử dụng công nghệ nén MPEG-2, nó cho hiệu quả nén cao, tốc độ bit thấp. MPEG-2 là chuẩn nén được tiêu chuẩn hoá, cho phép các hệ thống MPEG khác nhau dùng cùng các file dữ liệu. Các file MPEG có thể được truyền như dữ liệu nén trong các dòng truyền tải MPEG. Do đã được thừa nhận rộng rãi và chất lượng ảnh cao của nó, do hỗ trợ cả độ phân giải video HD và SD, MPEG-2 là sự lựa chọn sơ đồ nén tốt nhất và an toàn nhất cho việc sản xuất chương trình. Nó mềm dẻo và có thể có hai dạng (I-frame – giống với dạng mã hoá DV – thích hợp cho dựng trong sản xuất hậu kỳ, và nhóm GOP dài thích hợp cho lưu trữ, truyền dẫn nơi mà băng thông và dung lượng lưu trữ khá quí hiếm). Tuy nhiên nó cũng có những nhược điểm như : Khi dùng trong sản xuất chương trình hoặc hậu kỳ...nén MPEG-2 không cho phép tận dụng hết ưu việt của nó. Ví dụ, để tận dụng được ưu điểm SDTI-CP với desk Sony IMX/D10 người sử dụng phải mã hoá ở frame I ở tốc độ 30/40 hoặc 50 Mb/s, không tận dụng được các ưu điểm của nén thời gian. MPEG GOP dài là khó dựng, tu sửa và điều khiển bởi một số hệ thống vì mỗi frame không chứa tất cả các dữ liệu cần thiết để cấu trúc lại frame đó. Mã hoá MPEG chỉ frame I thường được sử dụng khi dựng và điều này đòi hỏi tốc độ bit cao hơn nhiều. ở đây cần lưu ý rằng việc lựa chọn định dạng nén cần căn cứ vào nhu cầu cụ thể cũng như khả năng kinh phí có thể có. Ví dụ từ lâu Hiệp hội viễn thông châu Âu (EBU) đã khuyến cáo rằng để đảm bảo chất lượng và tính liên hoạt trong môi trường sản xuất truyền hình số, tại các trung tâm sản xuất truyền hình chính, đặc biệt ở nơi mà dữ liệu được sử dụng nhiều lần, nên dùng nén MPEG-2 4 :2 :2P@ML với tốc độ bit 50 Mb/s và mã hoá chỉ frame I. Tất nhiên do giá thành các thiết bị dựa trên nén MPEG-2 4 :2 :2P@ML vẫn còn cao nên các thiết bị dựa trên nén DVCPRO, DVCAM vẫn hay được sử dụng. Cũng theo EBU các thiết bị theo chuẩn DV (cả DVCPRO và DVCAM) là các thiết bị bán chuyên dụng, dung hoà giữa giá thành và chỉ tiêu kỹ thuật, nên các mạch chỉnh sửa được thiết kế không thật tốt (để giảm giá thành), không thể đảm bảo chất lượng tín hiệu ở mức cao. Ngoài ra, mã hoá DV là ít hấp dẫn vì tính không tương thích tương đối của nó với các tiêu chuẩn truyền dẫn (GOP dài) và tính không hiệu quả lưu trữ/ băng thông cao. Hiện nay các chuẩn nén mới như MPEG-4, H2.64/AVC... đã được nghiên cứu thành công và đã trở thành các chuẩn nén thực tế và sẽ thay thế dần các chuẩn nén được trình bày ở trên do chúng cho hiệu quả nén cao hơn. Hiện tại trên thị trường đã có rất nhiều hãng đã đưa ra các sản phẩm phần cứng và phần mềm mã hoá, xử lý, truyền dẫn... Video theo chuẩn MPEG-4/ H.264. Cùng với sự phát triển ngày càng nhanh chóng của công nghệ vi điện tử và công nghệ thông tin, giá của các thiết bị Video theo chuẩn MPEG-4/ H.264 ngày càng giảm nhanh và tốc độ xử lý ngày càng cao hơn. Mặt khác, các chuẩn truyền dẫn, quảng bá tín hiệu truyền hình mặt đất, vệ tinh...mới nhất đều hỗ trợ chuẩn MPEG-4/ H.264. Do vậy, khả năng ứng dụng của các thiết bị theo chuẩn MPEG-4/ H.264 trong dây chuyền mã hoá, xử lý, truyền dẫn...tín hiệu Video ngày càng rộng rãi và cho phép triển khai các dịch vụ Video mới. Các sản phẩm theo chuẩn MPEG-4 hiện đang có trên thị trường hiện nay là: Các phần mềm mã hoá/ giải mã Video MPEG-4 như là DivX..., các phần mềm phát các file Video MPEG-4 như BSPlayer,... Các bộ mã hoá/ giải mã Video theo chuẩn MPEG-4/ H.264 như... Các đầu ghi/ phát đĩa CD/ DVD theo chuẩn MPEG-4. Kết luận chương 3 Chương 3 của luận văn đã trình bày ứng dụng của kỹ thuật nén video trong sản xuất chương trình truyền hình, cụ thể là đối với máy ghi hình số. Khi ứng dụng công nghệ nén video trong các định dạng D VTR ta thấy được những ưu điểm như : gọn, độ tin cậy cao, cho thời lượng ghi băng dài, giá cả hợp lý, đảm bảo chất lượng và một số tính năng khác so với máy ghi hình tương tự. Đồng thời trong chương 3 của luận văn còn đưa ra được hướng lựa chọn VTR trong thời gian tới và định hướng lựa chọn VTR trong tương lai gần với việc ứng dụng công nghệ nén tiên tiến hơn như MPEG-4, H.264/AVC, đây chính là đóng góp của luận văn. Kết luận chung Trong quá trình thực hiện luận văn này, em đã cố gắng tìm hiểu, tham khảo tài liệu và nghiên cứu các thiết bị sản xuất chương trình truyền hình, sắp xếp các kiến thức này có tính hệ thống. Tín hiệu truyền hình số lμ loại dữ liệu có tốc độ lớn nên cần có băng thông rộng. Với tốc độ của các kênh truyền hiện nay thì việc truyền tín hiệu truyền hình số rất khó khăn. Một yêu cầu đ−ợc đặt ra lμ lμm sao giảm đ−ợc tốc độ tín hiệu để phù hợp với tốc độ kênh truyền. Giải pháp đ−ợc đ−a ra lμ nén tín hiệu truyền hình số. Kỹ thuật nén có thể đáp ứng đ−ợc yêu cầu về tốc độ tín hiệu, bằng cách chọn tỷ số nén thích hợp. Sự phát triển của kỹ thuật số vμ công nghệ xử lý tín hiệu số cùng công nghệ xử lý ảnh lμm cho hiệu quả nén ngμy cμng cao vμ chất l−ợng của tín hiệu cũng đ−ợc nâng cao hơn. Công nghệ truyền hình số nói chung, thiết bị sản xuất chương trình truyền hình nói riêng đang dần thay đổi hết sức nhanh chóng. Xu hướng số hoá toàn bộ dây chuyền sản xuất chương trình, truyền dẫn phát sóng sẽ xảy ra trong tương lai gần. Luận văn này đã nêu bật được các vấn đề trên, việc ứng dụng kỹ thuật nén trong các thiết bị ghi hình đã và đang đem lại hiệu quả cao trong quá trình sản xuất chương trình, xu hướng áp dụng công nghệ nén tiên tiến hơn cho các thiết bị ghi hình số sẽ được các hãng sản xuất giới thiệu trong tương lai gần. Tuy nhiên, do kiến thức, tài liệu và thời gian hạn hẹp nên em chưa thể đi sâu nghiên cứu được ứng dụng của kỹ thuật nén video đối với các thiết bị sản xuất chương trình truyền hình khác và đó cũng là hạn chế của luận văn này.

Các file đính kèm theo tài liệu này:

  • doc31762.doc