Tiểu luận Nghiên cứu và trình bày các vấn đề trong xử lý ảnh: Hệ thống xử lý tín hiệu hai chiều ( Two-dimensional Systems) - Cảm thụ ảnh ( Image Perception ) Lấy mẫu và lượng tử hóa ( Image Sampling and Quantization)

Xử lý ảnh là mảng kiến thức quan trọng và có mặt trong chương trình đào tạo của ngành CNTT. Nó được ứng dụng rộng rãi trong nhiều lĩnh vực. Trong bài tiểu luận trên, nhóm chúng tôi tập trung trình bày một số vấn đề : - Hệ thống xử lý tín hiệu hai chiều - Cảm thụ ảnh - Lấy mẫu và lượng tử hóa Mặc dù, đã có nhiều cố gắng, song không thể tránh được những sai sót. Nhóm chúng tôi rất mong nhận được sự đóng góp của thầy và các bạn. Chúng tôi chân thành cảm ơn.

71 trang | Chia sẻ: oanh_nt | Lượt xem: 1141 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Tiểu luận Nghiên cứu và trình bày các vấn đề trong xử lý ảnh: Hệ thống xử lý tín hiệu hai chiều ( Two-dimensional Systems) - Cảm thụ ảnh ( Image Perception ) Lấy mẫu và lượng tử hóa ( Image Sampling and Quantization), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

i căn bậc 3 của độ chói và nó mô tả độ tương phản (hay độ sáng) của một màu không đổi. Hệ toạ độ này rất hữu dụng trong việc đo sự khác nhau của màu sắc một cách định lượng. Hệ S, q, W* là sự biểu diễn đơn cực của U*, V*, W*, trong đó S và q mô tả, theo thứ tự định sẵn thuộc tính bão hoà và sắc thái của màu (Hình 10). Giá trị S lớn đưa ra màu với độ bão hoà cao. Hệ NTSC (National Television Systems Committee) được phát triển như một chuẩn cho vô tuyến truyền hình. Hệ NTSC đã dùng ba thành phần phốt pho để tạo ra ba dải quang phổ đỏ, xanh da trời, xanh lá cây. Ánh sáng trắng được tạo thành từ tỉ lệ ba màu cơ bản R= G= B=1. Bảng 5 đưa ra toạ độ của một số màu chính. Màu đơn đối với hệ toạ độ này là hình lập phương (Hình 17). Biểu đồ tính chất của màu đổi với hệ này được chỉ ra trong Hình 18. Chú ý rằng ánh sáng trắng đối với hệ NTSC khác với nó trong hệ CIE. Bảng 5: Giá trị tỉ lệ của từng màu trên ba màu cơ bản và màu nguyên chất của một số màu chính trong hệ NTSC. Red Yellow Green Cyan Blue Magenta White Black RN GN BN rN gN bN 1.0 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 0.5 0.5 0.0 0.0 1.0 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 0.5 0.5 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 1.0 0.5 0.0 0.5 1.0 1.0 1.0 0.333 0.333 0.333 0.0 0.0 0.0 0.333 0.333 0.333 Hệ biến đổi NTSC (Y, I, Q) được phát triển để biến đổi màu một cách thuận tiện từ ảnh màu sử dụng màu đơn sắc. Toạ độ Y là độ chói – luminance (kênh đơn sắc) của màu. Hai tín hiệu tỉ lệ I và Q cùng biểu thị sắc thái và độ bão hoà của màu và có độ rộng dải tần nhỏ hơn nhiều so với tín hiệu độ chói. Thành phần I và Q được truyền trong kênh sử dụng phép điều chế cầu phưong mà theo cách này phổ không gian I, Q không bị chồng lên phổ của Y và độ rộng dải tần yêu cầu cho sự chuyền không đổi (sẽ được làm rõ trong chương sau). Hệ Y, I, Q có liên quan tới hệ RN, GN, BN qua phép biến đổi tuyến tính. Nó và một số các biến đổi sang các hệ màu khác được đưa ra trong Bảng 6. Hình 18: biểu đồ tính chất của màu đối với hệ thu NTSC. Line of purples: màu tía.(đường chung nhau giữa màu đỏ và màu xanh lá cây) Hình 17 và 18 Hệ L*, a*, b* đưa ra biểu thức một cách định lượng cho hệ phân loại màu của Munsell. Giống như hệ U*, V*, W*, nó cũng đưa ra các công thức màu khác nhau. Tương tự, đối với các hệ toạ độ khác, chúng ta thu được: X= 0.781 Y= 0.886 Z= 0.066 x= 0.451 y= 0.511 z= 0.038 U= 0.521 V= 0.886 W= 0.972 u= 0.219 v= 0.373 w= 0.408 Y= 0.886 I= 0.322 Q= -0.312 Bảng 6:Biến đổi từ hệ thu NTSC sang các hệ toạ độ khác. Vecto đầu vào là [RN, GN, BN]T Vecto đầu ra Ma trận biến đổi Chú giải Hệ CIE gốc Hệ CIE X, Y, Z Hệ CIE UCS Hệ NTSC X./Đo độ khác nhau của màu: Tính toán sự khác nhau của hai màu bất kì đưa ra một vấn đề trong việc mã hoá, nâng cấp và phân tích ảnh màu. Sử dụng các dấu hiệu gợi ý rằng tỉ lệ các màu đơn có thể được quan tâm như không gian Riemannian với khoảng cách màu: (ds)2= (2.28) ds mô tả khác nhau vi phân giữa hai màu với toạ độ Xi và Xi+ dXi trong hệ toạ độ màu đã chọn. Hệ số ci, j đo độ nhạy trung bình do sự khác nhau nhỏ trong toạ độ thứ i và thứ j. Sự khác nhau nhỏ trong hai màu sẽ được mô tả trong sự quan sát những chi tiết đáng chú ý của màu (JND). Một đơn vị xác định bởi: I= (2.29) là phương trình mô tả đối với một elipsoit. Nếu hệ số ci, j là hằng số trong suốt không gian màu thì elipsoit JND có thể có kích thước không đổi trong không gian màu. Không gian màu có thể bị giảm thành không gian ơ-clít, trong đó sự khác nhau của hai màu bất kì có thể trở thành tương ứng đối với chiều dài của đường thẳng nối chúng. Nhưng ci,j thay đổi rất lớn đối với giá trị tỉ lệ giữa các màu, do đó cỡ của chúng cũng như sự định hướng của các elipsoit luôn thay đổi. Bởi vậy, khoảng cách giữa hai màu bất kì C1 và C2 được đưa ra bởi một chuỗi nhỏ các elipsoit nằm dọc đường cong C* nối C1 và C2 do đó khoảng cách: (2.30) là nhỏ nhất khi đánh giá dọc đường cong. Đường cong đó được gọi là sự đo đạc (geodesic) giữa C1 và C2. Hình 19: Geodesic trong mặt phẳng (u,v) Nếu ci, j là hằng số trong không gian tỉ lệ thì đường cong sẽ thành đường thẳng. Geodesic trong không gian màu có thể quyết định bởi kĩ thuật khách quan ví dụ như các phép tính toán học của sự biến đổi hay chương trình động. Hình 19 chỉ ra phép chiếu của một vài đường cong geodesic giữa các màu chính NTSC trong hệ UCS. Geodesic giữa hai màu chính sẽ gần là đường thẳng nhưng geodesic giữa các màu khác nói chung là đường cong. Bảng 7:Một số công thức: Công thức Số công thức Chú giải (Ds)2=(DU*)2+(DV*)2+(DW*)2 2.31 Công thức CIE 1964 (Ds)2=(DL*)2+(Du*)2+(Dv*)2 u*=13L*(u’-u0) v*=13L*(v’- v0) u’= u 2.32 Công thức CIE 1976, biến đổi của không gian u,v,Y thành không gian u*, v*, L*. u0, v0, Y0 : các thông số của màu tham khảo (Ds)2=(DL*)2+(Da*)2+(Db*)2 2.33 Hệ toạ độ màu L*, a*, b*. Do các thủ tục phức tạp nói trên của việc xác định khoảng cách giữa các màu, ta luôn muốn có một cách đo đạc đơn giản hơn. Một số công thức xấp xỉ không gian màu Riemannian gần với không gian màu Ơclit được đưa ra bởi CIE (Bảng 7). Công thức đầu tiên trong bảng được thông qua vào năm 1964. Công thức thứ 2 được gọi là công thức L*, u*, v* CIE 1976, nó là công thức sửa đổi của công thức CIE U*, V*, W* 1964, liên quan đến không gian màu không đổi. Công thức thứ ba được gọi là công thức màu khác nhau CIE 1976 L*, a*, b*. XI./Mô hình nhìn màu: Với cách mô tả màu bằng cách dùng vecto ba thành phần, một mô hình nhìn màu bao gồm ba kênh, mỗi kênh tương tự với mô hình đơn giản hoá trong Hình 9, được chỉ ra trong Hình 20. Ảnh màu được mô tả bởi toạ độ RN, GN, BN ở mỗi điểm ảnh. Ma trận A biến đổi đầu vào thành ba đáp ứng ak(x,y,C), với k=1, 2, 3, trong đó (x, y ) là toạ độ không gian của điểm ảnh và C là màu của nó. k= 1, 2, 3 (2.34) Hình 20: Mô hình nhìn màu Tk qua biến đổi phi tuyến sẽ đưa ra ba trường T~k(x,y), với k= 1, 2, 3. Ma trận B3x3 biến đổi T~k(x,y) thành Ck(x,y). Các Ck(x,y) sẽ đi qua các đáp ứng tần số của hệ thống thị giác Hk( x1,x2), đây chính là các bộ lọc thông thấp.Ma trận A và B như sau: Từ mô hình ở Hình 20, một tiêu chuẩn cho độ chính xác của ảnh màu có thể được định nghĩa. Ví dụ, đối với hai ảnh màu {RN, GN, BN} và {R’N,G’N,B’N}, giá trị dự tính của bình phương của lỗi (mean square error) có thể được định nghĩa bằng: (2.35) Trong đó R là miền mà trên đó ảnh được định nghĩa, A là diện tích của nó, và Bk(x,y) và B’k(x,y) là đầu ra của mô hình đối với hai ảnh màu. Hình 21: Đáp ứng tần số của ba kênh màu C1, C2, C3 của mô hình nhìn. XII./Thuộc tính thời gian của thị giác: Khía cạnh thời gian của chức năng thị giác trở nên quan trọng trong quá trình xử lý ảnh động và trong thiết kế hiển thị ảnh đối với ảnh tĩnh. Nó được đề cập dưới đây. 1.Quy luật Bloch: Tia sáng ở khoảng thời gian khác nhau nhưng có độ lớn năng lượng bằng nhau là không thể phân biệt được dưới một khoảng thời gian tới hạn. Khoảng thời gian tới hạn vào khoảng 30ms, khi mà mắt thích ứng với mức rọi sáng vừa phải. Mắt càng thích ứng tốt với bóng tối thì thời gian tới hạn càng dài. 2.Tần số tới hạn hợp nhất (Critical Fusion Frequency CFF) Khi quan sát chậm một tia sáng, các tia sáng đơn lẻ là có thể phân biệt được. Với tần số của tia sáng trên tần số hợp nhất CFF, thì các tia sáng là có thể phân biệt được từ một ánh sáng với cường độ trung bình như nhau. Tần số này thông thường không vượt quá 50 đến 60 Hz (xem hình 22). Thuộc tính này là nền tảng của việc quét và hiển thị của máy ảnh và ti vi. Trường ảnh trộn lẫn được lấy mẫu và hiển thị lại ở tần số 50 đến 60 Hz (Tần số được chọn để khớp với tần số điện để tránh nhiễu). Đối với hiển thị ảnh số tĩnh, các màn hình hiện đại được refresh với tỉ lệ 60 khung/s để tránh sự nháy hình. 3.Hiệu ứng không gian và thời gian (Spatial versus temporal effects): Hình 22 Mắt nhạy đối với không gian tần số cao hơn là đối với không gian tần số thấp. Hình 22 so sánh hệ MTF thời gian for flickering fields với sự không gian tần số khác nhau. Có thể nhận thấy rằng nó rất hữu ích trong việc mã hoá ảnh động bằng cách lấy mẫu bất kì đâu trong miền động ngoại trừ biên. Với lí do tương tự, màn hình sử dụng tốc độ refresh ở 60 Hz. LẤY MẪU VÀ LƯỢNG TỬ HÓA ẢNH (Image sampling and Quantization) I. Lời mở đầu: Yêu cầu cơ bản nhất trong việc xử lý hình ảnh trên máy tính là hình ảnh phải ở dạng biểu diễn số, tức là, dạng mảng những từ nhị phân có độ dài hữu hạn. Để số hóa (hình 4.1), những hình ảnh cho trước được lấy mẫu trên các lưới riêng và mỗi mẫu hoặc mỗi pixel được lượng tử hóa bởi một số hữu hạn bit. Ảnh số được lượng tử hóa có thể được xử lý hay chuyển qua bước biến đổi số tương tự. Máy tính số Lượng tử hóa Mẫu f(x, y) f(x, y) u(m, n) Ảnh vào Digitization Hiển thị Máy tính số Chuyển đổi từ D->A u(m, n) Display Hình 4.1: Lấy mẫu, lượng tử hóa và hiển thị ảnh. 1.Quét hình ảnh (Image Scanning): Phương pháp chung của việc lấy mẫu hình ảnh là quét ảnh theo từng hàng và lấy mẫu theo mỗi hàng đó. Một đối tượng, phim ảnh, hoặc giấy trong suốt là các dạng chiếu sáng liên tục để tạo nên hình ảnh điện tử trên một tấm kẽm nhạy cảm được gọi là tấm cảm quang. Tùy theo các loại camera mà tấm cảm quang là chất quang dẫn hay quang truyền, trái lại, trong ống phân tích hình ảnh, tấm cảm quang lại là hiệu ứng quang điện. Một khe hổng điện tử nhỏ quét tấm cảm quang và phát ra dòng điện tương ứng với ánh sáng đồng nhất trên tấm cảm quang. Một hệ thống với kỹ thuật quét như vậy được gọi là kỹ thuật số hóa scan-out. Một vài thiết bị quét hiện đại, như thiết bị cameras charge-coupled (CCD) chứa một mảng các bộ tách sóng quang, đó là một tập các công tắc điện tử điều khiển các mạch trên tất cả các chip đơn. Bằng khóa bên ngoài, mảng này có thể được quét bởi các phần tử theo cách mong muốn (xem hình 4.3). Đây thực sự là một thiết bị lấy mẫu hai chiều và thường được gọi là mảng self-scanning. Hình 4.3 Một kỹ thuật khác được gọi là phương pháp scan-in, đối tượng được quét bởi một ánh sáng chuẩn, mỏng giống tia laze, nó sẽ chiếu sáng chỉ trên những chấm nhỏ tại 1 thời điểm. Sự truyền ánh sáng được hình ảnh hóa bằng một thấu kính trên bộ tách sóng quang (hình 4.4). Một máy quét có độ phân giải cao và một trống quét xoay dùng để tạo ra những hình ảnh kỹ thuật số, hiển thị hoặc ghi những hình ảnh này. Hình 4.4 + 4.5 2 .Chuẩn truyền hình (Television Standards): Ở Mỹ, một phát minh máy quét chuẩn được đưa ra bởi RETMA. Mỗi lần hoàn thành việc quét của tấm cảm quang được gọi là một khung, nó chứa 525 dòng và được quét ở tốc độ 30 khung/giây. Mỗi khung bao gồm hai trường kết hợp, mỗi trường chứa 262.5 dòng, như trong hình 4.5. Để loại bỏ những ánh sáng lập lòe, các trường xen kẽ nhau được gửi với tốc độ 60 trường/giây. Việc quét các dòng này có một độ nghiêng vì tốc độ quét theo chiều dọc chậm hơn. Trường đầu tiên chứa tất cả những dòng lẻ, trường thứ hai chứa các dòng chẵn. Bằng cách duy trì các trường ở tốc độ khá hơn những khung ở tốc độ 60Hz, dải thông của sự truyền tín hiệu giảm và vào khoảng 4.0MHz. Tại điểm cuối của trường đầu tiên, ống tia catot (CRT) chiếu tia vạch lại một cách khá nhanh hướng lên đỉnh trung tâm của tấm cảm quang. Tia sáng có xu hướng chéo trong suốt thời gian vạch lại theo cột dọc hàng ngang, do đó việc vạch lại theo đường ríc rắc của nó là không thể. Trong mỗi đường dọc được vạch lại có 21 dòng bị mất, bởi vậy chỉ có 484 dòng hoạt động trong 1 khung. Có 3 chuẩn truyền hình màu, NTSC dùng ở Bắc Mỹ và Nhật; SECAM dùng ở Pháp, Đông Âu, và Liên Bang Xô Viết; PAL dùng ở miền Tây nước Đức, Anh, một phần Châu Âu, Nam Mỹ, một phần Châu Á, và Châu Phi. Hệ NTSC dùng 525 dòng quét trên 1 khung, 30 khung/giây, và 2 trường kết hợp chặt chẽ trong 1 khung. Tín hiệu hình ảnh màu có thể được viết như một tín hiệu tổ hợp: u(t) = Y(t) + I(t)cos(2п ft + Ф) + Q(t)sin(2п ft + Ф) (4.1) với Ф = 33º và f là tần số tương ứng. Thành phần Y và (I,Q) là các thành phần độ chói và thành phần màu, có thể thu được bằng cách chuyển dời tuyến tính các tín hiệu R, G, và B (xem Chương 3). Một nửa năng lượng dải thông của Y, I, và Q xấp xỉ 4.2MHz, 1.3MHz, và 0.5MHz. Tần số sóng mang màu f là 3.58MHz, tức là 455 f/2.Với flà tần số quét tuyến tính (ví dụ 15.75 đối với NTSC). Từ f là cấp số nhân lẻ của f/2 cũng như một nửa tần số khung. f/2 là pha của sóng mang sẽ thay đổi 180º từ dòng đến dòng, và từ khung đến khung. NTSC là một tổ hợp tín hiệu video với 2:1 dòng có thể diễn giải như: u(x, y, t) = Y(x, y, t) + I(x, y, t)cos(2п fx + Ф)cos[п(ft – fy)] + Q(x, y, t)sin(2п fx + Ф)cos[п(ft – fy)] (4.2) Hệ SECAM dùng 625 dòng ở tốc độ 25 khung/giây với 2:1 dòng đan xen nhau. Mỗi dòng quét bao gồm tín hiệu Y(t) và một tín hiệu U/ (B – Y)/2.03 hoặc V/ (R – Y)/1.14 thay đổi từ dòng đến dòng. Những tín hiệu này liên quan đến trục NTSC như: I = V/ cos 33º - U/ sin 33º Q = V/ sin 33º + U/ cos 33º (4.3) Điều này tránh lại sự điều chỉnh góc phần tư và tương ứng với thành phần màu phản hồi với pha dò lỗi hiện tại trong NTSC nhận. Sóng mang U/ và V/ tại 4.25 và 4.41 MHz. SECAM cũng chuyển giao sóng mang phụ, nó sẽ tăng độ phức tạp của sự pha trộn đối với việc truyền dẫn. Hệ PAL cũng chuyển 625 dòng ở tốc độ 25 khung/giây với 2:1 dòng đan xen. Tín hiệu tổ hợp là: u(t) = Y(t) + U/ cos 2пft + (-1)V/ sin2пft với m là số đường thẳng, từ đó pha V/ sẽ thay đổi bởi 180º giữa các dòng liên tục trong cùng một trường. Sự đan xen giữa các dòng liền kề nhau có thể bị nén lại bởi phép tính trung bình cộng. U/, V/ được cho có dải thông bằng nhau (1.3 MHz) với vị trí sóng mang tại 4.43 MHz. 3. Hiển thị và ghi hình ảnh (Image Display and Recording) Một hệ hiển thị và ghi ảnh là một khái niệm hệ thống quét trong sự điều khiển nghịch đảo. Một phương pháp thông dụng là quét các mẫu ảnh, sau đó chuyển từ dạng kỹ thuật số sang dạng tương tự (D sang A), trong CRT, nó hiển thị một mảng của các khoảng các chấm sáng mờ cường độ nhỏ mà cường độ của nó tỷ lệ với mẫu cường độ lớn. Hình ảnh được quan sát qua một màn kính. Chất lượng của ảnh phụ thuộc vào cỡ của chấm đen, cả hình dạng và khoảng cách của nó. Một cách cơ bản, việc quan sát hình ảnh nên liên tiếp. Yêu cầu đưa vào giữa các mẫu có thể được cung cấp trong một số cách. Một cách là làm mờ các điểm điện tử, từ đó tăng sự chồng chéo giữa các điểm. Điều này yêu cầu điều khiển hình thù của điểm. Mặc dù thế, nó vẫn là một “giải pháp tối ưu”, cái đó, chúng ta sẽ thấy, nó yêu cầu cần một bộ lọc thông thấp hoàn hảo. Trong một vài sự hiển thị, một chấm đen rất nhỏ có thể được hoàn tất bởi vậy việc đưa vào đó có thể chuyển đổi kỹ thuật số để tạo ra một mảng lớn hơn, sẽ chứa xấp xỉ của một vài mẫu lỗi từ những mẫu đã cho. Ý tưởng này áp dụng cho dạng hiển thị đồ họa ánh xạ bit. Hiển thị CRT được dùng ghi lại hình ảnh trên phim bằng cách đơn giản hình ảnh chấm đen qua ống kính lên phim (về cơ bản, giống như hình ảnh từ một máy ảnh với lá chắn sáng mở cho tối thiểu một chu kỳ khung). Có các cách ghi ảnh khác, như là dùng dụng cụ đo mật độ, một máy chiếu có lỗ hổng hình chữ nhật, với kích cỡ tương ứng của các điểm ảnh bởi vậy trường hình ảnh có thể được làm đầy. Một kiểu ghi/hiển thị khác được gọi là hiển thị ảnh bán sắc. Giống như hiển thị, có thể viết chỉ những chấm đen hoặc trắng. Bằng cách đánh dấu kích cỡ chấm nhỏ hơn kích cỡ điểm ảnh, các chấm đen hoặc trắng được phân tán một cách ngẫu nhiên đến khi số trung bình của các chấm đó so với một vùng các điểm ảnh là cùng một cấp độ xám. Tương ứng như không gian hòa hợp được thực hiện bằng mắt, như việc hiển thị một điểm đen và trắng được đưa ra trong việc nhận thức của mức xám. Báo, tạp chí, một số hiển thị đồ họa, bản in và máy cơ học dùng phương pháp hiển thị ảnh bán sắc này. II. Định lý lấy mẫu hai chiều (Two – Dimensional Sampling Theory): 1. Dải giới hạn ảnh (Bandimited Images): Xử lý số cho các bức ảnh có thể được hiểu như nghệ thuật làm mẫu hình ảnh giống với việc dùng tín hiệu dải giới hạn. Mặc dù những hình ảnh trong thế giới thực rất hiếm khi có dải giới hạn, nhưng chúng có thể gắn liền với nhau một cách gần giống như vậy bằng các hàm của dải giới hạn. Một hàm f(x, y) được gọi là dải giới hạn nếu biến đổi Fourier của nó F(ξ,ξ) là bằng không, bên cạnh đó giới hạn xấp xỉ bằng tần số mặt (Hình 4.6): F(ξ, ξ) = 0, | ξ| >ξ , | ξ|>ξ (4.4) Hình 4.6 Các đại lượng ξ và ξđược gọi là các dải thông x và y của ảnh. Nếu quang phổ là sự đối xứng vòng quanh, thì tần số không gian đơn ξ ξ= ξ được gọi là dải thông. 2.Sự lấy mẫu chống lại sự tái tạo (Sampling versus Replication): Định lý lấy mẫu có thể hiểu một cách đơn giản là việc ghi nhớ thực tế rằng biến đổi Fourier của một hàm lấy mẫu bất kỳ nào đó là một sự co dãn, sự tái tạo định kỳ của biến đổi Fourier của hàm đầu tiên. Nhìn vào đây, thấy hàm lấy mẫu ảnh lý tưởng, đó là một mảng 2 chiều vô hạn của hàm Dirac delta đặt ở vị trí trục vuông góc với khoảng Δx, Δy (Hình 4.7a), như: comb(x, y; Δx, Δy) (x - mΔx, y - nΔy) (4.5) Việc lấy mẫu ảnh được định nghĩa như sau: f(x, y) = f(x, y) comb(x, y; Δx, Δy) = (mΔx, nΔy)(x - mΔx, y - nΔy) (4.6) Biến đổi Fourier của hàm comb với khoảng Δx, Δy khác với hàm comb với khoảng (1/ Δx,1/ Δy), cụ thể là: COMB(ξ, ξ) = Ì{comb(x, y; Δx, Δy)} = ξ ξ(ξ-k ξ, ξ- l ξ) (4.7) = ξ ξcomb(ξ, ξ;1/Δx, 1/Δy) với ξ1/Δx, ξ1/Δy. Áp dụng các thuộc tính nhân trong Bảng 2.3 vào công thức (4.6), biến đổi Fourier của ảnh được lấy mẫu f(x, y) được đưa ra: F(ξ, ξ) = F(ξ, ξ) COMB(ξ, ξ) = ξ ξ( ξ, ξ) ( ξ-k ξ, ξ- l ξ) (4.8) = ξ ξ(ξ-k ξ, ξ- l ξ) Từ (4.8), biến đổi Fourier của ảnh được lấy mẫu, ngoài việc co dãn các hệ số, sự tái tạo định kỳ của biến đổi Fourier của ảnh vào trên một khoảng (ξ, ξ) ( Hình 4.7b). 3.Khôi phục lại ảnh từ việc lấy mẫu của nó (Reconstruction of the Image from Its Samples) Từ một biến đổi Fourier, chúng ta biết rằng nếu quang phổ của ảnh gốc có thể lấy lại bằng cách dựa vào quang phổ của ảnh được lấy mẫu, sau đó chúng ta sẽ tiếp tục đưa thêm ảnh từ ảnh được lấy mẫu. Hình 4.7a, hình 4.7b. Hình 4.7c Nếu tần số lấy mẫu x, y lớn hơn hai lần dải thông, như sau: ξ> 2 ξ; ξ> 2 ξ (4.9) hay, tương tự, nếu khoảng cách lấy mẫu nhỏ hơn 1/2 của nghịch đảo dải thông, cụ thể là: Δx <; Δy < (4.10) thì F(ξ, ξ) có thể được viết lại bằng bộ lọc thông thấp với tần số tương ứng: (4.11) Với là mọi đường biên của là hình vòng tròn bao quanh, ở giữa hình chữ nhật , được chỉ ra trong hình 4.7b. Được viết như sau: F/(ξ, ξ) H(ξ, ξ)F(ξ, ξ) = F(ξ, ξ) (4.12) Như vây, ảnh gốc liên tục có thể được sửa lại một cách chính xác bởi việc lọc thông thấp ảnh được lấy mẫu. 4. Tỷ số Nyquist, dạng răng cưa, tần số foldover (Nyquist Rate, Aliasing, and Foldover Frequencies) Các giới hạn dưới của tỷ số lấy mẫu, đó là, 2 ξ, 2 ξ trong (4.9), được gọi là Tỷ số Nyquist hoặc là Tần số Nyquist. Sự tương hỗ của chúng được gọi là khoảng thời gian Nyquist. Định lý lấy mẫu phát biểu rằng một dải giới hạn ảnh được lấy mẫu trên tỷ số Nyquist x và y của nó có thể khôi phục lại loại bỏ các lỗi bởi bộ lọc thông thấp mẫu ảnh. Tuy nhiên, nếu tần số lấy mẫu gần tới tần số Nyquist, đó là, nếu: ξ<2 ξ ; ξ<2 ξ thì sự tái tạo tuần hoàn của F(ξ, ξ) sẽ chồng chéo lên nhau (Hình 4.7c), dẫn đến kết quả là một quang phổ bị bóp méo F(ξ, ξ), từ đó F(ξ, ξ) không thể thay đổi sự mất mát. Các tần số này lên tới một nửa tần số lấy mẫu, đó là, mức trên ξ/2, ξ/2 được gọi là tần số foldover. Sự chồng chéo theo chu kỳ liên tục của quang phổ này chính là nguyên nhân gây ra tần số foldover trong ảnh gốc được xuất hiện như tần số dưới ξ/2, ξ/2 trong ảnh được lấy mẫu. Hiện tượng kỳ lạ này được gọi là dạng răng cưa. Các lỗi của dạng răng cưa là không thể di chuyển được bởi bộ lọc đến sau. Dạng răng cưa có thể được ngăn ngừa bởi bộ lọc thông thấp hình ảnh ngay lần đầu tiên vì vậy dải thông của nó nhỏ hơn một nửa tần số mẫu, đó là, khi (4.9) được thoả mãn. Hình 4.8a và 4.8b chỉ ra ảnh được lấy mẫu ở mức trên và mức dưới của tỷ số Nyquist. Dạng răng cưa có thể xác định được gần bằng với tần số cao (trên 1/3 khoảng cách từ trung tâm). Hiệu ứng dạng răng cưa trở nên vô hình khi ảnh gốc được lọc thông thấp trước khi lấy mẫu con (Hình 4.8c và hình 4.8d). Nếu vùng hỗ trợ của bộ lọc thông thấp trong (4.11) là = (4.13) hình chữ nhật ở giữa, thì đáp ứng xung của nó là h (x, y) = sinc(x ξ)sinc(y ξ) (4.14) Biến đổi Fourier ngược (4.12) và sử dụng (4.14), (4.16), ảnh được khôi phục thu được là: f /(x, y) = (mΔx, nΔy)sinc(x ξ - m)sinc(y ξ - n) (4.15) Hình 4.8 Cái đó bằng với f(x, y) nếu Δx, Δy thỏa mãn (4.10). Chúng ta có thể tóm tắt những kết quả trên bằng định lý bên dưới: 5.Định lý lấy mẫu (Sampling Theorem): Dải giới hạn f(x, y) của ảnh thỏa mãn (4.4), và lấy mẫu đều trên lưới vuông với không gian Δx, Δy có thể được khôi phục lại loại bỏ các lỗi dựa vào giá trị của mẫu f(mΔx, nΔy) đã quy định tỷ số mẫu lớn hơn tỷ số Nyquist, như sau: Hơn nữa, việc khôi phục ảnh được đưa vào công thức sau: f(x, y) = (mΔx, nΔy) (4.16) III. Mở rộng của định lý lấy mẫu (Sampling Theorem): Có một vài mở rộng của việc lấy mẫu 2 chiều: 1.Trường lấy mẫu ngẫu nhiên (Sampling Random Fields): Trong môi trường lấy mẫu vật lý, những nhiễu ngẫu nhiên luôn có trong ảnh, vì vậy nó quan trọng tới định lý lấy mẫu cho các trường ngẫu nhiên. Một trường ngẫu nhiên ổn định liên tục f(x, y) được gọi là dải giới hạn nếu hàm mật độ năng lượng quang phổ S(ξ, ξ) là dải giới hạn, đó là: Nếu S(ξ, ξ) = 0 để |ξ| > ξ, | ξ| > ξ (4.17) 2.Định lý lấy mẫu cho các trường ngẫu nhiên: Nếu f(x, y) là dải giới hạn trường ngẫu nhiên ổn định thì: f /(x, y) (mΔx, nΔy)sinc((x ξ - m)sinc(y ξ - n) (4.18) hội tụ đến f(x, y), đó là: E(| f(x, y) - f /(x, y)|) = 0 (4.19) khi ξ = 1/ Δx , ξ=1/Δy, ξ>2 ξ, ξ>2 ξ. 3.Lấy mẫu và kết hợp trên lưới không vuông (Nonrectangular Grid Sampling and Interlacing): Tất cả các thảo luận trước và những bài giảng về việc lấy mẫu 2 chiều đều được dành hết cho các lưới lấy mẫu vuông. Đây là một hình thức lý tưởng của lưới lấy mẫu nếu quang phổ F(ξ, ξ) giới hạn trên hình chữ nhật của (4.13). Các lưới lấy mẫu khác có thể có hiệu quả hơn trong giới hạn của mật độ lấy mẫu (đó là, mẫu/vùng) nếu vùng của F(ξ, ξ) không vuông góc. Ví dụ về quang phổ hình 4.9 Hình 4.9 4.Lấy mẫu theo lưới 6 cạnh (Hexagonal Sampling) Các hàm được sắp xếp vòng tròn một cách cân xứng và/hoặc dải giới hạn nằm trên một vùng tròn, nó có thể chỉ ra rằng mẫu ảnh trên lưới 6 cạnh yêu cầu 13.4% một số mẫu hơn so với mẫu lấy theo lưới vuông. 5.Lấy mẫu một cách tối ưu nhất (Optimal Sampling): Phương trình (4.16) đã giải thích rằng quá trình biến đổi mẫu một hàm liên tục f(x, y) trong dãy f(mΔx, nΔy) từ đó ta có thể tìm lại hàm gốc. Vì thế, các hệ số mở rộng của chuỗi hội tụ của hàm f(x, y) có thể được đưa ra một dạng tổng quát của mẫu. Đối với các hàm của dải giới hạn, hàm sinc là tối ưu nhất để tìm lại hàm gốc f(x, y) từ các mẫu f(m Δx, n Δy). Đối với dải giới hạn các trường ngẫu nhiên, các trường ngẫu nhiên được khôi phục hội tụ về gốc theo hướng vuông góc. Nói một cách thông thường hơn, đây là các hàm tối ưu theo hướng lấy mẫu ảnh ngẫu nhiên, đưa ra một dãy hữu hạn như làm các khối lỗi nằm giữa ảnh gốc và các ảnh được khôi phục là tối thiểu. Đặc biệt, một dãy mở rộng của sự quan tâm đặc biệt là: f(x, y) = Φ(x, y) (4.24) với Φ(x, y) là hàm eigen của hàm tương quan tự động đối với trường ngẫu nhiên f(x, y). Đây được gọi là dãy số mở rộng Karhunen-Loeve (KL) của trường ngẫu nhiên. Sự mở rộng này đạt đến mức a là các giá trị trực giao ngẫu nhiên,và, để đưa ra các số hữu hạn, điều kiện độ sai lệch bình phương trong ảnh được khôi phục là nhỏ nhất trong số tất cả các hàm mẫu có thể. Đặc tính này có ích trong việc phát triển kỹ thuật nén dữ liệu cho ảnh. Điều khó trong việc tận dụng kết quả có trước đối với việc lấy mẫu tối ưu trong bức ảnh thực (với kích thước có hạn) là việc tạo ra hệ số a. Quy ước việc lấy mẫu (theo hàm sinc), hệ số ađơn giản là các giá trị f(mΔx, nΔy), điều đó dễ dàng thu được. Tuy vậy, lý thuyết mở rộng của KL có ích trong việc quyết định giới hạn khi thực hiện và phục vụ cho những hướng dẫn quan trọng trong việc thiết kế các thuật toán xử lý ảnh. IV. Kiểm tra những thiếu sót trong việc lấy mẫu và khôi phục ảnh Như đã nói ở trên, lý thuyết lấy mẫu căn cứ vào một vài ý tưởng. Ảnh trong thế giới thực không có dải giới hạn, có nghĩa là các lỗi dạng răng cưa có xuất hiện. Điều đó có thể được giảm bớt bởi bộ lọc thông thấp với ảnh đầu vào trước khi lấy mẫu. Như là đưa ra giải pháp đã mất, với điều đó các kết quả trong việc làm mờ của ảnh, cũng xẩy ra bởi việc quét ảnh có lỗ ảnh giới hạn. Cuối cùng, hệ thống khôi phục có thể không bao giờ yêu cầu bộ lọc thông thấp bởi lý thuyết lấy mẫu. Hàm di chuyển của nó độc lập trên lỗ ảnh hiển thị. Hình 4.10 trình bày hệ thống thực tế lấy mẫu/khôi phục. 1.Lỗ ảnh lấy mẫu (Sampling Aperture): Một hệ thống thực lấy mẫu có đầu ra , có thể được làm như sau: g(x, y) f(x, y)= f(x, y) = (4.25) =comb(x, y; Δx, Δy)g(x, y) (4.26) với là sự phân bố ánh sáng trong lỗ kính và là hình dạng của nó. Trong thực tế, lỗ ảnh đối xứng với cạnh được xoay 180º, đó là . Phương trình (4.25) là không gian tương quan của f(x, y) với và trình bày quá trình quét ảnh trong lỗ ảnh. Phương trình (4.26) trình bày đầu ra của mẫu. Hinh4.10 2. Lỗ ảnh hiển thị/Hàm đưa vào (Display Aperture/Interpolation Function) Hình ảnh khôi phục hoàn hảo được yêu cầu đưa vào bậc vô hạn giữa các mẫu f(mΔx, nΔy). Đối với hệ thống hiển thị thì điều này có nghĩa là một chấm xuất hiện của nó nên có sự phân bố ánh sáng được đưa ra bởi hàm sinc, nó có khoảng thời gian vô hạn và các vấu phủ định. Điều này đã làm nó không thể đối với hệ thống ảnh rời rạc để biểu diễn gần được đưa vào hoàn hảo. Hinh 4.11 Hình 4.13 là một vài hàm sử dụng phép nội suy. Phép nội suy hai chiều có thể được biểu diễn bởi phép nội suy liên tục về phía hàng và cột của bức ảnh. Ở phần loại 0, và loại 1 giữ các bộ lọc đưa ra hằng số khôn ngoan và phép nội suy tuyến. Loại cao hơn thì có thể đưa ra phương trình bậc 2 (n=2) và phương trình bậc 3 (n=3). Hình 4.14 chỉ ra sự tác động của phép nội suy thực tế trong ảnh khôi phục. Tìm giải pháp đã mất thích đáng đến bộ lọc khôi phục độc lập trên độ rộng của vấu chính. Hinh 4.12 Từ |sinc(x)|<1 với mỗi x, vấu chính của bộ lọc quang phổ sẽ trở nên hẹp hơn với n tăng. Vì thế, giữa phép nội suy phần loại n của hình 4.13, hàm phần loại 0 sẽ đưa ra giải pháp đã mất nhỏ nhất và lỗi phép nội suy lớn nhất. Sự tác động này có thể thấy được trong hình 4.12, nó bao gồm ảnh đưa vào bởi hàm phần loại 0 và 1. Trong thực tế, tuyến đưa vào (phần đầu tiên) đưa ra sự cân bằng hợp lý giải pháp đã mất và được san bằng chính xác. 3. Phép nội suy Lagrange ( Lagrange Interpolation): Các phần loại 0 và 1 cũng thuộc về lớp hàm đa thức nội suy được gọi là đa thức Lagrange. Đa thức Lagrange của loại (q-1) được định nghĩa: (4.28) với cho q lẻ, và cho q chẵn. Đối với không gian một chiều, chuỗi lấy mẫu f(m) với mẫu nằm trong khoảng , hàm nội suy trong mẫu đưa ra là: f(x)=f (m+α) (4.29) với đối với q lẻ và 0 đối với q chẵn. Công thức này sử dụng q mẫu, , được đưa vào một vài vị trí (m+α)giữa hai mẫu. Cho q=1,2,3 chúng ta sẽ có công thức: q=1 = ; (loại 0) q=2 =(1-α) 0 (loại 1) q=3 = (1-α)(1+α) với . Công thức phép nội suy Lagrange của (4.29) được sử dụng vì nó hội tụ về công thức hàm nội suy sinc trở thành (4.31) với được quy về dạng đa thức Lagrange theo hướng x và y. Hinh 4.13 Hinh 4.14 Hinh 4.15 V. Lượng tử hóa hình ảnh Lượng tử hóa ảnh là bước kế tiếp của việc lấy mẫu, nhằm thực hiện một ánh xạ từ một biến liên tục u (biểu diễn giá trị độ sáng sang một biến rời rạc u* với các giá trị thuộc tập hữu hạn {r, r,…, r}. Ánh xạ này thường là một hàm bậc thang tuân theo nguyên tắc sau (Hình 4.16): Cho { t, với k=1,…., L + 1}là một tập các bước dịch chuyển hay mức độ quyết định, t là giá trị nhỏ nhất và t là giá trị lớn nhất của u. Nếu u [t, t) thì nó được sắp xếp theo r, k là mức độ khôi phục. Cách đơn giản nhất để lượng tử hóa là dùng lượng tử hóa đều. Theo phương pháp này, giả sử đầu ra của một bộ cảm biến nhận giá trị từ 0.0 đến 10.0. Nếu mẫu là lượng tử đều trên 256 mức, thì bước dịch chuyển và mức khôi phục tính bởi: t=, k = 1,…,257 r= t, k = 1,….,256 Đại lượng q t- t= r- rlà hằng số với các giá trị k và gọi là khoảng lượng tử hóa. Trong chương này, chúng ta sẽ xem xét các bộ lượng tử hóa không bộ nhớ, có nghĩa là đầu ra chỉ phụ thuộc duy nhất là đầu vào. Các bộ lượng tử hóa kiểu này rất có ích trong kỹ thuật mã hóa điều xung PCM (Pulse Code Modulation), PCM vi phân, chuyển mã…Chú ý rằng ánh xạ lượng tử hóa này không thuận nghịch, nghĩa là với một đầu ra đã cho, đầu vào là không duy nhất. Vì vậy, người ta đã nghiên cứu bổ sung nhiều kỹ thuật khác nhau để cực tiểu hóa biến dạng, tăng hiệu quả. Hinh 4.16 VI. Trung bình bình phương cực tiểu hay lượng tử hóa Lloyd-Max: Kỹ thuật này nhằm cực tiểu hóa sai số trung bình bình phương đối với một số mức lượng tử hóa đã cho.Cho u là một biến thực ngẫu nhiên với hàm mật độ liên tục . Mong muốn ở đây là tìm được mức độ quyết định tvà mức khôi phục rvới một bộ lượng tử hóa L mức sao cho sai số trung bình bình phương là nhỏ nhất: ε = E |(u – u*)| = (4.32) Viết lại (4.32) ta có: ε = (4.33) Để tính r,ta cần giải hệ phương trình (nhận được khi lấy vi phân 2.5): , 1 ≤ k ≤ L Lưu ý rằng t t do đó giá trị t và r cho bởi: t= (4.34) r= = E [u|u] (4.35) với có k [t, t). Kết quả trên chứng tỏ rằng mức dịch chuyển tối ưu nằm trên nửa đường của các mức khôi phục, các mức khôi phục tối ưu nằm tại trọng tâm của phân bố mật độ giữa các mức dịch chuyển. Giải hệ phương trình (4.34, 4.35) ta thu được các cận t, t. Trong thực tế, người ta hay áp dụng phương pháp Newton để giải phương trình trên. Khi số mức lượng tử hóa lớn, người ta dùng phương pháp xấp xỉ mật độ xác suất như một hàm hằng khôn ngoan (xem hình 4.17): ( t) , t t (4.36) Thay giá trị xấp xỉ đó vào (4.33) và thực hiện các yêu cầu một cách tối thiểu giải pháp tương đương với mức độ quy định thu được như sau: t+ t (4.37) với A= t- tvà k= 1,…,L. Phương pháp này yêu cầu t, trất lớn, được gọi là các điểm overload, hữu hạn. Các giá trị này được làm mỏng dãy động A của lượng tử hóa, phải làm giả trước khi sắp xếp các mức quyết định và mức khôi phục. Mức chuyển tiếp { t} được xác định, mức khôi phục { r} có thể được xác định đơn giản hơn bởi giá trị trung bình của tvà t. Giá trị trung bình bình phương lượng tử hóa không chính xác thu được như sau: (4.38) Đây là công thức có ích bởi vì nó đưa ra ước lượng của lỗi lượng tử một cách trực tiếp trong giới hạn của mật độ xác suất và số của các mức lượng tử hóa. Kết quả này chính xác đối với mật độ xác suất các hằng số khôn ngoan. Có hai cái thường sử dụng mật độ cho lượng tử hóa của liên kết dữ liệu ảnh là hàm Gause và hàm mật độ Laplac, chúng được định nghĩa như sau: Hàm Gause có dạng: (4.39) Hàm Laplac có dạng: (4.40a) với lần lượt có nghĩa là giá trị trung bình và biến của u. Giá trị biến của hàm mật độ Laplac được đưa ra: (4.40b) Bảng 4.1 và 4.2 là các giá trị được thiết kế cho một vài lượng tử hóa Lloyd-Max đối với mật độ cho trước. Bảng mở rộng trong [30]. Hinh 4.17 1. Lượng tử hóa tối ưu chuẩn: Đối với sự phân bố chuẩn, các phương trình lượng tử Lloyd-Max trở thành phương trình tuyến, đưa ra các khoảng thời gian bằng nhau giữa mức chuyển tiếp và mức khôi phục. Đây cũng được gọi là lượng tử tuyến. Pu(u)= Từ (4.35) chúng ta thu được: (4.41) Kết hợp (4.34) và (4.41) ta thu có: với Cuối cùng chúng ta thu được , (4.42) Do đó tất cả các chuyển tiếp càng tốt bằng với mức khôi phục là không gian bằng nhau. Lỗi lượng tử hóa ..là sự sắp xếp chuẩn trên khoảng (). Do đó, lỗi trung bình bình phương được đưa ra: (4.43) Biến của biến ngẫu nhiên chuẩn là A và , đối với lượng tử hóa chuẩn có b bit,chúng ta có q = : dB (4.44) Do đó tỷ lệ dấu hiệu ồn đạt được bởi giá trị lượng tử hóa trung bình bình phương tối ưu đối với sự phân bố chuẩn là 6dB/bit. 2. Các thuộc tính của lượng tử hóa trung bình bình phương tối ưu: Lượng tử này có một vài thuộc tính thú vị. Đầu ra lượng tử hóa là dựa vào ước lượng của đầu vào, đó là: E[u*]=E[u] (4.45) Lỗi lượng tử hóa là trực giao với đầu ra lượng tử hóa, đó là: E[(u-u*)u*)=0 (4.46) 3. Biến của đầu ra lượng tử hóa bị giảm bởi nhân tố 1-f(B), với f(B) là giá trị trung bình bình phương của B bit lượng tử đối với biến đầu vào, như sau: (4.47) Nó có khả năng thiết kế giá trị trung bình bình phương lượng tử đối với phần tử giá trị 0 phân bố biến (xem 4.13). Bảng 4.1: Lượng tử trung bình bình phương tối ưu đối với mật độ Gause với giá trị 0 và dạng chuẩn chệch hướng; Mức MSE SNR(dB) Entropy 2 .3634 4.3964 1.0000 3 .1902 7.2085 1.5358 4 .1175 9.3003 1.9111 5 .0799 10.972 2.2029 6 .058 12.367 2.4428 7 .0440 13.565 2.6449 8 .0345 14.616 2.8248 K 1 2 3 4 0.0000 .7979 .6120 0.0000 1.2240 0.0000 .9816 .4528 1.5104 .3823 1.2444 0.0000 .7646 1.7242 0.000 .6589 1.4469 .3177 1.001 1.8936 .2803 .8744 1.6108 0.0000 .5606 1.1882 2.0334 .0000 .5606 1.050 1.748 .2451 .7561 1.344 2.152 Mức MSE SND(dB) Entropy 9 0.0279 15.551 2.9826 10 .0229 16.395 3.1245 11 .0129 17.163 3.2534 12 .0163 17.868 3.3716 13 .0141 18.519 3.4806 14 .0122 19.125 3.5819 15 .0107 19.691 3.6765 K 1 2 3 4 5 6 7 8 .2218 6833 1.197 1.865 0.000 .4437 .9189 1.476 2.254 0.000 .4048 .8339 1.342 1.698 .1996 .6309 1.0579 1.598 2.324 .1823 .560 .9564 1.425 2.059 0.000 .3675 .7525 1.1756 1.689 2.245 0.000 .3402 .6944 1.681 1.533 2.140 .1658 .5119 .8759 1.2457 1.758 2.498 .1569 .4761 .8127 1.1943 1.6231 2.2147 0.000 .3138 .368 .9871 1.334 1.8647 2.567 0.000 .2936 .596 9182. 1.3314 1.896 2.5647 .1457 .4414 .7506 1.085 1.4677 1.982 2.6253 .1370 .4144 .7031 1.012 1.360 1.775 2.345 0.000 .2739 .5549 .8516 1.175 2.006 2.681 VII. Thiết kế một compandor: Một compandor (nén dữ liệu – giải nén dữ liệu) là một thứ tự lượng tử hóa chuẩn và suc-ceeded bởi phép chuyển đổi phi tuyến như trong hình 4.1. Đầu vào u biến thiên ngẫu nhiên là hợp quy cách đầu tiên thông qua phép chuyển đổi phi tuyến với bộ nhớ thấp f(.) đến trường biến thiên ngẫu nhiên w khác. Biến thiên ngẫu nhiên này là phép lượng tử hóa chuẩn cho y € {yi}, như là phép chuyển đổi phi tuyến bằng g(.) cho đầu ra u’. Tất cả phép chuyển đổi từ u sang u’ là phép lượng tử hóa không chuẩn. Các hàm f và g là đề cập tất cả các hệ thống gần giống như phép lượng tử hóa Lloyd-Max.Nó là kết quả cho bởi : g(x) = f-1(x) (4.51) f(x)=2a-a (4.52) Đoạn [-a , a] là phạm vi của w trong mỗi thao tác lượng tử hóa chuẩn. Nếu pu(n) là hàm chẵn tức là pu(n) = pu(-n) ta có f (x) = - f(-x) x< 0 f(x) = a , x 0 (4.53) f(x) = - f( - x), x<0 Giá trị nhỏ nhất và lớn nhất của f(x) là –a và a, theo một thứ tự dựng sẵn. Song, việc chọn a là bất kỳ. Nhìn vào hình Fig4.19, f(x) và g(x) tương ứng là hàm nén dữ liệu và giải nén dữ liệu tương ứng với các vùng W=f(u) n U=g(y) y x y u F(.) G(.) Uniform quantizer u y w Hinh 4.19 Chú ý: Thiết kế compandor không là nguyên nhân của biến thiên ngẫu hứng w sang phân phối chuẩn. Cho L lớn, ước lượng lỗi giá trị trung bình bình phương của compandor gần đúng như: (4.57) Compandor không cần t1 và tl+1 giới hạn. Khi thực hiện compandor thì phép biến đổi phi tuyến f(.) và f-1(.) có thể thực hiện tương tự như các thiết bị phi tuyến và lượng tử hóa chuẩn có thể như bộ chuyển đổi tương tự sang kĩ thuật số. Trong ứng dụng kĩ thuật số truyền thông đầu vào của phép lượng tử hóa chuẩn có thể mã hóa cho sự truyền. Người nhận có thể mã hóa, thực hiện quá trình chuyển đổi kĩ thuật số sang tương tự và theo phép chuyển đổi phi tuyến f-1(.) Tính quyết định và khôi phục của compador giống như phép lượng tử hóa phi tuyến cho bởi: Tk = g (Kg) t-k = -tk k = 0,…., L/2 Rk = g ((k-1/2)q) r-k = - r-k, k = 1, …,L/2 (4.58) VIII. Điều kiệ thuận lợi để lượng tử hóa chuản của giá trị trung bình bình phương Từ một phép lượng tử hóa chuẩn có thể thực thi một cách dễ dàng. Thật thú vị khi biết cách tốt nhất để lượng tử hóa một biến ngẫu nhiên phân tán không chuẩn bởi một phép lượng tử hóa chuẩn mức L. Để đơn giản, coi pu(n) là một hàm chẵn và L là một số nguyên chẵn. Với mỗi L cho trước phép lượng tử hóa chuẩn với điều kiện tốt nhất được xác định hoàn toàn bởi một bước lượng tử hóa có kích thước q . Định nghĩa: Trong đó q phải được xác định. Do đó lỗi bình phương trung bình là nhỏ nhất. Giới hạn của các tham số: Với {} nằm trong phép lượng tử hóa chuẩn sẽ làm đơn giản với Bây giờ, vấn đề chỉ đơn thuần là thu nhỏ ξ như một hàm của một biến đơn q. Kết quả đạt được bằng cách nhắc lại việc giải một phương trình tuyến tính (với L>2) Với L = 2 điều kiện chuẩn tốt nhất và phép lượng tử hóa Lloyd-Max là đồng nhất đưa ra: Tương đương với giả thiết trung bình của biến ngẫu nhiên | u |. Bảng 4.3 cung cấp các tham số lượng tử hóa chuẩn trong điều kiện tốt nhất cho mật độ xác suất cho Gaussian và Laplacian IX. Ví dụ, so sánh và thực hành Phép so sánh giữa các phép lượng tử hóa khác nhau có thể được tạo ra bởi ít nhất hai cách khác nhau. Trước tiên giả sử đầu ra của phép lượng tử có thể được mã hóa bởi một số mức cố định. Đây là trường hợp cho một phép chuyển đổi từ tương tự sang số với chiều dài từ cố định. Trong trường hợp so sánh phép lượng tử có lỗi thay đổi( hoặc kj ) như một hàm lượng tử hóa bits chỉ ra đường cong thuận lợi để lấy trung bình bình phương(Lloyd - Max) và điều kiện tốt nhất phép lượng tử hóa chuẩn cho hàm mật độ Gaussian. Như mong đợi, điều kiện để hình thành phép lượng tử hóa trung bình bình phương. Với mật độ Gaussian, sự hình thành khác biệt giữa trung bình bình phương và lượng tử hóa chuẩn là khoảng 2 d B cho B=6.Trong nhiều trường hợp của mật độ Laplacian, sự khác biệt này khoảng 4.3dB. Trên thực tế thì sự khác biệt này không thể phân biệt được. No.of Mức đầu ra Gaussian Laplacian Step size M.S.E Entropy Step size M.S.E Entropy 2 1.596 .363 1.00 1.414 .500 1.00 3 1.224 .190 1.54 1.414 .264 1.32 4 .996 .199 1.90 1.087 .196 1.75 5 .843 .082 2.18 1.025 .133 1.86 6 .733 .070 2.41 .871 .110 2.13 Từ tỉ lệ không chính xác thuyết này được biết như tỉ lệ giá trị nhỏ nhất có thể đạt được. B của một biến thay đổi ngẫu nhiên Gaussian cho bởi tỉ số không chính xác của hàm B= (4.59) Khi D< thì giá trị trung bình bình phương bằng mẫu. Nó có thể được viết bởi D=2 với B ≥ 0 (4.60) Và mô tả sự phụ thuộc bé thua không chính xác có thể đạt tới được bất kì trên thực tế phép lượng tử cho Gaussian thay đổi ngẫu nhiên. Đây được gọi là Shannon lower bound. Sự kết hợp cho mã hóa tốt nhất là giả thuyết vì nó yêu cầu một khối tích hợp vô hạn của thay đổi ngẫu nhiên cho phép lượng tử hóa chung. Và nó cũng được gọi là phép lượng tử hóa Shannon (Shannon quantizer). Phép lượng tử hóa thay đổi trong hình 4.20 cũng so sánh chúng, phép lượng tử hóa bằng nhau này còn đưa ra sự phụ thuộc phân bố trên có thể đạt tới sự khác nhau bằng phép lượng tử Shannon, cho sự phân bố thay đổi ngẫu nhiên phi Gaussian. Cho một tỉ lệ B phép lượng tử không bộ nhớ còn gọi là phép lượng tử một chiều ( block length is one ). Nói chung nó không đạt được thay đổi thấp hơn giá trị đưa ra. Phép biến đổi một chiều thuận lợi cho giá trị trung bình bình phương cho một biến ngẫu nhiên chuẩn của biến δ2 được trong phép thay đổi này. Do đó, đối với một vài sửa chữa không chính xác D, tỉ số lượng tử hóa Shannon được đưa vào thực tế với tỉ số đạt được nhỏ nhất với bộ nhớ lượng tử bằng 0 có khả năng xảy ra sự phân bố cao của xử lí ảnh. Phép so sánh thứ 2 dựa trên entropy của đầu ra phép lượng tử hóa đối với sai lệch của nó. Nếu biến được lượng tử hóa là entropy được mã hóa bởi lược đồ mã hóa theo chiều dài biến như mã Huffman (xem chương II, phần II.2), sau đó sẽ trung bình các bit cần để mã hóa đầu ra thường ít hơn Log2L. Phép lượng tử làm tối thiểu hóa độ sai lệch cho một entropy đầu ra được xác định [27 – 29]. Mã hóa entropy tăng tính phức tạp của thuật toán mã hóa giải mã và cần bộ lưu trữ đệm bổ xung tại nơi truyền, và nhận để duy trì tỷ lệ bit xác định thông qua các kênh liên kết. Từ hình 4.20, có thể thấy phép lượng tử hóa chuẩn với mã entropy cho hiệu năng tốt hơn phép lượng tử hóa Llod-Max ( không bao gồm mã hóa entropy). Người ta cũng thấy rằng phép lượng tử hóa chuẩn là xấp xỉ tốt bằng với “phép lượng tử hóa lý tưởng” dựa trên entropy so với tiêu chuẩn sai lệch bình phương. Nếu như kích thước của bước lượng tử được tinh chỉnh với respect với tiêu chuẩn này. Trên thực tế, việc thiết kế bộ lượng tử hóa sẽ rút xuống phạm vi với số lượng các phép lượng tử hóa mức (L) và phạm vi động (A). Với một số mức cho trước, một quy ước sẽ được đưa vào giữa các độ phân giải lượng tử hóa (tj - tj-1) và phạm vi động có thể đạt tới. Các yếu tố này trở thành quan trọng riêng khi các tín hiệu đầu vào là chuyển động hoặc có một độ phân giải đặc biệt chưa xác định. X. Phân tích kiểu cho phép lượng tử trên thực tế Trong một số vấn đề mã hóa ảnh chúng ta sẽ thấy nó hữu ích cho việc phân tích các biểu thức cho giá trị lượng tử hóa dự tính của bình phương lỗi như là hàm của một số lượng bit. Bảng 4.4 liệt kê độ sai lệch một số kiểu hàm cho Lloyd – Max và thuận lợi cho phép lượng tử hóa chuẩn của Gaussian, Laplacian có khả năng xảy ra nhiều sự thay đổi duy nhất. Mẫu dạng tổng quát có f(b)=a2-bB. Nếu đầu vào của phép lượng tử hóa có dạng σ2 thì đầu ra giá trị dự tính của bình phương lỗi là σ 2f(B). Điều đó dễ kiểm tra thấy f(B) là hàm đơn điệu giảm , hàm lồi của B, cái yêu cầu thuộc tính chống sai lệch tỉ số của hàm. Từ bảng 4.4 chúng ta thấy sự sai lệch xấp xỉ nhau, số của bit, x cần cho giá trị bình phưong tốt nhất tương ứng với hiệu suất của B – bit lượng tử hóa Shannon cho bởi công thức: 2-2B Với sai lệch nhỏ. Ta có giải pháp cho x: x = B + 0.5 Nghĩa là với bộ nhớ rỗng (Tín hiệu một chiều) lựa chọn tốt nhất lượng tử hóa trong thực tiễn khoảng ½ bit giới hạn dưới của nó đạt được với một khối hướng vô hạn Bảng 4.4:f(B)= a2-bB Lượng tử hóa 0≤2B≤5 5≤2B≤36 36≤2B≤512 a b a b a b Shannon Mean square 1 2 1 2 1 2 Guassian Mean square 1 1.05047 1.5253 1.8274 2.2573 1.9626 Laplacian optimum uniform 1 1.1711 2.0851 1.7645 3.6308 1.9572 Gaussian optimum unioform 1 1.5012 1.2477 1.6883 1.5414 1.7562 Laplacian 1 1.1619 1.4156 1.4518 2.1969 1.5944 XI. Lượng tử hóa của biến phức ngẫu nhiên Gaussian Trong nhiều trường hợp chúng ta muốn lượng tử hóa một biến ngẫu nhiên phức tạp, ví dụ như: z= x+jy Có x và y là hai biến độc lập. Một phương pháp để lượng tử hóa x và y bằng Lloyd-Max sử dụng B bit. Nó không phải là lượng tử hóa nhỏ nhất cho z. Bây giờ giả sử chúng ta viết: Z= Aejθ , (4.62) Khi A và θ là không phụ thuộc nhau, với A có mật độ Rayleigh dày ( Nhìn 4.15b) và θ được phân bố đều. Nó có thể chỉ ra giá trị lượng tử hóa nhỏ nhất với z yêu cầu rằng θ là dạng lượng tử hóa đều. L1 và L2 là số mức lượng tử hóa A và θ, lần lượt nếu nó lượng tử một cách độc lập bởi chính giá trị lượng tử hóa bình phương của nó . Sau đó các quy định {tk} và mức khôi phục {rk} của A đối với giá trị tối ưu mức xây dựng bình phương của z được đưa ra bởi: Tk= vk (4.63) Nếu L2 lớn thì sin(1/L2) à 1, có nghĩa là biến thiên độ và pha có thể lượng tử độc lập. Đối với việc đưa ra L, sự chỉ định tối ưu của L1 và L2 yêu cầu tỉ số log2L>=4.6 bit, pha này nên phân phối xấp xỉ 1.37 bit nhiều hơn biên độ. Việc thực hiện chọn pha biên độ lượng tử được tìm thấy chỉ ở mép tốt hơn là sự độc lập giá trị lượng tử hóa bình phương x và y. Tuy nhiên, các kết quả có trước này được sử dụng khi nó yêu cầu số hóa biến biên độ và biến pha. Chắc chắn việc liên kết chặt chẽ các ứng dụng việc lấy mẫu với việc đo lường là được làm trực tiếp. XII. Lượng tử hóa trực quan Các vấn đề đề cập trước để áp dụng vào lượng tử hóa chia mức xám của ảnh đơn sắc. Nếu số lớp của lượng tử hóa không đủ thì một hiện tượng lạ gọi là contouring và trở nên nhìn thấy được. Khi các nhóm điểm ảnh ở gần đó sẽ lượng tử hóa với giá trị tương tự, vùng hằng số của mức xám, đường ranh giới của nó được gọi là contours. Lượng tử hóa chuẩn của ảnh phổ biến, nơi mà các điểm ảnh mô tả độ chói của hàm, cần phải 256 mức xám hoặc 8 bit. Hiệu lực của đường biên bắt đầu trở nên nhìn thấy được bằng hoặc đươi 6 bit/ pixels. Trung bình bình phương ứng với biểu đồ mức xám của ảnh đưa ra, có thể chỉ cần 5 đến 6 bit/pixel. Trừ một số đường biên nhìn thấy được. Từ một số biểu đồ mức xám của ảnh biến thiên khá mạnh, trung bình bình phương lượng tử hóa tối ưu đối với dữ liệu ảnh thô ít khi được sử dụng. Một lượng tử chuẩn với 8 bit/pixel thì hay được sử dụng. Hinh 4.21 Trong ước lượng lượng tử hình ảnh mắt dường như khá nhạy cảm với các đường biên và các lỗi, nó ảnh hưởng từ cấu trúc địa phương. Tuy nhiên các đường biên không góp phần nhiều vào trung bình bình phương lỗi. Vì vậy, sắp xếp theo hệ thống lượng tử hóa trực quan nên cố gắng giữ đừơng biên lượng tử hóa dưới mức của tầm nhìn trên phạm vi của các vật sáng được hiển thị. Chúng ta cần xem xét hai phương thức của thành tựu này *Hằng số lượng tử hóa Từ khi độ nhạy của thị giác gần chuẩn để mà có thể phát hiện sự thay đổi của độ tương phản, nó thích đáng để lượng tử hóa chức năng độ tương phản được chỉ ra trong hình 4.21. Hai biến đổi phi tuyến cái mà được sử dụng để hiện thị độ tương phản c là : C=αln(1+βu) (4.64) C=αuβ (4.65) Trong đó α và β là độ tương phản và u là độ chói. Ví dụ trong 4.64 giá trị α=β/ln(1+β) nằm từ 6 đến 18 và trong 4.65 nên chọn α=1 và β=1/3 đối với việc miêu tả độ tương phản cho trước. Chúng ta sử dụng giá trị nhỏ nhất của trung bình bình phương lỗi (MMSE). Để lượng tử hóa cho trường độ tương phản. Để hiện thị hay xây dựng lại lượng tử hóa độ tương phản là biến đổi nó trở thành giá trị của độ chói bởi biến đổi ngược. Việc nghiên cứu thực nghiệm chứng tỏ ra rằng chỉ thay đổi 2% trong độ tương phản là đáng chú ý. Bởi vậy nếu mà lượng tử hóa chuẩn, cái thước độ tương phản cần phải có 50 độ chia hoặc là cần 6 bit. Tuy nhiên với điều kiện thuận lợi để lựa chọn giá trị trung bình bình phương 4 đến 5 bit/ điểm ảnh Miêu tả độ nhiễu của lượng tử hóa Hinh 4.22: Phương thức khác của hiệu ứng khử nhiễu đường biên là thêm vào một lượng nhiễu giả phân phố chuẩn vào độ chói trước khi lượng tử xem hình 4.22. Cái nhiễu giả ngẫu nhiên này được gọi là dither. Để hiển thị ảnh, thì người ta trừ đi chuỗi giả ngẫu nhiên trong lượng tử đầu ra. Và hiệu quả là cái ở trong miền Gradient với độ chói thấp. Nhiễu đầu ra là lí do làm cho điểm ảnh lên trên hoặc xuống mức gốc bằng cách phá vỡ contour. Tuy nhiên giá trị trung bình của lượng tử hóa điểm ảnh là giống nhau và không có nhiễu. Trong suốt quá trình hiển thị nhiễu có khuynh hướng lấp đầy trong vùng Contuor, bằng cách này mà không gian trung bình không thay đổi. (hình 4.23). Một lượng dither thêm vào có thể đủ nhỏ để duy trì độ phân giải nhưng đủ lớn để cho phép giá trị độ chói có thể thay đổi ngẫu nhiên trong mức lượng tử quyết định. Nhiễu có thể làm ảnh hưởng đến các bit mã hóa của lượng tử hóa. Chất lượng của ảnh có thể nhận được bởi lượng tử 3 bit. Hinh 4.23 12.1Thế hệ ảnh bán sắc H1 = H2 = Những phương pháp đề cập trước đây rất gần với phương pháp ảnh bán sắc từ ảnh mức xám. Ảnh nửa sắc độ là ảnh nhị phân cái mà đưa ra sự biểu diễn mức xám. Ví dụ hầu hết các ảnh được in ra bao gồm tất cả các ảnh dạng văn bản đều là ảnh bán sắc. Hình 4.24 chỉ ra khái niệm cơ bản của thế hệ ảnh bán sắc. Ảnh đề cập là vượt quá mẫu (ví dụ đối với ảnh 256x256 có thể được in ra ở cỡ 1024x1024 với các ma trận các điểm đen và trắng) xảy ra cùng lúc với các điểm ảnh có sẵn đối với ảnh bán sắc. Đối với mỗi mẫu ảnh (thể hiện giá trị độ chói ) một số ngẫu nhiên được thêm vào và tín hiệu kết quả bị lượng tử hóa 1 bit ( 0 hoặc 1 ) đẩu ra (0 hoặc 1) sẽ mô tả các điểm đen hoặc trắng. Trong thực tế, tín hiệu dither là một mẫu giả ngẫu nhiên hai chiều xác định, cái nó mà lặp lại được lặp lại theo chu trình để tạo ra ma trận bán sắc của ảnh. Hình 4.25 chỉ ra hai mẫu bán sắc. Ảnh bán sắc đưa ra mẫu Moire. Nếu mà ảnh mẫu và ma trận Dither có chung hay là gần chung chu trình. Hinh 4.24 Thuật toán bán sắc đựơc thiết kế để làm nhỏ hiệu ứng Moire. Hình 4.26 chỉ ra một ảnh bán sắc 512 x 512. Tạo ra từ ảnh gốc 512 x 512 x 8 bit. Sự biểu diễn mức xám trong ảnh bán sắc ảnh hưởng đến khoảng không địa phương trung bình được biểu diễn bởi mắt. Nói chung cảm nhận mức xám là bằng nhau đối với các điểm đen. Mỗi ô phân giải tương ứng với một miền bởi một điểm ảnh trong ảnh gốc. Hinh 4.26 12.2 Lượng tử màu Một điểm ảnh trong ảnh màu được coi như là một vecto 3 chiều C(c1,c2,c3) mô tả 3 màu chính. Lựong tử hóa một ảnh màu yêu cầu phân phối ô lượng tử đối với màu sắc trong màu đơn trong hệ tọa độ đã chọn, thậm chí nếu tất cả các màu là rất giống nhau nhưng ô lựong tử vẫn có thể có kích cỡ không bằng nhau bởi vì thay đổi bẳng nhau ở trong tọa độ màu nói chung không gây nên sự thay đổi bằng nhau ở màu cảm nhận. Hình 4.27 chỉ ra thủ tục lựơng tử màu kì vọng. Biến đổi tọa độ đầu tiên được biểu diễn và tọa độ biến tk là độc lập với phép lượng tử hóa. Trong hệ tọa độ màu NTSC RN GN BN, toàn bộ màu sinh ra là hình lập phương [0.1] x [0.1] x [0.1]. Nó chỉ ra rằng lựong tử hóa chuẩn của mỗi tọa độ màu trong hệ thống này cung cấp kết quả tốt nhất so với khi so sánh với lượng tử hóa chuẩn ở một vài hệ tọa độ khác. 4 bit/ màu có thể đựơc nhận thấy là đầy đủ trong hệ tọa độ này. KẾT LUẬN Xử lý ảnh là mảng kiến thức quan trọng và có mặt trong chương trình đào tạo của ngành CNTT. Nó được ứng dụng rộng rãi trong nhiều lĩnh vực. Trong bài tiểu luận trên, nhóm chúng tôi tập trung trình bày một số vấn đề : Hệ thống xử lý tín hiệu hai chiều Cảm thụ ảnh Lấy mẫu và lượng tử hóa Mặc dù, đã có nhiều cố gắng, song không thể tránh được những sai sót. Nhóm chúng tôi rất mong nhận được sự đóng góp của thầy và các bạn. Chúng tôi chân thành cảm ơn. TÀI LIỆU THAM KHẢO Anil K.Jain – Fundamentals of digital image processing. Dương Mạnh Bá, Nguyễn Thanh Thủy - Nhập môn xử lý ảnh số

Các file đính kèm theo tài liệu này:

DAN107.doc