Bài giảng Xử lý ảnh số (Bản đẹp)

Kỹ thuật lấy ngưỡng không nhất thiét phải được áp dụng cho toàn bộ ảnh, mà có thể áp dụng cho từng vùng ảnh một. Hai tác giả Chow và Kaneko đã phát triển một biến thể của kỹ thuật lấy ngưỡng bằng cách chia một ảnh có kích thước MxN ra thành nhiều vùng không chồng chất lên nhau. Các giá trị ngưỡng được tính riêng biệt cho từng vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngưỡng cho toàn bộ ảnh. Trong thuật toán mới này, kích thước của các vùng cần được chọn một cách thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng. Tính hữu ích của thuật toán này, cũng như nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng dụng cụ thể.

65 trang | Chia sẻ: huongthu9 | Lượt xem: 359 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Xử lý ảnh số (Bản đẹp), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

m 2 3 S(m,n) G(m,n) h1(m,n)⊗ h2(m,n) h1(m,n) h2(m,n) G(m,n) S(m,n) Bài giảng Xử lý ảnh số 24 GV. Mai Cường Thọ c. Tính chất phân phối với phép cộng [ ] ),(),(),(),(),(),(),( 3121321 nmSnmSnmSnmSnmSnmSnmS ⊗+⊗=+⊗ Ghép nối song song 2 hệ thống tuyến tính bất biến có đáp ứng xung h1, h2 Tương đương với Ví dụ: Cho một hệ thống xử lý ảnh được thiết kế như hình vẽ, hãy xác định đáp ứng G(m,n) của hệ thống. Với Giải Ta có [ ] [ ]),(),(),(),( ),(),(),(),(),(),( 321 32 nmhnmhnmhnmS nmhnmhnmSnmhnmSnmG ⊗+⊗= ⊗+⊗= S(m,n) g(m,n) h1(m,n) + h2(m,n) n -1 1 1 1 h1(m,n) m n 1 j 1 j h2(m,n) m n 1 -j 1 j h3(m,n) m n 1 1 1 1 S(m,n) m h1(m ,n) h2(m ,n) h3(m ,n) + G(m,n) S(m,n) h1(m,n) h2(m,n) + V1(m,n) V2(m,n) S(m,n) G(m,n) Bài giảng Xử lý ảnh số 25 GV. Mai Cường Thọ Tính riêng: h2(m,n)⊗h3(m,n) )1,1(),1()1,(),( )1.1()1,1(),1()0,1()1,()1,0(),()0,0( ),1(),1(),(),0( ),(),(),(),( 3333 32323232 1 0 32 1 0 32 1 0 1 0 3232 −−+−+−+= −−+−+−+= −−+−= −−⋅=⊗ ∑∑ ∑∑ == = = nmjhnmhnmhnmjh nmhhnmhhnmhhnmhh lnmhlhlnmhlh lnkmhlkhnmhnmh ll k l h(m,n)=h1(m,n)+h*(m,n) Kết quả cuối cùng của hệ thống ta có: ∑ ∑ ∞ −∞= ∞ −∞= −−=⊗ k l lnkmhlkSnmhnmS ),(),(),(),( Khai triển công thức trên với S(m,n) và H(m,n) ta sẽ thu được tín hiệu ra G(m,n). 1 -j 1 n 0 0 j h3(m,n-1) m n 1 0 1 -j 0 j h3(m-1,n) m jh3(m-1,n-1) n 0 0 1 0 0 j m 0 j -1 h2⊗h3 n j 1 j -1 jh3(m,n) m h*(m,n) n 1 0 2 0 1 2j m 1 2j -1 h(m,n) n 1 1 3 -1 2 2j m 1 2j -1 Bài giảng Xử lý ảnh số 26 GV. Mai Cường Thọ CHƯƠNG IV CÁC PHÉP BIẾN ĐỔI ẢNH Các phép biến đổi ảnh là cách tiếp cận thứ hai được áp dụng trong tín hiệu số nói chung và trong xử lý ảnh nói riêng. Phép biến đổi (transform) là thuật ngữ dùng để chỉ việc chuyển đổi sự biểu diễn của một đối tượng từ không gian này sang một không gian khác, từ cách biểu diễn này sang cách biểu diễn khác, ví dụ phép biến đổi Fourier, Z, Laplace. Nói chung mục đích của các phép biến đổi ở đây là cố gắng phân tích để biểu diễn tín hiệu dưới dạng tổng có trọng số của các tín hiệu cơ bản, đặc biệt mà ta có thể thấy rõ được tính chất của chúng. - Nhớ lại phép biến đổi Fourier tín hiệu rời rạc một chiều: ∑ ∑ ∞ −∞= − ∞ −∞= = = n knj k knj enx N kX ekXnx ω ω ).(1)( ).()( Ta có ωωω sincos je j += là một tín hiệu điều hòa phức cơ bản. - Đối với ảnh số, ta có thể mô tả như sau: Các Sij là các ảnh cơ sở, các aij là các hệ số phân tích I. Phép biến đổi Unitar (Unitary Transform) 1. Ma trận trực giao và ma trận Unitar • Cho A là một ma trận vuông • A trực giao khi: hay IAAT = Trong đó A-1 là ma trận đảo của A. AT là ma trận chuyển vị của A. • Ma trận A được gọi là ma trận Unitar nếu: A-1= A*T hay AA*T= I A* là ma trận liên hợp của A S S11 S12 SMN a11 + a11 + aMN + AA T=−1 Bài giảng Xử lý ảnh số 27 GV. Mai Cường Thọ Các phần tử của A* được xác định như sau với aik= x + jy thì a*ik = x – jy (dạng số phức tổng quát). Nhận xét : Nếu các phần tử của ma trận A có giá trị là số thực thì A trực giao ⇔ A unitar Ví dụ 1 Xét xem ma trận A sau đây có phải là ma trận Unitar không Giải : Ta có , A trực giao ⇒ A Unitar Ví dụ 2 Kiểm tra tính Unitar của ma trận sau Nhận xét Tuy nhiên Vậy A không Unitar Ví dụ 3 Xét ma trận 11 11 2 1 − =A 11 11 2 1 − =AT IA == −− = 20 02 2 1 11 11 11 11 2 1AT 2 2 j jA − = 2 2 j jAT −= Ij j j jA AT ==− − = 20 01 2 2 2 2 I j j j j j jA j j j j AA T ≠ − = −− = − = − = 322 223 2 2 2 2 , 2 2 , 2 2 A*T** Ij j j j j j Aj j j j A TTA ≠==== 02 20 2 1 1 1 1 1 2 1 , 1 1 2 1 , 1 1 2 1 A Bài giảng Xử lý ảnh số 28 GV. Mai Cường Thọ Tuy nhiên ta lại có: ⇒ A là ma trận Unitar ví dụ 4: Xét tính Unitar của ma trận sau: 2. Phép biến đổi Unitar một chiều Cho vector S = S(n) = (S(0), S(1), S(2),S(N-1))T và ANxN là ma trận Unitar. Ta có ảnh V của S qua phép biến đổi Unitar thuận. Ví dụ: S(n)= (S1, S2, S3)T , ma trận unitar Ta có Phép biến đổi Unitar ngược: Suy ra: 2 3 2 1 2 3 2 11 2 3 2 1 2 3 2 11 111 3 1 jj jjA − − + − + − − − = IAj j A T == − − = 20 02 2 1 , 1 1 2 1 A*T* →→ = SAV hay ∑ − = = 1 0 )()( N n kn nskv a aaa aaa aaa A 333231 232221 131211 = SaSaSa SaSaSa SaSaa S S S aaa aaa aaa S SAV 333232131 323222121 31321211 3 2 1 333231 232221 131211 1 ++ ++ + =×== + →→ → − → = VS A 1 →→ = VS A T* Bài giảng Xử lý ảnh số 29 GV. Mai Cường Thọ Hay ta có công thức: Trong đó: Kết luận: với hình ảnh cơ sở ka∗ là cột k của ma trân A*T, ta tách Sr thành các hình ảnh cơ sở thông qua các hệ số của Vr 3 Phép biến đổi Unitar 2 chiều Cho ma trận Unitar ANxN , với ảnh s(m, n) ta có công thức biến đổi Unitar của ảnh S như sau: Cặp biến đổi Unitar 2 chiều: )()()( 1 * 1 kvkvns N k kn N k nk ab ∑∑ == == bbb bbb bbb A T 333231 232221 131211 * = k n ba nkkn = * )1(...)1()0( * 1 * 1 * 0 −+++= → − →→→ NVvvS aaa N Các hinh ảnh cơ sở hệ số phân tích V = ASAT (Xác định hệ số phân tích) S= A*TVA* (Xác định ảnh cơ sở) Hay S= ∑∑ − = − = 1 0 1 0 , * ),( N k N l lk lkVA , với A lk* , : là hình ảnh cơ sở aaA Tlklk *** , = Trong đó : ak* và al* là các cột thứ k và l của A*T Bài giảng Xử lý ảnh số 30 GV. Mai Cường Thọ Ví dụ: Cho ma trận Unitar A và ảnh S, hãy xác định các ảnh cơ sở của S qua phép biến đổi Giải: * Xác định hệ cơ sở: V= ASAT = A*T = * Xác định các aaA Tlklk *** , = Ta có : 1 1 2 1* 0 =a và 1 1 2 1* 1 − =a 11 11 2 111 1 1 2 1* 0 * 0 * 00 === aaA T , 11 11 2 111 1 1 2 1* 0 * 1 * 10 −− = − == aaA T 11 11 2 111 1 1 2 1* 1 * 0 * 01 − − =−== aaA T , 11 11 2 111 1 1 2 1* 1 * 1 * 11 − − =− − == aaA T * Như vậy S có thể biểu diễn qua các hình ảnh cơ sở như sau: 11 11 0 11 11 11 11 2 1 11 11 2 5 43 21 − − + −− − − − −==S 11 11 2 1 − =A và 43 21 =S 04 210 2 1 11 11 22 64 2 1 11 11 43 21 11 11 2 1 − − = −−− = −− 11 11 2 1 − Hình ảnh cơ sở Bài giảng Xử lý ảnh số 31 GV. Mai Cường Thọ Ví dụ 2: Cho ma trận Unitar A và ảnh S, hãy xác định V và A lk* , 1 1 2 1 j j A = và 43 21 =S Giải: * V= ASAT = jj jj j j jj jj j j j j 5351 5153 2 1 1 1 243 4231 2 1 1 1 43 21 1 1 2 1 ++ +−+− = ++ ++ = * A*T= 1 1 2 1 j j − − * Tính aaA Tlklk *** , = với ja −= 1 2 1* 0 và 12 1* 1 j a − = 1 1 2 11 1 2 1* 0 * 0 * 00 −− − =− − == j jjjaaA T j jjjaaA T − − =− − == 1 1 2 11 1 2 1* 1 * 0 * 01 j jjjaaA T − −− =− − == 1 1 2 11 12 1* 0 * 1 * 10 1 1 2 11 12 1* 1 * 1 * 11 j jjjaaA T − −− =− − == II. Biến đổi Fourier 1. Biến đổi Fourier 1 chiều Cho f(x) là hàm liên tục với biến thực x. Biến đổi Fourier của f(x) là ℑ ( ){ }xf : ℑ ( ){ }xf = F(u) = dxxf e uxj pi2)( − ∞ ∞− ∫ Trong đó j= 1− Cho F(u), f(x) có thể nhận được bằng cách biến đổi Fourier ngược (IFT): ℑ-1 ( ){ }uF = f(x) = duuF e uxj∫∞ ∞− pi2)( Bài giảng Xử lý ảnh số 32 GV. Mai Cường Thọ Công thức trên là cặp biến đổi Fourier tồn tại nếu f(x) liên tục và có thể tích phân được, và F(u) cũng có thể tích phân được. Trong thực tế các điều kiện trên luôn thoả mãn. Với f(x) là hàm thực, biến đổi Fourier của hàm thực nói chung là số phức: F(u) = R(u) + j I(u) Trong đó R(u) và I(u) là thành phần thực và thành phần ảo của F(u). Ta thường biểu diễn dưới dạng hàm mũ F(u)= e ujuF )()( φ Trong đó: )()()( 22 uIuRuF += và   = )( )( tanarg)( uR uI uφ - F(u) được gọi là phổ biên độ Fourier của f(x), và )(uφ gọi là góc pha. - Biến u thường được gọi là biến tần số (phần biểu diễn hàm mũ) =e uxj pi2− , theo công thức Euler: e uxj pi2− = cos(2piux) – jsin(2piux) Vậy ta có thể nói rằng, biến đổi Fourier tạo ra một cách biểu diễn khác của tín hiệu dưới dạng tổng có trọng số các hàm sin và cosin (2 hàm trực giao) Ví dụ: Ta có hàm f(x) như sau: F(u) = dxxf e uxj∫∞ ∞− − pi2)( = dxA X uxj e∫ − 0 2pi = [ ]e uxjuj A Xpipi 22 0−− = [ ]12 2 −− −e uxjuxj A pipi = [ ] eeee uxjuxjuxjuxj ux u A uj A pipipipi pi pipi −−− =− )sin( 2 22 Đó là một hàm phức, phổ Fourier: )( )sin()sin()( ux uxAxnux u A uF e uxj pi pi pi pi == − A f(x) X x Bài giảng Xử lý ảnh số 33 GV. Mai Cường Thọ 2. Biến đổi Fourier 2 chiều Biến đổi Fourier có thể mở rộng cho hàm f(x, y) với 2 biến. Nếu f(x, y) là hàm liên tục và tích phân được và F(u, v) cũng tích phân được, thì cặp biến đổi Fourier 2 chiều sẽ là : ℑ { } ∫ ∫ +−∞ ∞− == dxdyyxfvuFyxf e vyuxj )(2),(),(),( pi ℑ-1 { } ∫ ∫∞ ∞− + == dudvvuFyxfvuf e vyuxj )(2),(),(),( pi Trong đó u, v là biến tần số. Cũng như biến đổi Fourier 1 chiều, ta có phổ biên độ, phổ pha, cho trường hợp 2 chiều: ),(),(),( 22 vuIvuRvuF += và   = ),( ),( tanarg),( vuR vuI vuφ Ví dụ: xác định biến đổi Fourier của hàm trên hình sau: F(u, v)= Y vyjXX Y uxj vyjuxjvyuxj vyjuxjAdydxAdxdyyxf ee eee 0 2 00 0 2 22)(2 22 ),(     −    −== −− −−+− ∞ ∞− ∫ ∫ ∫∫ pipi pipi pipipi = [ ] [ ]        =−−−− −− −− vY vY uX uX AXY vjuj A ee ee vYjuXj YjuXj pi pi pi pi pipi pipi pipi )sin()sin(1 2 11 2 22 Phổ công suất của nó: vY)( vY)sin( uX)( )Xusin(XY),( 2 pi pi pi piAvuF = Các tính chất của biến đổi Fourier A X Y F(x,y) x y Bài giảng Xử lý ảnh số 34 GV. Mai Cường Thọ 3. Biến đổi Fourier rời rạc (DFT) Giả thiết cho hàm liên tục f(x), được rời rạc hoá thành chuổi: { } { } { } [ ]{ }{ }xNxfxxfxxfxf ∆−+∆+∆+ 1,2,, 0000 Trong đó: N- số mẫu, ∆x bước rời rạc ( chu kỳ lấy mẫu). Ta dùng biến x vừa là biến liên tục vừa là biến rời rạc. Ta định nghĩa : f(x)= f(x0 + x∆x) x: - là các giá trị rời rạc 0, 1, 2,, N-1. Chuỗi { })1(...),2(),1(),0( −Nffff là các mẫu đều bất kì được lấy mẫu đều từ một hàm liên tục. Cặp biến đổi Fourier cho các hàm lấy mẫu: F(u)= ∑ − = −1 0 2 )(1 N x N uxj exfN pi với u= 0, 1, 2, N-1 Và f(x) =∑ − = 1 0 2 )( N x N uxj euF pi với x= 0, 1, 2, N-1 Trường hợp DFT 2 chiều: F(u, v) = ∑∑− = − = +− 1 0 1 0 )(2),(1 M x N y N vy M uxj eyxfMN pi f(x,y)=∑ ∑ − = − = + 1 0 1 0 )(2),( M u N v N vy M uxj evuF pi với u= 1,0 −M , v= 1,0 −N và x= 1,0 −M , y= 1,0 −N Nếu M=N (lấy mẫu vuông ): Ta có: ∑∑− = − = + − = 1 0 1 0 )(2),(1),( N x N y N vyuxj eyxfNvuF pi ∑∑− = − = + = 1 0 1 0 )(2),(1),( N u N v N vyuxj evuFN yxf pi với x, y=0, 1, 2,N-1 Bài giảng Xử lý ảnh số 35 GV. Mai Cường Thọ Chương V Xử lý và nâng cao chất lượng ảnh Nâng cao chất lượng ảnh là một bước quan trọng tạo tiền đề cho xử lý ảnh. Mục đích: làm nổi bật một số đặc tính của ảnh: Thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuếch đại ảnh - Tăng cường ảnh: Nhằm hoàn thiện trạng thái quan sát của một ảnh. Bao gồm điều khiển mức xám, thay đổi độ tương phản, giảm nhiễu, làm trơn, nội suy - Khôi phục ảnh: Nhằm khôi phục ảnh gần với trạng thái thực nhất trước khi biến dạng, tùy theo nguyên nhân gây ra biến dạng. Các phương pháp thực hiện: - Thực hiện trên miền không gian + Toán tử điểm (Point Operations): giá trị 1 điểm ảnh đầu ra phụ thuộc duy nhất vào 1 giá trị đầu vào tại vị trí tương ứng trên ảnh vào. + Toán tử cục bộ (Local Operations): giá trị một điểm ảnh đầu ra phụ thuộc vào giá trị của chính nó và các lân cận của nó trong ảnh vào. - Thực hiện trên miền tần số + Toán tử tổng thể (Global Operations): giá trị của 1 điểm ảnh đầu ra phụ thuộc vào tất cả giá trị các điểm ảnh trong ảnh vào I. Tăng cường ảnh I.1. Các thao tác trên miền không gian (Spatial Operations) - Là hàm thao tác trực tiếp trên tập các điểm ảnh. - Biểu diễn công thức tổng quát như sau: )],([),( nmSnmV T= - Một láng giềng (Neighborhood) của (m,n) được định nghĩa bởi việc sử dụng một ảnh con (subimage) hình vuông, hình chữ nhật hoặc bát giác, có tâm điểm tại (m,n). Hình 5.1. Một số dạng lân cận - Khi láng giềng là 1x1, thì hàm T trở thành hàm biến đổi hay ánh xạ mức xám (gray level transformation function). v = T[s] s, v là các mức xám của S(m,n) và V(m,n). Bài giảng Xử lý ảnh số 36 GV. Mai Cường Thọ 1. Các kỹ thuật tăng cường ảnh sử dụng toán tử điểm - Xử lý điểm ảnh là 1 trong các phép xử lý cơ bản và đơn giản. Có 2 cách tiếp cận trong cách xử lý này: + Dùng 1 hàm thích hợp (hàm tuyến tính hay hàm phi tuyến) tùy theo mục đích cải thiện ảnh để biến đổi giá trị của điểm ảnh (mức xám, độ sáng) sang một giá trị khác (mức xám mới). + Dựa vào kỹ thuật biến đổi lược đồ xám (Histogram). (i). Tăng độ tương phản Trước tiên cần làm rõ khái niệm độ tương phản. Ảnh số là tập hợp các điểm mà mỗi điểm có giá trị sáng khác nhau, ở đây độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau. Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền, một cách nôm na độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Với khái niệm này, nếu ảnh của ta có độ tương phản kém, ta có thể thay đổi tuỳ theo ý muốn. Hình 5.2. Các hình vuông con cùng 1 mức xám xuất hiện trên các nền khác nhau Nguyên lý: Điều chỉnh lại biên độ trên toàn dải hay dải có giới hạn bằng cách biến đổi tuyến tính (T là hàm tuyến tính) hay phi tuyến biên độ đầu vào. + Cách biến đổi tuyến tính:    ≤<+− ≤<+− ≤ = Lsbvbs bsavas ass v b a )( )( γ β α với các độ dốc γβα ,, xác định độ tương phản tương đối, L là số mức xám tối đa của ảnh. Biểu diễn dưới dạng đồ thị ta có: - Dễ dàng thấy rằng: + 1=== γβα : ảnh kết quả trùng với ảnh gốc. + 1,, >γβα : giãn độ tương phản + 1,, <γβα : co độ tương phản Việc chọn γβα ,, phải phù hợp, sao cho với Ls ≤≤0 thì Lv ≤≤0 s v a b L vb va L α β γ Bài giảng Xử lý ảnh số 37 GV. Mai Cường Thọ ví dụ: 200100190180 130170160120 26272423 26302220 30202010 S giả sử chọn: 5.0,8,5.0,30,10 ===== γβαba tính được: 165,5 == ba vv 5.0=α 8=β 5.0=γ s 10 20 22 23 24 26 27 30 100 120 130 160 170 180 190 200 v 5 85 101 109 117 133 141 165 200 210 215 230 235 240 245 250 + Cách biến đổi phi tuyến: trong trường hợp biến đổi phi tuyến, người ta sử dụng các hàm mũ hay hàm log dạng: )1log( scv += , γcsv = , γ,c là hằng số hiệu chỉnh và 0>γ . (ii). Tách nhiễu và phân ngưỡng Tách nhiễu Là trường hợp đặc biệt của phân ngưỡng khi các độ dốc 0== γα . Ứng dụng để quan sát ảnh, cắt ảnh hoặc giảm nhiễu khi biết tín hiệu đầu vào nằm trên khoảng [ ]ba, . Đồ thị minh họa: → Phân ngưỡng (Thresholding) - Là trường hợp đặc biệt của tách nhiễu khi constba == - Ứng dụng tạo các ảnh nhị phân, in ảnh 2 màu, vì ảnh gần nhị phân không thể cho ra ảnh nhị phân khi quét ảnh bởi có sự xuất hiện của nhiễu do bộ cảm biến và sự biến đổi của nền. Thí dụ trường hợp ảnh vân tay. - Đồ thị minh họa: → (ii). Biến đổi âm bản (Digital Negative) - Biến đổi âm bản nhận được khi dùng phép biến đổi sLv −= . Ứng dụng khi hiện các ảnh y học và trong quá tròng tạo các ảnh âm bản s v a≡ b L L s v a b L L β s v L L Bài giảng Xử lý ảnh số 38 GV. Mai Cường Thọ (iii). Cắt theo mức (Intensity Level Slicing) - Làm nổi bật một miền mức xám nhất định (để tăng cường một số đặc điểm nào đó). Có 2 kỹ thuật thực hiện: + Hiển thị giá trị cao cho tất cả các mức xám trong vùng quan tâm, và ngược lại (không nền). + Làm sáng vùng mức xám mong muốn, nhưng giữ nguyên các giá trị xám khác (có nền). Không nền:   ≠ ≤≤= 0 bsaL v Có nền:   ≠ ≤≤= s bsaL v (iv). Trích chọn bít (Bit Plane Slicing) Mục đích là để làm nổi bật các thành phần trên toàn ảnh bởi việc sử dụng các bít đặc biệt. - Mỗi mức xám s của 1 điểm ảnh được mã hóa trên B bít, và được biểu diễn: BB BB kkkks ++++= − −− 2...22 1 2 2 1 1 - Trong các bít mã hóa, người ta chia làm 2 loại: bít bậc thấp và bít bậc cao. Với bít bậc cao, độ bảo toàn thông tin cao hơn nhiều so với bít bậc thấp, các bít bậc thấp thường biểu diễn nhiễu hay nền. Muốn trích chọn bít thứ n và hiện chúng, ta dùng biến đổi:   ≠ == 0 1nkL v (v). Các toán tử logic và đại số Sử dụng toán tử logic: Ứng dụng đối với các ảnh nhị phân NOT, AND, OR, XOR, NOT_AND... Sử dụng toán tử đại số: Cộng, Trừ, Nhân - Trừ ảnh: mục đích tìm ra sự khác nhau của ảnh khi quan sát ảnh ở 2 thời điểm khác nhau. Sử dụng biến đổi ),(),(),( 21 nmsnmsnmv tt −= Kỹ thuật này được dùng trong dự báo thời tiết, trong y học. Bài giảng Xử lý ảnh số 39 GV. Mai Cường Thọ (vi). Mô hình hóa và biến đổi lược đồ xám Lược đồ xám: là một hàm rời rạc cung cấp tần suất xuất hiện của mỗi mức xám. kk nsh =)( + sk là mức xám thứ k + nk là số các điểm ảnh khác có cùng mức xám sk + n là tổng số các điểm ảnh trong ảnh - Biểu diễn lược đồ xám: + Trục tung biểu diễn số điểm ảnh cho một mức xám (hoặc tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh) + Trục hoành biễu diễn các mức xám Ví dụ: # Phương pháp giãn lược đồ xám (Histogram Stretching ) - Thường thì trong một số ảnh, các giá trị xám không phủ đều trên toàn dải động sẵn có của ảnh, mà chỉ tập trung ở một số mức xám nhất định (tồn tại nhiều giá trị xám =0, hoặc là 2B-1). Điều này làm cho ảnh quá tối, quá sáng hoặc tương phản kém. h(sk) sk ảnh tối h(sk) sk ảnh sáng h(sk) sk ảnh tương phản thấp h(sk) sk ảnh tương phản cao Bài giảng Xử lý ảnh số 40 GV. Mai Cường Thọ Để giải quyết điều này, ta thực hiện thao tác giãn lược đồ xám lên toàn dải động của ảnh. Giả sử dải động (dải độ sáng ) của ảnh là 120 −÷ B , thì: thao tác này là một ánh xạ sao cho: Giá trị xám nhỏ nhất của ảnh →giá trị 0 Giá trị xám lớn nhất của ảnh →giá trị 2B-1 Ánh xạ này là: ( ) min)( minmax 12 − − − = k B k sv # Phương pháp san bằng lược đồ xám (Histogram Equalization) Mục đích của phương pháp này là cố gắng chuyển lược đồ xám của ảnh về gần với 1 lược đồ định trước. Thuật toán san bằng: + Khởi tạo H for (i=0; i<256; i++) H[i] = 0 ; + Tính H for (i=0; i<M; i++) for (j=0; j<N; j++) H[Im[i][j]]++ + Tính tỉ lệ xuất hiện mức xám I trên ảnh for (i=0; i<256; i++) Hr[i] = H[i] / (M*N) ; + Tính phân phối xác suất mức xám k trên ảnh Tong=0; for (k=0; k<255; k++) { Tong+= Hr[k] ; HC[k] = Tong} + San bằng for (i=0; i<M; i++) for (j=0; j<N; j++) ImEq[i][j] = 255 * HC[Im[i][j]] ; {Hàm phân phối xác suất P(a) là khả năng xuất hiện các mức xám trong ảnh bé hơn hoặc bằng mức xám a} h(sk) sk a b Max h(sk) sk a b Max Ảnh gốc Ảnh sau khi san bằng Bài giảng Xử lý ảnh số 41 GV. Mai Cường Thọ Ví dụ Cân bằng histogram của ảnh S 3020101020 3060607070 7050506040 3030704020 5040302010 =S Xác định tần số mức xám 25 3)40( 25 4)70(, 25 5)30( 25 3)60(, 25 4)20( 25 3)50(, 25 3)10( = == == == Hr HrHr HrHr HrHr ; 25 15)40( 25 25)70(, 25 12)30( 25 21)60(, 25 7)20( 25 18)50(, 25 3)10( = == == == Hc HcHc HcHc HcHc Áp dụng ImEq[i,j]=255*Hc[Im[i,j]] và làm tròn số liệu ta có Mức xám sin 10 20 30 40 50 60 70 Thay thế bởi sout 31 72 122 153 184 214 255 I.2. Kỹ thuật tăng cường ảnh sử dụng các toán tử cục bộ (miền không gian) -Kỹ thuật lọc số miền không gian - Nhiễu gây cho ta những khó khăn khi phân tích tín hiệu, trong khi các kỹ thuật trên rõ ràng là chưa đáp ứng được vấn đề giảm nhiễu. Vì vậy, kỹ thuật lọc số miền không gian được ứng dụng. - Cơ sở lý thuyết của lọc số là dựa trên tính dư thừa thông tin không gian. - Trong kỹ thuật này, người ta sử dụng một mặt nạ và di chuyển khắp ảnh gốc. Tùy theo cách tổ hợp điểm đang xét với các điểm lân cận mà ta có kỹ thuật lọc tuyến tính hay phi tuyến. Điểm ảnh chịu tác động của biến đổi là điểm ở tâm mặt nạ. - Mô hình lọc số: h(m,n) S(m,n) V(m,n) mức xám 10 20 30 40 50 60 70 tần số 3 4 5 3 3 3 4 Bài giảng Xử lý ảnh số 42 GV. Mai Cường Thọ I.2.1. Kỹ thuật lọc tuyến tính (Linear Filter) (i) Lọc trung bình không gian - Mục đích: san bằng ảnh, làm mịn ảnh, loại bỏ các thành phần nhiễu muối, tiêu. - Ý tưởng: mỗi điểm ảnh được thay thế bằng tổng trọng số hay trung bình trọng số của các điểm lân cận với với mặt nạ. - Công thức toán học biểu diễn như sau: ∑∑ −= −= ++= a as b bt tnsmstswnmv ),(),(),( 2 )1( ,2 )1( − = − = NbMa , MxN là số lẻ. W: cửa sổ lọc, ),( tsw là các trọng số của bộ lọc. Trên là công thức tính tổng chập, vậy đây chính là việc nhân chập ảnh với mặt nạ lọc ảnh. - Thực tế ta thường dùng mặt nạ 33xMxN = , - Nói chung, người ta sử dụng nhiều kiểu mặt nạ khác nhau.         = 111 111 111 9 1 1H ,         = 111 121 111 10 1 2H ,         = 121 242 121 16 1 3H Ví dụ: Dùng mặt nạ H1    ++++++++= 9 30100403020020705030)2,3(S =63 (ii). Lọc thông thấp không gian (Spacial Low- Pass Filter). - Mục đích: Khử nhiễu cộng và nội suy ảnh - Trong lỹ thuật này, hay dùng một số mặt nạ sau:         = 010 121 010 8 1 1tH , ( )         += 11 11 2 1 2 2 b bbb b b H b 703010040 103020020 60705030 40302020 =S Bài giảng Xử lý ảnh số 43 GV. Mai Cường Thọ I.2.2. Kỹ thuật lọc phi tuyến (NonLinear Filter) (i). Lọc trung vị (Median Filter) - Được sử dụng chủ yếu cho giảm nhiễu - Một bộ lọc trung vị cũng dựa vào việc dùng một cửa số di chuyển trên ảnh, và giá trị xám pixel đầu ra được thay thế bởi trung vị của các pixel trong cửa sổ đó. - Thuật toán: + Các pixel trong cửa sổ sẽ được sắp xếp từ nhỏ tới lớn. + Nếu kích thước của cửa sổ =JxK là lẻ thì vị trí trung vị là 2/)1( +JxK , ngược lại thì vị trí trung vị là 2/JxK . Ví dụ: Dùng cửa sổ 3x3 ta có. (ii) Bọ lọc giữ biên (Kuwahara Filter) - Biên đóng vai trò quan trọng trong cảm nhận ảnh của chúng ta và trong phân tích ảnh. Bằng cách nào đó ta làm trơn ảnh mà không làm mất đi độ sắc nét của biên, nếu có thể thì không làm thay đổi vị trí của biên. - Bộ lọc đạt được mục đích này gọi là bộ lọc “giữ biên”. - Bộ lọc này cũng sử dụng một cửa sổ: + kích thước J=K=4L+1, L nguyên. + Chia của sổ thành 4 vùng( như mô tả) + Trong mỗi vùng ta tính trung bình độ sáng ∑ ℜ∈Λ = ),( ),(1 nm i nmsm và bình phương độ lệch chuẩn ( )∑ ℜ∈ − −Λ = ),( 22 ),( 1 1 nm ii mnmsµ 703010040 103020020 60705030 40302020 =S 20 30 30 30 40 50 70 100 200 Pixel trung tâm Vùng 1 Vùng 2 Vùng 3 Vùng 4 Bài giảng Xử lý ảnh số 44 GV. Mai Cường Thọ + Giá trị đầu ra của pixel trung tâm trong cửa sổ là giá trị trung bình của vùng có bình phương độ lệch chuẩn nhỏ nhất. - Λ là số điểm ảnh của vùng ℜ (ii). Lọc thông cao, thông dải (Spacial High- pass, Band -pass Filter) - Mục đích: làm trơn ảnh và trích chọn biên. - Nếu ta có bộ lọc thông thấp không gian là ),( nmhLP , thì bộ lọc thông cao được định nghĩa ),(),( nmhnmh LPHP −= δ , và bộ lọc thông dải là ),(),( 21 nmhnmhh LPLPBP −= - Dưới đây là cac mặt nạ hay dùng cho lọc thông cao.         −−− −− −−− = 111 191 111 1HP ,         − −− − = 010 151 010 2HP ,         − −− − = 121 252 121 3HP I.3. Các thao tác trên miền tần số - Kỹ thuật này không thao tác trên một vùng ảnh mà là toàn bộ ảnh. - Ý tưởng: Biểu diễn ảnh đầu vào qua miền tần số sử dụng biến đổi Fourier thuận, chọn hàm đáp ứng tần số ),( vuH sao cho đạt kết quả mong muốn. Sau đó ta dùng biến đổi Fourier ngược để biểu diễn lại ảnh qua miền không gian. Mô hình lọc số miền tần số Ta có: ),(),(),( nmhnmxnmy ⊗= Sử dụng biến đổi Fourier thuận, biểu diễn qua miền tần số ta được: ),(),( vuXnmx F→ ),(),( vuHnmh F→ ),().,(),(),( vuHvuXvuYnmy F =→ ),(),( 1 nmyvuY F→ Ta có các bộ lọc miền tần số hay dùng là lọc thông thấp và thông cao h(m,n) Bộ lọc x(m,n) y(m,n) Bài giảng Xử lý ảnh số 45 GV. Mai Cường Thọ Bộ lọc thông thấp, bộ lọc thông cao (i). Lọc thông thấp - Mục đích: làm trơn ảnh - Bộ lọc thông thấp lý tưởng: Hàm truyền đạt có dạng   > ≤= 0 0 ),(0 ),(1),( DvuD DvuD vuH 00 ≥D , D(u,v) là khoảng cách từ điểm (u,v) đến gốc tọa độ tần số 0D còn được gọi là tần số cắt của bộ lọc. Là giao điểm giữa H(u,v) =1 với H(u,v)=0 - Gốc tọa độ ( )2,2),( NMvu = - 22),( vuvuD += Bộ lọc lý tưởng chỉ ra rằng, tất cả các tần số trong vòng tròn bán kính D0 không bị suy giảm, trong khi đó tất cả các tần số ngoài vòng tròn này hoàn toàn bị suy giảm. Đồ thị không gian của bộ lọc thông thấp lý tưởng, biểu diễn dưới dạng ảnh, lát cắt của đồ thị Bài giảng Xử lý ảnh số 46 GV. Mai Cường Thọ - Bộ lọc ButterWorth thông thấp: Hàm truyền đạt bậc n với quĩ tích tần số cắt tại D0 n D vuD vuH 2 0 ),(1 1),(   + = Đồ thị không gian của bộ lọc thông thấp lý tưởng, biểu diễn dưới dạng ảnh, lát cắt của đồ thị (ii) Lọc thông cao - Mục đích: Làm sắc nét ảnh - Bộ lọc thông cao có thể được định nghĩa qua bộ lọc thông thấp như sau ),(1),( vuHvuH LPHP −= -Bộ lọc thông cao lý tưởng:   > ≤= 0 0 ),(1 ),(0),( DvuD DvuD vuH Bài giảng Xử lý ảnh số 47 GV. Mai Cường Thọ -Bộ lọc ButterWorth thông cao: n vuD D vuH 2 0 ),(1 1),(   + = II. Khôi phục ảnh (Image Restoration) Khôi phục ảnh để cập tới các kỹ thuật laọi bỏ hay tối thiểu hóa các ảnh hưởng cua môi trường bên ngoài hay các hệ thông thu nhận, phát hiện và lưu trữ ảnh đến ảnh thu nhận được. Khôi phục ảnh bao gồm các quá trình như: lọc ảnh, khử nhiễu nhằm làm giảm các biến dạng để có thể khôi phục lại ảnh gần giống ảnh gốc tùy theo các nguyên nhân đã gây ra biến dạng. - Về nguyên tắc: Khôi phục ảnh là nhằm xác định mô hình toán học của quá trình gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh. Quá trình thu nhận ảnh từ thế giới thực Bài giảng Xử lý ảnh số 48 GV. Mai Cường Thọ - Hướng tiếp cận: Một mô hình sẽ được xây dựng từ các ảnh kiểm nghiệm để xác định đáp ứng xung của hệ thống nhiễu. II.1. Mô hình quan sát và tạo ảnh - Cơ sở lý thuyết của kỹ thuật khôi phục ảnh: Quá trình gây ra biến dạng ảnh gốc phụ thuộc vào hệ thống quan sát và tạo ảnh. Ta phải xem xét ảnh quan sát được biểu diễn thế nào trên cơ sở đó mô hình hóa nhiễu sinh ra. Tiếp theo là dùng biến đổi ngược (lọc ngược) để khử nhiễu và thu lấy ảnh gốc. - Ảnh quan sát được gồm: ảnh gốc + nhiễu: ),( nmu + ),( nmη - Nhiễu gồm: + Nhiễu nhân: thành phần nhiễu phụ thuộc kiểu thiết bị quan sát và tạo ảnh ),(1 nmη + Nhiễu cộng : thành phần nhiễu ngẫu nhiên độc lập ),(2 nmη Như vậy là: nếu bằng cách nào đó xác định được các loại tác động biến dạng (phụ thuộc vào hệ thống và thiết bị) thì ta suy ra được ảnh gốc. - h(m,n): còn được gọi là hàm phân tán điểm (point-spread function.) - Trong trường hợp lý tưởng,   ≠≠ ==== 0 00 01),(),( nhaym nm nmnmh δ II.2. Kỹ thuật lọc tuyến tính (i). Lọc ngược Lọc ngược là kỹ thuật khôi phục đầu vào của hệ thống khi biết đầu ra (ảnh thu nhận được). Tiến trình thu nhận ảnh Hàm tác động gây nên biến dạng h(m,n) Bộ lọc khôi phục ảnh v(m,n) u(m,n) ),(ˆ nmu w(m,n) η(m,n) h(m,n) Bài giảng Xử lý ảnh số 49 GV. Mai Cường Thọ - ),(),(),(),( nmnmunmhnmv η+⊗= - Biểu diễn qua miền tần số: ),(),(),(),( βαβαβαβα WUHV += Tiến trình phục hồi ảnh bằng lọc ngược - ),( 1),(1 βαβα HH = − Để đơn giản ta gải thiết là hệ thống không có nhiễu. Như vậy thì vấn đề chỉ còn xác định xác định hàm phân tán điểm h(m,n). - Mô hình ảnh rung động mờ (Blur Motion) + Lý tưởng: ảnh không có rung động mờ:   ≠≠ ==== 0 00 01),(),( nhaym nm nmnmh δ + Ảnh có rung động mờ tuyến tính (dịch chuyển, xoay, kết hợp cả 2,):    =≤+= khác vàLnm LLnmh 0 )tan( m n 2 1 ),:,( 22 ϕϕ L: độ dịch chuyển, ϕ góc xoay + Rung động đồng nhất ngoài tiêu điểm (Uniform Out of Focus Blur)    ≤+= khác Rnm RRnmh 0 1 ):,( 222 2pi - Biến dạng ảnh do nhiễu loạn của khí quyển 6 5 22 )(),( βαβα +−= keH k là hệ số hiệu chỉnh, k<1 ),(1 βα−H Bài giảng Xử lý ảnh 50 GV. Mai Cường Thọ CHƯƠNG VI PHÁT HIỆN BIÊN VÀ PHÂN VÙNG ẢNH I. Biên và kỹ thuật phát hiện biên Nhìn chung về mặt toán học người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột về độ xám như chỉ ra trong hình dưới đây: Như vậy, phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong các đối tượng. Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên. Điều quan trọng là sự biến thiên giữa các điểm ảnh là nhỏ, trong khi đó biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn. Xuất phát từ cơ sở này người ta thường sử dụng 2 phương pháp phát hiện biên sau: • Phương pháp phát hiện biên trực tiếp: phương pháp này nhằm làm nổi đường biên dựa vào biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu là dùng kỹ thuật đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient, nếu lấy đạo hàm bậc 2 ta có kỹ thuật Laplace. • Phương pháp gián tiếp: Nếu bằng cách nào đấy ta phân ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là biên. s(m,n) Biên lý tưởng n s(m,n) Biên bậc thang n Biên thực tế s(m,n) n Bài giảng Xử lý ảnh 51 GV. Mai Cường Thọ II. Phương pháp phát hiện biên trực tiếp Tương tự như các phép toán làm trơn ảnh, khả năng lấy đạo hoàm theo tọa độ các điểm là hết sức quan trọng. Bài toán cơ bản ở đây là nếu chiếu theo đúng định nghĩa toán học về đạo hàm thì chúng ta không thể thực hiện được việc lấy đạo hàm các điểm ảnh, do một ảnh số hóa không phải là một hàm liên tục a[x,y] theo các biến tọa độ mà chỉ là một hàm rời rạc a[m,n] với các biến tọa độ nguyên. Vì lý do đó, những thuật toán ma chúng ta trình bày ở đây chỉ có thể được xem là các xấp xỉ cho đạo hàm thật sự theo tọa độ của ảnh liên tục ban đầu. 1. Phương pháp Gradient Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm bậc nhất. Vì ảnh là một hàm 2 biến, khi tính đạo hàm chúng ta cần phải xác định hướng cần lấy đạo hàm. Các hướng ở đây có thể là hướng ngang, dọc, hoặc tùy ý là sự kết hợp của 2 hướng ngang dọc. Ký hiệu hx , hy , hθ là các bộ lọc đạo hàm theo các hướng x,y, bất kỳ. Ta có quan hệ sau: yx hhh .sin.cos][ θθθ += Theo định nghĩa gradient ),( yxf∇ là một vectơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x và y. yx ii rr , là các vector đơn vị theo hai hướng x và y. yxxxyx iyxfhiyxfhiy yxfi x yxfyxf rrrr )),(()),((),(),(),( ⊗+⊗= ∂ ∂+ ∂ ∂=∇ x x x f(x) f’(x ) f’’(x) Bài giảng Xử lý ảnh 52 GV. Mai Cường Thọ Các thành phần của gradient được tính bởi: dx yxfydxxff x yxf x ),(),(),( −+≈= ∂ ∂ dy yxfdyyxff y yxf y ),(),(),( −+≈= ∂ ∂ Với dx là khoảng cách các điểm theo hướng x(khoảng cách tính bằng số điểm) và tương tự với dy. Trên thực tế người ta hay dùng dx=dy=1 Như vậy ta có : Độ lớn Gradient : 22 )),(()),((,( yxfhyxfhyxf yx ⊗+⊗=∇ Hướng Gradient :     ⊗ ⊗=∇ ),( ),( arctan)),(( yxfh yxfh yxf x yψ Độ lớn Gradiant xấp xỉ : ),(),(),( yxfhyxfhyxf yx ⊗+⊗=∇ Trong kỹ thuật gradient, người ta chia nhỏ thành 2 kỹ thuật(do dùng 2 toán tử khác nhau) : kỹ thuật gradient và kỹ thuật la bàn. Kỹ thuật gradient dùng toán tử gradient lấy đạo hàm theo một hướng; còn kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo 8 hướng: Bắc, Nam, Đông, Tây và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam. Thực hiện ký thuật trên, với mỗi điểm ảnh I(m,n) của I, đạo hàm theo x, theo y được kí hiệu tương ứng bởi Ix, Iy Ta có:   −+= −+= ),()1,(),( ),(),1(),( nmInmInmI nmInmInmI y x yx inmInmIinmInmInmI rr )),()1,(()),(),1((),( −++−+=∇⇒ ),()1,(),(),1(),( nmInmInmInmInmI −++−+=∇⇒ Điều này tương đương với nhân chập ảnh với 2 mặt nạ (bộ lọc) hx và hy ]11[][][ −== Tyx hh hx(m,n) hy(m,n) + I(m,n) ),( nmI∇ Bài giảng Xử lý ảnh 53 GV. Mai Cường Thọ Nói chung, ảnh kết quả sau khi áp dụng kỹ thuật nổi biên phụ thuộc rất nhiều vào việc chọn (hx , hy.). Sau đây là một số bộ lọc khác hay dùng - ]101[][][ −== Tyx hh (2.1) - Bộ lọc Sobel [ ] [ ]101 1 2 1 4 1 101 202 101 4 1 −•         =         − − − =xh [ ] [ ]121 1 0 1 4 1 121 000 121 4 1 •         − =         −− =yh Theo trên ta thấy hx và hy đều tách được, mỗi bộ lọc lấy đạo hàm theo một hướng nhờ phương trình (2.1) và làm trơn theo hướng trực giao với hướng đó nhờ một bộ lọc tam giác một 1- chiều. - Bộ lọc Prewitt [ ] [ ]101 1 1 1 3 1 101 101 101 3 1 −•         =         − − − =xh [ ] [ ]111 1 0 1 3 1 111 000 111 3 1 •         − =         −−− =yh Theo trên ta thấy hx và hy đều tách được, mỗi bộ lọc lấy đạo hàm theo một hướng nhờ phương trình (2.1) và làm trơn theo hướng trực giao với hướng đó nhờ một bộ lọc đều một 1- chiều. Toán tử la bàn Toán tử la bàn đo gradient theo một số hướng đã chọn. Nếu kí hiệu gk là gradient la bàn theo hướng θk=pi/2 +2kpi với k=0,1, 2,7. Như vậy ta có gradient E theo 8 hướng ngược chiều kim đồng hồ. yx hhh .sin.cos][ θθθ += Bài giảng Xử lý ảnh 54 GV. Mai Cường Thọ Có nhiều toán tử la bàn khác nhau. Nhưng ở đây, trình bày một cách chi tiết toán tử Kish. Toán tử này sử dụng mặt nạ 3x3. 333 503 553 333 303 555 21 −−− − − = −−− −−= HH 553 503 333 533 503 533 43 − − −−− = −− − −− = HH 333 305 355 335 305 335 355 305 333 555 303 333 8765 −−− − − = −− − −− = − − −−− =−− −−− = HHHH Trong đó H1, H2, H3, H8 tương ứng với 8 hướng: 00, 450, 900, 1350, 1800, 2250, 3150. Nếu ta kí hiệu ∇i, i=1, 2, 8 là gradient thu được theo 8 hướng bởi 8 mặt nạ, biên độ gradient tại (x, y) được tính như sau: ( )8....,2,1,),(),( =∇=∇ iyxMaxyx i 2. Kỹ thuật Laplace Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi độ sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc 2, gọi là phương pháp Laplace. Toán tử Laplace được định nghĩa như sau: 2 2 2 2 2 dy f dx ff ∂+∂=∇ Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai. Dưới đây là 3 kiểu mặt nạ hay dùng: 121 252 121 111 181 111 010 141 010 321 − −− − = −−− −− −−− = − −− − = HHH Với mặt nạ H1, đôi khi người ta dùng phần tử ở tâm có giá trị là 8 thay vì giá trị là 4 như đã chỉ ra. Để dễ hình dung việc xấp xỉ đạo hàm bậc hai trong không gian rời rạc bởi mặt nạ H1 hay là ý nghĩa của mặt nạ H1, ta xét chi tiết cách tính đạo hàm bậc 2. Trong không gian rời rạc đạo hàm bậc 2 có thể tính: WS NW E W N S NE SE Mô hình 8 hướng Bài giảng Xử lý ảnh 55 GV. Mai Cường Thọ )1,()1,(),(2 ),1(),1(),(2 2 2 2 2 +−−−= ∂ ∂ +−−−= ∂ ∂ yxfyxfyxf y f yxfyxfyxf x f Vậy ),1()1,(),(4)1,(),1(2 yxfyxfyxfyxfyxff +−+−+−−−−=∇ 3. Phương pháp khớp nối lỏng a. Khái niệm láng giềng 4 và láng giềng 8 Với điểm P được bao phủ xung quanh bởi 8 điểm: P0, P1, P8 Ta có láng giềng 8 của P gồm các điểm: P0, P1, P2, P3, P4, P5, P6, P7 Láng giềng 4 của P gồm các điểm: P0, P2, P4, P6. b. Phương pháp khớp nối lỏng • Xét các điểm p và q là 2 điểm 4 láng giềng. • I(p), I(q): giá trị mức xám của điểm p và q • Nếu θ>− )()( qIpI thì coi như có cặp biên (p, q). Ví dụ: Cho ma trận ảnh chọn θ =3 ta có II. CÁC KỸ THUẬT DÒ BIÊN 1 Kỹ thuật Freeman(dò biên theo ảnh đen trắng) Thuật toán Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1. Bước 2: Lặp Nếu “điểm ảnh hiện thời là đen” rẽ trái Ngược lại thì rẽ phải. Dừng khi gặp điểm 1 ban đầu. P3 P2 P1 P4 P P0 P5 P6 P7 6 2 3 6 2 3 6 2 3 6 2 3 6 2 3 2 3 6 2 3 1 4 2 8 5 7 4 2 8 5 7 1 2 8 5 7 1 4 3 6 1 4 2 8 5 7 4 2 8 5 7 1 2 8 5 7 1 4 Bài giảng Xử lý ảnh 56 GV. Mai Cường Thọ Cải tiến thuật toán trên (Luân văn tiến sĩ: Hồ Ngọc Kỷ -1992) Thuật toán Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1. Bước 2: Lặp Nếu “điểm ảnh hiện thời là đen” Thì “dò ngược”. Ngược lại “sang phải”. Đến khi gặp pixel 1 2. Dò biên theo cặp nền vùng Phương pháp Tìm cặp điểm (n,v), trong đó n và v là điểm 8 láng giềng, n là điểm nền và v là điểm vùng. Ban đầu có (n0, v0) dựa vào đó ta tìm được (n1, v1), qua trình này cứ tiếp tục. Tổng quát nếu có (ni, vi) ta sẽ tìm (ni+1, vi+1), sao cho ni và ni+1 là 8 láng giềng , vi và vi+1 là 8 láng giềng. 11 14 19 24 25 30 13 7 3 2 1 4 5 6 8 10 9 12 15 16 17 18 20 21 22 23 26 27 28 29 31 32 33 34 35 1 2 12 3 11 4 6 5 10 9 8 7 Bài giảng Xử lý ảnh 57 GV. Mai Cường Thọ Quá trình dò biên theo nền vùng là: tìm 1 dãy các điểm (n0, v0), (n1, v1)(nk, vk) sao cho n0, n1, .nk : chu tuyến nền v0, v1, .vk : chu tuyến vùng 3. Xấp xỉ bởi đoạn thẳng Nối điểm xuất phát R với điểm đang xét Pc bởi một đoạn thẳng. Sau đó tính toạ độ của Pi, một điểm nằm giữa R và Pc sao cho khoảng cách từ Pi đến đoạn thẳng là cực đại. Gọi khoảng cách này là di. Nếu di lớn hơn một ngưỡng cho trước (độ chính xác của xấp xỉ) người ta phân đoạn RPc thành 2 đoạn RPi và PiPc và tiếp tục thực hiện lấy mẫu với từng đoạn cho tới khi đoạn thẳng tìm được là “rất gần” với đường bao. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cặp (ni+1, vi+1) 8 láng giềng Pi • • • • • • • • • • • • R Pc di Pi di • • • • • • • • • • • • R Pc P1 P2 • • • • • • • • • • • • R Pc Hình xấp xỉ đường biên bằng đường gấp khúc Bài giảng Xử lý ảnh 58 GV. Mai Cường Thọ III. CÁC PHƯƠNG PHÁP PHÂN VÙNG ẢNH Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm ra được nhờ các kỹ thuật phân đoạn ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu cảnh trong ảnh. Chúng ta cần phải hiểu được là: - Không có kỹ thuật phân đoạn nào là vạn năng, theo nghĩa có thể áp dụng cho mọi loại ảnh. - Không có kỹ thuật phân đoạn nào là hoàn hảo. Có thể hiểu phân vùng là tiến trình chia ảnh thành nhiều vùng, mỗi vùng chứa một đối tượng hay nhóm đối tượng cùng kiểu. Chẳng hạn, một đối tượng có thể là một kí tự trên một trang văn bản hoặc một đoạn thẳng trong một bản vẽ kỹ thuật hoặc một nhóm các đối tượng có thể biểu diễn một từ hay hay đoạn thẳng tiếp xúc nhau. Ta có một số phương pháp phân vùng ảnh như sau: 1. Thuật toán gán nhãn thành phần liên thông Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn riêng biệt. Nhãn thường là các số tự nhiên bắt đầu từ một đến tổng số các thành phần liên thông có trong ảnh. Giải thuật quét ảnh từ trái sang phải và từ trên xuống dưới. Trong dòng thứ nhất của các pixel đen, một nhãn duy nhất được gán cho mỗi đường chạy liên tục của pixel đen. Với mỗi pixel đen của các dòng tiếp theo, các pixel lân cận trên dòng trước và pixel bên trái được xem xét. Nếu bất kì pixel lân cận nào được gán nhãn, nhãn tương tự được gán cho pixel đen hiện thời; ngược lại nhãn tiếp theo chưa được sử dụng được chọn. Thủ tục này được tiếp tục cho tới dòng cuối của ảnh. Lúc kết thúc tiến trình này, một thành phần liên thông có thể chứa các pixel có các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn pixel “?” trong hình vẽ. Pixel đối với lân cận trái và những lân cận trong dòng trước có thể được gán nhãn một cách riêng biệt. Một tình huống như vậy phải được xác định và ghi lại. Sau tiến trình quét ảnh, việc gán nhãn được hoàn tất bằng cách thống nhất các mâu thuẫn các nhãn và gán lại các nhãn chưa sử dụng. Bài giảng Xử lý ảnh 59 GV. Mai Cường Thọ Để minh hoạ ta có hình biểu diễn sau : Vd : một phương pháp sửa nhãn ∃(p,q) là liên thông 8 mà label(p)label(q) -> sửa nhãn cho giống nhau. 2. Phân vùng bằng tách cây tứ phân Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn một cách tổng thể trên miền lớn của ảnh. Nếu tiêu chuẩn được thỏa, việc phân đoạn coi như kết thúc. Trong trường hợp ngược lại, ta chia miền đang xét thành 4 miền nhỏ hơn. Với mỗi miền nhỏ, ta áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa. Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng. Vì thế cây này có tên là cây tứ phân. Cây này cho ta hình ản rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . * * * * . . * * * . . . . . 1 1 1 1 . . 2 2 2 . . . . . . * * * . . * * * * . . . . . 1 1 1 . . 2 2 2 2 . . . . * * * * . * * * * * . . . . 1 1 1 1 . 2 2 2 2 2 . . . . . . * * * * * . . . . . . . . . 1 1 ? * * . . . . . . . . . * * * * * * . * . . . ⇒ . . . * * * * * * . * . . . * * . . . . . . . . * * . . * * . . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . . . . . . * * . . . . . . . . . . . Hình b . Ảnh ban đầu Hình c . Tiến trình gán nhãn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 . . 2 2 2 . . . . . 1 1 1 1 . . 1 1 1 . . . . . . 1 1 1 . . 2 2 2 2 . . . . . 1 1 1 . . 1 1 1 1 . . . . 1 1 1 1 . 2 2 2 2 2 . . . . 1 1 1 1 . 1 1 1 1 1 . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 1 . 3 . . . ⇒ . . . 1 1 1 1 1 1 . 2 . . . 4 4 . . . . . . . . 3 3 . . 3 3 . . . . . . . . 2 2 . . . 4 4 . . . . . . . 3 3 . . . 3 3 . . . . . . . 2 2 . . . 4 4 . . . . . . . . . . . . 3 3 . . . . . . . . . . . Hình d . Sau khi quét đầy đủ Hình e .Kết quả sau cùng . . . . . . . . . .. . . . . P P P P . . . . . . . . L ? . . . . . . . . . . . . . . .. . . . . .. P: lân cận trước, L lân cân trái Bài giảng Xử lý ảnh 60 GV. Mai Cường Thọ Một vùng thỏa chuẩn sẽ tạo nên một nút lá, nếu không nó sẽ tạo nên một nút trong và có 4 nút con tương ứng với việc chia làm 4 vùng. Ta cứ tiếp tục như vậy cho đến khi phân xong. Các nút của cây biểu diễn số vùng đã phân. Tiêu chuẩn phân vùng ở đây là màu sắc. Nếu mọi điểm của vùng đều là màu trắng thì sẽ tạo nên nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi vùng không thuần nhất và phải tiếp tục chia. Với ngưỡng θ cho trước, vùng thuần nhất phải thỏa điều kiện • Độ lệch chuẩn σ < θ • Hoặc θ<− MinMax với Max, Min lần lượt là giá trị lớn nhất và nhỏ nhất của mức xám trong vùng cần chia. • Giá trị điểm ảnh trong vùng bằng cách lấy trung bình giá trị của vùng đó Ảnh gốc Phân đoạn ở mức 1 Ví dụ: Cho ảnh S(m, n) , hãy phân vùng theo tiêu chí: ngưỡng θ= 2 và θ<− MinMax 98664422 98664422 22335577 22335577 12335578 98765532 88664422 88664422 ),( =nmS kết quả Vùng 2 Vùng 1 Vùng 3 Vùng 4 98664422 98664422 22335577 22335577 12335578 98765532 88664422 88664422 ),( =nmS Vùng 1 Bài giảng Xử lý ảnh 61 GV. Mai Cường Thọ Ta có cây tứ phân như sau 3. Phân vùng bởi hợp Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại nếu thỏa tiêu chuẩn để được một miền đồng nhất lớn hơn. Ta lại tiếp tục với miền thu được cho tới khi không thể hợp được nữa. Số miền còn lại cho ta kết quả phân đoạn. Như vậy miền nhỏ nhất của bước xuất phát là điểm ảnh. Phương pháp hợp vùng được thực hiện như sau: • Giả sử có 2 vùng ω và ω’ • Ta xác định cặp các điểm 4 láng giềng (p, q) sao cho p ∈ω và q ∈ω’ • Xác định   ≤−= otherwise qIpIif qpT 0 )()(1),( 1θ Trong đó I(p), I(q) là giá trị mức xám của điểm p và q, θ1 là giá trị ngưỡng cho trước. • Gọi b(ω) và b(ω’) là số điểm biên của 2 vùng ω và ω’ (8) (3) 22 21 (1) (2) (8) (9) 14 4 3 2 1 13 12 11 (6) (7) (6) (3) (3) 23 24 (4) (2) (5) (2) (8) (7) (5) (7) (2) (4) (2) (3) (6) (9) Bài giảng Xử lý ảnh 62 GV. Mai Cường Thọ • Xét hàm khả năng hợp 2 vùng : ))(),(( ),(),( ' ' ϖϖ ϖϖ bbMin qpT KNG ∑= • Nếu ( ) 2', θϖϖ ≥KNG thì có thể hợp 2 vùng ω và ω’ thành 1 vùng. Ví dụ: Xét khả năng hợp các vùng của ảnh sau, 1θ =3, 2θ =0.6 44442222 88644222 88662212 88866612 68886111 66666111 66666611 ),( =nmS Gọi A, B, C, D, E lần lượt là các vùng chứa mức xám 1, 2, 4, 6, 8 Ta có bảng 1, Đếm số điểm biên các vùng và tính toán các ∑ ),( qpT Xác định hợp vùng Bảng 2 Kết luận : Có thể hợp được 2 vùng D và E vì 11/10 >θ2 Có thể hợp được 2 vùng B và C vì 4/6 >θ2 KNG(ω,ω’) A B C D E A - 5/10 0 0 0 B 5/10 - 4/6 0 0 C 0 4/6 - 3/6 0 D 0 0 3/6 - 11/10 ω’ ω A B C D E B(ω) A - 5 0 0 0 10 B 5 - 4 0 0 11 C 0 4 - 3 0 6 D 0 0 3 - 11 19 E 0 0 0 11 - 10 Bài giảng Xử lý ảnh 63 GV. Mai Cường Thọ IV. Phân vùng ảnh dựa theo ngưỡng biên độ - Kỹ thuật lấy ngưỡng Kỹ thuật này dựa trên một ý tưởng hết sức đơn giản. Một tham số θ, gọi là ngưỡng độ sáng, sẽ được chọn để áp dụng cho một ảnh a[m,n] theo cách sau: Nếu [ ] θ≥nma , thì [ ] 1, == objectnma Ngược lại [ ] 0, == backgroundnma Thuật toán trên giả định rằng chúng ta đang quan tâm đến các đối tượng sáng (object) hay nền ảnh (background) bằng các giá trị “1” hoặc “0”. Câu hỏi trung tâm trong kỹ thuật lấy ngưỡng khi đó sẽ là: Chúng ta nên chọn ngưỡng θ như thế nào? Mặc dù không có thuật toán chọn ngưỡng vạn năng nào có thể áp dụng cho mọi loại ảnh. Chúng ta cũng có nhiều phương pháp đưa ra dưới đây: 1. Ngưỡng cố định Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh. Nếu chúng ta biết trước là chương trình ứng dụng sẽ làm việc với những ảnh có độ tương phản rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần như đồng nhất và rất sáng, thì giá trị ngưỡng không đổi 128 trên thang độ sáng từ 0 đến 255 sẽ là một giá trị chọn khá chính xác. Chính xác ở đây nên được hiểu theo nghĩa là số lượng các điểm ảnh bị phân lớp sai là cực tiểu. 2. Ngưỡng dựa trên lược đồ Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay ảnh cần được phân đoạn. Hình dưới đây cho chúng ta một ví dụ về ảnh và lược đồ độ sáng liên kết với nó. Bài giảng Xử lý ảnh 64 GV. Mai Cường Thọ Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám. Những kỹ thuật phổ biến nhất trong số đó sẽ được trình bày dưới đây. Những kỹ thuật này có thể tận dụng lợi thế do sự làm trơn dữ liệu lược đồ ban đầu mang lại, nhằm loại bỏ những dao động nhỏ về độ sáng. Tuy nhiên các thuật toán làm trơn cần phải cẩn trọng không được làm dịch chuyển các vị trí đỉnh của lược đồ. Nhận xét này dẫn đến thuật toán làm trơn lược đồ dưới dây, với độ rộng của cửa sổ W là N, thông dụng là N=3 hoặc N=5 (bộ lọc trung bình 1-chiều): [ ] ( ) ( ) [ ]ibh N bh N Ni rawsmooth −= ∑ − −−= 2/1 2/1 1 2.1. Tuật toán đẳng liệu (Isodata) Kỹ thuật chọn ngưỡng theo kiểu lặp này do Ridler và Calvard đưa ra. Thuật toán như sau: - Chia lược đồ thành 2 đoạn bằng một giá trị ngưỡng khởi động 10 2 −= Bθ , tức là bằng phần nửa thang độ xám động của ảnh. - Sau đó tính toán độ sáng trung bình của 2 vùng: - 0,fm của những điểm ảnh thuộc đối tượng - 0,bm của những điểm ảnh nền. - Tính giá trị ngưỡng mới 2 0,0, 1 bf mm + =θ Quá trình này cứ thế sẽ được tiếp tục với các ngưỡng mới cho đến khi nào giá trị ngưỡng không thay đổi nữa thì dừng lại. Biểu diễn dưới dạng công thức toán học, chúng ta có: 2 1,1, −− + = kbkf k mm θ cho tới khi 1−= kk θθ 2.2. Thuật toán tam giác Thuật toán này do Zack đưa ra trong (36) và được minh họa trong hình (trang bên). Trong hình này, chúng ta có thể quan sát thấy một đường thẳng đã được xây dựng bằng cách nối từ giá trị lớn nhất của lược đồ tại độ sáng bmax đến giá trị nhỏ nhất của lược đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin], chúng ta đi tính khoảng cách d từ giá trị lược đồ tại b là h[b] đến đường thẳng đã có. Giá trị b0 ứng với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng θ. Bài giảng Xử lý ảnh 65 GV. Mai Cường Thọ Kỹ thuật lấy ngưỡng không nhất thiét phải được áp dụng cho toàn bộ ảnh, mà có thể áp dụng cho từng vùng ảnh một. Hai tác giả Chow và Kaneko đã phát triển một biến thể của kỹ thuật lấy ngưỡng bằng cách chia một ảnh có kích thước MxN ra thành nhiều vùng không chồng chất lên nhau. Các giá trị ngưỡng được tính riêng biệt cho từng vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngưỡng cho toàn bộ ảnh. Trong thuật toán mới này, kích thước của các vùng cần được chọn một cách thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng. Tính hữu ích của thuật toán này, cũng như nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng dụng cụ thể.

Các file đính kèm theo tài liệu này:

bai_giang_xu_ly_anh_so_ban_dep.pdf