Luận văn Nắn chỉnh biến dạng hình học và ứng dụng

MỞ ĐẦU Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải trí . có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải qua. Với sự phát triển ngày càng hoàn thiện của công nghệ phần cứng, công nghệ phần mềm cũng đang có những bước tiến quan trọng đóng góp một phần không nhỏ cho sự phát triển của xã hội loài người đặc biệt là lĩnh vực xử lý ảnh. Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình hay nói cách khác là bị biến dạng đi. Ví dụ: ảnh chụp cuốn sách thường có một đầu to đầu nhỏ do cách đặt máy ảnh, ảnh chụp bề mặt trái đất từ vệ tinh bị méo do bề mặt cong của trái đất v.v Nói đến xử lý ảnh người ta sẽ hiểu ngay đây là quá trình hiệu chỉnh hay bằng cách nào đó để làm cho đối tượng được thu nhận thể hiện được đúng bản chất của mình trên ảnh. Thông thường khâu đầu tiên của quá trình xử lý ảnh được gọi là khâu tiền xử lý với mục đích nắn chỉnh các điểm sai lệch trên ảnh sao cho kết quả được giống nhất so với đối tượng được thu nhận. Nắn chỉnh biến dạng nhằm hiệu chỉnh các khuyết điểm của đối tượng là khâu tiền xử lý quan trọng trong xử lý ảnh. Khi sử dụng các thiết bị để thu nhận hình ảnh người ta đã phát hiện ra yếu tố sai lệch ở kết quả của hình ảnh thu được và để khắc phục điều này người ta đã tìm cách sửa chữa, nắn chỉnh nhằm có được kết quả tốt hơn. Như vậy nắn chỉnh biến dạng ban đầu chỉ đơn thuần mang mục đích khắc phục các nhược điểm của ảnh do thiết bị thu nhận gây ra. Sau đó nhờ chính những kết quả từ khâu nắn chỉnh đã đem lại những hướng phát triển mới quan trọng trong nhận dạng và đối sánh. Chẳng hạn nhận dạng tội phạm tự động trong ngành công an thay vì phải cầm ảnh của họ để đối chiếu với hàng trăm đối tượng đáng nghi khác có trong máy tính, hoặc xác định độ trùng khớp của một đối tượng với tập đối tượng cho trước trong khảo cổ học để nghiên cứu quá trình tiến hóa của sự vật, hiện tượng v.v Ngày nay, người ta còn dùng nắn chỉnh biến dạng để “cố tình” tạo ra các hình dạng theo ý muốn chủ quan. Điển hình là các nhà làm phim, họ tạo ra các thước phim miêu tả sự thay đổi của một đối tượng theo thời gian, hoặc quá trình biến đổi từ đối tượng này đến đối tượng khác v.v nhờ các kỹ thuật nắn chỉnh biến dạng với chất lượng không thua kém gì các thước phim sử dụng thiết bị thu nhận. Việc nghiên cứu các kỹ thuật nắn chỉnh biến dạng hình học là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh trong khi thực tế đang đặt ra những yêu cầu đòi hỏi. Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn lựa chọn đề tài: "Nắn chỉnh biến dạng hình học và ứng dụng". Bố cục của luận văn bao gồm phần mở đầu, ba chương chính, phần kết luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức như sau: Chương 1: Khái quát về xử lý ảnh và nắn chỉnh biến dạng. Chương này trình bày một số khái niệm trong xử lý ảnh, các vấn đề cơ bản của xử lý ảnh. Trình bày khái niệm, cách phân loại và các ứng dụng cơ bản của nắn chỉnh biến dạng. Chương 2: Một số kỹ thuật nắn chỉnh biến dạng hình học. Các kỹ thuật được trình bày dựa vào đặc trưng được xác định để phục vụ cho công việc nắn chỉnh. Đặc trưng đó có thể dựa trên phân vùng ảnh, trên cơ sở tập các điểm đặc trưng, dựa trên cơ sở vector, dựa trên kỹ thuật nắn chỉnh khung lưới, v.v Chương 3: Ứng dụng nắn chỉnh biến dạng. Phần này trình bầy ứng dụng nắn chỉnh sách dựa trên các điểm đặc trưng. Kèm theo là một số kết quả. MỤC LỤC MỞ ĐẦU 1 Chương 1. KHÁI QUÁT VỀ XỬ LÝ VÀ NẮN CHỈNH ẢNH 3 1.1. Khái quát về xử lý ảnh 3 1.2. Một số khái niệm cơ bản trong xử lý ảnh 4 1.2.1. Ảnh số . 4 1.2.2. Điểm ảnh . 4 1.2.3. Mức xám (gray level) . 4 1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số . 5 1.3. Các vấn đề chung liên quan đến xử lý ảnh số . 6 1.3.1. Xử lý ảnh mức thấp . 6 1.3.2. Những khó khăn khi xử lý ảnh số 7 1.4. Ứng dụng của hệ thống xử lý ảnh . 8 1.5. Quá trình xử lý ảnh số 10 1.6. Các thành phần cơ bản của hệ thống xử lý ảnh . 14 1.7. Nắn chỉnh biến dạng . 16 1.7.1. Khái niệm nắn chỉnh biến dạng . 16 1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng . 17 1.7.3. Các điểm đặc trưng để nắn chỉnh . 19 1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng 19 Chương 2. MỘT SỐ KỸ THUẬT NẮN CHỈNH BIẾN DẠNG HÌNH HỌC 27 2.1. Nắn chỉnh trên cơ sở phân vùng ảnh . 27 2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng 31 2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector 41 2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới 45 2.4.1. Xây dựng hàm biến đổi . 45 2.4.2. Nhận xét kết quả . 47 2.5. Xây dựng khung nắn chỉnh . 47 2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC 48 2.6.1. Các mô hình nắn chỉnh trong IrasC . 48 2.6.2. Quá trình nắn chỉnh ảnh 50 Chương 3. ỨNG DỤNG NẮN CHỈNH BIẾN DẠNG 55 3.1. Nắn chỉnh một cuốn sách 55 3.2. Giới thiệu chương trình 58 3.2.1. Mô tả các chức năng trong chương trình . 58 3.2.1.1. Chức năng quản lý các Style (ảnh mẫu) 58 3.2.1.2. Chức năng quản lý các điểm đặc trưng 58 3.2.1.3. Chức năng nâng cao chất lượng ảnh 59 3.2.1.4. Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh 59 3.2.2. Giao diện chính của chương trình 60 3.2.3. Kết quả của một số chức năng trong chương trình . 63 KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 66

pdf72 trang | Chia sẻ: maiphuongtl | Lượt xem: 2956 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Nắn chỉnh biến dạng hình học và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
định hai điểm có cùng toạ độ trên ảnh đích và ảnh gốc. Sau đó gán giá trị màu của điểm ảnh đích bằng giá trị màu của điểm gốc tương ứng. * Cơ sở lý thuyết + Khái niệm về toạ độ Barycentric Với mỗi điểm M(xm,ym) nằm trong tam giác ABC thì chúng ta đều có thể biểu diễn toạ độ của nó theo toạ độ các đỉnh của tam giác như sau: Giải hệ phương trình này ta được một nghiệm duy nhất: ( - ) ( - ) - ( - ) ( - ) ( - ) ( - ) - ( - ) ( - ) ya yc xa xm xa xc ya ym v ya yc xa xb xa xc ya yb  ( - ) ( - ) - ( - ) ( - ) ( - ) ( - ) - ( - ) ( - ) ya ym xa xb xa xm ya yb w ya yc xa xb xa xc ya yb  u = 1-v-w Ti = S i Ti  Tj =  xm = u  xa + v  xb + w  xc ym = u  ya + v  yb + w  yc u+v+ w = 1 u,v, w  0 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 29 Chúng ta nói rằng điểm M có toạ độ là (u, v, w) đối với tam giác ABC. + Một số đặc điểm cần chú ý của toạ độ Barycentric Đối với mỗi điểm toạ độ của nó là duy nhất. Toạ độ của một điểm phụ thuộc vào tỉ lệ các khoảng cách từ nó đến các đỉnh của tam giác chứ không phải là khoảng cách tuyệt đối giữa chúng. Nếu khoảng cách tương đối của điểm cần biểu diễn đến điểm cơ sở nhỏ thì hệ số tương ứng với nó sẽ lớn. Hình 2.1 sẽ minh hoạ cho khái niệm hệ toạ độ Barycentric. Đến đây thuật toán đã hoàn toàn rõ ràng. Vậy các bước phải thực hiện đối với thuật toán này là: Xây dựng lưới tam giác cho ảnh gốc và ảnh đích Đối với mỗi cặp tam giác tương ứng với ảnh gốc và ảnh đích ta nội suy tam giác ở ảnh gốc thành tam giác ở ảnh đích. Một vấn đề nảy sinh là làm sao có thể tìm được tất cả các điểm thuộc tam giác ABC một cách hiệu quả? Có nhiều phương án để giải quyết vấn đề này, phần sau đây sẽ giới thiệu một phương pháp khá hiệu quả. * Phương pháp xác định tất cả các điểm thuộc một tam giác Phương pháp này gồm có các bước như sau: Tìm các giá trị xmax, xmin, ymax, ymin đối với các đỉnh của tam giác. (0,1,0) (1,0,0) (0,0,1) Hình 2.1 Hệ toạ độ Barycentric M Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 30 For a = ymin to ymax do - Tìm giao điểm của đường thẳng y=a với 3 cạnh của tam giác. - Chỉ xét các giao điểm có hoành độ thuộc [xmin,xmax] và sắp xếp các giao điểm theo chiều tăng dần của hoành độ. - Các điểm nằm trên đường thẳng y=a và có hoành độ thuộc đoạn [x_min,x_max] là thuộc tam giác (với x_ thể hiện hoành độ giao điểm). Sử dụng thuật toán tam giác người ta có thể xác định được tọa độ các điểm bị bóp méo dựa vào cặp điểm đặc trưng. Các điểm này được xác định dựa vào việc xác định tam giác nào là cơ sở, cặp điểm nào là cơ sở. Việc xác định cặp điểm đặc trưng có thể dựa vào thuật toán sau Trước tiên định nghĩa một ánh xạ T cho các đỉnh của tam giác: M(A)=A', M(B)=B', M(C)=C'. Các điểm còn lại sẽ được ánh xạ theo toạ độ Barycentric (1, 2, 3) nghĩa là: X= 1*A+2*B+3*C Trong đó: i  0 và 1+ 2+ 3 =1 Khi đó điểm Y là ánh xạ của X qua M được tính toán như sau: Y = M(X) = M(1*A+2*B+3*C) = 1* M (A) +2*M(B) +3*M(C) = 1*A'+2*B'+3*C' y = ymin y = ymax x = x m ax x = x m in Hình 2.2 Tìm tất cả các điểm thuộc tam giác theo dòng quét Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 31 b. Phân vùng tứ giác Nếu lưới xây dựng trên ảnh nguồn và đích tương ứng là lưới tứ giác, ta cần nội suy các tứ giác cho nhau. Để thực hiện điều này ta dùng phép nội suy Bilinear. Phép nội suy Bilinear xác định một hàm biến đổi từ một hình vuông kích thước 0,1x0,1 tới một tứ giác trong không gian (tứ giác này không nhất thiết phải đồng phẳng). Phép biến đổi được thực hiện tương đương với hai việc: Thứ nhất là nội suy trên các cạnh AD và BC thu được điểm P và Q. P = (1-v)A +vD Q = (1-v)B +vC Việc tiếp theo là nội suy trên đoạn PQ sử dụng thông số u: B(u,v)=(1-u)P +uQ 2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng Thuật toán có hướng tiếp cận dựa trên cơ sở các cặp điểm đặc trưng như đã trình bầy ở trên. Do vậy, điều quan trọng là làm sao có thể biểu diễn được một điểm bất kỳ theo tập các đặc trưng khi mà lực lượng của tập lớn. Tuy nhiên, thuật toán lợi dụng tính chất phân vùng của đối tượng ảnh để Hình 2.4 Nội suy Bilinear Hình 2.3. Nội suy tam giác Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 32 giảm nhẹ lực lượng hệ cơ sở từ tập các đặc trưng ban đầu giúp cho việc biểu diễn là khả thi. Việc xác định các điểm đặc trưng của ảnh nhằm cung cấp các thông tin về đối tượng giúp cho sự việc nắn chỉnh được thực hiện thuận lợi. Các công thức nắn chỉnh bao giờ cũng được đưa ra dựa trên các điểm đặc trưng và xây dựng các công thức nắn chỉnh là đại diện cho một thuật toán nắn chỉnh hình học. Để đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng phần của ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là ta đã biểu diễn được thông tin của đối tượng và ánh xạ từng phần của chúng cho nhau. Đây cũng chính là mục đích của giai đoạn xác định các điểm đặc trưng. Thông thường nắn chỉnh hình dạng người ta dùng phương pháp bình phương bé nhất hoặc giá trị trung bình nhỏ nhất trên cơ sở thông tin thu được từ các điểm đặc trưng. Phương pháp bình phương nhỏ nhất (OLS) là một thủ thuật toán học được sử dụng để ước lượng mối tương quan giữa các biến khác nhau. Kiểu tương quan đơn giản nhất là: 0 1i i iY b b X e   Kết quả quá trình ước lượng các hệ số b0 và b1 được gọi là b0 mũ và b1 mũ. Các hệ số này được sử dụng để ước lượng biến phụ thuộc Yi mũ. Chúng ta có thể nói rằng:  0 1i iY b b X    Chênh lệch giữa giá trị thực tế Yi và giá trị ước lượng  iY là bằng yếu tố sai số ei. Điều này có thể viết dưới dạng:  0 1i i i ii i Y b b X e Y Y e        Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 33 Minh họa lên đồ thị. Minh họa ei lên đồ thị. Mục đích của phương pháp OLS là tối thiểu hóa tổng 2 2 1 2,e e và 2 3e . Hình 2.5 Đồ thị biểu diễn giá trị ước lượng Y Hình 2.6 Đồ thị biểu diễn giá trị chênh lệch ei Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 34 Minh họa Yi lên đồ thị. Đường tuyến tính liên hệ X và Y được tính bằng phương pháp OLS là đáng tin cậy bởi vì nó tối thiểu hóa tổng bình phương các sai số. Nghĩa là nó tối thiểu hóa: 2 ie Tương đương với tối thiểu hóa:  2( )i iY Y Điều này có ba đặc điểm cơ bản: 1. Đường hồi quy đi qua điểm ( , )X Y , điểm này là trung bình các dữ liệu. 2. Tổng bình phương các sai số hay các phần dư là bằng 0. 3. Phương pháp OLS đưa ra những ước lượng "tốt nhất" phụ thuộc vào các khái niệm cũng như các điều kiện. Các Khái Niệm. Sai Số Ước Lượng Chuẩn[2] (SEE). 1 2 2 EE 2 ie S n         Hình 2.7 Đồ thị biểu diễn giá trị thực Yi Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 35 Tổng bình phương tất cả các sai lệch[3] (TSS). 2( )iTSS Y Y  Ta có: TSS = RSS + ESS. Mô hình giải thích bao nhiêu biến động của biến phụ thuộc! R2 sẽ giải quyết vấn đề này. R2 là tỉ lệ giữa tổng bình phương tất cả các sai lệch của biến giải thích với tổng bình phương tất cả các sai lệch, hay: 2 ES 1 S RSS R TSS TSS    R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao biến động của biến phụ thuộc. Nếu R2 bằng 0. Nghĩa là mô hình không đưa ra thông tin nào về biến phụ thuộc và dự đoán tốt nhất về giá trị của biến phụ thuộc là giá trị trung bình của nó. Các biến "giải thích" thực sự không đưa ra được một giải thích nào. Hình 2.8 Đồ thị biểu diễn tổng bình phương tất cả các điểm sai lệch Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 36 Minh họa lên đồ thị. Với phương pháp bình phương bé nhất ta có thể xây dựng được tọa độ điểm cần nắn chỉnh như sau: Với một điểm (x,y) ở ảnh gốc phải chuyển sang toạ độ (u,v) tương ứng ở ảnh đích. Phép chuyển đổi này là xác định mối quan hệ giữa (x,y) và (u,v) và ngược lại. Chuyển đổi ngược được biểu diễn như sau: T -1 (x,y)  u,v (1.1) Chuyển đổi thuận sẽ là: T(u,v)  x, y (1.2) Giải pháp chung là xác định cặp hàm đa thức: N N   aij Pi(x) Pj(y) i=0 j=i (1.3) N N   bij Pi(x) Pj(y) i=0 j=i Hình 2.9 Đồ thị biểu diễn sự biến động của các biến Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 37 Trong đó, hàm P thông thường là đa thức Chebychev và các tham số aij và bij được xác định bằng phương pháp bình phương bé nhất hoặc giá trị trung bình nhỏ nhất. Để xác định đa thức bậc N ta phải có ít nhất k=(N+1)(N+2)/2 điểm đặc trưng. Trong bài toán này, hệ toạ độ được sử dụng là hệ toạ độ Đề các nên chỉ cần ba hay nhiều hơn điểm đặc trưng cho đa thức bậc nhất (N=1). Quan hệ (1.1) sẽ trở thành phương pháp đa thức. T ([F(uc,vc)]k, [xc,yc]k, x, y)  u,v (1.4) Trong đó, cặp (uc , vc) và (xc, yc) là cặp toạ độ biểu diễn trường của các điểm đặc trưng và (N+1)(N+2)/2  k. Biến đổi Affine sáu tham số hay được sử dụng để mô hình hoá biến đổi từ vị trí toạ độ ảnh gốc sang vị trí ảnh đích. Hình thức của chúng như sau: u = 0 x + 1 y + 2 v = 3 x + 4 y + 5 Trong đó, (x,y) là điểm ở ảnh gốc cần ánh xạ sang ảnh đích. (u ,v) là toạ độ ảnh đích. Các hệ số  được ước lượng bằng phương pháp bình phương tối thiểu. Giả sử ta đã chọn n điểm đặc trưng trên ảnh gốc và ảnh đích, các giá trị  được tính toán như sau: Đặt: 1 1; i n i n i i i i x y x y n n        ; 1 1 2 2 1 1 ( )( ) ( )( ) ; và ( ) ( ) i n i n i i i i i i i n i n i i i i x x y y x x y y p q y y x x                           -1 N Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 38 Ta có: 1 0 1 2 1 ( )( ) 1 ( ) i n i i i i i n i i x x u x q x x                1 1 1 2 1 1 ( )( ) ( )( ) ( ) ( )( ) i n i n i i i i i i i i n i n i i i i i y y u x q x x y y y y q x x y y                              2 0 1 1 1 ( ) i n i i i u x x x y n           1 1 3 2 1 1 ( )( ) ( )( ) ( ) ( )( ) i n i n i i i i i i i i i n i n i i i i i x x v y p y y v y x x p x x y y                              1 4 3 2 1 ( )( ) 1 ( ) i n i i i i i n i i y y v y p y y                5 4 2 1 1 ( ) i n i i i v y y y y n           Phương pháp này rất hiệu quả khi nắn chỉnh các vùng có diện tích không lớn. Tuy nhiên không có giải pháp nào để xác định kích thước vùng đó là bao nhiêu là phù hợp với phép biến đổi này mà chỉ phụ thuộc vào kinh nghiệm và thực nghiệm. Nếu ảnh gốc có các mặt cần nắn chỉnh lớn thì chia thành các vùng nhỏ hơn và thực hiện biến đổi riêng rẽ từng vùng con này. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 39 Để có được kết quả như vậy, ta cần có các phép biến đổi toạ độ của các điểm ảnh, cụ thể theo thuật toán thì ta biến đổi toạ độ (x,y) thành (u,v). có thể thể hiện bằng hình ảnh như sau: Thực chất của việc biến đổi toạ độ x, y là thực hiện kéo x đi một góc α khi đó: x = u + T*v , y = v Khi kéo y đi một góc α thì x = u , y = v + T*u Kết quả kéo sẽ được : x= fx(u,v) , y= fy(u,v) Nắn chỉnh Ảnh nguồn Ảnh đích Hình 2.10 Ảnh gốc và ảnh bị nắn chỉnh Hình 2.11 Nắn chỉnh bằng cách biến đổi tọa độ các điểm ảnh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 40 Thuật toán có thể viết như sau: For ( int u= 0; u< umax; u++) { For (int v=0; v<vmax; v++) { Float x = fx(u,v); Float y=fy(u,v); Dst (x,y) = Src (u,v); } } Kết quả của thuật toán: Như đã nói ở thuật toán trên trước khi để nắn chỉnh được ảnh gốc thì ta cần xác định được các cặp điểm đặc trưng. Đây là bước đầu tiên cũng là bước quan trọng trong nắn chỉnh ảnh. Ảnh nguồn Ảnh đích Hình 2.12 Mô tả sự biến đổi của tọa độ các điểm ảnh Hình 2.13 Mô tả kết quả thuật toán biến đổi Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 41 2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector Trong trường hợp trên giữa các điểm điều khiển không có sự ràng buộc nào. Khi các điểm đặc trưng được xác định sao cho chúng tạo thành từng cặp điểm, tức là các vector, ta sẽ có phương thức nắn chỉnh trên cơ sở các vector. a. Chuyển đổi với một cặp vector Xét trường hợp chỉ có một cặp vector: PQ trên ảnh đích và P’Q’ trên ảnh nguồn. Khi đó với mỗi điểm X trên ảnh đích, điểm X’ tương ứng với X trên ảnh nguồn được tính như sau: 2 2 . . ( ) PX PQ u PQ PX perpendicular PQ V PQ         Đặt ' 'A B = perpendicular( ' 'P Q  ) )''()''('' ABvPQuPX  Trong đó: Perpendicular() trả lại vector vuông góc, cùng chiều dài với vector vào. Hướng của perpendicular() có thể chọn một trong hai hướng: Nếu quay perpendicular() một góc 900 theo chiều kim đồng hồ quanh gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng của vector vào. Nếu quay perpendicular() một góc 900 ngược chiều kim đồng hồ quanh gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng của vector vào. Nếu đã chọn hướng nào thì trong suốt quá trình thực hiện biến đổi phải tuân theo hướng đã chọn. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 42 Giá trị u thể hiện chiều dài của đoạn thẳng và v là khoảng cách tới đường thẳng. Giá trị của u tăng từ 0 đến 1 khi điểm ảnh tiến từ P đến Q và nhỏ hơn 0 hoặc lớn hơn 1 thì sẽ vượt qua vùng giới hạn. Giá trị của v là khoảng cách từ điểm ảnh đến đoạn thẳng. Nếu có một cặp vector thì thuật toán biến đổi được cho như sau: Với mỗi điểm ảnh X trên ảnh đích: Tìm cặp giá trị tương ứng (u,v) Tìm điểm X’ trên ảnh nguồn dựa trên (u,v) vừa xác định ImgDestination.X = ImgSource.X’ Hình 2.15 minh hoạ cho thuật toán, cách tìm điểm X’ khi biết PQ, P’Q’ và điểm ảnh X. Trong đó ảnh góc trên bên trái là ảnh gốc, các ảnh còn lại là các ảnh kết quả với đoạn thẳng được xác định tương ứng. Hình 2.14 Cặp đoạn thẳng đơn Hình 2.15 Một số kết quả minh họa của thuật toán Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 43 b. Chuyển đổi với nhiều cặp vector Biến đổi với nhiều cặp vector sẽ phức tạp hơn so với một cặp vector. Trong thuật toán này chúng ta sẽ tính toán thêm các giá trị weight cho sự biến đổi của từng vector. Mỗi điểm X’ sẽ được tính toán cho từng cặp vector. Độ dịch chuyển Di=Xi’-X đo sự sai khác giữa vị trí của điểm ảnh nguồn và đích. Một trọng số dựa trên những độ dịch chuyển này sẽ được tính toán. Trọng số này sẽ được xác định bởi khoảng cách từ X đến vector. Giá trị trọng số này được thêm với X để xác định điểm X’ cần lấy trên ảnh nguồn. Trường hợp vector đơn sẽ là một trường hợp đặc biệt của trường hợp nhiều vector nếu như giá trị weight không bao giờ là 0 tại mọi điểm trên ảnh. Giá trị weight là lớn nhất nếu điểm ảnh nằm đúng trên vector và sẽ là bé nhất nếu nó nằm xa vector nhất. Công thức tính weight được cho như sau: ( ) b plength W a dist        Trong đó: Length là chiều dài của vector, dist là khoảng cách từ điểm ảnh đến vector, a, b, p là các hằng số dùng để thay đổi quan hệ giữa các vector. Nếu a tiến tới 0 và dist đúng bằng 0 thì weight tiến tới vô cực. Khi đó điểm ảnh nằm trên vector gốc sẽ được ánh xạ đúng đến vị trí tương ứng trên vectơ đích. Giá trị a lớn sẽ cho kết quả nắn chỉnh tốt hơn (trơn hơn). Giá trị b thể hiện sự tác động của chiều dài vector đến các điểm ảnh. Nếu b lớn thì điểm ảnh chỉ bị tác động bởi một vector có khoảng cách đến nó ngắn nhất. Nếu b=0 thì điểm ảnh sẽ bị tác động như nhau đối với mọi vector. Giá trị hay sử dụng của b là [0.5;2]. Giá trị của p là [0;1]. Nếu p = 0 thì tất cả các weight không phụ thuộc vào chiều dài vector. Nếu p=1 thì vector nào dài hơn sẽ có weight lớn hơn. Thuật toán được cho như sau: For mỗi điểm X trên ảnh đích DSUM=(0,0) Weightsum =0 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 44 For mỗi vector PiQi Tính u, v dựa trên Pi,Qi Tính X’i dựa trên u,v và Pi’Qi’ Di=Xi’-X dist = khoảng cách từ X tới PiQi weight= ((lengthp)/(a+dist))b DSUM=DSUM+Di*weight weightsum=weightsum+weight X’=X+DSUM/weightsum ImgDestination.X=ImgSource.X’ Hình 2.16 là một minh hoạ cho việc tính toán điểm X’ trên cơ sở biết X và các cặp vector tương ứng. Hình 2.16 Nhiều cặp vector Hình 2.17 Kết quả của thuật toán Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 45 Với kỹ thuật vector khi thực hiện bóp méo một hình ảnh thì hình ảnh không còn ở trạng thái ban đầu nữa, tuy nhiên khi các tọa độ ánh xạ sang ảnh đích thì một số pixel ảnh sẽ không thể ánh xạ sang được, vì vật sẽ khó khăn cho việc chuyển đổi màu của ảnh. Việc xác định lại màu sắc cho ảnh lại phải sử dụng đến thuật toán tô màu (theo làn, theo dòng,..). Nhưng để sử dụng được các thuật toán này thì việc tìm tọa độ của các điểm ảnh là rất quan trọng. Hình 2.18 cho thấy khi bóp méo ảnh thì tọa độ thay đổi phụ thuộc vào hàm chuyển đổi f, hàm này có thể được xác định bằng thuật toán vector như đã trình bày ở trên. 2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới 2.4.1. Xây dựng hàm biến đổi Hàm biến đổi được trình bày sau đây sẽ chỉ ra cách thức xác định tất cả các điểm tương ứng với từng điểm ảnh thuộc ảnh A có khung lưới là Ma trong ảnh N có khung lưới là Mb. Đây là công việc cần thiết khi thực hiện nắn chỉnh một ảnh hay đối tượng ảnh bất kỳ. Công việc này được tiến hành qua hai giai đoạn: quét ngang và quét dọc. Do hai giai đoạn này được thực hiện tương tự nhau nên chúng ta chỉ trình bày đại diện một giai đoạn là giai đoạn quét ngang. Hình 2.18 Tọa độ ảnh thay đổi khi bóp méo x = fx(u,v) y = fy(u,v) Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 46 Giả sử khung lưới Ma và Mb của hai ảnh A và B như hình vẽ: Ở giai đoạn quét ngang chúng ta sẽ chỉ quan tâm đến các đường B- Spline dọc trên cả hai ảnh và xếp chồng chúng với nhau. Chú ý rằng có một sự tham chiếu một - một giữa các đường B-Spline dọc này. Chúng ta sẽ quét từng dòng ngang từ trên xuống dưới, với mỗi dòng quét ngang chúng ta sẽ xác định giao của nó với các đường B-Spline. Các bước cần làm đối với đường quét ngang có phương trình y=a được xác định như sau (xem minh hoạ trong hình 2.20): Xây dựng một hệ trục toạ độ hai chiều.  Xây dựng các điểm, mỗi điểm này nhận giá trị hoành độ giao điểm của đường quét ngang với các đường B - Spline của ảnh A làm hoành độ và hoành độ giao điểm với đường B-Spline tương ứng với nó trên ảnh B làm tung độ.  Xây dựng một đường cong đi qua tất cả các điểm này. Hình 2.19 Khung lưới B-Spline của hai ảnh Hình 2.20 Xác định các điểm tương đương cho mỗi dòng quét Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 47  Đường cong trong hình 2.20 là ánh xạ hoành độ của các điểm có tung độ là a của hai ảnh A và B. Với cách xác định tọa độ điểm như thuật toán khung lưới thì ta có thể xác định được tọa độ của các điểm ảnh khi ánh xạ sang ảnh đích. Theo công thức cosi thì tọa độ đó có thể xác định theo công thức sau: Quay một góc Θ : x = ucosΘ - vsinΘ y = usinΘ + vcosΘ Mô tả bằng hình ảnh như sau: 2.4.2. Nhận xét kết quả  Đây là thuật toán có chất lượng đầu tiên, tuy nhiên nó cũng chưa thật tốt.  Thời gian chạy tương đối lâu do phải làm việc với các đường cong phức tạp là B-Spline.  Cần nhiều tương tác của người sử dụng trong việc xây dựng khung lưới.  Trong nhiều trường hợp mô hình khung lưới không phù hợp. 2.5. Xây dựng khung nắn chỉnh Vấn đề đặt ra ở đây là phải xác định được các cặp mặt tương ứng giữa ảnh gốc được chụp vào cần nắn chỉnh và ảnh đích. Cũng giống như việc xác Quay 300 Hình 2.21 Cách xác định tọa độ mới Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 48 định các cặp điểm đặc trưng, ta chưa có một phương pháp hiệu quả nào để cho phép tự động nhận biết các mặt này. Vì thế không còn phương pháp nào khác là nhờ sự trợ giúp của con người một cách thủ công. Việc xác định các mặt đồng nghĩa với việc chia ảnh thành các vùng đa giác mà các đỉnh của đa giác là các điểm đặc trưng. Thực tế người ta cũng có thể nắn chỉnh được mà không cần bước xác định các mặt của đối tượng cần nắn chỉnh. Vì trên cơ sở các điểm đặc trưng đã chọn, dùng phương pháp nội suy dựa trên lưới tam giác và tập các điểm đặc trưng là tìm ra ngay được công thức biến đổi đối với mỗi điểm ảnh cần nội suy. Tuy nhiên sẽ gặp phải một số khó khăn sau:  Khối lượng tính toán tăng lên. Bởi vì: Đối với mỗi điểm ảnh bất kỳ cần nội suy thì ta phải xét ảnh hưởng của tất cả các điểm đặc trưng của ảnh đối với điểm đó. Nghĩa là, một điểm ảnh của vùng này thực chất chỉ cần xét sự ảnh hưởng của các điểm đặc trưng thuộc vùng đó đến nó nhưng làm theo cách không phân vùng thì phải xét đến cả những điểm đặc trưng của các vùng còn lại.  Việc nội suy thiếu chính xác. Do đó hiệu quả nắn chỉnh không cao. Chính vì những nhược điểm trên khi không định nghĩa rõ ràng các mặt cần nội suy nên ở đây sẽ sử dụng phương pháp chia ảnh thành các vùng cần nội suy riêng biệt nhằm mục đích xây dựng khung cho đối tượng cần nắn chỉnh. 2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC 2.6.1. Các mô hình nắn chỉnh trong IrasC Nói chung mục đích của quá trình nắn là chuyển đổi các ảnh quét đang ở toạ độ hàng cột của các pixel về toạ độ trắc địa (toạ độ thực - hệ toạ độ địa lý hoặc toạ độ phẳng). Đây là bước quan trọng nhất trong quá trình thành lập ảnh số vì nó ảnh hưởng tới toàn bộ độ chính xác của ảnh sau khi được số hoá Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 49 dựa trên nền ảnh. Quá trình này được dựa trên toạ độ của các điểm khống chế ảnh, toạ độ của các điểm khống chế tương ứng trên file.dgn và mô hình được chọn để nắn. Các mô hình nắn được viết sẵn trong phần mềm IrasC. Phần mềm IrasC nhằm phục phụ các thao tác xử lý ảnh raster, cho phép hiển thị, xử lý nâng cao chất lượng hình ảnh và xuất ra các dữ liệu raster phục vụ cho các ứng dụng khác nhau. Phần mềm này cho phép xử lý ảnh hàng không, vệ tinh hoặc bất kì loại dữ liệu dạng raster đã được quét và lưu trữ dưới dạng tệp tin. Các điểm ảnh trong các tệp tin này được hiển thị với phạm vi màu rộng và độ đậm nhạt khác nhau. Có thể hiển thị đơn sắc (đen trắng), ảnh đa phổ màu hoặc ảnh tổ hợp màu. * Mô hình Hermert: Là mô hình chuyển đổi tuyến tính có khả năng hiệu chỉnh được sự xoay, sự dịch chuyển, tỷ lệ chiều dài trên hai trục x và y là một hằng số. Phép lấy mẫu trong mô hình này là tự lựa chọn. Mô hình nắn chuyển này chỉ sử dụng nắn file quét từ bản đồ, tuy nhiên cũng ít được sử dụng: * Mô hình Affine: Là mô hình chuyển đổi tuyến tính có khả năng hiệu chỉnh sự xoay, sự dịch chuyển nghiêng và tỷ lệ. Mô hình chuyển đổi này thường được áp dụng khi nắn file quét từ bản đồ. Phép lẫy mẫu trong mô hình này là tuỳ chọn. * Mô hình Projective: Là mô hình chuyển đổi theo nguyên lý hình học chiếu, tức là áp và gắn một hệ thống lưới không song song vào một hệ thống lưới song song. Mô hình chuyển đổi này thường áp dụng cho ảnh hàng không. Phép lấy mẫu trong mô hình này là bắt buộc. * Polynomial Equations: Là mô hình chuyển đổi xây dựng trên các công thức toán học phức tạp. Mô hình chuyển đổi này được phân thành nhiều bậc khác nhau trên cơ sở số mũ cao nhất của các đa thức chuyển đổi bậc hai, bậc ba, bậc bốn và bậc năm. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 50 2.6.2. Quá trình nắn chỉnh ảnh Quá trình nắn ảnh được tiến hành qua các bước sau: - Mở file.dgn: Được mở trong môi trường MicroStation khi dùng để nắn ảnh cần thoả mãn các yêu cầu sau: + File.dgn được tạo trên cơ sở file seed để được khai báo chuẩn về hệ thống toạ độ + Toàn bộ các tham số khác như đơn vị đo độ dài, đo góc... đơn vị đo trên toạ độ phẳng, toạ độ địa lý được khai báo rõ ràng và đầy đủ - Thu thập các điểm khống chế vào file.dgn: Sau khi mở hoặc tạo file mới, ta lần lượt nhập các điểm khống chế toạ độ. - Mở hiển thị file ảnh - Lựa chọn phương pháp nắn ảnh: Modul IrasC cung cấp cho người sử dụng bảy phương pháp nắn, ta có thể chọn phương pháp nắn phù hợp từ nút tuỳ chọn Model trong hộp hội thoại Residual. Sau khi chọn xong phương pháp nắn, kết quả nắn sẽ được xuất ra File*.itm, ta cần ghi file này vào bộ nhớ để tiện xử lý sau này - Lựa chọn phương pháp lẫy mẫu: Đối với phương pháp nắn được lựa chọn là phi tuyến tính thì việc lẫy mẫu là bắt buộc còn đối với phương pháp nắn là tuyến tính thì việc lẫy mẫu là tuỳ chọn. - Tiến hành nắn ảnh: Sau khi chọn xong phương pháp lấy mẫu ta sẽ tiến hành nắn ảnh. Quá trình nắn được tiến hành theo hai bước là nắn sơ bộ và nắn chính xác. + Nắn sơ bộ được lựa chọn theo phương pháp nắn Affine hoặc Project. Trong sản xuất hiện nay người ta thường hay sử dụng phương pháp nắn Affine vì theo như phương pháp này thì khi nắn ta chỉ cần nắn ba điểm cũng có thể đạt độ chính xác cần thiết Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 51 + Nắn chính xác được lựa chọn theo phương pháp nắn Affine vì phương pháp nắn này cho độ chính xác rất cao. Số lượng điểm cần nắn tối đa là 25 điểm gồm 4 điểm mấu khung, các mắt lưới và các điểm dàn trải đều trên khung bản đồ. - Đánh giá sai số của các điểm khống chế của các điểm thu nhận: Sai số vị trí toạ độ và vị trí trên ảnh của các điểm khống chế. - Lưu file ảnh: Sau khi thực hiện các sửa đổi trên ảnh như điều chỉnh độ sáng tối và tương phản xoay ảnh, ghép ảnh, nắn ảnh, ta sẽ lưu ảnh sửa đổi vào file ảnh gốc đã mở. * Với phần mềm nắn chỉnh, các bước cụ thể như sau: - Mở ảnh bằng phần mềm. Người sử dụng cần cập nhật toạ độ thực (toạ độ ảnh) của điểm khống chế để kết thúc việc chọn điểm khống chế thứ nhất. - Tiến hành các bước chọn điểm khống chế như vậy cho tới khi số lượng điểm khống chế đạt yêu cầu kỹ thuật. - Khi số lượng điểm khống chế đạt 4 điểm trở lên, sai số trung bình RMS sẽ được chương trình tính toán tự động cho mỗi điểm và cho tập hợp điểm. Sai số này được hiển thị. Trong trường hợp này độ chính xác tối thiểu cho việc nắn chỉnh hình học cần đạt phải nhỏ hơn hoặc bằng 1.0, tương đương với sai số vị trí cực đại là một pixel ảnh. Các điểm khống chế phải được chọn ở những vị trí ít có biến đổi như ngã ba đường, hoặc địa vật rõ nét như toà nhà. - Sau khi lựa chọn các điểm khống chế, hiển thị danh sách các điểm khống chế người sử dụng có thể xem lại các vị trí điểm khống chế đã chọn trên ảnh bằng cách chọn điểm đó trong danh sách. - Đôi khi một số điểm khống chế có sai số lớn quá thì người sử dụng có thể thay đổi lại vị trí điểm bằng cách chọn điểm đó trên ảnh rồi Update. Giá Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 52 trị toạ độ (hàng - cột) mới sẽ được cập nhật tức thời và sai số RMS cũng sẽ được tính toán lại. - Người sử dụng có thể xoá điểm khống chế có sai số lớn bằng cách chọn điểm khống chế rồi xóa. - Trong trường hợp không muốn xoá điểm khống chế nhưng loại bỏ điểm này khỏi danh sách tính toán, và nắn chỉnh ảnh, người sử dụng có thể “giấu” điểm đó đi. - Ngược lại với thao tác này, người sử dụng có thể nạp lại các điểm khống chế đã lựa chọn trước đây từ file đã lưu. - Để bắt đầu việc nắn chỉnh hình học ảnh, chương trình sẽ hiển thị để người sử dụng lựa chọn ảnh cần nắn. - Khai báo phương pháp nắn Warp Method theo bậc 1, 2 hoặc 3; lựa chọn tên tập tin lưu ảnh sẽ nắn. Nếu bộ nhớ được chọn, ảnh kết quả sẽ được lưu tạm trong bộ nhớ của máy và sẽ bị xoá đi khi kết thúc chương trình sau đó người dùng có thể bắt đầu quá trình nắn ảnh. - Kết quả chất lượng của ảnh phụ thuộc rất nhiều vào công đoạn lựa chọn điểm khống chế ảnh. Để hạn chế sai số, thông thường, các điểm khống chế được lựa chọn sao cho chúng phân bố đều trên toàn bộ diện tích sẽ nắn, đồng thời, bao phủ được tới đường biên (theo khung hình) của ảnh. Sai số sẽ chọn điểm nắn RMS Error càng nhỏ thì độ chính xác của kết quả sẽ càng cao. Tổng số điểm khống chế cho một cảnh ảnh tối thiểu phải từ 15 điểm. Lựa chọn bậc nắn ảnh là 2. - Sau khi kết thúc quá trình nắn ảnh, ảnh mới đã nắn sẽ được lưu vào một tập tin (như trong trường hợp đang trình bầy, có thể thấy, với sai số RMS Error = 0.931164, ảnh kết quả đạt độ chính xác khá cao. Các đối tượng trên ảnh trùng khít với nhau. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 53 - Khi phải ghép nhiều cảnh ảnh với nhau để tạo một ảnh lớn hơn, các ảnh thành phần cần được nắn chỉnh hình học từ trước. Ảnh sau khi đã nắn chỉnh hình học có thể được sử dụng trong việc phân loại giải đoán các đối tượng hoặc tạo bình đồ ảnh cho khu vực Phương trình chuyển đổi toạ độ có dạng: Bậc 1: x’ = a0 + a1x + a2 y, (1) y’ = b0 + b1y + b2 y Bậc 2: x’ = c0 + c1x + c2y + c3xy + c4x2 + c5y2, (2) y’ = d0 + d1x + d2y + d3xy + d4x2 + d5y2, Bậc 3: x’ = g0 + g1x + g2y + g3xy + g4x2 + g5y2 + g6xy2 + g7xy2 + g8x3+ g9y3 (3) y’=h0+h1x+ h2y + h3xy + h4x2 + h5y2 + h6xy2 + h7xy2 + h8x3+h9y3 Trong đó, x’, y’ là toạ độ của ảnh chưa nắn, x,y là toạ độ của ảnh nắn. a0... h9 là các hệ số của phương trình chuyển đổi. Tóm lại: Trong khi một ảnh có thể bị thay đổi với nhiều cách khác nhau. Nắn chỉnh có thể hiều là ta đi thay đổi các điểm ảnh bằng việc ánh xạ từ điểm ảnh này tới điểm ảnh khác mà không thay đổi màu sắc. Điều này có thể dựa vào các thuật toán có sẵn như thuật toán nội suy, thuật toán tô màu,..bản thân các pixel ảnh có thể được thay đổi bằng việc ánh xạ. Nếu các chức năng là song ánh thì có thể thay đổi ngược lại với các ảnh nguồn. Các phương pháp nắn chỉnh cho thấy: Hình ảnh bị bóp méo có thể mô phỏng bằng quang học Hình ảnh có thể được xem nếu chiếu lên một bề mặt cong hoặc được nhân đôi (điều này thường được thấy rõ khi kéo giãn hình ảnh) . Hình ảnh có thể được phân chia thành từng đa giác và đa giác méo. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 54 Hình ảnh có thể được sử dụng phương pháp nội suy. Có ít nhất hai cách được sử dụng để tạo ra một hình ảnh bằng cách lựa chọn bất kỳ một phương pháp bóp méo nào: - Cách 1: Phương pháp chuyển tiếp (lập bản đồ): một bản đồ có thể có được từ cách chuyển tiếp các hình ảnh từ vệ tinh sau đó thực hiện nắn chỉnh và nội suy. - Cách 2: Ước tính loại cong vênh diễn ra giữa những hình ảnh liên tiếp. Có thể sử dụng các kỹ thuật dự đoán luồng quang học. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 55 Chương 3 ỨNG DỤNG NẮN CHỈNH BIẾN DẠNG Như đã nói trong chương 2. Các phương pháp nắn chỉnh đều cho ra hình ảnh sau nắn chỉnh có chất lượng khá tốt. Ứng với mỗi điểm của ảnh gốc đều tìm được vị trí tương ứng của nó bên ảnh đích. Sau khi điều này được thực hiện với tất cả các điểm cần xét ở ảnh gốc thì ảnh đích thu được có hình hài thoả mãn điều kiện đầu bài yêu cầu nhưng có nhiều điểm trong ảnh đích chưa có điểm nào từ ảnh gốc ánh xạ sang nên các điểm đó vẫn mang mầu nền. Những điểm ở ảnh đích mà không có điểm ảnh ở ảnh gốc ánh xạ sang gọi là những “lỗ hổng”. vì vậy chúng ta phải sử dụng thêm thuật toán tô màu và thuật toán nội suy để nhằm lấp đi những khuyết điểm sau khi nắn chỉnh. Vậy hình ảnh sau khi nắn chỉnh sẽ có hình dạng như ban đầu nhờ vào các phương pháp nắn chỉnh như phương pháp bình phương bé nhất,…Sau đây chúng ta đi vào ứng dụng cụ thể của một vài phương pháp nắn chỉnh ảnh nói chung và phương pháp bình phương bé nhất nói riêng. Đó là đi nắn chỉnh một cuốn sách. 3.1. Nắn chỉnh một cuốn sách Đối tượng cần nắn chỉnh là ảnh của một cuốn sách (đối tượng có dạng hình hộp) được chụp vào sao cho nhìn thấy được ba mặt của nó (dưới dạng hình 3D). Công việc cần nắn chỉnh là: - Nắn chỉnh các mặt của cuốn sách (vật hình hộp) sao cho sau khi nắn chỉnh các mặt của cuốn sách không bị cong (có dạng hình bình hành), các mép không bị nhăn và hình ảnh của các mặt nhìn rõ hơn. - Sau khi nắn chỉnh các mặt, áp dụng các kỹ thuật làm đẹp ảnh để thu được ảnh có mầu sắc, đường nét rõ và đẹp hơn. Yêu cầu đặt ra là: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 56 Ta mong muốn các mặt của sách sau khi nắn chỉnh sẽ là các hình bình hành. Vì thế phải có một mẫu ảnh làm khung để biến đổi ảnh ban đầu về hình dạng như mẫu đã chọn. Mẫu ảnh làm khung phải thỏa mãn: Là khung của một hình hộp có hình dạng gần với hình dạng của cuốn sách. Được thu nhận vào ở tư thế nhìn thấy ba mặt tương ứng với ba mặt của cuốn sách. Có kích thước không sai khác nhiều so với kích thước của cuốn sách. Ba mặt của cuốn sách (hình hộp) chụp vào sẽ được nắn chỉnh thành ba mặt tương ứng của một hình hộp có kích thước tương tự. Như vậy, vấn đề đặt ra là phải xác định được các cặp mặt tương đương giữa sách và hình hộp, công việc này dựa vào thuật toán xác định các điểm đặc trưng chúng ta đã trình bày ở chương 2 của luận văn. Cũng giống như việc xác định các cặp điểm đặc trưng, ta chưa có một phương pháp hiệu quả nào để cho phép tự động nhận biết các mặt của cuốn sách. Vì thế không còn phương pháp nào khác là nhờ sự trợ giúp của con người một cách thủ công. Việc xác định các mặt đồng nghĩa với việc chia ảnh thành các vùng đa giác mà các đỉnh của đa giác là các điểm đặc trưng. Trong bài toán cụ thể này ta phải xác định được ba đa giác tương ứng với ba mặt của cuốn sách. Hình 3.1 Ảnh gốc và mô hình khung mẫu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 57 Thực tế người ta cũng có thể nắn chỉnh được mà không cần bước xác định các mặt của nó. Vì trên cơ sở các điểm đặc trưng đã chọn, dùng phương pháp nội suy dựa trên lưới tam giác và tập các điểm đặc trưng là tìm ra ngay được công thức biến đổi đối với mỗi điểm ảnh cần nội suy (các phương pháp nội suy đã trình bày ở chương 2 của luận văn). Tuy nhiên, nếu làm như vậy đối với bài toán cụ thể này thì sẽ gặp phải một số khó khăn đó là khối lượng tính toán sẽ tăng lên, việc nội suy thiếu chính xác do hiệu quả nắn chỉnh không cao. Vì thế khi nắn chỉnh cuốn sách trong luận văn đã trình bày rất rõ việc tìm các mặt đặc trưng dựa vào thuật toán tìm điểm đặc trưng. Sau khi nắn chỉnh, hình ảnh của cuốn sách sẽ có hình dạng giống như khung mẫu, các khuyết điểm như cong vênh, lỗ hổng sẽ không còn. Để cuốn sách trở nên đẹp và rõ nét hơn có thể làm trơn ảnh bằng phương pháp nội suy, khi đó ta thu được hình ảnh cuốn sách như mong muốn. Hình 3.2 Xác định các điểm đặc trưng trên ảnh và khung mẫu Hình 3.3 Ảnh gốc và ảnh được nắn chỉnh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 58 3.2. Giới thiệu chương trình 3.2.1. Mô tả các chức năng trong chương trình 3.2.1.1. Chức năng quản lý các Style (ảnh mẫu) Chức năng này trong phần mềm cài đặt đã đưa ra một số khung ảnh làm mẫu nắn chỉnh. Người dùng phải chọn khung làm mẫu cho phù hợp mới có thể thực hiện nắn chỉnh một cách chính xác. Các bước thực hiện như sau: B1: Mở một ảnh làm mẫu đã có sẵn. B2: Tạo các điểm đặc trưng để định nghĩa khung đối tượng bằng việc tạo các điểm đặc trưng tương ứng trên khung ảnh làm mẫu . B3: Định nghĩa các mặt nhìn thấy của đối tượng trong ảnh. Ở đây phải định nghĩa 3 mặt của cuốn sách hoặc hình hộp. Mỗi mặt được xác định bởi bốn điểm đặc trưng tương ứng với bốn góc của mặt. B4: Lưu mẫu vừa định nghĩa: lưu ảnh mẫu cùng với các điểm đặc trưng. Các Style được lưu có phần mở rộng là sty. Vì vậy mà ta có chức năng quản lý style. 3.2.1.2. Chức năng quản lý các điểm đặc trưng Như đã nói đến ở chương 2. Để thực hiện nắn chỉnh được ảnh gốc, thì ta phải tìm ra được các điểm đặc trưng. Các điểm đặc trưng ảnh hưởng trực tiếp đến chất lượng nắn chỉnh. Vì vậy việc quản lý các điểm đặc trưng là cần thiết. B1: Thêm các điểm đặc trưng vào ảnh cần nắn chỉnh (ảnh gốc). Hình 3.4 Ảnh nắn chỉnh và được làm trơn Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 59 B2: Xoá một điểm đặc trưng bất kỳ trong ảnh cần nắn chỉnh. B3: Xoá tất cả các điểm đặc trưng. B4: Thay đổi toạ độ điểm đặc trưng bằng cách kéo thả chuột hoặc điều khiển bàn phím. B5: Thay đổi mầu điểm đặc trưng để nó không bị lấp bởi mầu nền. Khi đã thực hiện đủ các bước như trên, phần mềm cho phép thực hiện nắn chỉnh một cách tự động dựa vào thuật toán xác đinh điểm đặc trưng, và thực hiện nắn chỉnh. 3.2.1.3. Chức năng nâng cao chất lượng ảnh Nâng cao chất lượng ảnh là chức năng phụ trong chương trình, chức năng này cho phép tạo ra ảnh sau nắn chỉnh có chất lượng tốt. Trong chương 2 ta đã giới thiệu phương pháp nội suy nhằm nâng cao chất lượng ảnh sau khi nắn chỉnh. Như đã biết sau nắn chỉnh, một số điểm ảnh khi ánh xạ không ánh xạ được hết sang ảnh đích, nên trong ảnh thu được có hiện tượng vỡ hạt gây ra các lỗ hổng. Nội suy sẽ giúp lấp các lỗ hổng, làm cho ảnh đẹp hơn, mịn hơn. Trong phần mềm ta đã chỉ ra 2 phương pháp nội suy đó là nội suy tam giác và nội suy song tuyến tính, nhưng trong phần mềm do hạn chế về thời gian và hạn chế về mặt kiến thức, tác giả mới chỉ đưa ra được phương pháp nội suy tam giác có sử dụng hệ tọa độ Barycentric. 3.2.1.4. Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh Chức năng này cho phép ta ghi trạng thái phiên làm việc ra đĩa hoặc tải thông tin từ đĩa lên. Các thông tin này bao gồm: ảnh mẫu (style) và các ảnh cần nắn chỉnh, tập các điểm đặc trưng và một số thông tin về tuỳ chọn. Các file làm việc có phần mở rộng là wrk. Các chức năng gồm có: B1: Tạo một phiên làm việc mới bằng cách mở một ảnh gốc và mở chọn một Style đã được định nghĩa trước đó. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 60 B2: Ghi lại trạng thái làm việc lên file cũ. B3: Sao chép trạng thái phiên làm việc ra một file khác. B4: Mở file. Trong chức năng lưu file ảnh người dùng có thể tự do đặt tên file, và đặt đường dẫn mà không cần phải chỉ rõ. Ngài ra trong chương tình cài đặt còn nhiều chức năng khác, nhưng chức năng chủ yếu trong chương trình vẫn là chức năng quả lý style và chức năng quản lý các điểm đặc trưng. 3.2.2. Giao diện chính của chương trình - Khởi động chương trình Microsoft Visual Basic 6.0 - Chạy file chương trình ứng dụng nắn chỉnh xuất hiện giao diện Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 61 - Mở ảnh nguồn (ảnh cần nắn chỉnh): C:\Ungdung_nanchinhanh\work\ - Mở form khung mẫu để nắn chỉnh: C:\Ungdung_nanchinhanh\work\ Tệp dữ liệu ảnh gốc Tệp khung form mẫu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 62 - Giao diện trước khi nắn chỉnh - Giao diện khi thực hiện nắn chỉnh Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 63 3.2.3. Kết quả của một số chức năng trong chương trình Hình 3.5 Ảnh gốc và ảnh được nắn chỉnh Hình 3.6 Ảnh nắn chỉnh và được làm trơn Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 64 KẾT LUẬN Một vài năm trở lại đây công nghệ thông tin cùng với sự phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải trí… có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải qua. Trong sự phát triển chung đó, xử lý ảnh cũng là ngành khoa học phát triển với tốc độ vượt bậc. Người ta đã tìm ra nhiều kỹ thuật xử lý cho phép thay đổi, quay ảnh, phóng to, thu nhỏ… mà hình ảnh vẫn đẹp và trông rất tự nhiên. Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình hay nói cách khác là bị biến dạng đi. Vì thế đề tài thực hiện miêu tả quá trình nắn chỉnh hình học của một đối tượng vật thể được thực hiện. Trong đề tài thực hiện việc hiệu chỉnh hình ảnh ba chiều bị biến dạng khi thu nhận, tức là thực hiện nắn chỉnh hình học các loại ảnh 3 chiều, nhằm đưa các ảnh này về trạng thái ban đầu, tức là trạng thái khi chưa bị biến dạng. Tuy nhiên do hạn chế về mặt tìm tài liệu, hạn chế về mặt kiến thức của bản thân và hạn chế về thời gian. Nên trong luận văn em mới chỉ thực hiện đưa được các ảnh mẫu, các khung mẫu đã có sẵn vào phần mềm, chứ phần mềm không tự tạo ra được các khung cần nắn chỉnh. Kỹ thuật mà đề tài đề xuất gồm 2 pha chính: Nắn chỉnh hình dạng. Biểu diễn bề mặt. Các kỹ thuật đề xuất đã được cài đặt trong phần mềm BookMorphing. Hướng phát triển của đề tài: Do trong đề tài cong nhiều mặt hạn chế nên đề tài còn nhiều hướng mở như: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 65 Tìm hiểu cách để quản lý style (tạo các style) ngay trong phần mềm mà không phải thực hiện thủ công. Tìm hiểu phương pháp để xử lý hàng loạt ảnh đầu vào cùng lúc với một mẫu chọn trước dựa trên cơ sở sự tương đương về hình dạng của các ảnh đầu vào. Tìm hiểu phương pháp để mở rộng phạm vi các đối tượng được áp dụng. Điều này là có thể thực hiện được vì như đã phân tích ở trên, một đối tượng bất kỳ đều có hai thành phần: khung và bề mặt. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 66 TÀI LIỆU THAM KHẢO [1] Lương Mạnh Bá, Nguyễn Thanh Thủy, “Nhập môn xử lý ảnh số”, NXB khoa học và kỹ thuật. [2] Lê Thị Thủy (2004), "Nắn chỉnh hình học và ứng dụng trong sách thương mại điện tử", Khóa luận tốt nghiệp đại học - Trường ĐH Hồng Đức Thanh Hóa, 2004. [3] Lương Chi Mai, Huỳnh Thị Thanh Bình, “Nhập môn đồ họa máy tính”, NXB khoa học và kỹ thuật. [4] Đặng Văn Đức, “Hệ thống thông tin địa lý”, NXB KH&KT, 2001. [5] Greg Hunetneys (2003), “Image Warping, Compositing and Morphing”, University of Veginia, CS 445. [6] Hermann Birkholz, Dietmar Jackel, “Image Warping with Feature Curves”, Departmentof Computer, University of Rostock, Germany. [7] Michael Hoch, Georg Fleischmann, Bernd Girod (1994), “Modeling and Animation of Facial Expressions based on B-Splines”, Dept. Computer Science/ Audio-Visual Media, University Erlangen-Nuremberg, Germany. [8] T. Beier, B. Costa, L. Darsa, L. Velho, “Warping and Morphing of Graphical Objects”, SIGGRAPH, 1997. [9] [10] Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 67 MỤC LỤC MỞ ĐẦU ...................................................................................................... 1 Chương 1. KHÁI QUÁT VỀ XỬ LÝ VÀ NẮN CHỈNH ẢNH.................. 3 1.1. Khái quát về xử lý ảnh ............................................................................ 3 1.2. Một số khái niệm cơ bản trong xử lý ảnh ................................................ 4 1.2.1. Ảnh số ............................................................................................. 4 1.2.2. Điểm ảnh ......................................................................................... 4 1.2.3. Mức xám (gray level) ....................................................................... 4 1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số ............. 5 1.3. Các vấn đề chung liên quan đến xử lý ảnh số ......................................... 6 1.3.1. Xử lý ảnh mức thấp ......................................................................... 6 1.3.2. Những khó khăn khi xử lý ảnh số .................................................... 7 1.4. Ứng dụng của hệ thống xử lý ảnh ........................................................... 8 1.5. Quá trình xử lý ảnh số .......................................................................... 10 1.6. Các thành phần cơ bản của hệ thống xử lý ảnh ..................................... 14 1.7. Nắn chỉnh biến dạng ............................................................................. 16 1.7.1. Khái niệm nắn chỉnh biến dạng ..................................................... 16 1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng ....... 17 1.7.3. Các điểm đặc trưng để nắn chỉnh ................................................... 19 1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng .............. 19 Chương 2. MỘT SỐ KỸ THUẬT NẮN CHỈNH BIẾN DẠNG HÌNH HỌC .... 27 2.1. Nắn chỉnh trên cơ sở phân vùng ảnh ..................................................... 27 2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng ........................................ 31 2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector .............................................. 41 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 68 2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới ................................................ 45 2.4.1. Xây dựng hàm biến đổi ................................................................. 45 2.4.2. Nhận xét kết quả ........................................................................... 47 2.5. Xây dựng khung nắn chỉnh ................................................................... 47 2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC ........................ 48 2.6.1. Các mô hình nắn chỉnh trong IrasC ............................................... 48 2.6.2. Quá trình nắn chỉnh ảnh ................................................................ 50 Chương 3. ỨNG DỤNG NẮN CHỈNH BIẾN DẠNG .............................. 55 3.1. Nắn chỉnh một cuốn sách ...................................................................... 55 3.2. Giới thiệu chương trình ........................................................................ 58 3.2.1. Mô tả các chức năng trong chương trình ....................................... 58 3.2.1.1. Chức năng quản lý các Style (ảnh mẫu) .............................. 58 3.2.1.2. Chức năng quản lý các điểm đặc trưng ................................ 58 3.2.1.3. Chức năng nâng cao chất lượng ảnh .................................... 59 3.2.1.4. Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh ............ 59 3.2.2. Giao diện chính của chương trình .................................................. 60 3.2.3. Kết quả của một số chức năng trong chương trình ......................... 63 KẾT LUẬN ................................................................................................ 64 TÀI LIỆU THAM KHẢO .......................................................................... 66 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 69 DANH MỤC CÁC HÌNH Hình 1.1: Mô phỏng quá trình biến đổi hình học ......................................... 9 Hình 1.2: Các thành phần chính của hệ thống xử lý ảnh ............................ 14 Hình 1.3: Ví dụ về nắn chỉnh biến dạng ..................................................... 17 Hình 1.4: Phép co và giãn ảnh ................................................................... 21 Hình 1.5: Minh họa phép co và giãn ảnh ................................................... 22 Hình 1.6: Kết quả phép co và giãn ảnh ...................................................... 23 Hình 1.7: Kết quả phép mở và đóng ảnh .................................................... 23 Hình 1.8: Sử dụng phép toán HitAndMiss để tìm góc lồi của một ảnh ....... 25 Hình 1.9: Tìm kiếm xương ảnh .................................................................. 25 Hình 1.10: Ví dụ về phép toán làm gầy ảnh ................................................ 26 Hình 2.1: Hệ toạ độ Barycentric ................................................................ 29 Hình 2.2: Tìm tất cả các điểm thuộc tam giác theo dòng quét .................... 30 Hình 2.3: Nội suy tam giác ........................................................................ 31 Hình 2.4: Phép nội suy Bilinear ................................................................. 31 Hình 2.5: Đồ thị biểu diễn giá trị ước lượng Y .......................................... 33 Hình 2.6: Đồ thị biểu diễn giá trị chênh lệch ei .......................................... 33 Hình 2.7: Đồ thị biểu diễn giá trị thực Yi ................................................... 34 Hình 2.8: Đồ thị biểu diễn tổng bình phương tất cả các điểm sai lệch ........ 35 Hình 2.9: Đồ thị biểu diễn sự biến động của các biến ................................ 36 Hình 2.10: Ảnh gốc và ảnh bị nắn chỉnh ...................................................... 39 Hình 2.11: Nắn chỉnh bằng cách biến đổi tọa độ các điểm ảnh .................... 39 Hình 2.12: Mô tả sự biến đổi của tọa độ các điểm ảnh ................................. 40 Hình 2.13: Mô tả kết quả thuật toán biến đổi ............................................... 40 Hình 2.14: Cặp đoạn thẳng đơn ................................................................... 42 Hình 2.15: Một số kết quả minh họa của thuật toán ..................................... 42 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 70 Hình 2.16: Nhiều cặp vector ........................................................................ 44 Hình 2.17: Kết quả của thuật toán................................................................ 44 Hình 2.18: Tọa độ ảnh thay đổi khi bóp méo ............................................... 45 Hình 2.19: Khung lưới B-Spline của hai ảnh ............................................... 46 Hình 2.20: Xác định các điểm tương đương cho mỗi dòng quét .................. 46 Hình 2.21: Cách xác định tọa độ mới ........................................................... 47 Hình 3.1: Ảnh gốc và mô hình khung mẫu ................................................ 56 Hình 3.2: Xác định các điểm đặc trưng trên ảnh và khung mẫu ................. 57 Hình 3.3: Ảnh gốc và ảnh được nắn chỉnh ................................................. 57 Hình 3.4: Ảnh nắn chỉnh và được làm trơn ................................................ 58 Hình 3.5: Ảnh gốc và ảnh được nắn chỉnh ................................................. 63 Hình 3.6: Ảnh nắn chỉnh và được làm trơn ................................................ 63

Các file đính kèm theo tài liệu này:

  • pdf17LV09_CNTT_PhamDucHau.pdf
Tài liệu liên quan