KẾT LUẬN
Báo cáo đã trình bày những khái niệm tổng quan về giấu tin, cho thấy được
tầm quan trọng của giấu tin trong đời sống hiện nay.
Trong thời gian nghiên 4 tháng, nhóm nghiên cứu đã đạt được các kết quả sau:
Nắm rõ được khái niệm tổng quan về kỹ thuật giấu tin trong ảnh
Kỹ thuật nén ảnh JPEG2000
Kỹ thuật giấu tin trên miền biến đổi rời rạc wavelet cặp tần số giữa
Đề xuất kỹ thuật giấu cải tiến trên miền tần số Wavelet của miền
tần số cao (HL, LH) dựa trên kỹ thuật giấu đã công bố đối trên các hệ số
DWT đã được lượng tử hoá cho ảnh JPEG2000.
Cài đặt, thử nghiệm và đánh giá kết quả.
Vì thời gian nghiên cứu có hạn lên chưa xây dựng được giao diện chương
trình thân thiện với người dùng, giao diện chương trình còn thực hiện trên cửa sổ dòng lệnh.
Hướng nghiên cứu tiếp theo sẽ nghiên cứu tiếp một số kỹ thuật giấu tin
khác như: QIM, MFP.và hoàn thiện cài đặt đóng gói thành một phần mềm chuyên dụng.
43 trang |
Chia sẻ: linhlinh11 | Lượt xem: 868 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Kỹ thuật phát hiện thông tin ẩn giấu trong ảnh jpeg2000, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
HIỆN ẢNH CÓ GIẤU TIN TRÊN MIỀN
TẦN SỐ GIỮA DWT ........................................................................................ 25
4.1. Tổng quan về kỹ thuật phát hiện tin ẩn giấu trong ảnh (Steganalysis) .... 25
4.2. Với kỹ thuật giấu 1 ................................................................................... 26
4.3. Với kỹ thuật giấu 2 ................................................................................... 26
CHƢƠNG 5. CÀI ĐẶT THỬ NGHIỆM......................................................... 27
5.1. Môi trƣờng cài đặt .................................................................................... 27
5.2. Thử nghiệm .............................................................................................. 28
KẾT LUẬN ........................................................................................................ 36
TÀI LIỆU THAM KHẢO ................................................................................ 37
LỜI CẢM ƠN
Chúng em xin chân thành cảm ơn hội đồng khoa Công Nghệ Thông Tin,
hội đồng khoa học trường Đại Học Dân Lập Hải Phòng đã tạo điều kiện để
chúng em thực hiện tốt đề tài nghiên cứu khoa học.
Chúng em xin chân thành cảm ơn cô giáo: Ths. Hồ Thị Hương Thơm –
giảng viên khoa công nghệ thông tin trường ĐHDL Hải Phòng, đã tận tình
hướng dẫn và chỉ đạo chúng em trong suốt thời gian nghiên cứu đề tài.
Cuối cùng, chúng mình xin cảm ơn tất cả các bạn đồng môn đã động viên,
góp ý và trao đổi hỗ trợ cho chúng mình trong suốt thời gian nghiên cứu vừa
qua.
Vì thời gian nghiên cứu chỉ có hạn, trình độ hiểu biết của bản thân chúng
em còn nhiều hạn chế. Cho nên trong đề tài không tránh khỏi những thiếu sót,
chúng em rất mong được sự góp ý quý báu của tất cả các thầy cô giáo cũng như
các bạn để đề tài của chúng em được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!
Hải Phòng, ngày 14 tháng 8 năm 2009
Nhóm thực hiện
Phạm Thị Quỳnh
Phạm Thị Thu Trang
LỜI MỞ ĐẦU
Môi trƣờng mạng Internet phát triển rộng rãi cùng với sự hỗ trợ của các
phƣơng tiện đa truyền thông đã đem lại nhiều thuận lợi và cơ hội cho con ngƣời
trên mọi lĩnh vực của đời sống xã hội, trong giao lƣu, hợp tác, kinh doanh, ...
Nhƣng đồng thời nó cũng nhƣ đặt ra nhiều thách thức trong việc đảm bảo tính
an toàn cho các thông tin đƣợc truyền giao qua các phƣơng tiện truyền thông
nhƣ: nguy cơ sử dụng trái phép, xuyên tạc bất hợp pháp thông tin lƣu chuyển
trên mạng. Việc sử dụng một cách bình đẳng, an toàn các dữ liệu đa phƣơng tiện
cũng nhƣ cung cấp một cách kịp thời tới nhiều ngƣời dùng cuối và các thiết bị
cuối cũng là một vấn đề quan trọng.
Hơn nữa, sự phát triển mạnh của các phƣơng tiện kỹ thuật số đã làm cho
việc lƣu trữ, sửa đổi và sao chép dữ liệu ngày càng đơn giản, từ đó việc bảo vệ
bản quyền và chống xâm phạm trái phép các dữ liệu đa phƣơng tiện (âm thanh,
hình ảnh, tài liệu) cũng gặp nhiều khó khăn. Một công nghệ mới đƣợc ra đời đã
phần nào giải quyết đƣợc các khó khăn trên là giấu thông tin trong các nguồn đa
phƣơng tiện nhƣ các nguồn âm thanh, hình ảnh, ảnh tĩnh. Mục tiêu của giấu
thông tin là làm cho thông tin trở nên vô hình, từ đó khiến ta không thể thấy
đƣợc đối tƣợng.
Trong những năm gần đây, giấu thông tin trong ảnh là một bộ phận chiếm
tỷ lệ lớn nhất trong các chƣơng trình ứng dụng, các phần mềm, hệ thống giấu tin
trong đa phƣơng tiện bởi lƣợng thông tin đƣợc trao đổi bằng ảnh là rất lớn. Nó
đóng vai trò rất quan trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin
nhƣ: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền của tác
giảThông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay
đổi và không ai biết đƣợc đằng sau nó mang những thông tin có ý nghĩa. Ngày
nay, khi ảnh số đã đƣợc sử dụng rất phổ biến thì giấu thông tin trong ảnh đã đem
lại nhiều những ứng dụng to lớn trên hầu hết các lĩnh vực trong đời sống xã hội.
Giấu thông tin là một kỹ thuật còn tƣơng đối mới và đang phát triển rất
nhanh thu hút đƣợc sự quan tâm của cả giới khoa học và giới công nghiệp nhƣng
1
cũng còn rất nhiều thách thức. Bản báo cáo này trình bày về một kỹ thuật giấu
thông tin trong ảnh JPEG2000.
Nội dung của đề tài đƣợc trình bày trong 5 chƣơng:
Chƣơng 1: Tổng quan về kỹ thuật giấu tin trong ảnh
Chƣơng 2: Chuẩn nén ảnh tĩnh dựa trên biến đổi WAVELET-JPEG2000
Chƣơng 3: Phƣơng pháp giấu thủy vân dựa vào cặp tần số giữa DWT
Chƣơng 4: Vấn đề phát hiện ảnh có giấu tin trên miền tần số giữa DWT
Chƣơng 5: Cài đặt thử nghiệm
2
CHƢƠNG 1. TỔNG QUAN Kỹ THUẬT GIẤU TIN
1.1. Định nghĩa giấu tin
Giấu tin là một kỹ thuật giấu hoặc nhúng một lƣợng thông tin số nào đó
vào trong một đối tƣợng dữ liệu số khác (giấu tin nhiều khi không phải là hành
động giấu cụ thể mà chỉ mang ý nghĩa quy ƣớc).
1.2. Mục đích của giấu tin
Có 2 mục đích của giấu thông tin:
- Bảo mật cho những dữ liệu đƣợc giấu.
- Bảo đảm an toàn (bảo vệ bản quyền) cho chính các đối tƣợng chứa dữ
liệu giấu trong đó.
Có thể thấy 2 mục đích này hoàn toàn trái ngƣợc nhau và dần phát triển thành
2 lĩnh vực với những yêu cầu và tính chất khác nhau.
Hình 1.1. Hai lĩnh vực chính của kỹ thuật giấu thông tin.
Kỹ thuật giấu thông tin bí mật (Steganography): với mục đích đảm bảo
tính an toàn và bảo mật thông tin tập trung vào các kỹ thuật giấu tin để có thể
giấu đƣợc nhiều thông tin nhất. Thông tin mật đƣợc giấu kỹ trong một đối tƣợng
khác sao cho ngƣời khác không phát hiện đƣợc.
Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking) có mục đích là
để bảo vệ bản quyền của đối tƣợng chứa thông tin thì lại tập trung đảm bảo một
số các yêu cầu nhƣ đảm bảo tính bền vững đây là ứng dụng cơ bản nhất của
kỹ thuật thuỷ vân số.
1.3 Mô hình kỹ thuật giấu thông tin cơ bản
Giấu thông tin vào phƣơng tiện chứa và tách lấy thông tin là 2 quá trình
trái ngƣợc nhau và có thể mô tả qua sơ đồ khối của hệ thống nhƣ sau:
3
Hình 1.2. Lƣợc đồ chung cho quá trình giấu tin
- Thông tin cần giấu tuỳ theo mục đích của ngƣời sử dụng, nó có thể là thông
điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền.
- Phƣơng tiện chứa: các file ảnh, text, audio là môi trƣờng để nhúng tin
- Bộ nhúng thông tin: là những chƣơng trình thực hiện việc giấu tin
- Đầu ra: là các phƣơng tiện chứa đã có tin giấu trong đó
Hình vẽ sau chỉ ra các công việc giải mã thông tin đã giấu.
Hình 1.3. Lƣợc đồ chung cho quá trình giải mã
1.4. Môi trƣờng giấu tin
a) Giấu tin trong ảnh
Giấu tin trong ảnh hiện đang rất đƣợc quan tâm. Nó đóng vai trò hết sức
quan trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin nhƣ: nhận thực
thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giảThông tin sẽ
đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay đổi và không ai
Thông tin giấu
Phƣơng tiện
chứa(audio, ảnh,
video)
Phƣơng tiện
chứa đã đƣợc
giấu tin
Khóa
Bộ nhúng
thông tin
Phân
phối
4
biết đƣợc đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày này, khi ảnh
số đã đƣợc sử dụng rất phổ biến thì giấu thông tin trong ảnh đã đem lại nhiều
những ứng dụng quan trọng trên các lĩnh vực trong đời sống xã hội.
b) Giấu tin trong audio
Khác với kỹ thuật giấu thông tin trong ảnh: phụ thuộc vào hệ thống thị giác
của con ngƣời – HSV (Human Vision System), kỹ thuật giấu thông tin trong
audio lại phụ thuộc vào hệ thống thính giác HAS (Human Auditory System).
Bởi vì tai con ngƣời rất kém trong việc phát hiện sự khác biệt giữa các giải tần
và công suất, có nghĩa là các âm thanh to, cao tần có thể che giấu đi đƣợc các
âm thanh nhỏ, thấp một cách dễ dàng.
c) Giấu tin trong video
Cũng giống nhƣ giấu thông tin trong ảnh hay trong audio, giấu tin trong
video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng dụng nhƣ
điều khiển truy cập thông tin, nhận thức thông tin, bản quyền tác giả
Một phƣơng pháp giấu tin trong video đƣợc đƣa ra bởi Cox là phƣơng pháp
phân bố đều. Ý tƣởng cơ bản của phƣơng pháp là phân phối tin giấu dàn trải
theo tần số của dữ liệu gốc.
d) Giấu thông tin trong văn bản dạng text
Giấu thông tin trong văn bản dạng text thì khó thực hiện hơn do có ít thông
tin dƣ thừa, để làm đƣợc điều này ngƣời ta phải biết khéo léo khai thác các dƣ
thừa tự nhiên của ngôn ngữ. Một cách khác là tận dụng các định dạng văn bản
(mã hoá thông tin vào khoảng cách giữa các từ hay các dòng văn bản).
1.5. Phân loại giấu tin theo cách thức tác động lên các phƣơng tiện
Phƣơng pháp chèn dữ liệu: Phƣơng pháp này tìm các vị trí trong file dễ bị
bỏ qua và chèn dữ liệu cần giấu vào đó, cách giấu này không làm ảnh hƣởng gì
tới sự thể hiện các file dữ liệu ví dụ nhƣ đƣợc giấu sau các ký tự EOF.
Phƣơng pháp tạo các phƣơng tiện chứa: Từ các thông điệp cần chuyển sẽ
tạo ra các phƣơng tiện chứa để phục vụ cho việc truyền thông tin đó, từ phía
ngƣời nhận dựa trên các phƣơng tiện chứa này sẽ tái tạo lại các thông điệp.
1.6. Phân loại giấu tin theo các mục đích sử dụng
Giấu thông tin bí mật: đây là ứng dụng phổ biến nhất từ trƣớc đến nay, đối
với giấu thông tin bí mật ngƣời ta quan tâm chủ yếu tới các mục tiêu:
5
+ Độ an toàn của giấu tin - khả năng không bị phát hiện của giấu tin.
+ Lƣợng thông tin tối đa có thể giấu trong một phƣơng tiện chứa cụ thể
mà vẫn có thể đảm bảo an toàn.
+ Độ bí mật của thông tin trong trƣờng hợp giấu tin bị phát hiện.
Giấu thông tin thuỷ vân: do yêu cầu bảo vệ bản quyền, xác thực nên việc
giấu tin thuỷ vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là các
dấu hiệu thuỷ vân đủ bền vững trƣớc các tấn công vô hình hay cố ý gỡ bỏ nó.
Thêm vào đó các dấu hiệu thuỷ vân phải có ảnh hƣởng tối thiểu (về mặt cảm
nhận) đối với các phƣơng tiện chứa. Nhƣ vậy các thông tin cần giấu càng nhỏ
càng tốt.
Nhƣ vậy tuỳ theo các mục đích khác nhau thuỷ vân cũng có các yêu cầu
khác nhau.
Hình 1.4. Phân loại các kỹ thuật giấu tin
Information hiding
Giấu thông tin
Watermarking
Thuỷ vân số
Visible Watermarking
Thuỷ vân hiển thị
Steganography
Giấu tin mật
Fragile Watermarking
Thuỷ vân dễ vỡ
Robust Watermarking
Thuỷ vân bền vững
Imperceptible Watermarking
Thuỷ vân ẩn
6
CHƢƠNG 2. CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI
WAVELET– JPEG2000
2.1. Khái niệm nén ảnh.
- Nén là quá trình làm giảm thông tin dƣ thừa trong dữ liệu gốc.
Hình 2.1. ảnh ban đầu(a) và ảnh sau khi nén(b)
- Nhƣ vậy, nén ảnh có thể giảm nhỏ kích thƣớc ảnh, giảm thời gian truyền và
làm giảm chi phí xử lý ảnh trong khi chất lƣợng ảnh là tốt hơn.
2.2. Sự ra đời của JPEG2000
- Để việc nén ảnh có hiệu quả hơn, tháng 12/1999 một bản phác thảo tiêu chuẩn
nén hình ảnh theo công nghệ mới JPEG2000 thay thế cho chuẩn nén ảnh tĩnh
JPEG.
- Tháng 8/2000, bản phác thảo về tiêu chuẩn JPEG2000 đã đƣợc lƣu hành trong
giới chuyên gia hình ảnh.
- 12/2000 và đƣợc ISO hợp
, phân phối.
- JPEG-2000 sử dụng kỹ thuật mã hóa dạng sóng rời rạc (DWT – Descrete
Wavelet Transform) dùng mã số học.
2.3. Các tính năng của JPEG2000
JPEG2000 nhiều chức năng đặc biệt hơn mọi chuẩn nén ảnh tĩnh khác nhƣ
JPEG hay GIF. Dƣới đây là các chức năng ƣu việt của JPEG2000 so với các
chuẩn nén ảnh tĩnh khác :
Cho chất lƣợng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.
Sử dụng đƣợc với truyền dẫn và hiển thị lũy tiến về chất lƣợng, độ
phân giải, các thành phần màu và có tính định vị không gian.
Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.
7
Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh.
Có khả năng mã hóa với tỷ lệ nén theo từng vùng khác nhau.
Nén một lần nhƣng có thể giải nén với nhiều cấp chất lƣợng tùy
theo yêu cầu của ngƣời sử dụng.
2.4. Các bƣớc thực hiện nén ảnh theo chuẩn JPEG2000
Hình 2.2. Trình tự mã hóa và giải mã JPEG2000
2.4.1. Xử lí trƣớc khi biến đổi
Do sử dụng biến đổi Wavelet, JPEG2000 cần có dữ liệu ảnh đầu vào ở dạng
đối xứng qua 0. Xử lý trƣớc biến đổi chính là giai đoạn đảm bảo dữ liệu đƣa vào
nén ảnh có dạng trên. Ở phía giải mã, giai đoạn xử lý sau biến đổi sẽ trả lại giá
trị gốc ban đầu cho dữ liệu ảnh.
2.4.2. Biến đổi liên thành phần
Giai đoạn này sẽ loại bỏ tính tƣơng quan giữa các thành phần của ảnh.
JPEG2000 sử dụng hai loại biến đổi liên thành phần là biến đổi thuận nghịch
(Reversible Color Transform - RCT) và biến đổi màu không thuận nghịch
(Irrersible Color Transform - ICT) trong đó biến đổi thuận nghịch làm việc với
các giá trị nguyên, còn biến đổi không thuận nghịch làm việc với các giá trị
thực. ICT và RCT chuyển dữ liệu ảnh từ không gian màu RGB sang YCrCb.
RCT đƣợc áp dụng cho nén có tổn thất. Việc áp dụng các biến đổi màu trƣớc khi
nén ảnh không nằm ngoài mục đích làm tăng hiệu quả nén. Các thành phần Cr,
Cb có ảnh hƣởng rất ít tới sự cảm nhận hình ảnh của mắt trong khi thành phần
độ chói Y có ảnh hƣởng rất lớn tới ảnh. Chúng ta có thể thấy rõ điều này trên
hình 2.3.
Hình 2.3. Minh họa ảnh với RGB và YcrCb
8
2.4.3. Biến đổi riêng thành phần (biến đổi Wavelet)
Biến đổi riêng thành phần đƣợc áp dụng trong JPEG2000 chính là biến đổi
Wavelet. Để đảm bảo tính toàn vẹn thông tin cũng phải áp dụng các phép biến
đổi thuận nghịch hoặc không thuận nghịch. Do phép biến đổi Wavelet không
phải là một phép biến đổi trực giao nhƣ biến đổi DCT mà là một phép biến đổi
băng con nên các thành phần sẽ đƣợc phân chia thành các băng tần số khác nhau
và mỗi băng sẽ đƣợc mã hóa riêng rẽ. JPEG2000 áp dụng biến đổi Wavelet
nguyên thuận nghịch 5/3 (IWT) và biến đổi thực không thuận nghịch
Daubechies 9/7. Việc tính toán biến đổi trong JPEG2000 này sẽ đƣợc thực hiện
thep phƣơng pháp Lifting.
Sơ đồ của phƣơng pháp Lifting ID áp dụng trong JPEG2000 trên hình 2.4.
Việc tính toán biến đổi Wavelet ID 2D suy ra từ biến đổi Wavelet ID theo các
phƣơng pháp phân giải ảnh tùy chọn. Trong JPEG2000 có 3 phƣơng pháp giải
ảnh nhƣng phƣơng pháp đƣợc sử dụng nhiều nhất là phương pháp kim tự tháp.
Hình 2.4. Phƣơng pháp Lifting 1D dùng tính toán biến đổi Wavelet
Do biến đổi Wavelet 5/3 là biến đổi thuận nghịch nên có thể áp dụng cho nén
ảnh theo cả 2 phƣơng pháp, có tổn thất và không tổn thất trong khi biến đổi 9/7 chỉ
áp dụng cho nén ảnh theo phƣơng pháp có tổn thất thông tin.
2.4.4. Lƣợng tử hóa – Giải lƣợng tử hóa
Các hệ số của phép biến đổi sẽ đƣợc tiến hành lƣợng tử hóa. Quá trình
lƣợng tử hóa cho phép đạt tỉ lệ nén cao hơn bằng cách thể hiện các giá trị biến
đổi với độ chính xác tƣơng ứng cần thiết với các mức chi tiết của ảnh cần nén.
Các hệ số biến đổi sẽ đƣợc lƣợng tử hóa theo phép lƣợng tử hóa vô hƣớng. Các
hàm lƣợng tử hóa khác nhau sẽ đƣợc áp dụng cho các băng con khác nhau và
đƣợc thực hiện theo biểu thức :
9
),(sgn]
|),(|
[),( yxU
yxU
yxV
Với ∆ là bƣớc lƣợng tử, U(x, y) là giá trị băng con đầu vào; V(x, y) là giá
trị sau lƣợng tử hóa. Trong dạng biến đổi nguyên, đặt bƣớc lƣợng tử bằng 1. Với
dạng biến đổi thực thì bƣớc lƣợng tử sẽ đƣợc chọn tƣơng ứng cho từng băng con
riêng rẽ. Bƣớc lƣợng tử của mỗi băng do đó phải có ở trong dòng bit truyền đi
để phía thu có thể giải lƣợng tử cho ảnh.
Công thức giải lƣợng tử hóa là :
U(x, y) = [V(x, y) + rsgn V(x, y)]
Với r là một tham số xác định dấu và làm tròn, các giá trị U(x, y); V(x, y)
tƣơng ứng là các giá trị khôi phục và giá trị lƣợng tử hóa nhận đƣợc. JPEG2000
không cho trƣớc r tuy nhiên thƣờng chọn r = ½.
2.4.5. Mã hóa và kết hợp dòng dữ liệu sau mã hóa
JPEG2000 theo khuyến nghị của ủy ban JPEG quốc tế có thể sử dụng nhiều
phƣơng pháp mã hóa khác nhau cũng nhƣ nhiều cách biến đổi Wavelet khác
nhau để có thể thu đƣợc chất lƣợng ảnh tƣơng ứng với ứng dụng cần xử lý. Điều
này giúp cho JPEG2000 mềm dẻo hơn nhiều so với JPEG. Việc áp dụng các
phƣơng pháp mã hóa khác nhau cũng đƣợc mở rộng sang lĩnh vực nén ảnh động
bằng biến đổi Wavelet. Trong thực tế các phƣơng pháp mã hóa ảnh đƣợc áp
dụng khi nén ảnh bằng biến đổi Wavelet cũng nhƣ JPEG2000 thì có phƣơng
pháp đƣợc coi là cơ sở và đƣợc áp dụng nhiều nhất: phƣơng pháp SPIHT và
phƣơng pháp EZW. Hiện này JPEG2000 vẫn đƣợc áp dụng mã hóa bằng 2
phƣơng pháp này và một phƣơng pháp phát triển từ 2 phƣơng pháp này là
phƣơng pháp mã hóa mặt phẳng bit. Vì thế ở đây chúng ta sẽ xem xét hai
phƣơng pháp này. Việc kết hợp dòng dữ liệu sau mã hóa của JPEG2000 thực
chất là để thực hiện các tính năng đặc biệt của JPEG2000 nhƣ tính năng ROI vv.
2.4.6. Phƣơng pháp mã hóa SPIHT
Có thể thấy rằng dù áp dụng biến đổi Wavelet nào hay cùng với nó là một
phép phân giải ảnh nào thì trong các băng con có số thứ tự thấp cũng là những
thành phần tần số cao (mang thông tin chi tiết của ảnh) trong khi những băng
con có số thứ tự cao hơn thì sẽ chứa những thành phần tần số thấp (mang thông
tin chính về ảnh). Điều đó nghĩa là các hệ số chi tiết sẽ giảm dần từ băng con
mức thấp (HH1 chẳng hạn) (ứng với thành phần tần số cao) xuống băng con mức
10
cao (ứng với thành phần tần số thấp) và có tính tƣơng tự về không gian giữa các
băng con
Ví dụ nhƣ một đƣờng biên của hình vẽ trong ảnh sẽ tồn tại ở cùng một vị trí
trên các băng con đó (tƣơng ứng với mức độ phân giải của băng con ấy).
Điều này đã dẫn tới sự ra đời của phƣơng pháp SPIHT (Set partitioning in
hierarchical trees – phƣơng pháp mã hóa phân cấp theo phân vùng). Phƣơng
pháp SPHIT đƣợc thiết kế tối ƣu cho truyền dẫn lũy tiến. Điều này có nghĩa là
tại mọi thời điểm trong quá trình giải nén ảnh theo phƣơng pháp mã hóa này thì
chất lƣợng ảnh hiển thị tại thời điểm ấy là tốt nhất có thể đạt đƣợc với một số
lƣợng bit đƣa vào giải mã tính cho tới thời điểm ấy. Ngoài ra, phƣơng pháp này
sử dụng kỹ thuật embedded coding; điều đó có nghĩa là một ảnh sau nén với
kích cỡ (lƣu trữ) lớn (tỷ lệ nén thấp) sẽ chứa chính dữ liệu sau nén của ảnh có
kích cỡ (lƣu trữ) nhỏ (tỷ lệ nén cao). Bộ mã hóa chỉ cần nén một lần nhƣng có
thể giải nén ra nhiều mức chất lƣợng khác nhau.
Giả sử gọi các pixel trong môt ảnh p cần mã hóa là pi, j. Áp dụng một phép
biến đổi Wavelet T nào đó cho các pixel trong ảnh để tạo ra các hệ số của phép
biến đổi Wavelet là ci. j. Các hệ số này tạo ra một ảnh biến đổi là C. Phép biến
đổi này đƣợc viết dƣới dạng toán tử nhƣ sau: C=T(p). Trong phƣơng pháp
truyền dẫn lũy tiến với ảnh thì bộ mã hóa sẽ bắt đầu quá trình khôi phục (giải
nén) ảnh bằng cách đặt các giá trị của ảnh khôi phục từ các hệ số biến đổi là ĉ.
Sử dụng các giá trị giải mã của các hệ số biến đổi để tạo ra một ảnh khôi phục
(vẫn chƣa áp dụng biến đổi ngƣợc Wavelet) là ĉ và sau đó áp dụng biến đổi
Wavelet để tạo ra ảnh cuối cùng là pt
với pt = T-1(ĉ).
Nguyên tắc quan trọng của phƣơng pháp truyền dẫn ảnh theo kiểu lũy tiến là
phƣơng pháp này luôn truyền đi các giá trị mang thông tin quan trọng hơn của
ảnh đi trƣớc. Sở dĩ làm nhƣ vậy là do các thông tin đó chính là các thông tin sẽ
làm giảm thiểu nhiều nhất độ méo dạng của ảnh. Đây chính là lý do tại sao
phƣơng pháp SPIHT luôn truyền đi các hệ số lớn trƣớc và cũng là một nguyên
tắc quan trọng của phƣơng pháp này. Một nguyên tắc nữa là các bit có trọng số
lớn bao giờ cũng mang thông tin quan trọng nhất trong dữ liệu nhị phân. Phƣơng
pháp SPIHT sử dụng cả 2 nguyên tắc này, nó sắp xếp các hệ số biến đổi và
11
truyền đi các bit có trọng số lớn nhất. Quá trình giải mã có thể dựng lại ở bất kì
một bƣớc nào ứng với giá trị ảnh cần mã hóa yêu cầu.
Đây chính là cách mà phƣơng pháp mã hóa SPIHT làm tổn thất thông tin.
2.4.7. Phƣơng pháp mã hóa EZW
Phƣơng pháp mã hóa EZW (Embedded Zerotree Wavelet Encoder) cũng
dựa trên cơ sở phép mã hóa lũy tiến (progressive coding) giống nhƣ phƣơng
pháp SPIHT. Phƣơng pháp này chủ yếu dựa trên khái niệm về cây zero. Về cơ
bản, thuật toán này dựa trên hai nguyên tắc nhƣ đã trình bày ở phần phƣơng
pháp mã hóa SPIHT. Sau đây là các khái niệm cơ bản của thuật toán:
Cây tứ phân: Sau khi áp dụng biến đổi Wavelet ứng với các mức phân giải
khác nhau chúng ta có thể biểu diễn các hệ số biến đổi dƣới dạng một cây. Ta
thấy rằng với cây biểu diễn này là do quá trình biến đổi Wavelet ở các tỉ lệ khác
nhau. Ta gọi đây là các cây tứ phân (quatree). Sơ đồ cây tứ phân đƣợc minh họa
ở hình 2.5.
Hình 2.5. Minh họa cây tứ phân (a) và sự phân mức (b)
Cây zero (zero tree): Cây zero là một cây tứ phân, trong đó tất cả các nút
của nó đều nhỏ hơn nút gốc. Một cây nhƣ vậy khi mã hóa sẽ đƣợc mã hóa bằng
một đối tƣợng duy nhất và khi giải mã thì chúng ta cho tất cả các giá trị bằng
không. Ngoài ra để có thể mã hóa đƣợc các hệ số Wavelet trong trƣờng hợp này,
giá trị của nút gốc phải nhỏ hơn giá trị ngƣỡng đang đƣợc xem xét ứng với hệ số
Wavelet đó.
Nguyên lý hoạt động của thuật toán: Thuật toán sẽ mã hóa các hệ số theo
thứ tự giảm dần. Chúng ta sẽ dùng một giá trị gọi là ngƣỡng và sử dụng ngƣỡng
này để tiến hành mã hóa các hệ số biến đổi. Các hệ số đƣợc mã hóa theo thứ tự
12
từ vùng tần số thấp đến vùng tần số cao. Và chỉ những hệ số có giá trị tuyệt đối
lớn hơn hoặc bằng ngƣỡng thì mới đƣợc mã hóa. Tiếp theo giảm ngƣỡng và tiếp
tục làm nhƣ vậy cho tới khi ngƣỡng đạt tới giá trị nhỏ hơn giá trị của hệ số nhỏ
nhất. Cách giảm giá trị ngƣỡng ở đây thực hiện tƣơng đối đặc biệt, giá trị của
ngƣỡng giảm xuống một nửa so với trƣớc đó. Bộ giải mã phải biết các mức
ngƣỡng này thì mới có thể giải mã ảnh thành công. Nhƣng khi ta đi từ nút cha
đến nút con trong cây tứ phân thì nó vẫn có 3 nút con. Vậy ta phải đi theo nhánh
có nút con nào trƣớc. Nói một cách đầy đủ hơn ta di chuyển từ hệ số này đến hệ
số khác theo thứ tự nhƣ thế nào. Có nhiều cách di chuyển khác nhau, tuy nhiên
hai cách di chuyển trên hình 2.6 đƣợc sử dụng nhiều nhất.
Việc sắp xếp này còn phải đƣợc quy ƣớc thống nhất giữa quá trình mã hóa
và quá trình giải mã để việc giải mã ảnh đƣợc thành công.
Hình 2.6. Hai cách sắp xếp thứ tự các hệ số biến đổi.
2.4.8. So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác
Một tính năng quan trọng và là ƣu điểm rõ nét nhất của JPEG2000 so với
JPEG cũng nhƣ các chuẩn nén ảnh khác nhƣ MPEG 4 VTC hay JPEG – LS
v.v là JPEG2000 đƣa ra cả 2 kỹ thuật nén có tổn thất và không tổn thất theo
cùng một cơ chế mã hóa nghĩa là JPEG2000 thực hiện tất cả các dạng thức của
JPEG chỉ bằng một cơ chế mã hóa duy nhất. Nếu xét về sự tồn tại của 2 kỹ thuật
này thì JPEG cũng có khả năng nén ảnh có tổn thất và không tổn thất thông tin.
Tuy nhiên với JPEG thì cơ chế mã hóa với hai dạng này là khác nhau và rất khó
để sử dụng cả hai dạng này cùng lúc cho cùng một ứng dụng. Do đó, có thể thấy
13
rằng JPEG có tính mềm dẻo hơn bất kì chuẩn nén ảnh tĩnh nào trƣớc đây. Hơn
thế, những thống kê về thực tế cho thấy với cùng một tỉ lệ nén và một loại ảnh
thì ảnh đƣợc nén bởi JPEG2000 luôn có chất lƣợng tốt hơn so với JPEG. Chúng
ta xem xét hai ảnh trên hình 2.7 để thấy rõ điều này, ảnh bên trái đƣợc nén theo
JPEG còn ảnh bên phải đƣợc nén theo JPEG2000.
Hình 2.7. So sánh JPEG và JPEG2000
Tính năng ƣu việt thứ 2 của JPEG2000 so với JPEG chính là trong dạng
thức nén có tổn thất thông tin, JPEG2000 có thể đƣa ra tỉ lệ nén cao hơn nhiều
so với JPEG. Các phần mềm nén ảnh JPEG hiện nay (kể cả Photoshop) cũng chỉ
thiết kế để có thể nén đƣợc tới tỉ lệ 41:1 nhƣng với JPEG2000 thì tỉ lệ nén có thể
lên tới 200:1. Theo công thức tính PSNR trong đơn vị dB, chúng ta có: (b là số
bit dùng biểu diễn 1 pixel trong ảnh gốc)
1
log20)(
2
b
RMSE
dBPSNR
Với 2 ảnh ở hình 2.7, sự so sánh về tham số PSNR cho trên bảng 2.1. Để
có thể so sánh dễ dàng hơn, ta xét ảnh đƣợc nén với các tỉ lệ khác nhau (đo
lƣờng bởi hệ số bit/pixel hay bpp), Tất cả các số liệu trên bảng đều cho thấy
JPEG2000 nén ảnh tốt hơn là JPEG: hơn thế hệ số PSNR mà chúng ta xét trong
bảng đƣợc đo trong hệ đơn vị logarit.
14
Bảng 2.1. So sánh JPEG và JPEG2000
Tính năng ƣu việt thứ 3 của JPEG2000 so với JPEG là chuẩn nén ảnh này
có thể hiển thị đƣợc các ảnh với độ phân giải và kích thƣớc khác nhau từ cùng
một ảnh nén. Với JPEG thì điều này là không thể thực hiện. Sở dĩ có điều này là
do JPEG2000 sử dụng kỹ thuật phân giải ảnh và mã hóa đính kèm mà chúng ta
đã nói tới ở phần mã hóa ảnh theo JPEG2000. Tính năng này là một lợi thế đặc
biệt quan trọng của JPEG2000, trong khi JPEG cũng nhƣ các chuẩn nén ảnh tĩnh
trƣớc đây phải nén nhiều lần để thu đƣợc chất lƣợng với từng lần nén khác nhau
thì với JPEG2000 ta chỉ cần nén một lần còn chất lƣợng ảnh thì sẽ đƣợc quyết
định tùy theo ngƣời sử dụng trong quá trình giải nén ảnh theo JPEG2000. Một
tính năng ƣu việt nữa của JPEG2000 là tính năng mã hóa ảnh quan trọng theo
vùng (ROI – Region ò Interest) mà chúng ta đã đề cập trong phần mã hóa ảnh
theo JPEG2000. Chất lƣợng của toàn bộ ảnh cũng đƣợc thấy rõ trên hình 2.8:
Hình 2.8. Minh họa tính năng ROI
Nhƣ chúng ta thấy trên hình 2.8, chất lƣợng của vùng ảnh đƣợc lựa chọn
tăng cao hơn khi vùng đó đƣợc áp dụng phƣơng pháp nén ảnh ROI.
15
JPEG2000 còn có một khả năng đặc biệt ƣu việt hơn JPEG, đó chính là khả
năng vƣợt trội trong khôi phục lỗi. Đó là khi một ảnh đƣợc truyền trên mạng
viễn thông thì thông tin có thể bị nhiễu, với các chuẩn nén ảnh nhƣ JPEG thì
nhiễu này sẽ đƣợc thu vào và hiển thị, tuy nhiên với JPEG2000, do đặc trƣng
của phép mã hóa có thể chống lỗi, JPEG2000 có thể giảm thiểu các lỗi này với
mức hầu nhƣ không có.
Bảng 2.2. So sánh tính năng của JPEG2000 với các chuẩn nén ảnh tĩnh khác.
16
CHƢƠNG 3. PHƢƠNG PHÁP GIẤU THỦY VÂN DỰA VÀO CẶP
TẦN SỐ GIỮA DWT
3.1. Giới thiệu
Khác so với các phƣơng pháp thủy vân cũ, ở phƣơng pháp này, thủy vân sẽ
đƣợc nhúng vào các hệ số tần số giữa bằng cách lƣợng tử hóa cặp hệ số tần số
giữa, chính là các dải LH và HL trong các hệ số DWT.
Một kỹ thuật thủy vân tốt cần đạt những yêu cầu sau:
An toàn (security): thủy vân đã nhúng vào chỉ có thể đƣợc truy nhập vào bởi
các tổ chức có quyền. Mặc dù thuật toán thủy vân đều đƣợc công bố rộng rãi cho
mọi ngƣời, nhƣng những ngƣời này nếu không có khóa bí mật sẽ không thể truy
nhập vào thủy vân trong ảnh đã đƣợc bảo vệ.
Tính vô hình (Impertibility): ngƣời xem khó có thể nhìn thấy đƣợc thủy vân
trong ảnh. Điều đó có nghĩa là sau quá trình nhúng thủy vân, chất lƣợng của ảnh
không bị suy giảm.
Trong những năm gần đây, có rất nhiều nghiên cứu về kỹ thuật thủy vân.
Trong đó, kỹ thuật thủy vân mờ rất đƣợc mọi ngƣời chú ý. Nó có điểm thuận lợi
thấy rõ là không cần ảnh gốc vẫn có thể lấy đƣợc thủy vân.
Nhìn chung các kỹ thuật thủy vân có thể chia làm 2 nhóm:
Kỹ thuật vùng không gian: nhúng tin vào các bit ít quan trọng nhất – các
bit thấp (LSB).
Kỹ thuật thay đổi vùng: phƣơng pháp này tốt hơn so với kỹ thuật vùng
không gian. Hai phƣơng pháp biến đổi: biến đổi cosin rời rạc (DCT) và biến
đổi sóng rời rạc (DWT) là 2 phƣơng pháp biến đổi quan trọng. Trong đó,
phƣơng pháp biến đổi DWT có ƣu điểm hơn hẳn. Vì DCT đƣợc tính toán một
cách độc lập trên các khối pixel nên một lỗi mã hóa sẽ gây ra sự không liên
tục giữa các khối thu đƣợc. Đó là lí do tại sao JPEG2000 tránh dùng DCT
thay vào đó nó chọn DWT. DWT sẽ thao tác trên toàn bộ ảnh. Nó có thể tách
ảnh thành các dải tần số khác nhau mà vẫn giữ đƣợc các thông tin về không
gian.Việc cân bằng giữa tính bền vững và tính vô hình có thể đƣợc thực hiện
một cách hoàn chỉnh.
Các kỹ thuật trƣớc đây chỉ bền vững trƣớc các tấn công nhƣ blurring,
sharpening và nén ảnh JPEG. Phƣơng pháp giấu thủy vân dựa vào cặp tần số
17
giữa DWT sẽ cho thấy khả năng ấn tƣợng của nó trong việc không chỉ chống lại
các tấn công thông thƣờng mà còn chống lại các loại biến đổi cấp xám. Các loại
biến đổi cấp xám khác với các tấn công khác ở chỗ chúng thƣờng không gây ra
sự suy giảm về mặt chất lƣợng ảnh. Đôi khi cân bằng histogram đƣợc sử dụng
nhƣ một quá trình nâng cao chất lƣợng ảnh. Nhƣng chúng thƣờng gây ra những
thay đổi trầm trọng về ảnh do đó chúng sẽ làm hỏng thủy vân đƣợc nhúng vào
trong ảnh. Trong báo cáo này sẽ đề cập đến mối tƣơng quan giữa các hệ số
DWT với các tấn công dạng này.
3.2. Thủy vân trong miền DWT
Việc tách wavelet có thể đƣợc thực hiện một cách dễ dàng bởi thuật toán
kim tự tháp. Bằng cách kết hợp 2 bộ lọc low-pass và high-pass, ảnh sẽ đƣợc
phân tích thành các dải: thấp-thấp (low-low LL), thấp-cao (low-high LH), cao-
thấp (high- low HL) và cao-cao (high-high HH). Để thu đƣợc các hệ số wavelet
nhỏ hơn thì dải LL sẽ đƣợc phân tách nhỏ hơn và thu đƣợc các mẫu con. Quá
trình xử lí này đƣợc thực hiện lại vài lần tùy theo yêu cầu của ngƣời dùng. Hơn
nữa, từ các hệ số DWT này, ta có thể xây dựng lại ảnh gốc. Quá trình xây dựng
này đƣợc gọi là đảo ngƣợc DWT (IDWT).
Nhìn chung, thủy vân đƣợc nhúng vào dải LL bền vững trƣớc các tấn công
nhƣng sẽ gây ra sự suy giảm về chất lƣợng ảnh. Ngƣợc lại, sự thay đổi các hệ số
wavelet cụ thể (dải HH), tin giấu dễ bị nhìn thấy và dễ bị tấn công thay đổi.
Thông thƣờng thủy vân số đƣợc nhúng vào dải tần số giữa HL hoặc LH bởi
chúng cân đối giữa hai điều trên, nghĩa là vẫn đảm bảo tính bền vững và vô hình
trƣớc mắt ngƣời.
Hình 3.1. Hai lần phân tách wavelet
18
3.2.1. Sự tƣơng quan giữa các hệ số của các dải giữa dƣới sự biến đổi cấp
xám
Các dải LH và HL đƣợc gọi là các dải ở giữa (middle bands) bởi vì chúng
chứa thông tin chi tiết về một chiều và các thông tin suy ra đƣợc của các chiều
khác. Bằng thực nghiệm ngƣời ta đã chứng minh mối quan hệ giữa các hệ số của
dải giữa với sự biến đổi cấp xám dựa vào cơ sở trực giao harr.
Hai ảnh cấp xám baboon (256 x 256) và lena (512 x 512) trong hình 3.2 thể
hiện sự khác nhau sau khi cân bằng mức xám. PSNR (peak to signal to noise
ratio) thể hiện tỉ số tín hiệu nhiễu giữa hai ảnh. PSNR đƣợc định nghĩa:
Với MSE (mean square error) là sai số bình phƣơng trung bình giữa ảnh
gốc (I) và ảnh đã biến đổi (K):
Thì PSNR đƣợc tính nhƣ sau:
MAX là giá trị lớn nhất có thể của pixel trong ảnh. Nếu ảnh đa cấp xám thì
MAX=255.
Hình 3.2. Cân bằng mức xám
19
Ảnh đã đƣợc phân tách 2 lần và chọn các dải LH2 và HL2 để kiểm tra độ
tƣơng quan giữa các hệ số trƣớc và sau khi biến đổi. Sự tƣơng quan correlation
đƣợc định nghĩa nhƣ sau:
22 )()(
))((
),(
yyxx
yyxx
yxnCorrelatio
Thông thƣờng trong các dải HL và LH, một vài hệ số có giá trị lớn sẽ đƣợc
tăng cƣờng về giá trị. Chúng đƣợc gọi là các hệ số quan trọng (significant
coefficents). Các hệ số này phù hợp để nhúng thủy vân bởi chúng bền vững
trƣớc các tấn công thông thƣờng vào ảnh. Và ở đây họ sử dụng nó để làm cơ sở
đo mối tƣơng quan. Một cặp hai dải tần số giữa chính là một cặp hệ số nằm trên
cùng một vị trí trong dải HL và LH đƣợc thể hiện trong hình 3.3. Họ dùng tỉ lệ
giữa các giá trị trƣớc và sau tấn công để chứng tỏ sự thay đổi của hệ số. Điều đó
có nghĩa là, tại vị trí (i,j):
cksbeforeattajiLHABS
ksafterattacjiLHABS
jiLHRatio
)),((
)),((
)),((
Hình 3.3 Cặp dải tần số giữa
Chúng ta có thể tính toán tỉ lệ giữa Ratio(LH2(i,j)) và Ratio(HL2(i,j)) của
¼ trong số các hệ số của ảnh Baboon sau khi cân bằng histogram. Các hệ số này
đại diện cho các hệ số quan trọng trong ảnh 3.4.
Hình 3.4. Mối quan hệ cặp dải trung gian LH2 và HL2 sau khi cân bằng Histogram
20
Dƣới các tấn công khác, sự thay đổi của cặp tần số giữa cũng thể hiện mối
tƣơng quan nhiều hơn hoặc ít hơn. Ví dụ nhƣ khi thực hiện làm mờ ảnh, giá trị
trung bình Ratio(LH2(i,j)) bằng 0,8368 và giá trị trung bình Ratio(HL2(i,j))
bằng 0,8461. Dƣới tấn công làm nét ảnh (sharpen attack), giá trị trung bình
Ratio(LH2(i,j)) của nửa lớn nhất của tất cả các hệ số là 1.2621; giá trị trung bình
Ratio(HL2(i,j)) = 0,8461.
3.2.2. Thuật toán nhúng và tách thủy vân (thuật toán 1) [1]
Ý tƣởng: sử dụng một hệ số trong cặp tần số giữa để lƣợng tử hóa hệ số
còn lại. Bƣớc lƣợng tử hóa là phần cố định của hệ số lớn hơn. Lựa chọn hệ số
nhỏ hơn để thực hiện lƣợng tử hóa (hình 3.5). 1/3 các giá trị lớn nhất của tất cả
các hệ số đƣợc lựa chọn là các hệ số quan trọng để thực hiện việc lƣợng tử hóa
này. Đối với các hệ số nhỏ sử dụng một bƣớc Step duy nhất để lƣợng tử hóa.
Hình 3.5. Lƣợng tử hóa cặp tần số dải trung gian
a. Kỹ thuật nhúng thuỷ vân
Bƣớc 1: thủy vân là 1 ảnh nhị phân. Ảnh gốc đƣợc tách thành 2 mức.
Nhúng thủy vân vào các dải LH2 và HL2. Giả sử kích thƣớc của LH2 là mxn
và của thủy vân là r x l. Thủy vân đƣợc nhúng ít nhất là [ m x n / r x l ] lần.
Bƣớc 2: ngƣỡng T của các hệ số nhỏ đặt bằng tầm quan trọng của hệ số
lớn nhất trong 1/3 các giá trị lớn nhất của tất cả các hệ số trong dải LH2 và
HL2. S (step) là khoảng cách cố định và D là số chia cố định. Thủy vân đƣợc
nhúng vào dải LH2 và HL2 cho đến khi tất cả các hệ số đều đƣợc lƣợng tử
hóa. Mỗi vị trí (i,j) đƣợc lƣợng tử hóa theo 1 bit thủy vân. Nếu bit này =1, hệ
số đƣợc làm tròn đến con số lẻ gần nhất, nếu không nó đƣợc làm tròn đến
con số chẵn gần nhất nhƣ trong hình 3.5 thể hiện.
21
For tất cả hệ số có trong dải LH2 và HL2
If ABS(HL2(i,j))<T and ABS(LH2(i,j))<T
Lƣợng tử hóa LH2(i,j) và (HL2(i,j)) bằng khoảng cách cố định S;
Else
Maxcoef=Max(ABS(HL2(i,j)), ABS(LH2(i,j)));
If Maxcoef=ABS(LH2(i,j))
Lƣợng tử hóa HL2(i,j) bằng Maxcoef/D;
Else
Lƣợng tử hóa LH2(i,j) bằng Maxcoef/D;
End if
End if
End for
Sau đó thực hiện IDWT 2 chiều để lập thành ảnh thủy vân.
b. Kỹ thuật tách thủy vân
Ảnh đƣợc phân tách thành 2 mức. Khi thủy vân đƣợc thêm vào ảnh gốc một
cách dƣ thừa, các hệ số của tần số giữa sẽ chia thành các phần., mỗi phần sẽ có
số các hệ số bằng với số bit của thủy vân. Gọi B(i,j) là các bit lấy ra đƣợc tại các
vị trí (i,j)
For tất cả hệ số trong dải LH2 và HL2
If ABS(HL2(i,j))<T and ABS(LH2(i,j))<T
B(i,j) = (LH2(i,j)/S mod 2 + và HL2(i,j)/S mod 2 )/2;
Else
Maxcoef=Max(ABS(HL2(i,j)), ABS(LH2(i,j)));
Step = Maxcoef / D;
If Maxcoef=ABS(LH2(i,j)
B(i,j) = HL2(i,j) /Step mod 2;
Else
B(i,j) = LH2(i,j) /Step mod 2;
End if
End if
End for
Một số vấn đề xảy ra khi thực nghiệm kỹ thuật này:
Ý tuởng của thuật toán trên là sau khi giấu các bit thông điệp làm cho
các hệ số luợng tử trở thành lẻ nếu bit cần thuỷ vân có giá trị 1 và thành
22
chẵn nếu bit cần thuỷ vân có giá trị 0. Khoá dùng để tách thuỷ vân chính là
các hệ số lƣợng tử chẵn lẻ. Nếu biết đƣợc bí mật này có thể dễ dàng tách
thuỷ vân đƣợc nhúng trong ảnh.
Khi thực nghiệm kỹ thuật này nhóm tác giả thấy rằng nó chỉ phù hợp
với kỹ thuật nhúng thuỷ vân trên miền biến đổi DWT sau đó nó sử dụng
biến đổi IDWT2 để lập ảnh thuỷ vân. Khó thích hợp với kỹ thuật nhúng
thuỷ vân trên miền tần số DWT đã lƣợng tử hoá của quá trình nén ảnh
JPEG2000, vì khi tách thuỷ vân trong quá trình giải nén ảnh JPEG2000,
thuỷ vân đƣợc tách không đúng với thuỷ vân ban đầu đem nhúng trong
ảnh. Điều này đƣợc giải thích nhƣ sau: do các hệ số DWT lƣợng tử trong
quá trình giải nén ảnh bị thay đổi, các hệ số DWT đƣợc khôi phục là các hệ
số thực, khi làm tròn các hệ số DWT thành số nguyên sẽ cho một số hệ số
DWT có giá trị trùng với giá trị của quá trình nén ảnh một số không trùng
với hệ số DWT ban đầu, vì vậy chỉ với một vài thay đổi nhỏ hệ số chẵn
thành hệ số lẻ có thể dẫn đến mất mát thông tin của thuỷ vân.
Ví dụ: ta có chuỗi bit sau cần thuỷ vân trong ảnh Img01.pgm
0 1 0 1 0 0 0 1 0 0 0 1 1 1 0 1 0 0 0 1 .
Ta thực hiện nén ảnh JPEG2000 cho ảnh Img01.pgm đƣợc miền DWT đã
bị lƣợng tử trƣớc khi giấu tin:
-4.548036 -4.017501 -4.724448 -5.2533717 -1.3734832 -0.09918876 -5.709606
-5.921742 -0.5623639 -0.68907404 -5.535633 -5.9311047 -0.039984897
-5.8014956 -0.05264521 -1.1272874 -0.36676776 -0.020146813 -1.7391355
-0.5642951 ...
Giá trị các hệ số DWT sau khi giấu tin
-6 -5 -6 -3 -4 -6 -6 -1 -2 0 -6 -5 -1
-1 -2 -5 -6 -6 0 -5...
Giá trị của các hệ số DWT cần khôi phục thuỷ vân
-6 -6 -6 -6 0 0 -6 -6 0 0 -6 -6 0
-6 0 0 0 0 0 0 ....
23
Từ hai vấn đề trên nhóm tác giả cải tiến thuật toán trên và nâng cao
tính bảo mật của thông điệp đuợc thuỷ vân theo thuật toán dƣới đây.
3.2.3. Thuật toán nhúng và tách thủy vân cải tiến (thuật toán 2)
Ý tƣởng: Thuỷ vân trƣớc khi đem nhúng là một chuỗi nhị phân sẽ đƣợc mã
hoá bằng một khoá KEY, sau đó đƣợc nhúng vào miền tần số giữa HL2 và LH2
của các hệ số DWT đã bị lƣợng tử hoá dựa vào một ngƣỡng Mark (Mark đƣợc
chọn thuộc miền giá trị của các hệ số DWT trên miền HL2 và LH2 sau khi đã bị
lƣợng tử bởi quá trình nén JPEG2000). Nếu chọn giá trị nhỏ hơn các hệ số DWT
đã lƣợng tử sẽ bị mất trong quá trình nén ảnh JPEG2000, điều đó sẽ dẫn đến mất
thuỷ vân nhúng trong ảnh.
a. Kỹ thuật nhúng thuỷ vân:
Bƣớc 1: Cần thủy vân 1 văn bản vào trong miền biến đổi DWT của ảnh
JPEG2000, văn bản đƣợc chuyển thành dãy nhị phân. Sau đó thuỷ vân thực
hiện mã hoá với một khoá KEY (là một chuỗi nhị phân có độ dài bằng kích
thƣớc của chuỗi nhi phân thuỷ vân) bằng phép toán XOR ta đƣợc một chuỗi
nhị phân mới B.
Ảnh gốc đƣợc tách thành 2 mức. Nhúng thủy vân vào các dải LH2 và
HL2. Giả sử kích thƣớc của LH2 là mxn và của thủy vân là l.
Bƣớc 2: Chọn Mark thuộc miền giá trị của các hệ số DWT trên miền HL2
và LH2 sau khi đã bị lƣợng tử. Đặt mark vào phần tử đầu tiên (hoặc vị trí
cuối cùng) trong mảng hệ số DWT. Thủy vân đƣợc nhúng vào dải LH2 và
HL2 cho đến khi nhúng hết các bit thuỷ vân. Các bit thuỷ vân đƣợc nhúng
vào hệ số DWT nhƣ sau: nếu bit thuỷ vân =1, hệ số đƣợc đặt bằng mark, nếu
không nó đƣợc giữ nguyên.
Thực hiện tiếp quá trình nén ảnh JPEG2000 ta đƣợc ảnh j2k đã chứa
thông điệp
b. Kỹ thuật tách thủy vân:
Giải nén ảnh j2k ta nhận các hệ số lƣợng tử DWT đã bị lƣợng tử, sử dụng
các hệ số miền tần số giữa HL2 và LH2 để tách thuỷ vân. Lấy giá trị mark tại
phần tử đầu tiên (hoặc vị trí nào đó theo quá trình giấu quy định) trong mảng hệ
số DWT của miền tần số giữa HL2 và LH2.
24
Gọi B(i,j) là các bit lấy ra đƣợc tại các vị trí (i,j). Nếu hệ số bằng mark thì
B(i,j) = 1. Nếu hệ số không bằng mark thì B(i,j) = 0. Sau đó chuỗi B đƣợc thực
hiện phép toán XOR với key để khôi phục lại chuỗi nhị phân ban đầu chuyển
ngƣợc lại văn bản đã nhúng.
Ví dụ: ta có chuỗi bit sau cần thuỷ vân trong ảnh Img01.pgm
0 1 0 1 0 0 0 1 0 0 0 1 1 1 0 1 0 0 0 1 .
Ta thực hiện nén ảnh JPEG2000 cho ảnh Img01.pgm đƣợc miền DWT đã
bị lƣợng tử trƣớc khi giấu tin:
1.4519639 1.9824992 1.2755519 0.7466281 -1.3734832 -0.09918876
0.29039386 0.07825812 -0.5623639 -0.68907404 0.4643671 0.06889546 -
0.039984897 0.19850446 -0.05264521 -1.1272874 -0.36676776 -0.020146813 -
1.7391355 -0.5642951...
Giá trị của mark= 3.0
GIA TRI CAC HE SO DWT SAU KHI GIAU TIN
Gia tri cua mark 3.0
GIA TRI CAC HE SO DWT SAU KHI GIAU TIN
1.4519639 3.0 1.2755519 3.0 -1.3734832 -0.09918876 0.29039386 3.0 -
0.5623639 -0.68907404 0.4643671 3.0 3.0 3.0 -0.05264521 3.0 -0.36676776 -
0.020146813 -1.7391355 3.0
Khôi phục thông điệp đã thuỷ vân trong ảnh
Giá trị của Mark=3.0043945 (đã bị thay đổi trong quá trình giải nén). Các hệ số
DWT có giá trị bằng 3.0 đều bị thay đổi 3.0043945.
Giá trị của các hệ số DWT cần khôi phục thuỷ vân
0.0 3.0043945 0.0 3.0043945 0.0 0.0 0.0 3.0043945 0.0 0.0 0.0 3.0043945
3.0043945 3.0043945 0.0 3.0043945 0.0 0.0 0.0 3.0043945
Các bit đƣợc khôi phục:
0 1 0 1 0 0 0 1 0 0 0 1 1 1 0 1 0 0 0 1
25
CHƢƠNG 4. VẤN ĐỀ PHÁT HIỆN ẢNH CÓ GIẤU TIN
TRÊN MIỀN TẦN SỐ GIỮA DWT
4.1. Tổng quan về kỹ thuật phát hiện tin ẩn giấu trong ảnh (Steganalysis)
Steganalysis là kỹ thuật phát hiện sự tồn tại của thông tin ẩn giấu trong
multimedia. Giống nhƣ thám mã, mục đích của Steganalysis là phát hiện ra
thông tin ẩn và phá vỡ tính bí mật của vật mang tin ẩn.
Phân tích tin ẩn giấu thường dựa vào các yếu tố sau:
- Phân tích dựa vào các đối tƣợng đã mang tin.
- Phân tích bằng so sánh đặc trƣng: So sánh vật mang tin chƣa đƣợc giấu tin với
vật mang tin đã đƣợc giấu tin, đƣa ra sự khác biệt giữa chúng.
- Phân tích dựa vào thông điệp cần giấu để dò tìm.
- Phân tích dựa vào các thuật toán giấu tin và các đối tƣợng giấu đã biết: Kiểu
phân tích này phải quyết định các đặc trƣng của đối tƣợng giấu tin, chỉ ra công
cụ giấu tin (thuật toán) đã sử dụng.
- Phân tích dựa vào thuật toán giấu tin, đối tƣợng gốc và đối tƣợng sau khi giấu
tin.
Các phương pháp phân tích có thể phân thành 3 nhóm:
- Phân tích trực quan: Thƣờng dựa vào quan sát hoặc dùng biểu đồ
histogram giữa ảnh gốc và ảnh chƣa giấu tin để phát hiện ra sự khác biệt giữa
hai ảnh căn cứ đƣa ra vấn đề nghi vấn. Với phƣơng pháp phân tích này thƣờng
khó phát hiện với ảnh có độ nhiễu cao và kích cỡ lớn.
- Phân tích theo dạng ảnh: Phƣơng pháp này thƣờng dựa vào các dạng ảnh
bitmap hay là ảnh nén để đoán nhận kỹ thuật giấu hay sử dụng nhƣ các ảnh
bitmap thƣờng hay sử dụng giấu trên miền LSB, ảnh nén thƣờng sử dụng kỹ
thuật giấu trên các hệ số biến đổi nhƣ DCT, DWT, DFT. Phƣơng pháp này rất
rộng.
- Phân tích theo thống kê: Đây là phƣơng pháp sử dụng các lý thuyết thống
kê và thống kê toán sau khi đã xác định đƣợc nghi vấn đặc trƣng. Phƣơng pháp
này thƣờng đƣa ra độ tin cậy cao hơn và đặc biệt là cho các ảnh dữ liệu lớn.
Trong phần tiếp theo sẽ trình bày một số vấn đề về phát hiện ảnh có giấu
tin trên miền biến đổi DWT đã đƣa ra trong chƣơng 3.
26
4.2. Với kỹ thuật giấu 1
Kỹ thuật này giấu chỉ cần biến đổi miền dữ liệu ảnh với hệ số DWT làm
tròn thành chẵn và lẻ. Do chƣa cài đặt đƣợc kỹ thuật này trên ảnh JPEG2000 lên
chƣa thể đƣa ra đƣợc vấn đề và phƣơng pháp phát hiện cụ thể.
4.3. Với kỹ thuật giấu 2
Kỹ thuật này giấu thông điệp trên miền DWT tần số cao HL và LH trong
quá trình nén ảnh JPEG2000. Có thể áp dụng cho kỹ thuật đánh dấu bản quyền,
nhận thực thông tin. Vấn đề phát hiện thông điệp giấu trong kỹ thuật này tƣơng
đối khó khăn vì:
- Thứ nhất các hệ số DWT là các hệ số thực lên không thể dùng thống kê
khi-bình phƣơng (POV) để phát hiện.
- Thứ hai ảnh này có PSNR trung bình là 40.53528 dB (theo thực nghiệm)
lên có tính vô hình rất cao.
- Thứ ba ngƣời tấn công phải biết hệ số Mark dùng để đánh dấu thông điệp
nhúng vào. Giá trị Mark nằm trong miền giá trị thuộc 1/3 các hệ số DWT lớn
nhất của tất cả các hệ số DWT, do đó ngƣời tấn công sẽ phải thử ...
- Thứ tƣ trong trƣờng hợp ngƣời tấn công biết hệ số Mark và tách đƣợc
thông điệp ngƣời tấn công cần phải biết khoá KEY để khôi phục đúng nguyên
gốc của thông điệp ban đầu. Nếu thông điệp đem giấu có độ dài n bit thì khoá
KEY có độ dài tƣơng tự do đó ngƣời tấn công phải thử 2n lần để tìm đúng khoá
KEY mã hoá thông điệp giấu.
Ví dụ: thông điệp đem giấu là một văn bản ”Cong hoa xa hoi” văn bản
này có 16 ký tự (cả cách trống) chuyển sang nhị phân có độ dài là 128 bit và sẽ
cần dùng một khoá KEY là một chuỗi bit nhị phân (đƣợc sinh theo kỹ thuật sinh
số giả ngẫu nhiên) có kích thƣớc bằng 128. Khi đó ngƣời tấn công phải duyệt
2
128
= 3.4028236692093846346337460743177e+38 lần để dò tìm khoá KEY.
27
CHƢƠNG 5. CÀI ĐẶT THỬ NGHIỆM
5.1. Môi trƣờng cài đặt
Ngôn ngữ cài đặt: Java là một ngôn ngữ lập trình có hiệu quả cao, cấu trúc
độc lập nên các ứng dụng của nó chỉ cần viết sao cho chạy đƣợc trên máy
ảo Java là có thể cài đặt và chạy tốt trên mọi hệ thống.
Môi trƣờng soạn thảo: Jcreator 4.5.
Môi trƣờng chạy chƣơng trình: môi trƣờng dòng lệnh của DOS.
Dƣới đây là giao diện chính của chƣơng trình:
Hình 5.1. Giao diện chƣơng trình
Giải thích dòng lệnh giấu thông tin:
java JJ2KEncoder -i image01.pgm -o anhgiautin.j2k -m in.txt -rate 2
Đối số JJ2KEncoder: là tên file chạy khởi đầu của chƣơng trình thực hiện
giấu - encoder.
Đối số -i: cho biết ảnh đầu vào (input).
Đối số image01.pgm: tên file ảnh đầu vào.
Đối số -o: cho biết ảnh đầu ra (output).
Đối số anhgiautin.j2k: tên file ảnh đầu ra.
Đối số -m: cho biết thông điệp cần giấu (message).
Đối số in.txt: tên file chứa thông điệp cần giấu.
28
Đối số rate: cho biết là thực hiện giấu hay tách lấy thông điệp. Với 1 là
thực hiện giấu.
Giải thích dòng lệnh tách thông tin:
java JJ2KDecoder –i anhgiautin.j2k -o anhkhoiphuc.pgm -m out.txt -rate 1
Đối số JJ2KDecoder: là tên file chạy khởi đầu của chƣơng trình thực hiện
tách lấy thông điệp - decoder.
Đối số -i: cho biết ảnh đầu vào (input).
Đối số anhgiautin.j2k: tên file ảnh đầu vào.
Đối số -o: cho biết ảnh đầu ra (output).
Đối số anhkhoiphuc.pgm: tên file ảnh đầu ra.
Đối số -m: cho biết thông điệp tách lấy ra đƣợc (message).
Đối số out.txt: tên file chứa thông điệp cần lấy.
Đối số rate: cho biết là thực hiện giấu hay tách lấy thông điệp. Với 2 là
thực hiện tách.
5.2. Thử nghiệm
Dƣới đây là một tập cơ sở dữ liệu ảnh gồm 100 ảnh đã đƣợc chuyển đổi
sang định dạng PGM. Các ảnh đƣợc đặt tên từ image01 đến image100.
29
30
31
32
Bảng 5.1. Tập ảnh thử nghiệm
Sử dụng phƣơng pháp thủy vân cải tiến để thực hiện giấu thông điệp
(trong hình 5.2) vào tập cơ sở dữ liệu ảnh trên với mark=3.0, ta thu đƣợc kết quả
PSNR trung bình trên 100 ảnh sau khi giấu tin là PSNRTB=40.53528 (lớn hơn
mức quy định là 40 dB, với PSNR 40dB thì mắt ngƣời không thể phân biệt
đƣợc sự khác biệt giữa 2 ảnh [5])
Hình 5.2 Thông điệp giấu
Sau khi giấu thông điệp thực hiện tách thông điệp đã giấu trên 100 ảnh
nhóm tác giả thấy rằng có đến 27 ảnh (27%) ảnh bị tách sai thông điệp gồm các
ảnh sau: image02, image11, image12, image16, image20, image21, image27,
image30, image32, image34, image37, image40, image43, image44, image47,
image49, image50, image53, image56, image57, image58, image77, image80,
image84, image85, image91, image95. Thông điệp sau khi khôi phục của các
ảnh này nhƣ sau:
33
Hình 5.3. Kết quả các thông điệp bị tách sai
Có ba ảnh bị tách sai một số ký tự của bản thông điệp là ảnh: image11 (3
ký tự), image39 (1 ký tự), image45 (2 ký tự). Thông điệp sau khi khôi phục của
các ảnh này nhƣ hình 5.4
34
Hình 5.4. Kết quả tách thông điệp của 3 ảnh image31, 39 và 48
Điều này đƣợc giải thích nhƣ sau: nhóm tác giả thấy những ảnh có độ nhiễu
tƣơng đối lớn dẫn đến giá trị của các DWT trong quá trình nén ảnh bị mất giá trị
ngƣỡng Mark (vì mark chọn xấp xỉ các hệ số bị loại bỏ), do đó quá trình giải nén
JPEG2000 không thể khôi phục đúng dữ liệu ban đầu, dẫn đến giá trị bit thông
điệp khôi phục bị sai. Vì vậy để khôi phục đúng thông điệp chúng ta cần chọn
giá Mark càng cao thì dữ liệu khôi phục càng chuẩn xác, tuy nhiên sẽ làm tăng
nhiễu tức là giá trị PSNR càng nhỏ. Vì vậy chúng ta cần chọn Mark sao cho
PSNR 40 thì vấn đảm bảo tính vô hình của thuỷ vân.
Để khôi phục đúng dữ liệu cho 26 ảnh khôi phục sai hoàn toàn và 3 ảnh sai
một số ký tự nhóm tác giả chọn lại một số giá trị của Mark nhƣ sau:
+ Với Mark = 5.0f khôi phục đƣợc thuỷ vân nhúng trong ảnh 2, 12, 20 và 3
ảnh sai một số ký tự 31, 39, 48.
+ Với Mark=7.0 khôi phục đƣợc thuỷ vân nhúng trong ảnh 16, 21, 26, 27,
47, 44, 50, 57, 77, 84, 85.
+ Với Mark =10.0 khôi phục đƣợc thuỷ vân nhúng trong ảnh 30, 34, 40, 43,
49, 53, 58, 80, 91, 95.
+ Với Mark =12.0 khôi phục đƣợc thuỷ vân nhúng trong ảnh 37
+ Với Mark =15.0 khôi phục đƣợc thuỷ vân nhúng trong ảnh 32
Sau khi thực hiện một số tấn công cân bằng histogram, sharpen, blur bằng
Corel Paint Shop Pro Photo X2 trên 10 ảnh đầu đã giấu tin ta thu đƣợc bảng kết
quả nhƣ sau:
Ảnh
(image#)
Cân bằng histogram Sharpen Blur
01 cong hoa p! hoi ûoîï·ëï}ý~{íëÿoä'/Ï ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ
03 - @ Fÿùýñùùýÿ cong hna pa hki ÿÿ••ÿÿÿÿÿùññùûùùùÿÿ
04 cong hoa xa hoi ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ
05 cong hoa xa hoi
06 nc cong hoa xa hni ±igÿ¢ì•ÿÿû•}þÿ{ÿÿÿßÿ
07 `-n cwOgÄéòsÄ2ç_WN ò8o'éÿÿÿ~ïï?ïÿÿþ•ÿý•
08 ì¨ ?Еÿàeï¶ cohg hNA 8 hna åkf´uùÿèçÿûõÿûßÜ•º
09 c/ne hoa a hoi ÷ol•áþ_ó jyîøï{=Ž "
10 Ão.g hea xa ho) o•nw-ïï|q<ý koï7 ;ÿÿ?ÿÿïÿ;ÿÿÿÿÿïÿÿÿÿÿÿï
11 aEli ËA ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ
Từ bảng ta thấy đây là thuỷ vân kém bền vững đối với tấn công làm mờ
(blur), bền vững yếu đối với tấn công cân bằng histogram và mài sắc cạnh
(sharpe) chỉ 4/10 ảnh bền vững với 2 loại tấn công này.
35
Vì vậy kỹ thuật này rất phù hợp đối với nhận thực bản quyền và chống
xuyên tạc, mọi hình thức thanh đổi nào cũng có thể dẫn đến vỡ thuỷ vân trong
ảnh.
36
KẾT LUẬN
Báo cáo đã trình bày những khái niệm tổng quan về giấu tin, cho thấy đƣợc
tầm quan trọng của giấu tin trong đời sống hiện nay.
Trong thời gian nghiên 4 tháng, nhóm nghiên cứu đã đạt đƣợc các kết quả
sau:
Nắm rõ đƣợc khái niệm tổng quan về kỹ thuật giấu tin trong ảnh
Kỹ thuật nén ảnh JPEG2000
Kỹ thuật giấu tin trên miền biến đổi rời rạc wavelet cặp tần số giữa
Đề xuất kỹ thuật giấu cải tiến trên miền tần số Wavelet của miền
tần số cao (HL, LH) dựa trên kỹ thuật giấu đã công bố đối trên các hệ số
DWT đã đƣợc lƣợng tử hoá cho ảnh JPEG2000.
Cài đặt, thử nghiệm và đánh giá kết quả.
Vì thời gian nghiên cứu có hạn lên chƣa xây dựng đƣợc giao diện chƣơng
trình thân thiện với ngƣời dùng, giao diện chƣơng trình còn thực hiện trên cửa
sổ dòng lệnh.
Hƣớng nghiên cứu tiếp theo sẽ nghiên cứu tiếp một số kỹ thuật giấu tin
khác nhƣ: QIM, MFP...và hoàn thiện cài đặt đóng gói thành một phần mềm
chuyên dụng.
37
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Xuân Huy và Trần Quốc Dũng, “Giáo trình giấu tin và thuỷ vân
ảnh”, Thông tin tƣ liệu, ĐHKHTN, 2003
[2]. Quan Yuan, Hongxun Yao, Wen Gao, Sanghyun Joo, “Blind watermarking
method based on DWT middle frequency pair”, Multimedia and Expo, 2002.
ICME '02. Proceedings, 2002 IEEE International Conference on paper 473- 476
vol.2, 2002.
[3]. Website:
[4].
[5]. Đỗ Ngọc Anh, NÉN ẢNH SỬ DỤNG BIẾN ĐỔI WAVELET VÀ ỨNG
DỤNG TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƢƠNG TIỆN DI ĐỘNG,
Luận văn cao học ĐTVT 2004 – 2006, Đại học Bách khoa Hà Nội.
Các file đính kèm theo tài liệu này:
- 19.PhamThiQuynh_CT901.pdf