Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

6 trang phuongnguyen 4350

Download

Bạn đang xem tài liệu "Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

mot_phuong_phap_tra_cuu_anh_dua_vao_do_tuong_tu_nhan_thuc.pdf

Nội dung text: Một phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức

Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Cơng nghệ thơng tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: 10.15625/vap.2015.000181 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC Vũ Văn Hiệu1, Nguyễn Hữu Quỳnh2, Ngơ Quốc Tạo3 1 Khoa Cơng nghệ Thơng tin, Trường Đại học Hải Phịng 2 Khoa Cơng nghệ Thơng tin, Trường Đại học Điện lực 3Viện Cơng nghệ thơng tin, Viện Hàn lâm Khoa học và Cơng nghệ Việt Nam hieuvvdhhp@gmail.com, quynhnh@epu.edu.vn, nqtao@ioit.ac.vn TĨM TẮT - Trong các hệ thống tra cứu ảnh dựa vào nội dung, các kết quả trả về thường khơng thỏa mãn nhu cầu thơng tin của người dùng. Cĩ hạn chế này là do: (1) ảnh truy vấn khơng biểu diễn được đầy đủ nhu cầu thơng tin của người dùng, (2) các đặc trưng mức thấp khơng phản ánh được thơng tin ngữ nghĩa của ảnh và (3) hàm khoảng cách kết hợp với các đặc trưng khơng thể hiện được nhận thức của người dùng. Để khắc phục hạn chế đĩ, chúng tơi đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong khơng gian đặc trưng. Chúng tơi đã thực nghiệm trên cơ sở dữ liệu ảnh gồm 10.800 ảnh. Các kết quả thực nghiệm chỉ ra rằng kỹ thuật này cải tiến được hiệu năng của hệ thống tra cứu ảnh dựa vào nội dung so với phương pháp đã cĩ và cho kết quả gần với nhận thức của người dùng. Từ khĩa - Tra cứu ảnh dựa vào nội dung, tương tự nhận thức, véc tơ đặc trưng. I. GIỚI THIỆU Các truy vấn lựa chọn “Top-k” đang trở nên phổ biến trong nhiều ứng dụng cơ sở dữ liệu hiện đại. Khơng như các hệ cơ sở dữ liệu quan hệ truyền thống, ở đĩ một truy vấn gồm một điều kiện lựa chọn chính xác và người dùng kỳ vọng nhận lại tập các đối tượng thỏa mãn chính xác điều kiện, trong các truy vấn lựa chọn “Top-k”, người dùng chỉ rõ các đối tượng mục tiêu và khơng kỳ vọng nhận lại các đối tượng thỏa mãn chính xác điều kiện. Kết quả của các truy vấn này là một danh sách các đối tượng được xếp hạng theo thứ tự giảm dần của độ tương tự với truy vấn người dùng. Do bản chất chủ quan của các truy vấn “Top-k”, các đối tượng trả về bởi hệ thống so với truy vấn người dùng thường khơng thỏa mãn nhu cầu thơng tin của người dùng ngay lập tức [1, 2, 3]. Điều này là do một số lý do: các ảnh truy vấn ban đầu khơng phải là các ảnh tốt nhất để biểu diễn nhu cầu thơng tin của người dùng hoặc các đặc trưng mức thấp khơng phản ánh được thơng tin ngữ nghĩa của ảnh hoặc hàm khoảng cách kết hợp với các đặc trưng khơng thể hiện được nhận thức của người dùng. Quá trình này được gọi là điều chỉnh truy vấn và truy vấn mới được gọi là “truy vấn điều chỉnh”. Trong tra cứu ảnh dựa vào nội dung, người dùng điều chỉnh truy vấn bằng việc tìm trong số các ảnh được trả về, một hoặc nhiều ảnh mà gần với những gì người dùng mong muốn [4, 5, 6]. Dựa trên phản hồi của người dùng, hệ thống sẽ tính các ảnh truy vấn mới và các trọng số mới và thực hiện truy vấn điều chỉnh. Một cách khác để điều chỉnh truy vấn là người dùng điều chỉnh các trọng số của các đặc trưng một cách thủ cơng để biểu diễn tốt nhất nhận thức về độ tương tự của người dùng [6]. Trong cả hai trường hợp, người dùng cĩ thể tiếp tục điều chỉnh truy vấn trên nhiều vịng lặp cho đến khi thỏa mãn với các kết quả. Các nghiên cứu gần đây chỉ ra rằng các kỹ thuật điều chỉnh truy vấn cải tiến đáng kể chất lượng của tập kết quả và tập kết quả cải tiến qua các lần lặp phản hồi [7, 8]. Giới hạn của nhiều cách tiếp cận dựa vào đặc trưng đã cĩ đĩ là giới hạn người dùng đối với một đặc trưng đơn được sử dụng cho tra cứu [8]. Các hệ thống hỗ trợ các truy vấn đa đặc trưng cung cấp các cơ chế đặc biệt cho người dùng để chỉ ra độ quan trọng trong các đặc trưng [5, 9, 10]. Độ tương tự tồn bộ giữa một đối tượng và ảnh truy vấn được tính tốn bằng tổng cĩ trọng số các độ tương tự trên tập đặc trưng. Cĩ một số hạn chế đối với một cách tiếp cận như thế [1, 2, 3]. Nĩ đặt quá nhiều gánh nặng lên người dùng khi xây dựng nhu cầu thơng tin chính xác. Người dùng cĩ thể khĩ biểu diễn truy vấn của họ dưới dạng các đặc trưng được cung cấp do ban đầu họ cĩ thể khơng cĩ ý tưởng rõ ràng về nhu cầu thơng tin. Với hạn chế thứ nhất và thứ hai khi người dùng gửi ảnh truy vấn ban đầu khơng phải là các ảnh tốt nhất để biểu diễn nhu cầu thơng tin của người dùng và các đặc trưng mức thấp khơng phản ánh được thơng tin ngữ nghĩa của ảnh. Hơn nữa, cĩ thể cĩ sự khơng phù hợp giữa nhận thức của người dùng về các thuộc tính trực quan và các biểu diễn đặc trưng được sử dụng cho tra cứu. Những người dùng khác nhau cĩ thể cĩ nhận thức khác nhau về khái niệm tương tự giữa các thuộc tính ảnh. Cuối cùng, thậm chí nĩ cịn khơng khả thi để biểu diễn nhu cầu thơng tin của người dùng bằng một kết hợp cĩ trọng số các đặc trưng của một ảnh truy vấn đơn. Các cách tiếp cận này cố định biểu diễn truy vấn và hàm đối sánh tương tự cũng làm cho hệ thống rất cứng nhắc. Bài báo đưa ra cách khắc phục hạn chế trên, đề xuất phương pháp tra cứu ảnh dựa vào độ tương tự nhận thức bằng việc xây dựng truy vấn tối ưu từ phản hồi của người dùng và tự động điều chỉnh sự quan trọng của mỗi chiều dữ liệu trong khơng gian đặc trưng. Chúng tơi cho phép người dùng chọn trọng số các ảnh trả về, những ảnh mà họ cho là thỏa mãn nhu cầu thơng tin của họ nhất và sau đĩ tính lại biểu diễn của truy vấn dựa trên sự phản hồi này. Phương pháp đề xuất tính tốn độ phân tán của các điểm dữ liệu do người dùng lựa chọn trên khơng gian đặc trưng để xác định mong muốn của người dùng về chiều dữ liệu quan trọng. Phần cịn lại của bài báo này được tổ chức như sau: Trình bày chi tiết phương pháp đề xuất, mơ tả các kết quả thực nghiệm tương ứng trong phần hai và ba, cuối cùng là kết luận sẽ được đưa ra trong phần bốn.
462 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC II. PHƯƠNG PHÁP TRA CỨU ẢNH VỚI ĐIỀU CHỈNH TRUY VẤN A. Mơ hình đề xuất Trong số k ảnh được trả về bởi việc thực hiện truy vấn khởi tạo, người dùng sẽ chọn n ảnh liên quan. Trên khơng gian đặc trưng F, tính giá trị trung bình của n đối tượng ảnh (theo từng đặc trưng) và thay biểu diễn trong khơng gian đặc trưng F của truy vấn khởi tạo bằng biểu diễn tương ứng với giá trị trung bình vừa tính được. Lặp lại quá trình này chúng ta sẽ nhận được điểm truy vấn tối ưu trong khơng gian đặc trưng F. Đến đây, chúng ta đã nhận được truy vấn tối ưu nhưng độ quan trọng của các chiều dữ liệu trong khơng gian đặc trưng F vẫn chưa theo mong muốn của người dùng. Do đĩ, tính phương sai của các dữ liệu trong khơng gian đặc trưng F theo mỗi chiều dữ liệu để xác định độ quan trọng của mỗi chiều dữ liệu trong khơng gian đặc trưng này (phương sai càng lớn, độ phân tán dữ liệu càng lớn và vì thế chiều đĩ sẽ ít quan trọng) là cần thiết. Dưới đây chúng tơi sẽ đề cập tới ba thuật tốn thể hiện ý tưởng trên, thuật tốn QRR tìm truy vấn tối ưu, thuật tốn SIDFS tính độ quan quan theo chiều dữ liệu trên khơng gian đặc trưng và thuật tốn IRuPS tính độ tương tự theo nhận thức. Thuật tốn 1: QRR (Query Representation Refinement) Đầu vào: S /*Tập các véc tơ đặc trưng ảnh cơ sở dữ liệu*/ F /* Tập các đặc trưng */ m /*Chiều của khơng gian đặc trưng*/ Kết quả: qopt /*Véc tơ truy vấn tối ưu*/ For F∈F do { QF= /* Thực hiện truy vấn khởi tạo đơn điểm với k ảnh trả về*/ While User chưa dừng phản hồi do { For j=1 to m do */ m số chiều của khơng gian đặc trưng*/ { SumF=0 SumwF=0 For i=1 to n do { =User_Choose_RelevanceImage(QF, k) /* User chọn n đối tượng, E1, Ei, En liên quan trong số k đối tượng trả về*/ =User_Choose_RelevanceLevel({1,2,3}) F F Sum =Sum + F F Sumw =Sumw + } CF[j]= } } F =C /* véc tơ truy vấn tối ưu trên khơng gian đặc trưng F*/ } Return qopt Hình 1. Thuật tốn điều chỉnh biểu diễn truy vấn QRR Thuật tốn 1 (QRR) điều chỉnh biểu diễn truy vấn được thực hiện như sau: Trên khơng gian đặc trưng F, người dùng thực hiện việc nhập vào một ảnh truy vấn mẫu q0 và thực hiện truy vấn này trên tập cơ sở dữ liệu đặc trưng S để được k ảnh kết quả. Quan sát trên k ảnh kết quả này, người dùng chọn n ảnh liên quan so với ảnh truy vấn và gần với nhu cầu thơng tin của mình, với mỗi ảnh liên quan chọn giá trị trọng số wi (một mức liên quan trong các mức 0: khơng liên quan – mặc định khơng chọn, 1: liên quan và 2: liên quan cao, 4: liên quan rất cao). Trên cơ sở các ảnh được chọn và giá trị wi được nhập, thuật tốn tính trọng tâm C theo chiều mỗi chiều j. Kết thúc một lần lặp phản hồi của người dùng là véc tơ F trọng tâm C gồm m chiều, cũng chính là véc tơ truy vấn tối ưu trên khơng gian F của lần lặp này. Lặp lại quá trình trên một số lần, thuật tốn sẽ cho ra véc tơ truy vấn tối ưu qopt. Thuật tốn SIDFS (Hình 2) tính độ quan trọng của chiều dữ liệu trong khơng gian đặc trưng F.
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngơ Quốc Tạo 463 Thuật tốn 2: SIDFS (Select Important Dimensions in Feature Space) Đầu vào: E /*Tập n ảnh do User chọn*/ F /*Tập các đặc trưng*/ m /*Chiều của khơng gian đặc trưng*/ Đầu ra: Weight_j /*Độ quan trọng theo chiều j*/ For F∈F do { For j=1 to m do { ∑ / ∑ Weight_j = /* trọng số theo chiều j*/ } } Hình 2. Thuật tốn tính độ quan trọng của chiều dữ liệu SIDFS. Thuật tốn 2 SIDFS tính độ quan trọng của chiều dữ liệu được thực hiện như sau: Thuật tốn lấy đầu vào là n ảnh , , tương tự nhận thức với truy vấn tối ưu (đầu ra của thuật tốn 1) trên khơng gian F. Lúc này, theo chiều thứ j của khơng gian đặc trưng F sẽ cĩ n điểm dữ liệu , , và thuật tốn tính phương sai của n điểm dữ liệu này theo chiều j của khơng gian F. Sau khi tính được giá trị của phương sai , thuật tốn đưa ra độ quan trọng của từng chiều dữ liệu j trong khơng gian đặc trưng F bởi vì lớn cĩ nghĩa là độ phân tán dữ liệu theo chiều j trong khơng gian đặc trưng F lớn, cũng cĩ nghĩa là độ quan trọng của chiều j trong khơng gian đặc trưng F nhỏ. Do đĩ độ quan trọng dữ liệu theo chiều j sẽ được tính bằng và gán cho Weight_j. Thuật tốn IRuPS (Hình 3) tra cứu ảnh dựa vào độ tương tự nhận thức cho ra tập kết quả gồm các ảnh cĩ độ tương tự nhận thức cao nhất với truy vấn. Thuật tốn IRuPS được thực hiện như sau: Với đầu vào là véc tơ truy vấn tối ưu qopt (đầu ra của thuật tốn 1) và trọng số Weight_j (đầu ra của thuật tốn 2) của chiều j trên khơng gian đặc trưng F, thuật tốn tính khoảng cách giữa truy vấn tối ưu với mỗi ảnh . Khoảng cách này được tính theo từng chiều j với độ quan trọng Weight_j được đưa vào cơng thức tính khoảng cách. Cuối cùng thuật tốn trả lại k ảnh, k ảnh này tương tự về mặt nhận thức nhất với qopt bởi vì khoảng cách được tính dựa vào hai yếu tố: (1) véc tơ truy vấn qopt cĩ véc tơ đặc trưng gần với nhu cầu thơng tin của người dùng và (2) độ quan trọng của chiều dữ liệu trong khơng gian đặc trưng được cập nhật tự động. Thuật tốn 3: IRuPS (Image Retrieval using Perceived Similarity) Đầu vào: S /*Tập các ảnh*/ qopt /*Véc tơ truy vấn tối ưu*/ Weight_j /*Trọng số chiều j của khơng gian đặc trưng F*/ Đầu ra: P /* Tập k ảnh tương tự nhận thức với qopt */ For F∈F do { For i=1 to ImageCount(S) do { Similarity(, )=0 For j=1 to m do 1/2 Similarity(, )=(Similarity(, )+(1-Weight_j* ) ) /*cập nhật trọng số theo chiều j*/ } } /*Sắp xếp các ảnh si trong cơ sở dữ liệu theo thứ tự giảm dần của độ tương tự so với qopt */ Return P /* k ảnh tương tự nhất (về mặt nhận thức) với qopt */ Hình 3. Thuật tốn tra cứu ảnh dựa vào độ tương tự nhận thức IRuPS
464 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC III. THỰC NGHIỆM A. Dữ liệu thực nghiệm Chúng tơi sử dụng tập dữ liệu con của tập Corel[11] gồm 10,800 ảnh. Tập dữ liệu trên được chia thành 80 chủ đề gồm: biển, thẻ, ngựa, bướm, hoa, vận động viên thể thao, lướt ván, thuyền buồm, hoa quả, cờ, chim, nhà, thác nước, gấu, linh dương đầu bị, ơ tơ, núi và hồng hơn, cánh rừng, Các ảnh được lưu trữ theo định dạng JPEG với cỡ 120×80. Cơ sở dữ liệu này sẽ được sử dụng để minh chứng sự chính xác của kỹ thuật. Thực nghiệm được cài đặt trên ngơn ngữ C# trên một máy tính PC Core i3 M350 2.27 GHz 2.27 GHz chạy hệ điều hành Windows 7. Để phân tích tính hiệu quả cho cách tiếp cận đề xuất của chúng tơi, chỉ tiêu được sử dụng là độ chính xác và triệu hồi, đĩ là hai độ đo để đánh giá thực nghiệm, chúng được định nghĩa là: area (R ) area (R ) recall = A và precision = A area (R) area ( A) Triệu hồi (Recall) là tỷ số của các ảnh liên quan trong cơ sở dữ liệu được tra cứu theo một truy vấn. Độ chính xác (Precision) là tỷ số của các ảnh được tra cứu mà liên quan đến ảnh truy vấn. Trong đĩ độ chính xác là tập ảnh tích cực với ảnh truy vấn ở mỗi vịng lặp phản hồi, tra cứu là tập ảnh kết quả trả về từ cách tiếp cận đề xuất ở mỗi phản hồi. Ký hiệu R là một tập các ảnh liên quan trong cơ sở dữ liệu, A là tập các ảnh tra cứu được trả về, RA là tập các ảnh liên quan trong tập A (Hình 4). Hình 4. Triệu hồi và chính xác cho các kết quả truy vấn B. Kết quả thực nghiệm Trong thực nghiệm ba đặc trưng gồm Color Histogram, Color Intensity và Textual được sử dụng để tính độ tương tự của ảnh truy vấn với từng ảnh trong cơ sở dữ liệu. Trong mỗi lần lặp phản hồi, để tìm truy vấn tối ưu chúng tơi sử dụng trọng số w biểu diễn mối quan hệ quan trọng với truy vấn. Để tìm ra truy vấn tối ưu và các trọng số quan trọng của chiều, chúng tơi chỉ tập trung quan sát trên tập các đối tượng liên quan. Từ tập các đối tượng liên quan, thuật tốn 1 và thuật tốn 2 được áp dụng để tìm ra truy vấn tối ưu và trọng số quan trọng của chiều. Do vậy, trọng số chỉ mức quan hệ được đề xuất gồm 4 mức: 0, 1, 2 và 4 tương ứng với ý nghĩa khơng liên quan, liên quan, liên quan cao và liên quan rất cao. Chúng tơi đã so sánh nghiên cứu này với một số nghiên cứu phản hồi liên quan đang tồn tại như là phương pháp Nạve QP[4] và Nạve QR[5]. Để cung cấp các kết quả đáng tin cậy, chúng tơi sử dụng tập thử nghiệm gồm 1000 ảnh ngẫu nhiên trong 80 chủ đề nĩi trên. Các ảnh trong tập thử nghiệm được sử dụng lần lượt như ảnh truy vấn của IRuPS, Nạve QR và Nạve QP để chỉ ra hiệu quả của IRuPS. Bảng 1 dưới đây là kết quả trung bình của mỗi lần lặp đối với các phương pháp IRuPS, Nạve QR và Nạve QP. Bảng 1. Trung bình độ chính xác của cách tiếp cận khác nhau trên tập thử nghiệm 1000 ảnh Vịng Nạve Nạve IRuPS lặp QR QP 1 0.7448 0.7448 0.7028 2 0.84985 0.7621 0.76535 3 0.90145 0.84765 0.79675 4 0.92935 0.8805 0.8225 5 0.94725 0.90125 0.84095 6 0.96015 0.91725 0.85645 7 0.96855 0.92625 0.8686 Kết quả bảng 1 cho thấy trung bình độ chính xác của các phương pháp IRuPS, Nạve QR và Nạve QP qua 7 lần lặp phản hồi tương ứng là 90.02%, 85.42% và 80.76%, từ đĩ chỉ ra rằng kỹ thuật đề xuất cải thiện độ chính xác đáng kể. Hình 5 cho biết lược đồ so sánh độ chính xác trên 7 lần lặp phản hồi tương ứng của các phương pháp IRuPS, Nạve QR và Nạve QP.
Vũ Văn Hiệu, Nguyễn Hữu Quỳnh, Ngơ Quốc Tạo 465 1.2 1 0.8 Nạve QP 0.6 Nạve QR 0.4 IRuPS 0.2 0 1234567 Hình 5. So sánh độ chính xác của IRuPS, Nạve QR và Nạve QP Để minh họa kết quả sau một số lần lặp phản hồi, hình 6,7 và 8 dưới đây chúng tơi minh họa ảnh hồng hơn sử dụng làm ảnh truy vấn trên cả ba phương pháp IRuPS, Nạve QR và Nạve QP tương ứng. Kết quả ở lần lặp thứ sáu minh họa cho thấy kỹ thuật đề xuất cải thiện độ chính xác đáng kể. Hình 6. Những ảnh tìm thấy bởi kỹ thuật Nạve QR Hình 7. Những ảnh tìm thấy bởi kỹ thuật Nạve QP
466 MỘT PHƯƠNG PHÁP TRA CỨU ẢNH DỰA VÀO ĐỘ TƯƠNG TỰ NHẬN THỨC Hình 8. Những ảnh tìm thấy bởi kỹ thuật IRuPS IV. KẾT LUẬN Chúng tơi đã phát triển phương pháp tra cứu ảnh IRuPS dựa vào nhận thức của người dùng và phản hồi liên quan. Phương pháp này cĩ hai ưu điểm: yêu cầu người dùng suy nghĩ trong tâm trí ảnh đối tượng cần tìm mà khơng cần miêu tả cụ thể và đánh giá ảnh đối tượng trong mỗi lần tra cứu bằng cách đưa vào các mức độ liên quan. Qua mỗi lần lặp phản hồi, dựa trên các đối tượng mà người dùng lựa chọn, hệ thống tự động học thơng tin bằng việc đánh giá chiều quan trọng. Dựa trên trọng số quan trọng của mỗi chiều, hệ thống đã cho kết quả gần với nhu cầu tra cứu của người dùng. V. TÀI LIỆU THAM KHẢO [1] Flickner, Myron, Et Al. "Query by Image and Video Content: The QBIC System."Computer 28.9 (1995): 23-32. [2] Bach, Jeffrey R., Et Al. "Virage Image Search Engine: An Open Framework For Image Management." Electronic Imaging: Science & Technology. International Society For Optics And Photonics, 1996. [3] Rui, Yong, et al. "Relevance feedback: a power tool for interactive content-based image retrieval." Circuits and Systems for Video Technology, IEEE Transactions on 8.5 (1998): 644-655. [4] Y. Rui, T. Huang, And S. Mehrotra. Content-Based Image Retrieval With Relevance Feedback in Mars. Proc. Of Ieee Int. Conf. On Image Processing, 1997. [5] K. Porkaew, K. Chakrabarti, And S. Mehrotra. Query Refinement For Content-Based Multimedia Retrieval in Mars. Proceedings Of Acm Multimedia Conference, 1999. [6] Y. Ishikawa, R. Subramanya, and C. Faloutsos. Mindreader: Querying Databases Through Multiple Examples. Proc. of Vldb, 1998. [7] K. Chakrabarti, K. Porkaew, And S. Mehrotra. Efficient Query Refinement in Multimedia Databases. Proceedings Of International Conference In Data Engineering(Icde), 2000. [8] Wu, Leejay, et al. "Multimedia queries by example and relevance feedback." IEEE Data Engineering Bulletin 24.3 (2001): 14-21. [9] Chakrabarti, Kaushik, et al. "Evaluating refined queries in top-k retrieval systems." Knowledge and Data Engineering, IEEE Transactions on 16.2 (2004): 256-270. [10] Luo, Xin, Guowen Wu, and Kenji Kita. "Learning distance metrics with feature space performance for image retrieval." Proceedings of the 2013 International Conference on Electrical and Information Technologies for Rail Transportation (EITRT2013)-Volume II. Springer Berlin Heidelberg, 2014 [11] AN IMAGE RETRIEVAL METHODS BASED ON PERCEIVED SIMILARITY Vu Van Hieu, Nguyen Huu Quynh, Ngo Quoc Tao ABSTRACT - Content-based image retrieval systems, the returned results are not satisfying the user's information needs. This restriction is due to: (1) query image is not fully represent the information needs of users, (2) low level features does not reflect the semantic information of image and (3) distance function combined with the features can not be perceived by the user. To overcome such limitations, we propose image retrieval method based on similarity perception by developing optimal query from user feedback. We have experimental database includes 10,800 images from Corel subset. The experimental results indicate that this technique improved content-based image retrieval system performance compared with the exit method and the results have been close to the perception of users.