Thiết kế hệ thống nhúng nhận dạng chữ viết tay tiếng Việt

10 trang phuongnguyen 2080

Download

Bạn đang xem tài liệu "Thiết kế hệ thống nhúng nhận dạng chữ viết tay tiếng Việt", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

thiet_ke_he_thong_nhung_nhan_dang_chu_viet_tay_tieng_viet.pdf

Nội dung text: Thiết kế hệ thống nhúng nhận dạng chữ viết tay tiếng Việt

THIẾT KẾ HỆ THỐNG NHÚNG NHẬN DẠNG CHỮ VIẾT TAY TIẾNG VIỆT DESIGN EMBEDDED SYSTEM FOR VIETNAMESE HANDWRITTEN RECOGNITION (1) Lê Hồng Phúc, (2) Hồng Trang (1) Bộ mơn Điện tử, Trường Đại học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh (2) Bộ mơn Điện tử, Trường Đại học Bách Khoa Thành Phố Hồ Chí Minh TĨM TẮT Nhận dạng chữ viết tay là một trong những chủ đề phổ biến đang được nghiên cứu và phát triển.Tuy nhiên, phần lớn các hệ thống nhận dạng hiện nay đều được thực hiện trên máy tính cá nhân. Trong bài báo này, chúng tối sẽ mơ tả quá trình xây dựng hệ thống nhận dạng chữ viết tay tiếng Việt off-line trênboard nhúng Beagleboard xM (BBxM). Bài tốn nhận dạng được thực hiệndưới sự hỗ trợ của thư viện xử lý ảnh OpenCV và phương pháp phân lớpSVM (Support vector machines). Ảnh các chữ viết tay sẽ được chụp từcamera. Hệ thống thực hiện cơng việc phát hiện và tách các ký tự, dấu thành cácmẫu. Các mẫu ký tự sẽ được trích đặc trưng theo phương pháp chu tuyến kếthợp với phương pháp xác định mật độ điểm ảnh.Các véc tơ đặc trưng được trích xuất sẽ được sử dụng cho quá trình huấn luyện để tạo ra các bộ phân lớp SVM. Các bộ huấn luyện này sau đĩ sẽ được sử dụng trong quá trình kiểm tra các ký tự chưa biết.Quá trình xây dựng các ứngdụng trên hệ điều hành nhúng được thực hiện trên hệ điều hành Windows7/Linux với sựhỗ trợ của phần mềm QtCreator và cơng cụ biên dịch chéo Qt-Everywhere.Kết quả thực nghiệm được thực hiện trên các ký tự viết tay tiếng Việt hoa cĩ dấu. Tỷ lệ nhận dạng của mơ hình đạt trên 90%. Từ khĩa: Beagleboard xM , Nhận dạng chữ viết tay,Hệ thống nhúng,Máy véc tơ hỗ trợ, Trích đặc trưng ABSTRACT Handwritten character recognition (HCR) is one of the common research topics has been studied and developed. However, most currentHandwritten recognition systems are designed on the personal computers.In this paper, we will describethe process of building the off-line handwritten character recognition system on embedded board BeagleBoard xM (BBxM). The identification problem is done with the support of the image processing library OpenCV and classification method SVM (Support vector machines). The handwriting letters will be captured by the camera. The system will detect and separate the letter samples. The features are extracted from these samples by the method of contour profiles and horizontal/vertical pixel density.The extracted feature vectors are used during the training phase for building twoSVM classifiers. The trained SVM classifiers are subsequently used during the testing phase for classifying unknown characters. The process of building applications on embedded operating system is implemented on Linux operating system with the assistance of QtCreator and Qt-Everywhere cross-compiler. The experimental results will be performed on the uppercase Vietnamesecharacters with diacritics. The accuracy of recognition model is over 90%. Key Words:Beagleboard xM, Handwritten character recognition, Embedded system, SVM, Feature extraction 1. TỔNG QUAN Ngày nay việc sử dụng máy tính để lƣu trữ nhận dạng mẫu[9] tuy ra đời từ thập niên 60 tài liệu, thơng tin cá nhân khơng cịn là vấn đề của thế kỷ trƣớc nhƣng vẫn luơn nhận đƣợc sự mới mẻ nữa. Xu hƣớng số hĩa tất cả những quan tâm, nghiên cứu của nhiều nhà khoa học thơng tin ngƣời dùng đang dần trở nên phổ trên thế giới.Trong số đĩ phải kể đến bài tốn biến. Để phục vụ cho cơng việc này, bài tốn nhận dạng chữ viết. Trang 1
Nhận dạng chữ viết tay là một bài tốn liên tập dữ liệu huấn luyện gồm N mẫu đƣợc cho quan đến kỹ thuật xử lý ảnh và các phƣơng dƣới dạng 푖, 푖 , 푖 = 1, ⋯ , . Trong pháp phân lớp[9]. Một số phƣơng pháp phân đĩ 푖 ∈ 푅 là véc tơ bao gồm m phần tử chứa lớp hiệu quả nhƣmơ hình mạng nơ-ron[9][11] giá trị của m thuộc tính hay đặc trƣng. Các véc hay máy véc tơ hỗ trợSVM tơ này đƣợc phân loại thành các mẫu dƣơng và [10][12][13][14]đang đƣợc áp dụng cho mơ mẫu âm. Mẫu dƣơng sẽ đƣợc gán nhãn là hình này.Cĩ hai hình thức nhận dạng phổ biến 푖 = +1 và mẫu âm sẽ là 푖 = −1 .SVM là nhận dạng trực tuyến (online)và nhận dạng đƣợc áp dụng cho bài tốn phân lớp tập dữ liệu ngoại tuyến (offline)[15].Các nghiên cứu về này theo các mơ hình nhƣ sau: nhận dạng chữ viết tay offline chủ yếu đƣợc Nếu tập dữ liệu là khả tách tuyến tính:Áp thực hiện trên tập dữ liệu số MNIST[16] và dụng mơ hình tuyến tính bằng cách định nghĩa các mẫu ký tựLa-tinh rời rạc. siêu phẳng tối ƣu với lề cực đại (Maximize Tiếng Việt [8] là một ngơn ngữ cĩ âm sắc. Margin/ Hard-Margin).Siêu phẳng cần tìm sẽ Bộ ký tự tiếng Việtxây dựng dựa trên bảng chữ cĩ hệ số w, b thỏa điều kiện nhƣ sau: cái La-tinh với một vài chữ ghép và sự bổ sung 1 2 của các nguyên âm kết hợp các âm sắc. Tổng min w (1) w,b 2 số ký tự rời rạc của tiếngViệtlà 93 ký tự kể cả T F, J, W và Z. Nhận dạng chữ viết tay tiếng Việt Thỏa: yii w x b 1 1, i 1, , N gặp nhiều khĩ khăn bởi ngồi sự đa dạng về phong cách viết (kích cỡ, độ nghiêng) thì cịn w Mẫu dƣơng cĩ khĩ khăn do sự tƣơng đồng giữa dấu và các Véc tơ thành phần nhiễu trong ảnh văn bản viết hỗ trợ tay.Hơn nữa cácvấn đề dính chữ khiến cho chúng ta rất khĩ để xây dựng đƣợc một hệ Mẫu âm Lề cực thống hồn chỉnh. Do đĩ hiện vẫn đang cần cĩ đại những giải pháp tổng thể để hƣớng tới mở rộng cho mơ hình chữ viết tay hạn chế [1] [2]. Trong bài báo này chúng tơi sẽ đề xuất mơ hình nhận dạng văn bản viết tay tiếng Việt rời Hình 1: Mơ hìnhsiêu phẳng lề cứng L-SVM rạc đƣợc thực hiện trên hệ thống nhúng. Nội Nếu tập dữ liệu là khơng khả tách tuyến dung sẽ trình bày một số vấn đề liên quan đến tính: Mở rộng mơ hình tuyến tính bằng cách quá trình phân vùng ký tự, trích đặc trƣng, cho phép một số mẫu bị phân lớp sai để tạo ra huấn luyện/phân lớp SVM cũng nhƣ các bƣớc siêu phẳng tối ƣu với lề mềm (Soft-Margin). triển khai ứng dụng trên hệ thống nhúng. Khi điều kiện của bài tốn (1) đƣợc viết lại: N 2. PHƢƠNG PHÁP PHÂN LỚP SVM 1 2 (2) min w C i w,b  SVM haymáy véc tơ hỗ trợ (Support vector 2 i 1 machines)đƣợc Vapnik đề xuất vào năm T Thỏa: yi( w x i b ) 1  i , i 1, , N, i 0 1995[10]. Đây là phƣơng pháp học máy cĩ giám sát (Supervised learning), đƣợc phát w Mẫu dƣơng T triểndựa trên lý thuyết học thống w0xbi kê[10][17][18]. Phƣơng pháp này cĩmột nền tản tốn học vũng chắc, cho độ tin cậy cao và i thích hợp cho các bài tốn phân lớp đa lớp nhƣ Mẫu âm Lề nhận dạng chữ viết. T mềm w0xbi SVM ban đầu đƣợc thiết kế cho trƣờng hợp T w0xbi phân lớp đơn giản nhất,phân lớp nhị phân:Cho Trang 2
Hình 2: Mơ hìnhsiêu phẳng lề mềm C-SVM Việc lựa chọn hàm nhân sẽ tuân theo điều kiện Huấn luyện: là quá trình đi giải bài tốn tối ƣu Mercer[10]. (1) và (2) bằng phƣơng pháp sử dụng nhân tử SVM cho nhận dạng đa lớp: các mơ hình Lagrange [10], kết quả ta thu đƣợcvéc tơ chỉ bên trên chỉ áp dụng cho bài tốn phân lớp nhị hƣớng w của siêu phẳng cĩ dạng: phân, 푖 = −1, +1 , tuy nhiên trong nhiều NSV ứng dụng thực tế, dữ liệu nhận dạng thƣờng w yx (3)  i i i đƣợc gán nhãn cho rất nhiều lớp. Vì vậy mơ i 1 hình SVM cho phân lớp đa lớp cũng đƣợc Trong đĩ N là số lƣợng các véc tơ hỗ trợ SV nghiên cứu và phát triển. Một số chiến lƣợc cĩ tham gia vào việc xây dựng siêu phẳng phân thể đƣợc áp dụng cho bài tốn SVM đa cách. Trong cả hai trƣờng hợp trên, hàm mục lớp[21] nhƣ sau: tiêu cho bài tốn phân lớp SVM sẽ cĩ dạng: Nsv  Một chống phần cịn lại (One-vs-Rest) g x y x x b (4)  i i i i 1  Một chống một (OVO: One-vs-One) Nhận dạng:Một mẫu mới x*sẽ đƣợc phân lớp 3. MƠ HÌNH NHẬN DẠNG CHỮ VIẾT theo hàm quyết định: TAY TIẾNG VIỆT NSV Trong phần này, chúng tơi sẽ trình bày chi T (5) y f x sign  i y i x i x b i 1 tiết kiến trúc của mơ hình nhận dạng chữ viết tay tiếng Việt. Áp dụng mơ hình phi tuyến: nếu tập dữ liệu là khơng tuyến tính, ta sử dụng phép ánh xạ Form lấy Ảnh nhận mẫu Tiền xử lý dạng phi tuyến∅ để ánh xạ tập dữ liệu đĩ sang một ảnh khơng gian mới cĩ số chiều lớn hơn và ở đĩ ta Tách ký cĩ thể dễ tìm đƣợc siêu phẳng phân chia tuyến Cơ sở tự và dấu tính. Khi đĩ hàm quyết định trở thành: dữ liệu NSV T f x y  x  x b (6)  i i i KýKý ttựự Huấn luyện Nhận dạng Ký tựtự i 1 20x28 220x280x2 8 20x2 8 với SVM1 với SVM1 DDấuấ u Huấn luyện Nhận dạng DDấu ấu xx  14x1420x28 với SVM2 với SVM2 14x1420x28 Trích Trích đặc trƣng đặc trƣng Kết nối dấu Hình 3: Ánh xạ phi tuyến và ghi kết quả Để tránh việc tính tốn dữ liệu trực tiếp Hình 4: Kiến trúc của mơ hình nhận dạng trong khơng gian mới, ta sử dụng thủ thuật hàm nhân (Kernel trick).Nghĩa là, tích vơ 3.1 Tiền xử lý hƣớng trong Tiền xử lý sẽ giúp chuyển đổi thành ảnh nhị khơnggianđặctrƣngtƣơngđƣơngvới một hàm phân và loại bỏ những thành phần cĩ thể nhân K của khơng gian đầu vào. khơng phải là ký tự hoặc dấu. T K xi, x j  x i x j (7) C đƣợc xem ký tự /dấu nếu: Khi đĩ cơng thức 2.4 đƣợc viết lại: min{W, H <C{w, h}<max{W, H} Loại bỏ C nếu: C{w,h} max{w, h} ≤ min{W, H} NSV min{w, h} ≥ max{W, H} f x  i y i K x i,0 x j b (8) i 1 Trang 3
Hình 5: Minh họa quá trình tiền xử lý dịng riêng biệt, ta cần cĩ thuật tốn để nhận Ảnh xám sau khi đƣợc chuyển sang ảnh nhị biết điều này. Bằng cách đánh nhãn cho phần phân sẽ đƣợc lọc nhiễu theo các bƣớc nhƣ sau: chữ và phần dấu dựa vào tọa độ và chiều cao của đƣờng bao ta sẽ biết đƣợc đâu là dịng chữ Bước 1: Tìm hình chữ nhật bé nhất chứa các và đâu là dịng dấu, từ đĩ sẽ gom dấu vào lại điểm ảnh trắng trên khung ảnh c{w,h}. dịng chữ tƣơng ứng của nĩ. Bước 2: Loại bỏ những hình chữ nhật thỏa b. Tách chữ điều kiện về kích thƣớc {W,H} và tỉ lệ giữa chiều cao và chiều rộng (H/W) nhƣ hình 5. Yêu cầu trƣớc tiên của việc tách chữ là các chữ khơng dính liền nhau. Cơng việctách chữ 3.2 Cơ sở dữ liệu đƣợc thực hiện nhƣ sau: Ảnh ký tự và dấu sẽ đƣợc trích xuất từ các + Xác định mật độ điểm ảnh theo cột đƣợc form thu thập chữ viết tay. Các mẫu sẽ đƣợc thực hiện theo cơng thức bên dƣới: phân loại vào trong 36 folder và đƣợc gán Height 1 nhãn theo thứ tự từ 1 đến 29 cho phần ký tự và V i  P i, j div 255 (10) i 0 từ 30 đến 36 cho phần dấu. Với j 0 w i d th 1 + Xác định vùng cắt dựa trên điểm bắt đầu khoảng trắng và độ rộng khoảng trắng. c. Tách ký tự và dấu Chữ viết rời rạc, phần ký tự và phần dấu khơng dính nét nhau sẽ giúp cho việc tách ký tự theo giải thuật phát hiện đƣờng bao đối tƣợng trở nên đơn giản hơn. Các đối tƣợng sau khi tách ra khỏi chữ sẽ đƣợc sắp xếp và phân Hình 6: Các bƣớc xây dựng bộ cơ sở dữ liệu loại để đƣa vào đúng bộ nhận dạng ký tự hoặc dấu. 3.3 Tách ký tự và dấu Sắpxếp:Các thành phân liên thơng sau khi a. Tách dịng đƣợc tách rời sẽ đƣợc sắp xếp theo thứ tự. Sắp Yêu cầu trƣớc tiên của việc tách dịng là các xếp sơ cấp sẽ sắp xếp các đối tƣợng tăng dần dịng chữ khơng đƣợc viết quá nghiêng. Cơng theo chiều x, sắp xếp mới sẽ chỉ áp dụng đối việc tách dịng đƣợc thực hiện nhƣ sau: với những đối tƣợng cĩ vùng liên thơng trùng + Xác định mật độ điểm ảnh theo dịng đƣợc lấp theo chiều x và chúng sẽ đƣợc sắp xếp theo thực hiện theo cơng thức bên dƣới. thứ tự giảm dần theo chiều y. wi d th 1 H i  P i, j div 255 (9) j 0 Với i 01 height + Xác định vùng cắt dựa trên điểm bắt đầu của dịng chữ và độ rộng dịng chữ. Hình 8: Minh họa việc sắp xếp các đối tƣợng cĩ thể là ký tự hoặc dấu Phân loại:Việc phân loại đối tƣợng sẽ dựa vào tọa độ, chiều cao và diện tích của đƣờng bao Hình 7: Minh họa quá trình tách dịng quanh đối tƣợng, cụ thể: Trƣờng hợp phần dấu bị tách ra thành một + Xét về tọa độ, nếu đối tƣợng cĩ tọa độ y lớn Trang 4
hơn tọa độ trung bình thì đĩ là dấu nặng. phân lớp SVM riêng biệt cho việc huấn luyện + Xét về chiều cao, ta tìm chiều cao trung bình dấu và ký tự. (htb) của các đối tƣợng trong một chữ. Nếu đối  Bộ SVM1: 29 ký tự {A, B, C, D, Đ, E, G, tƣợng nào cĩ chiều cao nhỏ hơn htbthì đƣợc H, I, K, L, M, N, O, P, Q, R, S, T, U, V, xem là phần dấu, ngƣợc lại là phần ký tự. X, Y, Ơ, Ƣ, Z, W, F, J}. + Xét về diện tích, ta tìm diện tích trung bình  Bộ SVM2: 7 dấu {Ạ, Á, Ă, Â, À, Ã, Ả}. (Stb) của các đối tƣợng trong chữ. Nếu đối Các SVM1 và SVM2 đƣợc xây dựng từ các tƣợng nào cĩ diện tích nhỏ hơn Stbthì cũng SVM nhị phân theo chiến lƣợc huấn luyện đa đƣợc xem là phần dấu, ngƣợc lại là phần ký tự. lớp một chống một(OVO).Hàm nhân đƣợc Nhƣ trong hình 9 ta đƣợc vùng 1 và 2 đƣợc sửdụng là hàm tuyến tính, các tham số đƣợc phân loại là dấu, vùng 3 là vùng ký tự. lựa chọn theo mơ hình C-SVM (C=10) [7]. Nhận dạng:Cơng việc nàyđƣợc thực hiện trên tập kiểm tra và ảnh văn bản. Các ký tự và dấu đƣợc tách ra trong quá trình tách ký tựsẽđƣợc đƣa vào kết hợp với bộ huấn luyện để cho kết Hình 9: Phân nhĩm theo vùng liên thơng quả nhận dạng. Kết quả sau khi nhận dạng với 3.4 Trích đặc trƣng phƣơng phápphân lớpSVM sẽtrả vềmột giá trị Trong bƣớc này ảnh ký tự và dấu sẽ đƣợc nhãn trong bộhuấn luyện SVM. Các nhãn này chuẩn hĩa kích thƣớc và trích đặc trƣng. Cả sẽ đƣợc kết hợp lại để cho ra kết quả nhận hai bƣớc này đƣợc áp dụng nhƣ nhau trong cả dạng cuối cùng. huấn luyện và nhận dạng. 4. XÂY DỰNG ỨNG DỤNG TRÊN + Vùng 1, 2:chuẩn hĩa về kích thƣớc 14x14. BOARD NHÚNG BBxM + Vùng 3: chuẩn hĩa về kích thƣớc 20x28. 4.1 Phần cứng Một số phƣơng pháp trích đặc trƣng hiệu Sơ đồ hệ thống phần cứng đƣợc thực hiện quả cho chữ viết tay tiếng Việt đã đƣợc đề cập nhƣ trong hình 10. trong[9] [4][19]. Phƣơng pháp trích đặc trƣng đƣợc sử dụng là phƣơng pháp kết hợp giữa chu tuyến và phân bố điểm ảnh. Véc tơ đặc trƣng F cĩ đƣợc từ sự tổng hợp của các giá trị nhƣ trong bảng 1. Bảng 1: Thống kê số đặc trƣng của ký tự và dấu theo các phƣơng pháp Phƣơng pháp trích đặc trƣng Ký tự Dấu Hình 10: Sơ đồ hệ thống phần cứng Đặc trƣng chu tuyến từ trái sang 18 12 Bằng cách sử dụng một camera để quét ảnh Đặc trƣng chu tuyến từ phải sang 18 12 đầu vào, ảnh của chữ viết sẽ đƣợc đƣa vào Đặc trƣng chu tuyến từ trên xuống 26 12 nhận dạng bởi hệ thống board nhúng Đặc trƣng chu tuyến từ dƣới lên 26 12 BBxM[22], giao diện xử lý và kết quả dạng Đặc trƣng phân bố theo dịng 18 12 text đƣợc thực hiện và hiển thị trên một màn Đặc trƣng phân bố theo cột 26 12 hình LCD. F1, F2: Véc tơ đặc trƣng tổng hợp 132 72 4.2 Phần mềm 3.5 Huấn luyện và nhận dạng Ứng dụng nhận dạng chữ viết tay đƣợc thực Huấn luyện:Cơng việc này đƣợc thực hiện hiện với sự hỗ trợ của thƣ viện xử lý ảnh trên các đặc trƣng của tồn bộ ảnh trong bộ cơ OpenCV[23][24], giao diện chƣơng trình đƣợc sở dữ liệu. Chúng tơi đã xây dựng hai máy xây dựng trên phần mềm mã nguồn mở Qt Trang 5
Creator. Trên máy tính chúng tơi tiến hành đánh giá Đểcác ứng dụng cĩthểchạy đƣợc trên tính hiệu quả của phƣơng pháp trích đặc trƣng BBxM, chúng tơi đã tiến hành cài đặt hệ điều đƣợc đề xuất với hai phƣơng pháp khác là chu hành Angstrom[25] và một số thƣ viện hỗ trợ tuyến (CT) và nhị phân (NP).Kết quả đánh giá nhƣ QtEverywherevà OpenCVtrên BBxM. này đƣợc thực hiện đối với tập cơ sở dữ liệu của 29 ký tự cĩ một vùng liên thơng. Cĩ tất cả 5. KẾT QUẢ THỰC NGHIỆM 8770 mẫu, chúng tối tơi lựa chọn ngẫu 5.1 Chƣơng trình nhận dạng nhiên2/3 trong số đĩ để huấn luyện và 1/3 để nhận dạng. Tỷ lệ nhận dạng đúng đƣợc xác Ứng dụng đƣợc xây dựng trên cả máy tính định là phần trăm của các mẫu trong tập kiểm cá nhân (PC) và BBxM. Giao diện tra đƣợc bộ phân lớp xếp lớp đúng.Kết quả so đƣợcthiếtkếtrựcquandễ dàng sử dụng và kiểm sánh đƣợc trình bày trong bảng 2. tra. Kết quả cho phép nhận dạng các chữ viết tay rời rạc trên các dịng chữ khác nhau. Bảng 2: So sánh kết quả nhận dạng theo các phƣơng pháp trích đặc trƣng Kết quả nhận dạng văn bản viết tay là tốt đối với các trƣờng hợp ảnh bị nhiễu sáng, Số mẫu Số mẫu Tỷ lệ nhận dạng đúng (%) dịng chữ cĩ độ nghiêng vừa phải và chữ cĩ huấn luyện kiểm tra CT+PB CT NP kích thƣớc lớn nhỏ khác nhau. Các trƣờng hợp cịn lại cho kết quả khơng chính xác. 5870 2900 98.28 94.9 97.24 Hình 13trình bày tỷ lệ nhận dạng của từng mẫu tự. Kết quả cho thấy một số mẫu cĩ tỷ lệ nhận dạng thấp (A, H, M,N, O, D). Nguyên nhân là do sốmẫuhuấn luyện của các ký tự này cịn ít, cĩ sự giống nhau về cấu trúc. Để tỷ lệ nhận dạng tăng lên ta cĩ thể tăng thêm số mẫu huấn luyện và đồng thời kết hợp thêm một số phƣơng pháp trích đặc trƣng khác. Hình 11: Chƣơng trình nhận dạng trên PC Hình 13: Tỷ lệ nhận dạng của 29 ký tự theo các phƣơng pháp trích đặc trƣng So sánh thời gian huấn luyện và nhận dạng đƣợc thể hiện trong bảng 3. Thời gian đƣợc tính là tổng thời gian để huấn luyện/ nhận dạng hết tất cả các mẫu của 29 ký tự. Bảng 3: Thời gian huấn luyện và nhận dạng Hình 12: Chƣơng trình nhận dạng trên BBxM CT+PB CT NP 5.2 Kết quả thống kê Huấn luyện 7305.65ms 5663.24ms 16042ms Chúng tơi đã tiến hành việc đánh giá các kết Nhận dạng 13454.5ms 12052.5ms 14762.5ms quả thực nghiệm trên cả máy tính cá nhân (CORE i5 tốc độ 2,6Ghz, 4Gb Ram) và BBxM Các kết quả cho thấy phƣơng pháp trích đặc (ARM-Cortex A8 tốc độ 1Ghz, 512Mb Ram). trƣng chu tuyến kết hợp phân bố điểm ảnh cho Trang 6
độ chính xác cao nhất, hiệu suất đạt 98.28%. Hƣớng nghiên cứu và phát triển tiếp theo là Kích thƣớc bộ huấn luyện nhỏ (2,011KB). xây dựng mơ hình nhận dạng chữ viết để cĩ Trích đặc trƣng theo phƣơng pháp nhị phân thể nhận dạng đƣợc các chữ viết bị dính nét. đƣợc thực hiện với giải thuật đơn giản nhất, cho Việc nàyđịihỏicầnphảisửdụngkỹthuật phân hiệu suất khá cao (97.24%) nhƣng thời gian đoạn ảnh nâng cao để cĩ thể tách đƣợc các ký huấn luyện và nhận dạng khá cao (huấn luyện: tự dính nét. Một số phƣơng pháp nhằm nâng 16042ms, nhận dạng: 14762.5ms), kích thƣớc cao độ chính xác của nhận dạng chữ viết đƣợc bộ huấn luyện lớn (8,294KB). Phƣơng pháp đề cập trong [26][27], trong đĩ phƣơng pháp trích đặc trƣng theo chu tuyến cho hiệu xuất tách vùng liên thơng của dấu đƣợc đề cập thấp nhất, chỉ đạt 94.9% nhƣng cĩ thời gian trong [27] cĩ thể đƣợc áp dụng để giải quyết huấn luyện và nhận dạng cũng nhƣ thấp nhất. cho một phần bài tốn các ký tự dính nét. Kích thƣớc bộ huấn luyện chỉ 1,456KB. Ngồi ra cĩ thể nghiên cứu cải tiến phần ghi Thời gian nhận dạng trên BBxM và máy kết quả, áp dụng mơ hình kiểm tra ngơn tính cĩ độ chênh lệch khá lớn. Kết quả so sánh ngữ[5] [6]. Kết quả sau khi nhận dạng sẽ đƣợc đƣợc trình bày trong hình 4. Thời gian nhận xem xét trong ngữ cảnh để cĩ thể giải quyết dạng đƣợc tính tốn xấp xỉ, nĩ phụ thuộc vào một số trƣờng hợp sai so với cấu trúc ngữ pháp kích thƣớc khung ảnh, độ phức tạp và số lƣợng tiếng Việt. ký tự cĩ trên khung ảnh. TÀILIỆUTHAMKHẢO Bảng 4: So sánh thời gian nhận dạng trên [1]PhamAnhPhuong,LêThanhLong,VõVănLƣ máy tính và BBxM ờng,“Nhậndạngchữviếttayrờirạctrêncơsởm Khung ảnh 640x480 áyvéctơtựaSVM”,Kỷyếuhộinghịkhoahọc, Máy tính ~100ms ĐạihọcDuytân,2011. BBxM ~1000ms [2]PhạmAnhPhƣơng,NgơQuốcTạo,LƣơngChi Kết quả nhận trên BBxM là tƣơng đối thấp, Mai,"Kết hợp các bộ phân lớp SVM cho khĩ cĩ thể đáp ứng đƣợc các ứng dụng thời việc nhận dạng chữ Việt viết tay rời gian thực. Tuy nhiên nếu hệ thống đƣợc triển rạc",tạpchíkhoahọcvàđiềukhiển,T.25,S.1(2 khai trên hệ thống cĩ cấu hình phân cứng 009),88-97. mạnh mẽ hơn thì tính khả thi của ứng dụng là [3]PhạmAnhPhƣơng,NgơQuốcTạo,LƣơngChi khá cao. Mai,“Trích chọn đặc trƣng wavelet Haar 5. KẾT LUẬN kết hợp với SVM cho việc nhận dạng chữ viết tay tiếng Bàibáo đã đƣaragiảithuậtnhậndạngchữviết Việt”,TạpchíCơngnghệThơngtinvàTruyềnt tay tiếng Việttheo phƣơng pháp trích chọn đặc hơng,ISSN0866-7039,kỳ3,số20,10-2008,tr trƣng kết hợp và phƣơng pháp phân lớp SVM. 36-42. Phƣơng pháp này cho tỷ lệ nhận dạng các ký tự rời rạc trên 90%. [4]PhamAnhPhuong,“Some methods for effectively extracting features for Isolated Chƣơng trình nhận dạng cĩ khả năng thực Vietnamese Handwritten hiện việc tách các dịng văn bản cĩ độ nghiêng Recognition”,JournalofScience(Hueuniver vừa phải, các chữ, ký và dấu đƣợc viết rời rạc. sity),53(2009)73.(inVietnamese). Kếtquảthựchiện trênBBxMcĩthểápdụng đƣợc trên thực tế (thời gian nhận dạng khoảng [5]NguyễnThịThanhTâm,“Nghiên cứu phƣơng 100ms/1 khung ảnh). Kết quả này thuộc khá pháp nâng cao độ chính xác nhận dạng chữ nhiều vào chất lƣợng ảnh đầu vào của camera, in đứt, dính và chữ viết tay hạn chế trong khoảng cách giữa các chữ, giữa ký tự và dấu tiếng Việt”,Việncơngnghệthơngtin(2013). và vị trí của dấu đặt tại các nguyên âm. [6]VõĐạiBình,NguyễnThịTúMi,NguyễnThùy Trang 7
Giang,“Phân tích bố cục và nhận dạng ảnh comprehensive cơng văn tiếng survey",In:IEEETransactionsonPatternAna Việt”,KhoaCơngNghệThơngTin, lysisandMachineIntelligence22(1),63–84. ĐạiHọcNơngLâmTP.HCM,2008. [16]Y.LeCunandC.Cortes.“The MNIST [7] Phạm Phƣơng Anh, “ Áp dụng một số Database of Handwritten chiến lƣợc đa lớp cho bài tốn nhận dạng Digits”(2007), chữ viết tay hạn chế”, Tạp chí khoa học mnist/. Đại học Huế, ISSN 1859-1388, số 45, [17]C.-C.ChangandC.-J.Lin,“LIBSVM: a (2008), tr 109-118. library for support vector machines, ACM [8] April klazema,” The Vietnamese Alphabet: Transactions on Intelligent Systems and Learning the Basics”, June 6, 2014. Technology”,2:27:1–27:27,2011. [18]OvidiuIvanciuc,“Applications of Support lphabet/ Vector Machines in Chemistry. In:Reviews [9]MohamedCheriet,NawwafKharma,Cheng-L in Computational inLiuandChingY.Suen,“Character Chemistry”,Volume23,Eds.:K.B.Lipkowitz Recognition Systems: A Guide for andT.R.Cundari.Wiley-VCH,Weinheim,20 Students and 07,pp.291-400. Practioners”,N.Y.:JohnWiley&Sons,2007. [19]MarkS.NixonandAlbertoS.Aguado“Featur [10]V.N.Vapnik,“The Nature of Statistical e Extraction Methods For Character Learning Recognition”,Thirdedition(2012). Theory”,Springer-Verlag,NewYork(1995). [20]JiaweiHanandMichelineKamber,“Data [11] Y.Tay, M.Khalid, R.Yusof, and Mining: Concepts and C.Viard-Gaudin, "Offline cursive Techniques”,ThirdEdition-July6,2011. handwriting recognition system based on [21]Platt,JohnC.,Cristianini,NelloandShawe-T hybrid markov model and neural aylor,"Large Margin DAGs for Multiclass networks" in Proceedings of the IEEE Classification",AdvancesinNeuralInformati International Symposium on onProcessingSystems.MITPress,2000. Computational Intelligence in Robotics and Automation, 2003, vol. 3, pp. [22] BeagleBoard-xM 1190-1195, July 2003. RevCSystemReferenceManual,April4,201 0. [12]Burges,ChristopherJ.C,“A Tutorial on Support Vector Machines for Pattern [23]OpenCVReferenceManualv2.1,2010. Recognition”,1998. [24]GaryBradskiandAdrianKaehler,“Learning [13]LuizS.OliveiraandRobertSabourin,"Suppo OpenCV: Computer Vision with the rt Vector Machines for Handwritten OpenCV Library”,2008. Numerical String [25]MerciadriLuca,KưenKooi.ÅngstrưmManu Recognition",EcoledeTechnologieSup´erie al,29/06/2010. ure-Montreal,Canada,2004. [26]LeAnhCuong,NgoTienDat,NguyenVietHa, [14]GiorgosVamvakas,“Optical Character “Isolated Handwritten Vietnamese Recognition for Handwritten Character Recognition with Feature Characters”,NationalCenterforScientificRe Extraction and Classifier search“Demokritos”,AthensGreece,2009. Combination”.VNUJournalofScience,Math [15]R.PlamondonandS.N.Srihari(2000)."On-li ematics-Physics26(2010)123-139. ne and off-line handwriting recognition: a [27]TrongNguyenNguyen,HuuHungHuynh,“A Trang 8
Robust Method for Recognizing Accents in Vietnamese Handwriting Characters”,InternationalJournalofComput erandInformationTechnology(ISSN:2279– 0764)Vol–Issue01,January2014. Thơng tin liên hệ tác giả 1. Tác giả chính Họ và tên: Lê Hồng Phúc Đơn vị: Bộ mơn Điện tử, Trƣờng Đại học Sƣ Phạm Kỹ Thuật Thành Phố Hồ Chí Minh Điện thoại: 090 4508396 Email:lephuckt@gmail.com 2. Cán bộ hƣớng dẫn khoa học Họ và tên, học hàm, học vị: Giảng viên, Tiến sỹ Hồng Trang Đơn vị: Bộ mơn Điện tử, Trƣờng Đại học Bách Khoa Thành Phố Hồ Chí Minh Điện thoại: 098 8071579 Email:hoangtrang@hcmut.edu.vn hoặc mr.hoangtrang@gmail.com Trang 9
BÀI BÁO KHOA HỌC THỰC HIỆN CƠNG BỐ THEO QUY CHẾ ĐÀO TẠO THẠC SỸ Bài báo khoa học của học viên cĩ xác nhận và đề xuất cho đăng của Giảng viên hướng dẫn Bản tiếng Việt ©, TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP. HỒ CHÍ MINH và TÁC GIẢ Bản quyền tác phẩm đã được bảo hộ bởi Luật xuất bản và Luật Sở hữu trí tuệ Việt Nam. Nghiêm cấm mọi hình thức xuất bản, sao chụp, phát tán nội dung khi chưa cĩ sự đồng ý của tác giả và Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh. ĐỂ CĨ BÀI BÁO KHOA HỌC TỐT, CẦN CHUNG TAY BẢO VỆ TÁC QUYỀN! Thực hiện theo MTCL & KHTHMTCL Năm học 2016-2017 của Thư viện Trường Đại học Sư phạm Kỹ thuật Tp. Hồ Chí Minh.