Skip to main content
Reader

OCR là gì? Số hóa tài liệu bằng phần mềm OCR tiếng việt tốt nhất hiện nay - FPT.AI Reader

by content 26.07.2021

1. OCR là gì?

OCR là viết tắt của Optical Character Recognition, nghĩa là nhận dạng ký tự quang học. Công nghệ OCR được tạo ra để chuyển đổi hình ảnh của chữ đánh máy hoặc chữ viết tay thành văn bản tài liệu ở dạng file mềm, dễ dàng số hoá tài liệu và lưu trữ thông tin.

Ứng dụng của công nghệ ocr

Công nghệ ocr được ứng dụng nhiều trong việc chuyển file scan, file pdf sang word. Hiện nay tại Việt Nam, phần mềm ocr tiếng Việt FPT.AI Reader được xây dựng trên nền tảng Trí tuệ nhân tạo (AI) có khả năng nhận dạng và trích xuất các trường thông tin cần thiết trên các loại giấy tờ tùy thân như CMND/CCCD, Hộ chiếu, Giấy phép lái xe...

Nhờ có phần mềm ocr FPT.AI Reader, các dữ liệu khách hàng được số hóa và lưu trữ nhanh chóng trong CRM của doanh nghiệp, tạo ra một cuộc cách mạng trên hành trình số hóa tài liệu, giấy tờ.

Phần mềm OCR hoạt động như thế nào?

Nhận dạng kí tự quang học - OCR là công cụ hỗ trợ tự động hoá các tác vụ nhập dữ liệu và số hoá giấy tờ, đặc biệt là các tài liệu định danh. OCR có khả năng nhanh chóng chuyển đổi văn bản trên giấy thành dạng file word, giúp việc lưu trữ và tìm kiếm thông tin trở nên đơn giản, dễ dàng hơn.

Phần mềm OCR phân tích hình ảnh đưa vào theo các vùng sáng – tối, xác định vùng sáng làm nền và vùng tối dưới dạng ký tự viết. Sau đó, phần mềm OCR chuyển đổi văn bản trong hình thành văn bản kỹ thuật số. Quy trình này bao gồm các bước:

          🔹 Bước 1: Đăng tải hình ảnh lên hệ thống

          🔹 Bước 2: Tiền xử lí: Đây là quá trình lọc nhiễu, giúp hệ thống xử lí ảnh chính xác hơn. Ví dụ, ảnh quá tối thì phải tăng sáng, giảm độ mờ của ảnh.

          🔹 Bước 3: Xác định vùng chứa thông tin (Crop): Hệ thống sẽ loại bỏ vùng background thừa của ảnh. Ví dụ, ảnh CCCD chụp trên mặt bàn, hệ thống sẽ crop phần cái bàn thừa đi, bởi phần nền thừa có thể gây nhiễu cho các công đoạn phía sau.

          🔹 Bước 4: Phát hiện trường thông tin: Xác định vị trí vùng chứa thông tin trên ảnh cần trích xuất.

          🔹 Bước 5: Đọc và phân loại thông tin: Đưa các thông tin được trích xuất vào từng trường thông tin cụ thể theo yêu cầu của doanh nghiệp.

          🔹 Bước 6: Xử lý hậu kì: Chỉnh sửa các trường thông tin còn sai sót sau khi máy đọc xong.

2. Tại sao FPT.AI Reader là phần mềm ocr tốt nhất trên thị trường hiện nay

Phần mềm số hoá tài liệu FPT.AI Reader là gì? 

FPT.AI Reader là ứng dụng nhận dạng và trích xuất chính xác nội dung từ ảnh chụp mẫu văn bản có sẵn (giấy tờ cá nhân, hóa đơn), hoặc theo bất kì định dạng văn bản tùy biến (hợp đồng, chứng từ, v.v.).

Sử dụng phần mềm FPT.AI Reader với giao diện người dùng tại website: https://reader.fpt.ai/ 

Với các ảnh chụp văn bản đánh máy hoặc chữ vi tính, sản phẩm FPT.AI Reader cho kết quả trích xuất thông tin chính xác lên đến 98% trong khoảng thời gian chỉ 1 giây.

FPT.AI Reader cho phép người dùng nhanh chóng trích xuất nội dung với hơn 30 loại văn bản như Giấy tờ cá nhân như chứng minh nhân dân/chứng minh thư quân đội, đăng kí xe, hộ chiếu...

ĐỐi với các loại giấy tờ có tính chất đặc thù riêng theo từng nhóm ngành như Tài chính, Ngân hàng, Bảo hiểm, người dùng hoàn toàn có thể tự xây dựng mô hình nhận dạng và trích xuất riêng cho từng loại giấy tờ đó. 

Điểm ưu việt của FPT.AI Reader so với các phần mềm OCR khác trên thị trường

✅ 1. Trích xuất được nhiều loại giấy tờ nhất

✅ 2. Tỉ lệ chính xác cao nhất trên thị trường hiện nay, lên đến 98%

✅ 3. Giao diện sử dụng đơn giản, người dùng không cần có kiến thức về lập trình vẫn có thể sử dụng được. 

✅ 4. Tùy biến được nhiều loại giấy tờ có form với khả năng tự training mô hình. Người dùng có thể tự gán nhãn dữ liệu (labelling) với từng trường thông tin cần nhận dạng & trích xuất.

✅ 5. Khách hàng có thể chủ động kết nối và sử dụng dữ liệu trích xuất thông qua API

FPT.AI Reader

Khách hàng có thể tự huấn luyện mô hình cho từng loại giấy tờ bằng cách tải ít nhất 3 mẫu lên và đánh nhãn các thông tin cần trích xuất.

Với khả năng nhận dạng và trích xuất không giới hạn các loại văn bản, giấy tờ, FPT.AI Reader chính là sự lựa chọn hàng đầu của các doanh nghiệp, tổ chức, cá nhân trong nghiệp vụ số hóa quy trình giấy tờ doanh nghiệp. Giúp doanh nghiệp và người dùng giảm thiểu nguồn lực, tiết kiệm chi phí, nâng cao hiệu suất vận hành nghiệp vụ. Hiện nay, FPT.AI đang cung cấp dịch vụ cho nhiều khách hàng lớn trong nước và quốc tế.

Hướng dẫn sử dụng FPT.AI Reader

     ➡️ Bước 1: Đăng kí tài khoản fpt.ai và truy cập https://reader.fpt.ai/

     ➡️ Bước 2: Chọn loại giấy tờ cần trích xuất thông tin

     ➡️ Bước 3: Tải file ảnh chụp các giấy tờ cần trích xuất lên hệ thống

     ➡️ Bước 4: Kiểm tra đối chiếu lại thông tin trích xuất

Xem hướng dẫn sử dụng phần mềm ocr FPT.AI Reader tại: https://fpt.ai/vi/huong-dan-su-dung-fptai-reader-ung-dung-trich-xuat-thong-tin-tu-anh-chup

3. Các lĩnh vực ứng dụng OCR tiếng Việt trong thực tế

Hiện nay, phần mềm OCR được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau như:

🔹 Tài chính – Ngân hàng

Khi có nhu cầu mở tài khoản ngân hàng mới, hay tham gia gói dịch vụ tài chính, bảo hiểm, yêu cầu bắt buộc của các tổ chức này là phải định danh khách hàng bằng cách cung cấp thông tin cá nhân trên CMND/CCCD, Hợp đồng vay vay…

Phần mềm số hoá tài liệu FPT.AI Reader giúp các doanh nghiệp xử lí khối tài liệu khổng lồ, số hóa nhiều quy trình trong ngành ngân hàng như: Xử lý hồ sơ khách hàng, số hóa tài liệu, hợp đồng, chứng từ; định danh khách hàng điện tử (eKYC) hỗ trợ quá trình onboarding...

phan mem OCR FPT.AI Reader

FPT.AI Reader tích hợp vào giải pháp eKYC giúp các doanh nghiệp định danh khách hàng nhanh chóng, bảo mật và có độ chính xác cao. 

Năm 2020, ngân hàng MB Bank ra mắt gói MB Family - một sản phẩm gia đình với ưu đãi dành cho mọi thành viên. Để tham gia gói sản phẩm, khách hàng cần cung cấp hồ sơ gồm các loại giấy tờ: Chứng minh thư của 2 vợ chồng; Hộ khẩu/ Giấy đăng ký kết hôn; Giấy khai sinh của con. 

MB Bank đã tin tưởng và lựa chọn giải pháp FPT.AI Reader nhằm tự động trích xuất dữ liệu từ hồ sơ đăng kí của các thành viên một cách nhanh chóng, chính xác. Đồng thời số hóa và đẩy nhanh quy trình nhập liệu, gia tăng trải nghiệm khách hàng. FPT.AI Reader đã nhận được những phản hồi tích cực và đánh giá cao từ MB Bank. Đặc biệt là khả năng nhận diện chữ và số trên Chứng minh nhân dân với độ chính xác cao ngay cả với các loại Chứng minh nhân dân cũ, mờ số. Mỗi ngày, FPT.AI Reader xử lí khoảng 5.000 yêu cầu/ngày cho MB Bank, và con số này vẫn đang tiếp tục tăng lên.

🔹 Bảo hiểm

Một số quy trình tiêu biểu trong lĩnh vực Bảo hiểm có thể kể đến như quy trình bồi thường bảo hiểm. Với FPT.AI Reader, nhân viên bảo hiểm chỉ cần một vài thao tác chụp hình đơn giản và đưa lên hệ thống, toàn bộ nội dung về bộ chứng quyền lợi bảo hiểm từ thông tin cá nhân người hưởng quyền lợi bảo hiểm, giấy ra viện, đơn thuốc, hóa đơn viện phí, cho đến kết quả xét nghiệm sẽ được nhanh chóng trích xuất và nhập liệu trên hệ thống, giảm thiểu thời gian nhập liệu, giúp nhân sự tập trung vào các nghiệp vụ chuyên sâu hơn.

FPT.AI Reader

Bảo hiểm AIA tích hợp FPT.AI Reader trong ứng dụng bán hàng điện tử trên di động (iPos), giúp các nhân viên bán hàng giải quyết nhanh chóng bài toán nhập liệu và số hóa thông tin khách hàng.

FPT.AI Reader đảm nhận thực hiện nhiều nhiệm vụ nhận dạng và trích xuất thông tin khách hàng trên 5 loại giấy tờ tùy thân khác nhau: 03 CMND/CCCD, 1 giấy khai sinh, 01 giấy đăng kí kết hôn. Đây là những giấy tờ bắt buộc mà mỗi khách hàng đều phải chứng thực trước khi tham gia bảo hiểm cùng AIA. 

Nhờ có FPT.AI Reader, thời gian nhập liệu thông tin khách hàng được rút ngắn, từ 3-4 phút viết tay xuống còn 0,5 - 1 giây/ảnh. Khách hàng không còn phải tự điền thông tin, nhân viên tư vấn cũng không phải tốn công nhập lại dữ liệu vào hệ thống, giúp các nhân viên tiết kiệm thời gian xử lí hồ sơ, đồng thời hiệu suất làm việc cũng tăng 60%.

Thông tin khách hàng được số hóa với kết quả chính xác trên 95% và nhanh chóng được lưu trữ trên hệ thống CRM của doanh nghiệp. Hồ sơ khách hàng được quản lí một cách hệ thống, dễ dàng truy xuất khi cần. Không chỉ mang lại hiệu quả vận hành vượt trội cho AIA, FPT.AI Reader còn giúp giảm hàng loạt các chi phí như nhân sự, in ấn, bảo quản… sự kết hợp của OCR và AI còn làm gia tăng tính bảo mật thông tin khách hàng.

🔹 Hành chính công

Khối Hành chính công cũng phải xử lí “hàng núi” giấy tờ mỗi ngày. Khi nhắc đến phải giải quyết các vấn đề hành chính tại các cơ quan nhà nước, không ít người dân cảm thấy “sợ” bởi quá nhiều thủ tục rườm rà phải thực hiện. Giải pháp OCR bước đầu đơn giản hoá, rút ngắn thời gian thực hiện việc kê khai và xác minh các giấy tờ tuỳ thân của người dân. Bên cạnh đó, việc quản lí hồ sơ người dân giúp số hoá cơ sở dữ liệu quốc gia, tiện lợi cho việc lưu trữ và tra cứu của các cơ quan hành chính.

🔹 Giao thông – Vận tải

Sở hữu công nghệ lõi mạnh mẽ, phần mềm ocr FPT.AI Reader đã được Grab - ứng dụng gọi xe hàng đầu thế giới, lựa chọn tích hợp vào quy trình định danh khách hàng điện tử trên mạng lưới Grab tại 8 nước Đông Nam Á với 2,8 triệu khách hàng.

Trước đây trong quá trình định danh, các đối tác (tài xế) Grab sẽ phải nhập tay từng trường thông tin cá nhân bao gồm những thông tin như Họ tên, ngày sinh, địa chỉ, số CMND/CCCD, mã bằng lái xe... Sau đó sẽ chụp ảnh giấy tờ định danh gửi lên hệ thống và đợi xác minh tài khoản. Quy trình nhập liệu này tốn nhiều thời gian và thường xảy ra sai sót. Với FPT.AI Reader, toàn bộ quy trình cồng kềnh này sẽ được tinh gọn chỉ trong vài giây, tạo nên những bước nhảy bật mạnh mẽ trong cải thiện trải nghiệm người dùng.

phan mem ocr FPT.AI Reader

Ảnh: Hình ảnh trích xuất Bằng lái xe 

🔹 Xử lý hóa đơn tự động trong ngành Bán lẻ

Xử lý hóa đơn tự động là phương pháp sử dụng phần mềm tích hợp công nghệ OCR – Nhận dạng ký tự quang học để trích xuất dữ liệu hóa đơn, điền thông tin vào hệ thống doanh nghiệp và quản lý kho dữ liệu.

Xử lý hóa đơn tự động có thể cắt giảm tới 80% thời gian và nguồn lực doanh nghiệp. Ngay khi tiếp nhận, hóa đơn sẽ được quét và ảnh chụp hóa đơn sẽ được hệ thống trích xuất dữ liệu phân tích. Hình thức tự động thu thập dữ liệu này cắt giảm hàng giờ nhập liệu thủ công của nhân viên. Sau đó, phần mềm tự động hóa hóa đơn sẽ tự động trích xuất và chuyển đổi dữ liệu thành dạng văn bản điện tử có thể tìm kiếm được qua vài click chuột.

4. Lợi ích của công nghệ OCR trong số hóa tài liệu cho các doanh nghiệp

1. Tiết kiệm thời gian: Với phần mềm OCR FPT.AI Reader, thời gian nhập liệu chỉ còn 2-3 giây, nhanh hơn khoảng 50-60 lần. Các tệp được số hoá nhanh chóng, dễ dàng lữu trữ và truy xuất thông tin hoặc tìm tài liệu khi cần thiết.

2. Giảm chi phí: Công nghệ OCR góp phần cắt giảm hàng nghìn giờ lao động, hạn chế tối đa các lỗi sai sót có thể xảy ra trong quá trình nhập liệu thủ công của con người. Từ đó, các doanh nghiệp tiết kiệm chi phí hoạt động.

3. Quản lí công việc tốt hơn: Khi doanh nghiệp cung cấp cho nhân viên các công cụ làm việc thích hợp, hiệu quả sẽ được cải thiện rõ rệt. Nhân viên sẽ không phải dành thời gian làm những công việc lặp đi lặp lại nhàm chán, mà tập trung nhiều hơn vào các nhiệm vụ có mức độ chuyên sâu. Hiệu suất làm việc sẽ được nâng cao.

4. Cải tiến quy trình kinh doanh: Xử lý dữ liệu thủ công tốn nhiều thời gian và không tạo ra bất kì giá trị trực tiếp nào cho doanh nghiệp. Hơn thế, khi nhập liệu thủ công có thể gây ra những sai sót không đáng có, khiến quy trình làm việc chậm trễ, phiền phức cho cả khách hàng và doanh nghiệp về sau.

Khi đảm bảo các hoạt động chuẩn trong từng khâu như nhập liệu, trích xuất thông tin, xử lí dữ liệu…, các doanh nghiệp sẽ có được 1 quy trình làm việc chuyên nghiệp và hiệu quả, góp phần tăng năng suất lao động.

5. Bảo mật tài liệu: Hoá đơn, hợp đồng, dữ liệu cá nhân của khách hàng và các thông tin quan trọng khác phải được bảo mật 24/7. Bất kì vi phạm an ninh nào cũng sẽ làm ảnh hưởng đến uy tín của doanh nghiệp và dẫn đến những phản ứng gay gắt từ khách hàng.

Các thông tin sau khi được công nghệ OCR xử lí sẽ được lưu trữ trên hệ thống cơ sở dữ liệu chung của doanh nghiệp, với nhiều bước bảo mật khác nhau, không phải ai cũng có quyền truy cập vào kho dữ liệu đó. Với bất kì một thay đổi nhỏ nào, hệ thống đều lưu lại lịch sự rõ ràng.

So với bảo mật một cách cơ học, đây chính là phương án lưu trữ các dữ liệu quan trọng một cách an toàn nhất hiện nay.

6. Không còn vấn đề về lưu trữ: Tủ hồ sơ khổng lồ hay phòng lưu trữ thông tin chứa hàng tấn các loại giấy tờ, hộp, kệ đựng… chiếm diện tích không gian quá nhiều. Số lượng tài liệu không ngừng tăng lên cho đến khi bạn không còn nơi nào để lưu trữ tài liệu giấy nữa. Một kho dữ liệu kĩ thuật số lưu trữ các tài liệu được xử lí vởi OCR sẽ giúp bạn tiết kiệm được diện tích không gian để dành cho nhiều hoạt động khác của doanh nghiệp.

7. Cải thiện dịch vụ khách hàng: Để khách hàng phải chờ đợi không phải là cách giữ chân khách hàng. Đặc biệt là khi họ gọi điện đến các tổng đài tư vấn. Nhờ công nghệ OCR, các nhân viên trực tổng đài chỉ mất vài giây để tìm kiếm và truy xuất thông tin cơ bản của khách hàng như tên, tuổi, địa chỉ, gói dịch vụ họ đang sử dụng… dựa vào số điện thoại khách gọi đến. Khi biết được khách hàng gọi đến cho mình là ai, giới tính là gì, các nhân viên tư vấn sẽ có lời chào và cách xưng hô hợp lí. Điều này sẽ gây được thiện cảm với khách hàng, tạo cảm giác thân thiết, gần gũi.

Khi tốc độ xử lí công việc nhanh hơn, đơn giản hơn, khách hàng sẽ có một trải nghiệm hài lòng. Họ sẽ nhớ đến thương hiệu của doanh nghiệp đó với ấn tượng tốt.

Với những lợi ích rõ ràng có thể nhìn thấy được, trong tương lai gần, công nghệ OCR hứa hẹn sẽ được ứng dụng vào nhiều ngành nghề và nhiều lĩnh vực khác nhau, tạo ra các bước chuyển vĩ đại trong thời đại công nghệ 4.0.

_____________________________

👉 Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

🏬 Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội/// Tầng 3 PJICO Building, 186 Điện Biên Phủ, Phường 6 Quận 3, TP.HCM

☎ Hotline: 1900 638 399

📩 Email: support@fpt.ai