FPT AI Read là ứng dụng nhận dạng và trích xuất chính xác nội dung từ ảnh chụp mẫu văn bản có sẵn (giấy tờ cá nhân, hóa đơn), hoặc theo bất kì định dạng văn bản tùy biến (hợp đồng, chứng từ, v.v.) bằng công nghệ ocr, nhằm số hóa tài liệu một cách nhanh chóng và thuận tiện.
Được nghiên cứu và phát triển bởi các chuyên gia FPT.AI, ứng dụng FPT AI Read sử dụng công nghệ Trí tuệ nhân tạo (AI) và Thị giác máy tính với công nghệ nhận dạng ký tự quang học (OCR) và Xử lý văn bản thông minh (IDP), kết hợp kỹ thuật xử lý ảnh nâng cao và Xử lý ngôn ngữ tự nhiên (NLP), cho phép người dùng số hóa văn bản chính xác chỉ với vài giây, độ bảo mật cao và dễ dàng lưu trữ.
Để sử dụng ứng dụng FPT.AI Reader, bạn cần có tài khoản FPT ID. Nếu chưa có tài khoản, bạn hãy đăng kí tài khoản ngay tại đây: https://id.fptcloud.com/
Sau đó, hãy truy cập: https://reader.fpt.ai/ để bắt đầu những trải nghiệm tuyệt vời!
1. Lựa chọn ngôn ngữ
Ứng dụng FPT AI Read hỗ trợ hai ngôn ngữ là Tiếng Anh và Tiếng Việt. Bạn hãy click vào biểu tượng trên góc phải màn hình để chọn ngôn ngữ sử dụng.
2. Hướng dẫn trích xuất thông tin với thư viện văn bản có sẵn trên phần mềm OCR FPT AI Read
2.1 Lựa chọn mẫu văn bản
Đầu tiên, click chọn Thư viện ở góc phải màn hình, giao diện FPT AI Read sẽ hiển thị các mẫu văn bản đã được tích hợp sẵn trên ứng dụng với độ trích xuất chính xác lên đến 98%.
Hiện tại, FPT AI Read hỗ trợ người dùng số hóa thông tin từ các mẫu văn bản như giấy tờ cá nhân, và theo các nhóm lĩnh vực ngành nghề khác nhau, trong đó có thể kể tới Chứng minh nhân dân, Bằng lái xe, Hộ chiếu, Giấy khai sinh, Hóa đơn, các chứng từ Bảo hiểm, v.v.
Để bắt đầu sử dụng, bạn cần click chọn loại văn bản cần trích xuất dữ liệu, đặt tên cho Dự án và click chọn Tạo. Bài viết sẽ lấy ví dụ với loại văn bản là Bằng lái xe.
Lúc này, giao diện trên màn hình sẽ hiển thị những trường thông tin quan trọng giúp bạn theo dõi toàn bộ quá trình sử dụng, cùng các dữ liệu liên quan khi thực hiện trích xuất thông tin Bằng lái xe (Tên, Trạng thái, Thời gian cập nhật, Thời điểm tạo, Dùng model, Hành động).
2.2 Tải lên dữ liệu
Để tiếp tục, bạn chọn Tải lên ở góc phải màn hình, thực hiện tải hình ảnh Bằng lái xe lên hệ thống.
Lưu ý: Dung lượng upload của 1 file không quá 5MB, chấp nhận các định dạng ảnh như jpg, png, pdf, v.v.
Bạn có thể tải lên đồng thời nhiều file ảnh bằng cách click Chọn File (1) ở góc dưới bên trải của màn hình. Sau khi đã lựa chọn những file ảnh Bằng lái xe cần tải, bạn click Tải lên (2) để hoàn thành bước này.
Ngay khi hình ảnh Bằng lái xe được tải thành công lên hệ thống, FPT AI Read sẽ tự động xử lý ảnh chỉ sau vài giây và chuyển trạng thái ảnh thành Đã xử lý. Lúc này, bạn có thể click vào từng dòng để xem được hình ảnh Bằng lái xe và kết quả trích xuất.
(Lưu ý: ảnh chỉ mang tính chất minh họa và không có giá trị sử dụng thực tế)
Thực hiện tương tự với những hình ảnh Bằng lái xe khác đã được tải lên thành công.
Ứng dụng công nghệ OCR FPT AI Read vẫn có thể nhận diện với kết quả chính xác cao trong điều kiện ảnh bị mờ, nhòe, kí tự trong ảnh không rõ nét, có các mảng màu khác nhau, các kí tự xếp chồng lên nhau, ảnh chụp không thẳng hàng v.v.. (Ví dụ: vết dấu đỏ chèn lên ký tự “ngày/date 05 tháng/month 07” trong ảnh dưới đây).
(Lưu ý: ảnh chỉ mang tính chất minh họa và không có giá trị sử dụng thực tế)
2.3 Phân quyền người dùng
FPT AI Read còn sở hữu tính năng phần quyền truy cập theo vai trò với những cá nhân khác trong cùng tổ chức. Người được phân quyền truy cập sẽ có thể tiếp cận kho dữ liệu hoặc trực tiếp đóng góp dữ liệu vào dự án.
Phân quyền cho người dùng khác bằng cách click chọn mục Cài đặt bên thanh ứng dụng bên trái màn hình.
Lựa chọn “Tạo mới” để phân quyền cho người dùng. Lựa chọn quyền Chỉnh sửa/Editor hoặc quyền Xem/Viewer.
Điền e-mail của tài khoản bạn muốn chia sẻ dự án, rồi chọn vai trò (Role) phù hợp.
Có hai vai trò:
? Admin: Người dùng có thể tải ảnh lên để thử nghiệm API như chủ sở hữu ứng dụng
? Viewer: Người dùng chỉ có thể xem quá trình thử nghiệm
Lưu ý: Người dùng mới cần có tài khoản FPT.AI Reader trước khi được phân quyền.
2.4. Thử nghiệm OCR API
Sau khi truy cập dự án bạn muốn thử nghiệm, tại trang Sử dụng/Usage, bấm vào nút Tải lên/Upload để tải lên ảnh thử nghiệm.
Bấm vào nút để tìm kiếm ảnh theo tên hoặc áp dụng bộ lọc cho ảnh.
Bấm vào tên ảnh để hiển thị kết quả OCR như dưới đây:
Bấm vào nút để tìm hiểu thêm về kết quả OCR của ảnh.
Nếu kết quả được trích xuất không chính xác, hãy kéo chuột vào thông tin và bấm vào lá cờ để báo cáo lỗi.
Điền thông tin chính xác, sau đó bấm Lưu/Save.
Để trích xuất hoặc lọc kết quả nhận dạng OCR, bấm nút và chấp nhận tải dữ liệu xuống.
3. Hướng dẫn trích xuất thông tin với những mẫu văn bản không có sẵn trên FPT AI Read
Bên cạnh hỗ trợ nhận dạng và trích xuất thông tin từ ảnh chụp mẫu văn bản có sẵn, FPT AI Read triển khai tính năng cho phép người dùng cuối tự xây dựng mô hình trích xuất thông minh theo bất kì định dạng văn bản tùy biến nào như hợp đồng, chứng từ, thẻ, v.v.
3.1 Tạo mô hình và tải lên ảnh chụp mẫu văn bản
Đối với loại văn bản không có sẵn trong mục Thư viện, bạn hãy trở lại màn hình chính bằng cách ấn vào mục Ứng dụng ở thanh điều hướng bên trái màn hình, chọn nút Tạo mới ở góc phải màn hình để tự tạo mẫu văn bản của riêng mình.
Sau đó, nhập trường thông tin Tên dự án, chọn loại văn bản OCR và click vào nút Tạo. Bài viết lấy ví dụ hướng dẫn trích xuất thông tin từ Thẻ sinh viên.
Lúc này, giao diện trên màn hình sẽ hiển thị những trường thông tin quan trọng để bạn có thể theo dõi toàn bộ quá trình sử dụng và các dữ liệu được số hóa (Tên, Trạng thái, Thời gian cập nhật, Thời điểm tạo, Dùng model, Hành động). Người dùng lựa chọn mục Mẫu trên thanh điều hướng bên trái, chọn Tải lên để thực hiện nhập dữ liệu đầu vào cho mẫu văn bản mới.
Bạn có thể tải lên đồng thời nhiều file ảnh bằng cách click Chọn File (1) ở góc dưới bên trải của màn hình. Sau khi đã lựa chọn những file ảnh Thẻ sinh viên, bạn click Tải lên (2) để hoàn thành bước này. Lưu ý: Dung lượng upload của 1 file không quá 5MB, chấp nhận đa dạng các file ảnh khác nhau (jpg, png, v.v…)
Tương tự như khi thao tác trên các mẫu văn bản có sẵn, thông tin đã được trích xuất từ ảnh sẽ được hiển thị trên cột phía bên phải.
3.2 Xây dựng mô hình trích xuất
Để có thể lọc ra được các thông tin quan trọng/thông tin cần trích xuất, người dùng cần xây dựng mô hình nhận dạng và trích xuất văn bản với các mẫu văn bản cốt lõi. Các mẫu văn bản phải là ảnh chụp có chất lượng tốt, ảnh chụp thẳng, không bị bóng mờ, nhòe, lệch khung hình. Mẫu văn bản có chất lượng tốt sẽ giúp khả năng nhận diện và trích xuất trở nên chính xác hơn. Để có thể xây dựng mô hình nhận dạng và trích xuất, bạn cần ít nhất 3 mẫu văn bản.
Sau khi đã thêm mẫu ảnh trong mục “Mẫu”, người dùng tiến hành đánh mã (labelling) các trường thông tin cần trích xuất, sửa lại kết quả trích xuất nhằm tăng cường khả năng nhận diện chính xác bằng cách chọn “Sửa”.
Trong thanh điều hướng bên trái, lựa chọn mục “Mẫu”, lựa chọn từng ảnh cần dán nhãn (labelling), chọn “Sửa”.
Ở bước này, bạn cần huấn luyện hệ thống bằng cách trỏ vào từng trường thông tin trên ảnh (1) và đối chiếu với dữ liệu hệ thống đã bóc tách (2). Bạn cần sửa dữ liệu máy nhận diện chưa chính xác hoặc xóa dữ liệu máy nhận diện không cần thiết. Với mỗi thay đổi, hệ thống sẽ tự động lưu lại thông tin bạn đã sửa.
Sau khi thao tác việc lựa chọn và hiệu đính dữ liệu, chọn “Thêm vào Train” để đưa mẫu vào danh sách chờ Huấn luyện.
Sau khi hiệu chỉnh xong tất cả các Mẫu dữ liệu, người dùng lựa chọn nút “Huấn luyện” để hệ thống bắt đầu quá trình huấn luyện mẫu dữ liệu.
Quá trình huấn luyện này sẽ mất một vài tiếng và cần ít nhất 3 mẫu để có thể bắt đầu quá trình huấn luyện. Sau khi quá trình Huấn luyện xong, hệ thống sẽ có thông báo cho người dùng.
Phần mềm FPT AI Read có khả năng tự học và trở nên thông minh hơn thông qua những dữ liệu đã được tinh chỉnh và huấn luyện trước đó. Bằng việc cung cấp mẫu văn bản chất lượng, dán nhãn chính xác dữ liệu, huấn luyện và kiểm thử mô hình thường xuyên, bạn có thể tự huấn luyện máy nhận diện và trích xuất thông tin một mẫu văn bản mới không có sẵn trong Thư viện một cách dễ dàng và thuận tiện.
3.3 Sử dụng mô hình trích xuất
Sau khi đã huấn luyện thành công các mẫu dữ liệu, người dùng tiến hành nhận dạng và trích xuất các văn bản theo như định dạng mẫu có sẵn. Các thao tác này tương tự như sử dụng với mẫu văn bản trong thư viện. Người dùng lựa chọn mục “Sử dụng” trên thanh điều hướng bên trái, tải tài liệu lên và nhận kết quả trích xuất.
4. Hướng dẫn tích hợp ứng dụng FPT AI Read vào hệ thống của doanh nghiệp
Việc tích hợp ứng dụng FPT AI Read với hệ thống của doanh nghiệp vô cùng dễ dàng với chi phí hợp lý thông qua APIs và dựa trên số lượng request thực tế của doanh nghiệp.
Để kết nối đến API OCR, bạn cần có tài khoản trên Console.fpt.ai. Sau đó tạo một API key để có thể gửi request tới gateway (mặc định mỗi API key tạo mới chỉ có thể gửi 50 requests).
Bạn có thể tìm hiểu chi tiết tại đây: https://fpt.ai/vi/tu-dong-trich-xuat-thong-tin-tu-hinh-anh-voi-api-cua-fptai
Đặc biệt, phần mềm OCR FPT AI Read có thể được triển khai một cách linh hoạt và mở rộng quy mô xử lý dữ liệu của hệ thống theo thực tế nhu cầu của doanh nghiệp.
5. Mua thêm dung lượng
Phần mềm ocr tiếng việt FPT AI Read tặng bạn miễn phí 50 requests/năm. Tuy nhiên, nếu có nhu cầu sử dụng lưu lượng nhiều hơn và tốc độ chuyển đổi cao hơn, bạn có thể mua thêm các gói trả phí trong phần “Cài đặt”, lựa chọn nút “Mua”.
Đối với khách hàng doanh nghiệp hoặc có nhu cầu sử dụng số lượng lớn yêu cầu, vui lòng liên hệ với chúng tôi ngay để được tư vấn!
_____________________________
👉🏻 Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi
📍 Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội
☎️ Hotline: 1900 638 399
📧 Email: [email protected]