Chuyển đến phần nội dung
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
Bài viết

Hướng dẫn sử dụng FPT AI Read trích xuất thông tin từ ảnh chụp

Tháng Năm 13, 2024

Chia sẻ với:

Để sử dụng ứng dụng FPT.AI Reader, bạn cần có tài khoản FPT ID. Nếu chưa có tài khoản, bạn hãy đăng kí tài khoản ngay tại đây: https://id.fptcloud.com/

Sau đó, hãy truy cập: https://reader.fpt.ai/ để bắt đầu những trải nghiệm tuyệt vời!

fpt ai reader
Giao diện của FPT AI Reader

Ứng dụng FPT AI Read hỗ trợ hai ngôn ngữ là Tiếng Anh và Tiếng Việt. Bạn hãy click vào biểu tượng trên góc phải màn hình để chọn ngôn ngữ sử dụng.

fpt ai reader
Lựa chọn ngôn ngữ sử dụng là tiếng Việt hoặc Tiếng Anh

>>> XEM THÊM: Computer Vision là gì? Cách thức hoạt động và 12+ ứng dụng

Hướng dẫn trích xuất thông tin với thư viện văn bản có sẵn trên FPT AI Reader

Tiếp theo, để trích xuất thông tin từ các kiểu văn bản ảnh chụp đã có sẵn trên thư viện của FPT AI Reader, bạn thực hiện các bước sau:

Lựa chọn mẫu văn bản

Đầu tiên, click chọn Thư viện ở góc phải màn hình, giao diện FPT AI Read sẽ hiển thị các mẫu văn bản đã được tích hợp sẵn trên ứng dụng với độ trích xuất chính xác lên đến 98%.

fpt ai reader
Click chọn thư viện

Hiện tại, FPT AI Read hỗ trợ người dùng số hóa thông tin từ các mẫu văn bản như giấy tờ cá nhân, và theo các nhóm lĩnh vực ngành nghề khác nhau, trong đó có thể kể tới Chứng minh nhân dân, Bằng lái xe, Hộ chiếu, Giấy khai sinh, Hóa đơn, các chứng từ Bảo hiểm, v.v.

fpt ai reader
FPT AI Reader hỗ trợ số hóa các mẫu văn bản thuộc các nhóm lĩnh vực, ngành nghề khác nhau

Để bắt đầu sử dụng, bạn cần click chọn loại văn bản cần trích xuất dữ liệu, đặt tên cho Dự án và click chọn Tạo. Bài viết sẽ lấy ví dụ với loại văn bản là Bằng lái xe.

fpt ai reader
Chọn loại văn bản cần trích xuất dữ liệu

Lúc này, giao diện trên màn hình sẽ hiển thị những trường thông tin quan trọng giúp bạn theo dõi toàn bộ quá trình sử dụng, cùng các dữ liệu liên quan khi thực hiện trích xuất thông tin Bằng lái xe (Tên, Trạng thái, Thời gian cập nhật, Thời điểm tạo, Dùng model, Hành động).

>>> XEM THÊM: Số Hóa Chứng Từ Xuất Nhập Khẩu Với FPT AI Read

Tải lên dữ liệu

Để tiếp tục, bạn chọn Tải lên ở góc phải màn hình, thực hiện tải hình ảnh Bằng lái xe lên hệ thống.

Lưu ý: Dung lượng upload của 1 file không quá 5MB, chấp nhận các định dạng ảnh như jpg, png, pdf, v.v.

fpt ai reader
Tải hình ảnh lên hệ thống

Bạn có thể tải lên đồng thời nhiều file ảnh bằng cách click Chọn File (1) ở góc dưới bên trải của màn hình. Sau khi đã lựa chọn những file ảnh Bằng lái xe cần tải, bạn click Tải lên (2) để hoàn thành bước này.

fpt ai reader
Tải nhiều file lên hệ thống

Ngay khi hình ảnh Bằng lái xe được tải thành công lên hệ thống, FPT AI Read sẽ tự động xử lý ảnh chỉ sau vài giây và chuyển trạng thái ảnh thành Đã xử lý. Lúc này, bạn có thể click vào từng dòng để xem được hình ảnh Bằng lái xe và kết quả trích xuất.

fpt ai reader
Hnh ảnh đã được FPT AI Reader xử lý

(Lưu ý: ảnh chỉ mang tính chất minh họa và không có giá trị sử dụng thực tế)

Thực hiện tương tự với những hình ảnh Bằng lái xe khác đã được tải lên thành công.

Ứng dụng công nghệ OCR, FPT AI Reader vẫn có thể nhận diện với kết quả chính xác cao trong điều kiện ảnh bị mờ, nhòe, kí tự trong ảnh không rõ nét, có các mảng màu khác nhau, các kí tự xếp chồng lên nhau, ảnh chụp không thẳng hàng v.v.. (Ví dụ: vết dấu đỏ chèn lên ký tự “ngày/date 05 tháng/month 07” trong ảnh dưới đây).

fpt ai reader
FPT AI Reader có thể nhận diện với kết quả chính xác cao trong trường hợp ảnh có vết dấu đỏ chèn lên ký tự

(Lưu ý: ảnh chỉ mang tính chất minh họa và không có giá trị sử dụng thực tế)

>>> XEM THÊM: Nhận dạng chữ viết tay bằng công nghệ OCR với FPT AI Read

Phân quyền người dùng

FPT AI Read còn sở hữu tính năng phân quyền truy cập theo vai trò với những cá nhân khác trong cùng tổ chức. Người được phân quyền truy cập sẽ có thể tiếp cận kho dữ liệu hoặc trực tiếp đóng góp dữ liệu vào dự án.

Phân quyền cho người dùng khác bằng cách click chọn mục Cài đặt bên thanh ứng dụng bên trái màn hình.

fpt ai reader
Phân quyền truy cập theo vai trò của cá nhân trong tổ chức

Lựa chọn “Tạo mới” để phân quyền cho người dùng. Lựa chọn quyền Chỉnh sửa/Editor hoặc quyền Xem/Viewer.

fpt ai reader
Chỉnh sửa/Editor hoặc Xem/Viewer quyền

Điền e-mail của tài khoản bạn muốn chia sẻ dự án, rồi chọn vai trò (Role) phù hợp.

Có hai vai trò:

⁠           ?⁠ Admin: Người dùng có thể tải ảnh lên để thử nghiệm API như chủ sở hữu ứng dụng

⁠           ?⁠ Viewer: Người dùng chỉ có thể xem quá trình thử nghiệm

Lưu ý: Người dùng mới cần có tài khoản FPT.AI Reader trước khi được phân quyền.

Thử nghiệm API OCR

Sau khi truy cập dự án bạn muốn thử nghiệm, tại trang Sử dụng/Usage, bấm vào nút Tải lên/Upload để tải lên ảnh thử nghiệm.

Bấm vào nút OCR FPT.AI để tìm kiếm ảnh theo tên hoặc áp dụng bộ lọc cho ảnh.

fpt ai reader
Tìm kiếm ảnh theo tên hoặc áp dụng bộ lọc cho ảnh

Bấm vào tên ảnh để hiển thị kết quả API như dưới đây:

fpt ai reader
Kết quả API OCR

Bấm vào nút OCR FPT.AIđể tìm hiểu thêm về kết quả OCR của ảnh.

fpt ai reader
Xem thêm về kết quả OCR của ảnh

Nếu kết quả được trích xuất không chính xác, hãy kéo chuột vào thông tin và bấm vào lá cờ để báo cáo lỗi.

fpt ai reader
Báo lỗi nếu thông tin không chính xác

Điền thông tin chính xác, sau đó bấm Lưu/Save.

fpt ai reader
Lưu/Save nếu thông tin chính xác

Để trích xuất hoặc lọc kết quả nhận dạng OCR, bấm nút OCR FPT.AI và chấp nhận tải dữ liệu xuống.

>>> TÌM HIỂU: Số hóa dữ liệu là gì? Quy trình và phần mềm khuyên dùng

Hướng dẫn trích xuất thông tin với những mẫu văn bản không có sẵn trên FPT AI Reader

Bên cạnh hỗ trợ nhận dạng và trích xuất thông tin từ ảnh chụp mẫu văn bản có sẵn, FPT AI Reader còn cho phép người dùng tự xây dựng mô hình trích xuất thông minh theo bất kì định dạng văn bản tùy biến nào như hợp đồng, chứng từ, thẻ, v.v. Các bước thực hiện cụ thể như sau:

Tạo mô hình và tải lên ảnh chụp mẫu văn bản

Đối với loại văn bản không có sẵn trong mục Thư viện, bạn hãy trở lại màn hình chính bằng cách ấn vào mục Ứng dụng ở thanh điều hướng bên trái màn hình, chọn nút Tạo mới ở góc phải màn hình để tự tạo mẫu văn bản của riêng mình.

fpt ai reader
Tạo mới loại văn bản không có sẵn trong Thư viện

Sau đó, nhập trường thông tin Tên dự án, chọn loại văn bản OCR và click vào nút Tạo. Bài viết lấy ví dụ  hướng dẫn trích xuất thông tin từ Thẻ sinh viên.

fpt ai reader
Nhập Tên dự án, chọn loại văn bản OCR và click vào nút Tạo

Lúc này, giao diện trên màn hình sẽ hiển thị những trường thông tin quan trọng để bạn có thể theo dõi toàn bộ quá trình sử dụng và các dữ liệu được số hóa (Tên, Trạng thái, Thời gian cập nhật, Thời điểm tạo, Dùng model, Hành động). Người dùng lựa chọn mục Mẫu trên thanh điều hướng bên trái, chọn Tải lên để thực hiện nhập dữ liệu đầu vào cho mẫu văn bản mới.

fpt ai reader
Nhập dữ liệu đầu vào cho mẫu văn bản mới

Bạn có thể tải lên đồng thời nhiều file ảnh bằng cách click Chọn File (1) ở góc dưới bên trải của màn hình. Sau khi đã lựa chọn những file ảnh Thẻ sinh viên, bạn click Tải lên (2) để hoàn thành bước này. Lưu ý: Dung lượng upload của 1 file không quá 5MB, chấp nhận đa dạng các file ảnh khác nhau (jpg, png, v.v…)

fpt ai reader
Tải lên đồng thời nhiều file ảnh

Tương tự như khi thao tác trên các mẫu văn bản có sẵn, thông tin đã được trích xuất từ ảnh sẽ được hiển thị trên cột phía bên phải.

fpt ai reader
Thông tin đã được trích xuất từ ảnh sẽ được hiển thị trên cột phía bên phải

>>> ĐỌC NGAY: OCR căn cước công dân: Ứng dụng công nghệ số hóa giấy tờ tùy thân

Xây dựng mô hình trích xuất

Để có thể lọc ra được các thông tin quan trọng/thông tin cần trích xuất, người dùng cần xây dựng mô hình nhận dạng và trích xuất văn bản với các mẫu văn bản cốt lõi. Các mẫu văn bản phải là ảnh chụp có chất lượng tốt, ảnh chụp thẳng, không bị bóng mờ, nhòe, lệch khung hình. Mẫu văn bản có chất lượng tốt sẽ giúp khả năng nhận diện và trích xuất trở nên chính xác hơn. Để có thể xây dựng mô hình nhận dạng và trích xuất, bạn cần ít nhất 3 mẫu văn bản.

Sau khi đã thêm mẫu ảnh trong mục “Mẫu”, người dùng tiến hành đánh mã (labelling) các trường thông tin cần trích xuất, sửa lại kết quả trích xuất nhằm tăng cường khả năng nhận diện chính xác bằng cách chọn “Sửa”.

Trong thanh điều hướng bên trái, lựa chọn mục “Mẫu”, lựa chọn từng ảnh cần dán nhãn (labelling), chọn “Sửa”.

fpt ai reader
Xây dựng mô hình nhận dạng và trích xuất các mẫu văn bản cốt lõi

Ở bước này, bạn cần huấn luyện hệ thống bằng cách trỏ vào từng trường thông tin trên ảnh (1) và đối chiếu với dữ liệu hệ thống đã bóc tách (2). Bạn cần sửa dữ liệu máy nhận diện chưa chính xác hoặc xóa dữ liệu máy nhận diện không cần thiết. Với mỗi thay đổi, hệ thống sẽ tự động lưu lại thông tin bạn đã sửa.

fpt ai reader
Cần huấn luyện để hệ thống nhận diện thông tin chính xác

Sau khi thao tác việc lựa chọn và hiệu đính dữ liệu, chọn “Thêm vào Train” để đưa mẫu vào danh sách chờ Huấn luyện.

Sau khi hiệu chỉnh xong tất cả các Mẫu dữ liệu, người dùng lựa chọn nút “Huấn luyện” để hệ thống bắt đầu quá trình huấn luyện mẫu dữ liệu.

fpt ai reader
Bắt đầu quá trình huấn luyện mẫu dữ liệu

Quá trình huấn luyện này sẽ mất một vài tiếng và cần ít nhất 3 mẫu để có thể bắt đầu quá trình huấn luyện. Sau khi quá trình Huấn luyện xong, hệ thống sẽ có thông báo cho người dùng.

Phần mềm FPT AI Read có khả năng tự học và trở nên thông minh hơn thông qua những dữ liệu đã được tinh chỉnh và huấn luyện trước đó. Bằng việc cung cấp mẫu văn bản chất lượng, dán nhãn chính xác dữ liệu, huấn luyện và kiểm thử mô hình thường xuyên, bạn có thể tự huấn luyện máy nhận diện và trích xuất thông tin một mẫu văn bản mới không có sẵn trong Thư viện một cách dễ dàng và thuận tiện.

Sử dụng mô hình trích xuất

Sau khi đã huấn luyện thành công các mẫu dữ liệu, người dùng tiến hành nhận dạng và trích xuất các văn bản theo như định dạng mẫu có sẵn. Các thao tác này tương tự như sử dụng với mẫu văn bản trong thư viện. Người dùng lựa chọn mục “Sử dụng” trên thanh điều hướng bên trái, tải tài liệu lên và nhận kết quả trích xuất.

>>> XEM THÊM: Insurtech là gì? Xu hướng ứng dụng công nghệ bảo hiểm tại Việt Nam

Hướng dẫn tích hợp ứng dụng FPT AI Reader vào hệ thống của doanh nghiệp

Việc tích hợp ứng dụng FPT AI Read với hệ thống của doanh nghiệp vô cùng dễ dàng với chi phí hợp lý thông qua APIs và dựa trên số lượng request thực tế của doanh nghiệp. Để kết nối đến API OCR, bạn cần có tài khoản trên Console.fpt.ai. Sau đó tạo một API key để có thể gửi request tới gateway (mặc định mỗi API key tạo mới chỉ có thể gửi 50 requests).

FPT AI Reader có thể được triển khai một cách linh hoạt và mở rộng quy mô xử lý dữ liệu của hệ thống theo thực tế nhu cầu của doanh nghiệp.

Mua thêm dung lượng

Phần mềm OCR tiếng việt FPT AI Read tặng bạn miễn phí 50 requests/năm. Tuy nhiên, nếu có nhu cầu sử dụng lưu lượng nhiều hơn và tốc độ chuyển đổi cao hơn, bạn có thể mua thêm các gói trả phí trong phần “Cài đặt”, lựa chọn nút “Mua”.

Đối với khách hàng doanh nghiệp hoặc có nhu cầu sử dụng số lượng lớn yêu cầu, vui lòng liên hệ với chúng tôi ngay để được tư vấn!

_____________________________

👉🏻 Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

📍 Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

☎️ Hotline: 1900 638 399

📧 Email: [email protected]

>>> ĐỌC THÊM VỀ CÁC CÔNG NGHỆ KHÁC:

Đánh giá

Bài viết liên quan

Cập nhật mọi tin tức mới nhất về công nghệ AI

Đăng ký nhận bản tin của FPT.AI để được phủ sóng mọi xu hướng công nghệ, câu chuyện thành công và phân tích của chuyên gia.