Nhảy đến nội dung
Reader

Sự phát triển của phần mềm OCR tiếng việt trong lĩnh vực ngân hàng

by content 09.01.2020

1. Vậy OCR là gì?

Nhận dạng kí tự quang học (OCR – Optical Charater Recognition) là phần mềm máy tính xử lí và cho phép chuyển đổi tài liệu dạng ảnh (các ảnh đầu ra của máy scanner, máy ảnh, file PDF…) thành tài liệu có thể biên tập được (file word…). OCR thực hiện được điều này nhờ công nghệ xử lí ngôn ngữ tự nhiên (NLP), giúp nhận dạng các chữ cái và kí tự, sau đó sao chép chúng theo định dạng và thứ tự được viết.

Đối với việc trích xuất các trường thông tin cần thiết trong giấy tờ tuy thân như chứng minh nhân dân, giấy phép lái xe… khi đưa tài liệu lên hệ thống, người dùng chọn lựa và xác định các vùng cần bóc tách. Sau đó, hệ thống được OCR nhận dạng để chuyển sang dạng text và tự động trích xuất các trường thông tin cần thiết.

2. Tại sao trong lĩnh vực ngân hàng, công nghệ OCR phải tích hợp AI?

Công nghệ OCR đã mang lại vô số tiện ích cho ngành ngân hàng, nhưng đáng chú ý nhất là số hoá tài liệu. Đại diện của ngân hàng Rabobank (Hà Lan) cho biết, công ty họ ứng dụng công nghệ OCR vào rất nhiều hoạt động kinh doanh. Bởi họ cần tổng hợp và tích luỹ thông tin khách hàng cho chính mình, để tận dụng nguồn dữ liệu lớn này cho nhiều dự án của ngân hàng trong tương lai.

Những năm gần đây, với sự kết hợp của Trí tuệ nhân tạo (AI) và công nghệ xử lí ngôn ngữ tự nhiên (NLP), OCR được mở rộng thành công nghệ thu thập và quản lí dữ liệu, đóng vai trò vô cùng quan trọng trong hệ thống tự động hoá quy trình kinh doanh của ngân hàng. Nhờ tích hợp AI, OCR hiểu được những gì nó trích xuất và tự động cải thiện đầu ra bằng Học Máy, học hỏi từ các dữ liệu sẵn có và liên tục bổ sung kiến thức còn thiếu, giúp xử lí và kiểm tra các lỗi tài liệu vật lí một cách nhanh chóng, tiết kiệm thời gian và chi phí.

Đối với văn bản đánh máy, OCR cho độ chính xác trên 98%. Tỉ lệ chính xác là một vấn đề rất lớn vì những lỗi sai nhỏ có thể dẫn đến việc mất dữ liệu quan trọng. Các ngân hàng sử dụng OCR như một phương tiện bảo mật giao dịch và quản lí rủi ro. Bởi khi dùng OCR truyền thống, người dùng chỉ có thể kiểm tra tài liệu một cách thủ công. Nhưng khi được tích hợp AI và công nghệ xử lí ngôn ngữ tự nhiên (NLP), OCR có thêm khả năng tự động đánh giá rủi ro cho bất kì tài liệu giấy tờ nào. AI có thể học hiểu để phân tích và xử lí nội dung tài liệu kĩ lưỡng, phát hiện điều bất thường từ thông tin thanh toán tín dụng trong dữ liệu trích xuất của khách hàng.

Ngoài các loại giấy tờ phổ biến nhất mà ngân hàng thường xuyên phải xử lí là chứng minh nhân dân (để lấy thông tin khách hàng), hợp đồng, biên lai, giấy vay tiền, báo cáo tài chính,… thì các dịch vụ ngân hàng như cho vay thế chấp và thẻ ghi nợ cũng có 1 khối lượng lớn tài liệu giấy cần số hoá. Ngân hàng sử dụng phần mềm OCR để quét các giấy đảm bảo của khách hàng được viết bằng tay như giấy vay vốn, giấy uỷ quyền… Phần mềm có khả năng nhận ra sự khác biệt trong sắp xếp văn bản mới. Từ đó gửi đi cảnh báo cho người giám sát về sự thay đổi trong định dạng nếu có sự sửa chữa.

Trên thế giới, nhiều ngân hàng sử dụng OCR kết hợp phần mềm nhận dạng khuôn mặt để cung cấp bảo mật 2 lớp tại các cây ATM. Nhiều ứng dụng di động đã ra đời dựa trên công nghệ OCR mang lại tiện ích cho người dùng như quét Séc gửi tiền bằng điện thoại di động. Khách hàng chỉ cần chụp lại số tài khoản, số tiền và chữ kí trên Séc ở độ phân giải cao bằng điện thoại, sau đó OCR sẽ diễn ra trong ứng dụng di động và dữ liệu được gửi đến ngân hàng để xử lí một cách nhanh chóng.

3. Ưu điểm vượt trội của OCR

Các tài liệu sau khi số hoá sẽ được định tuyến thông qua 1 luồng dữ liệu trung tâm, nơi tất cả các chuyên gia, nhà phân tích và nhân viên ở các bộ phân liên quan đều có thể truy cập, tra cứu thông tin nhanh chóng. Việc áp dụng công nghệ OCR vào hệ thống giúp ngân hàng quản lí công việc hiệu quả, chuẩn hoá hoạt động của từng bộ phận, đơn giản hoá các quy trình, giảm gánh nặng hành chính, tăng năng suất lao động và tối ưu hoá chi phí doanh nghiệp.

Số hoá tài liệu giúp ngân hàng tiết kiệm không gian lưu trữ cần thiết cho cùng 1 thông tin, giảm từ vài mét vuông xuống chỉ còn vài byte trên máy tính, giải phóng không gian, mang lại nhiều diện tích sử dụng hơn. Các tài liệu được số hoá có thể lưu trữ ở nhiều định dạng, thuận tiện cho việc tìm kiếm, chỉnh sửa dễ dàng, sao lưu đơn giản và bền vững theo thời gian. Ngoài ra, việc giảm thiểu sử dụng giấy giúp bảo vệ môi trường, tiết kiệm chi phí sản xuất giấy.

Hiện nay, ngoài chữ Latinh, công nghệ OCR có thể xử lí được rất nhiều tập lệnh với đa dạng ngôn ngữ tượng hình như Ả Rập, Ấn Độ, Trung Quốc… Được kết hợp với các tiêu chuẩn Unicode và phầm mềm dịch mchine (google Dịch), tài liệu bằng ngôn ngữ nào cũng có thể được quét, số hoá và dịch sang ngôn ngữ khác một cách nhanh chóng, giúp cắt giảm nhu cầu dịch thuật của con người, giảm thời gian quay vòng hoạt động của doanh nghiệp.

Ngân hàng là 1 trong những ngành luôn tiên phong song hành cùng với sự phát triển của khoa học công nghệ. Việc ứng dụng OCR cùng nhiều nền tảng khoa học tiên tiến đã và đang biến ngân hàng trở nên thông minh và thân thiện với người dùng hơn.

Nắm bắt được thời cơ và hiểu rõ tầm quan trọng của khoa học công nghệ, FPT là một trong những tập đoàn đầu tiên tích hợp tính năng ưu việt của phần mềm OCR với nền tảng trí tuệ nhân tạo AI để cho ra đời FPT.AI Reader, giúp chính phủ và doanh nghiệp giải quyết bài toán số hoá các loại giấy tờ tuỳ thân và trích xuất thông tin từ các loại hóa đơn, chứng từ, form mẫu một cách nhanh chóng, với độ nhận diện chính xác dẫn đầu thị trường. Nhiều sản phẩm ứng dụng Trí tuệ nhân tạo khác của FPT đã và đang được hoàn thiện với nhiều tính năng vượt trội, hứa hẹn sẽ mang đến bộ giải pháp toàn diện, làm đơn giản hoá quy trình hoạt động của nhiều doanh nghiệp, không chỉ trong lĩnh vực tài chính – ngân hàng.

_____________________________

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

☎ Hotline: 1900 638 399

? Email: [email protected]