Nhảy đến nội dung

FPT.AI – Nền tảng Trí tuệ nhân tạo toàn diện

by admin 27.12.2019

Mỗi cuộc cách mạng công nghiệp đều được thúc đẩy bởi sự phát triển của công nghệ, sự xuất hiện của động cơ hơi nước cho đến sự bùng nổ của máy vi tính đã đưa loài người và toàn bộ nền công nghiệp đến với kỷ nguyên mới. Bước vào cuộc cách mạng công nghiệp lần thứ tư, Trí tuệ nhân tạo (AI), Blockchain và Kết nối vạn vật (IoT) sẽ là những công nghệ chủ chốt, trong đó AI là nhân tố hạt nhân.

Theo báo cáo của Goldman Sachs, AI là công nghệ nhận được nhiều vốn đầu tư nhất từ các quỹ đầu tư mạo hiểm. Bên cạnh đó, hầu hết các doanh nghiệp đều lựa chọn AI như một khoản đầu tư chiến lược của mình.

Theo quan điểm của FPT, AI là lĩnh vực công nghệ cấp thiết nhất cần được tập trung đầu tư một cách tổng thể từ xây dựng nguồn lực về con người, xác định phạm vi áp dụng đến việc xây dựng các ứng dụng. Trong đó, điều quan trọng nhất là xây dựng một nền tảng AI nâng cao giúp FPT trở thành một công ty công nghệ cạnh tranh toàn cầu.

Xử lý ngôn ngữ tự nhiên, Nhận diện giọng nói, Thị giác máy tính và Cơ sở Tri thức là những mô-đun chủ đạo hiện nay mà nền tảng FPT.AI cung cấp. Với mục tiêu đầy tham vọng của mình, FPT.AI hướng tới việc trở thành một nền tảng có thể hỗ trợ con người trong quá trình tự động ra quyết định.
 

Hệ cơ sở tri thức

FPT.AI cung cấp một nền tảng giúp máy móc có thể học, trích xuất và khám phá những kiến thức, từ đó doanh nghiệp có kết hợp các dữ liệu riêng của mình (thông tin về sản phẩm, hướng dẫn sử dụng…) với kiến thức ngành riêng biệt để tạo nên một mạng lưới các khái niệm và các mối liên hệ.

Từ sơ đồ này, nền tảng sẽ cung cấp khả năng đặt câu hỏi và trả lời bằng chính các kiến thức mà nền tảng đó học được. Mô-đun cơ sở tri thức sẽ đóng vai trò như một bộ não, cung cấp thông tin tới các Automated Agent để giao tiếp với con người.

Knowledge Graph

Automated Agents

FPT.AI cung cấp cho các doanh nghiệp khả năng xây dựng các Automated Agent có thể hỗ trợ máy móc giao tiếp với con người một cách tự nhiên nhờ vào ba mô-đun:  Xử lý Ngôn ngữ Tự nhiên, Nhận dạng – Tổng hợp giọng nói và đặc biệt là Quản lý Hội thoại.

  • Mô-đun đầu tiên, xử lý ngôn ngữ tự nhiên hiện đang được kết hợp với những kỹ thuật tiên tiến nhất đảm bảo việc hiểu những ý định và thông tin do con người cung cấp. Phiên bản hiện tại của mô-đun hỗ trợ 3 ngôn ngữ: tiếng Việt, tiếng Anh và tiếng Nhật.
  • Để tạo lập một trợ lý ảo (chatbot) hiệu quả, trở ngại lớn nhất là làm thế nào để hội thoại giữa Bot và người dùng được tự nhiên và linh hoạt, đồng thời hỗ trợ đa dạng kịch bản trò chuyện chỉ trong một Bot. Phiên bản mới của mô-đun Quản lý Hội thoại sẽ mang đến cho người dùng chức năng để cấu hình Khung Quản lý Hội thoại một cách linh hoạt theo cách tiếp cận “Trạng thái Thông tin” (Information State). Theo đó, những kịch bản phức tạp sẽ được hỗ trợ, và người dùng có thể trò chuyện hoặc tạo ngữ cảnh theo nhu cầu.
  • Trong khi Tổng hợp Giọng nói đã được phát triển từ cách đây 5 năm, thì Nhận dạng giọng nói là một mô-đun mới được phát triển và sẽ được tích hợp vào nền tảng FPT.AI. Đây là mảnh ghép then chốt nhằm hoàn thiện việc xây dựng một Automated Agent. Các thành phần FPT.AI Speech chỉ tập trung vào ngôn ngữ tiếng Việt để có thể đạt tới độ chính xác cao nhất.

 

Những ứng dụng căn bản cho Automated Agent là Chatbot và Tổng đài tự động. Trong khi chatbot là ứng dụng cơ bản nhất thì Tổng đài tự động có cấu trúc phức tạp hơn nhưng mang lại lợi ích to lớn hơn cho khách hàng. Trong năm nay, sẽ có hai phiên bản Tổng đài tự động được giới thiệu. Đầu tiên, Cổng vào Giọng nói (Voice Gateway) sẽ thay thế Hệ thống trả lời tự động (Interactive Voice Response), người gọi sẽ không phải nghe một loạt hướng dẫn từ điện thoại, mà chỉ cần nói nội dung cần hỗ trợ. Tiếp theo đó, người gọi sẽ tương tác với chức năng Hỏi & Đáp căn bản dựa trên những công nghệ và những thành phần của cơ sở Tri thức nói trên.

Xử lý ảnh

Screenshot from FPT.AI, module Dialog Management

Xử lý ảnh cũng sẽ là mô-đun mới của FPT.AI tập trung vào việc cho phép Tự động hoá các quy trình xử lý (Cognitive RPA) cho doanh nghiệp. Nhận dạng Hình ảnh, nhận dạng mẫu và nhận dạng ký tự quang học (Optical Character Recognition – OCR) là những tính năng chính. Mô-đun này nhằm mục đích chụp và số hóa tất cả những giấy tờ căn bản như Chứng minh thư nhân dân, Bằng lái xe, Hóa đơn và hướng tới các mẫu chung.

Sau hai năm ra mắt, FPT.AI đã đạt được những kết quả đáng khích lệ tại thị trường nội địa và quốc tế: hơn 1000 ứng dụng chatbot được tạo lập trên nền tảng FPT.AI đã giúp nâng cao trải nghiệm của người dùng trên nhiều lĩnh vực như viễn thông, thương mại điện tử, ngân hàng, hay hành chính công… đồng thời giúp giảm thiểu chi phí vận hành cho doanh nghiệp. Một ví dụ tiêu biểu là Bot hỗ trợ giải đáp các thông tin về tài khoản người dùng, tra cứu thông tin về sản phẩm, dịch vụ mới của hãng viễn thông hàng đầu Singapore đã được FPT.AI xây dựng. Ứng dụng đã tiếp nhận và xử lý hơn 40.000 yêu cầu của người dùng trong một tháng, ngày cao điểm là hơn 4000 yêu cầu.

Bên cạnh đó, nhiều tính năng mới đã mang tới những mô hình kinh doanh mang tính chất đột phá cho đối tác của FPT.AI. Hệ thống tổng đài tự động sử dụng dịch vụ chuyển đổi văn bản thành giọng nói của FPT.AI đã thực hiện được hơn 750.000 nghìn cuộc gọi mỗi tháng, có thể thực hiện đồng thời 15.000 cuộc gọi, mỗi cuộc gọi kéo dài 2 phút. Trong khi để làm được việc đó trong 1 giờ cần 500 người. Với sự hỗ trợ của AI, máy móc đã có thể thay thế con người trong những tác vụ đơn giản, để có thể tập trung nguồn lực vào những công việc đòi hỏi chuyên môn cao hơn, mang lại những giá trị cao hơn.

Những con số như hơn 7,5 triệu yêu cầu, hơn 2.000 giờ giọng nói được các đối tác của FPT.AI sử dụng chính là minh chứng rõ ràng nhất về những lợi ích và hiệu quả mà nền tảng này đem lại.

Thông tin về tác giả:
Lê Hồng Việt