Chuyển đến phần nội dung
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
Bài viết

FPT và NVIDIA hợp tác phát hành tập dữ liệu Nemotron Personas Việt Nam

Tháng Sáu 3, 2026

Chia sẻ với:

Hà Nội, Việt Nam Tập đoàn FPT và NVIDIA hôm nay công bố phát hành tập dữ liệu Nemotron-Personas-Vietnam nhằm thúc đẩy phát triển AI chủ quyền tại Việt Nam và mở rộng ra khu vực Đông Nam Á. Tập dữ liệu được cung cấp miễn phí cho mục đích thương mại và phi thương mại, giúp các nhà phát triển, nhà nghiên cứu và doanh nghiệp xây dựng các hệ thống AI phản ánh đặc thù nhân khẩu học, địa lý và văn hóa Việt Nam.

Nemotron-Personas Việt Nam mở rộng hệ sinh thái NVIDIA Nemotron, bao gồm các mô hình, bộ dữ liệu, tài nguyên đánh giá và thư viện NVIDIA NeMo, cho phép các nhà phát triển tùy chỉnh, đánh giá và triển khai đa dạng ứng dụng AI cho người Việt.

Phát triển ứng dụng AI với năng lực am hiểu bản địa

Sự hợp tác giữa FPT và NVIDIA xuất phát từ mục tiêu chung, đó là cung cấp các mô hình, bộ dữ liệu và thư viện mở, hiệu quả cho cộng đồng phát triển AI. Các nguồn lực này giúp nhà phát triển xây dựng hệ thống AI có khả năng phản ánh tốt hơn ngôn ngữ, văn hóa, quy định, hạ tầng dữ liệu và mục tiêu kinh tế của từng quốc gia, thay vì phụ thuộc hoàn toàn vào các mô hình tổng quát toàn cầu.

Trong hợp tác này, NVIDIA đóng góp khung mô hình mở, thư viện dữ liệu tổng hợp NeMo Data Designer và phương pháp Nemotron-Personas. Đây là cách tiếp cận có cấu trúc để xây dựng các tập dữ liệu tổng hợp ở quy mô dân số, có thể kiểm chứng dựa trên đặc điểm nhân khẩu học và sẵn sàng cho cộng đồng AI sử dụng.

Với vai trò là NVIDIA Preferred Partner, FPT đóng góp chuyên môn địa phương, phương pháp xác thực, cơ sở hạ tầng dữ liệu và năng lực nghiên cứu AI thông qua ba đơn vị:

  • FPT Smart Cloud: Cung cấp dịch vụ GPU Cloud với các thế hệ GPU mới nhất của NVIDIA và các nền tảng suy luận AI tiên tiến, phục vụ quá trình phát triển và triển khai tập dữ liệu.
  • Viện Quantum AI & Cyber Security: Cung cấp chuyên môn và năng lực nghiên cứu, tham gia xây dựng phương pháp triển khai và xác thực tập dữ liệu Nemotron-Personas-Vietnam.
  • FPT DC5: Vận hành khảo sát thực địa, đóng góp dữ liệu nguồn qua khảo sát và hỗ trợ quy trình thu thập dữ liệu.

Đưa thực tế ngôn ngữ, nhân khẩu học và bối cảnh lao động Việt Nam vào ứng dụng AI

Bộ sưu tập Nemotron-Personas mở rộng họ mô hình NVIDIA Nemotron với các tập dữ liệu tổng hợp quy mô dân số dựa trên thống kê nhân khẩu học và lao động thực tế. Đây là các tập dữ liệu có cấu trúc, có thể kiểm chứng, phản ánh cách mọi người thực sự sống, làm việc và giao tiếp.

Tập dữ liệu Nemotron-Personas-Vietnam được phát triển riêng nhằm phản ánh sự đa dạng trong ngôn ngữ, nhân khẩu học và đặc điểm lao động cụ thể của Việt Nam.

Tập dữ liệu Nemotron-Personas-Vietnam bao gồm 900.000 persona tổng hợp dựa trên các số liệu thống kê chính thức mới nhất trong niên giám và địa giới của Việt Nam. Mỗi bản ghi chứa 31 trường, bao gồm 9 trường persona, 6 trường thuộc tính persona, 15 trường ngữ cảnh và 1 mã định danh duy nhất, cho phép các nhà phát triển dễ dàng lọc, phân loại và nhắm mục tiêu đến các nhóm dân số cụ thể. Tập dữ liệu được phát hành dưới dạng mã nguồn mở trên HuggingFace và tương thích với các thư viện NVIDIA NeMo trong suốt vòng đời phát triển AI, từ thu thập dữ liệu và tinh chỉnh đến sau huấn luyện và triển khai.

PGS.TS. Ngô Xuân Bách, Giám đốc Khối Sản phẩm AI, FPT Smart Cloud và Giám đốc Viện Quantum AI & Cyber Security, Tập đoàn FPT cho biết, “FPT tin rằng chủ quyền AI phải được xây dựng từ nền tảng để phản ánh ngôn ngữ, văn hóa và thực tế kinh tế địa phương. Tập dữ liệu Nemotron-Personas-Vietnam thể hiện cam kết của chúng tôi trong việc giúp các nhà phát triển AI địa phương dễ dàng tiếp cận các nguồn lực cần thiết để xây dựng các giải pháp AI dành riêng cho người Việt và có thể mở rộng ra khu vực”. 

Thúc đẩy AI có chủ quyền cho Việt Nam trên quy mô lớn

AI có chủ quyền ngày càng quan trọng với các quốc gia và ngành công nghiệp nơi các mô hình chung không đủ để đáp ứng các bài toán đặc thù của từng khu vực địa lý, ngành nghề. Các quốc gia cần AI có thể hiểu ngôn ngữ, thích ứng với khuôn khổ pháp lý và phù hợp với bối cảnh địa phương. Việc xây dựng và triển khai AI có chủ quyền đòi hỏi một hạ tầng AI mạnh mẽ phục vụ khối lượng công việc tính toán hiệu năng cao và suy luận ở quy mô lớn.

Với tầm nhìn làm chủ công nghệ AI, FPT liên tục mở rộng hệ sinh thái công nghệ, cho phép các nhà đổi mới AI để huấn luyện và triển khai AI trong phạm vi khu vực thông qua ba lớp tích hợp:

  • Dịch vụ GPU Cloud: Cung cấp nền tảng tính toán hiệu năng cao, sử dụng các dòng GPU mới nhất từ NVIDIA để huấn luyện và chạy các mô hình AI.
  • Nền tảng AI sẵn sàng suy luận: Cung cấp các công cụ cần thiết để triển khai các mô hình AI tiên tiến ở quy mô lớn.
  • Ứng dụng AI sẵn dùng: Đưa các khả năng AI chủ quyền trực tiếp đến các doanh nghiệp và tổ chức Việt Nam

Ba lớp năng lực này hợp thành một hệ sinh thái AI chủ quyền hoàn chỉnh, phục vụ toàn bộ chuỗi giá trị AI từ dữ liệu nền tảng và các mô hình mở đến các sản phẩm AI đã được triển khai và bản địa hóa, được xây dựng cho Việt Nam và có thể nhân rộng ra các quốc gia trong khu vực.

Bài viết liên quan

Cập nhật mọi tin tức mới nhất về công nghệ AI

Đăng ký nhận bản tin của FPT.AI để được phủ sóng mọi xu hướng công nghệ, câu chuyện thành công và phân tích của chuyên gia.