FPT.AI tham gia cuộc thi quốc tế mang tính học thuật uy tín nhất về ‘Xử lý ngôn ngữ và tiếng nói tiếng Việt’ với 3 giải Nhất và 1 giải Ba, chứng minh năng lực vượt trội về khả năng nghiên cứu công nghệ lõi để phát triển sản phẩm. Các công trình đều tập trung giải quyết những bài toán thiết thực của AI tiếng Việt như Suy luận số học, Xử lý tính toán thời gian và Truy vấn thông tin pháp lý. Đây là bước tiến lớn của FPT.AI trong hành trình xây dựng thế hệ AI mang bản sắc Việt.
VLSP 2025 – ‘Đấu trường’ học thuật hàng đầu của AI tiếng Việt
VLSP (Vietnamese Language and Speech Processing) là hội thảo quốc tế uy tín nhất về xử lý ngôn ngữ và tiếng nói tiếng Việt, trực thuộc Hiệp hội Ngôn ngữ học Máy tính (ACL). Sự kiện năm 2025 diễn ra tại Viện Nghiên cứu Cao cấp về Toán (VIASM), Hà Nội, quy tụ hàng trăm nhà khoa học, kỹ sư, lập trình viên công nghệ trong nước và quốc tế.
Được ví như “Olympic AI tiếng Việt”, VLSP là nơi các mô hình ngôn ngữ lớn (LLM) và hệ thống tiếng nói được đưa vào thử thách thực tế qua các hạng mục thi khắt khe. Các đội tham dự phải chứng minh năng lực công nghệ trong những bài toán cốt lõi nhất của AI ngôn ngữ đó là hiểu – suy luận – tính toán – truy xuất – phân tích ngữ nghĩa.
Tại VLSP 2025, FPT.AI đã xuất sắc giành 4 giải thưởng, gồm 3 Giải Nhất và 1 Giải Ba, trở thành doanh nghiệp có thành tích nổi bật nhất của năm. Đây là minh chứng cho năng lực nghiên cứu công nghệ lõi, khả năng sáng tạo và định hướng “Make in Vietnam” mà FPT đang theo đuổi.
FPT.AI và bốn dấu ấn nổi bật tại VLSP 2025
Tại kỳ VLSP 2025, FPT.AI xuất sắc giành 4 giải thưởng tại 4 hạng mục trọng điểm, bao gồm:
Giải Nhất – Hạng mục ‘Numerical Reasoning Question Answering’
Bài nghiên cứu “Enhancing Numerical Reasoning in Vietnamese Financial Question Answering through Program-Centric Policy Optimization” do nhóm FPT.AI thực hiện đã giành Giải Nhất tại hạng mục Numerical Reasoning QA của VLSP 2025, vượt qua 16 đội thi trong và ngoài nước. Công trình tập trung vào việc nâng cao khả năng suy luận định lượng và tính toán logic của mô hình AI tiếng Việt trong lĩnh vực tài chính, nơi yêu cầu độ chính xác và khả năng minh bạch cao.

Thay vì để mô hình “đoán” ra con số, nhóm nghiên cứu đã phát triển một phương pháp đặc biệt giúp AI biết lập trình để tự tính toán. Mô hình không trả lời trực tiếp, mà sinh ra một đoạn mã Python mô tả toàn bộ quy trình tính, sau đó thực thi để đưa ra kết quả và tự kiểm chứng. Cách tiếp cận này gọi là Program-Centric Policy Optimization (PCPO), được triển khai thông qua kỹ thuật Group Relative Policy Optimization (GRPO), cho phép AI học bằng cơ chế “thưởng khi tính đúng và bị phạt khi sai”.
Nhóm sử dụng mô hình ngôn ngữ Qwen3-8B kết hợp bộ dữ liệu mở rộng đa ngôn ngữ, bao gồm tập FinQA tiếng Anh và Vi-NumQA tiếng Việt, tổng cộng hơn 4.000 mẫu huấn luyện. Nhờ chiến lược kết hợp này, mô hình đạt độ chính xác thực thi 82,49% và độ chính xác chương trình 77,87% trên tập kiểm thử công khai, cùng 79,88% và 76,63% trên tập kín. Đây là kết quả thực nghiệm cao nhất toàn bộ cuộc thi.

Anh Nguyễn Bá Thành Bắc (giữa) – Đại diện diện Nhóm nghiên cứu FPT.AI lên nhận giải Nhất hạng mục Numerical Reasoning QA.
Nghiên cứu này chứng minh rằng khi AI được dạy “nghĩ và tính toán như con người”, nó không chỉ đưa ra đáp án đúng mà còn có thể giải thích rõ ràng cách tính ra kết quả, mở ra hướng ứng dụng quan trọng cho chatbot tài chính, trợ lý kế toán, hệ thống phân tích báo cáo và ngân hàng thông minh. Đây là một bước tiến đáng kể của FPT.AI trong việc xây dựng AI tiếng Việt có khả năng suy luận, minh bạch và đáng tin cậy, góp phần định hình thế hệ trí tuệ nhân tạo “Make in Vietnam” mang tính ứng dụng cao và đạt chuẩn quốc tế.
Đồng Giải Nhất – Hạng mục ‘Temporal Question Answering’ (sub-task 1)
Tại hạng mục Temporal Question Answering (TempQA), bài nghiên cứu “Enabling Temporal Commonsense in Vietnamese LLMs – Date-Arith and DurationQA” do nhóm FPT.AI thực hiện đã xuất sắc giành Giải Nhất nhờ thành công trong việc giúp mô hình ngôn ngữ tiếng Việt hiểu và suy luận chính xác về thời gian, một trong những năng lực khó nhất với AI hiện nay.
Nghiên cứu tập trung vào hai bài toán: Date-Arith (tính toán mốc thời gian) và DurationQA (hiểu và ước lượng độ dài thời gian). Nếu như Date-Arith yêu cầu AI phải tính được mốc thời gian “trước – sau” của một ngày cụ thể, thì DurationQA lại đòi hỏi mô hình vận dụng kiến thức đời sống để đánh giá thời lượng của các sự kiện thực tế. Để giải quyết hai bài toán này, nhóm FPT.AI đã xây dựng một pipeline huấn luyện kết hợp giữa học có giám sát (SFT) và tối ưu chính sách có phần thưởng (GRPO), cho phép mô hình “học từ trải nghiệm”.
Mô hình được huấn luyện trên các bộ dữ liệu tổng hợp tiếng Việt và tiếng Anh, sử dụng kiến trúc Qwen3-8B và Gemma-3-12B, trong đó Qwen thể hiện vượt trội ở khả năng lập luận logic. Kết quả, hệ thống đạt độ chính xác 83.5% cho Date-Arith và 80.1% cho DurationQA, cao nhất toàn bộ cuộc thi.
Điểm nổi bật của công trình là việc giúp AI không chỉ “hiểu ngôn ngữ” mà còn biết tư duy logic theo dòng thời gian như con người, nhờ đó có thể giải thích và kiểm chứng quá trình suy luận. Ứng dụng thực tế của hướng nghiên cứu này vô cùng rộng mở, từ chatbot hành chính, hệ thống quản lý hợp đồng, trợ lý pháp lý, đến các nền tảng AI tự động nhắc hạn và lập kế hoạch.
Kết quả này khẳng định tính sẵn sàng ứng dụng trong việc phát triển AI tiếng Việt có tư duy logic, có khả năng suy luận và diễn giải một cách minh bạch, đặt nền móng cho thế hệ AI “hiểu thời gian”.
Giải nhất – Hạng mục ‘Temporal Question Answering’
Đặc biệt, bài nghiên cứu với chủ đề “Retrieval-Guided Fine-tuning for Vietnamese Event Duration Question Answering” do Đào Nguyên Dương (FPT Smart Cloud) và Nguyễn Xuân Thành (ĐH Bách khoa Hà Nội) thực hiện được BTC đánh giá và đạt điểm cao nhất sub-task 2, xuất sắc giành Giải Nhất cả Task ‘Temporal Question Answering’.

Công trình này tập trung vào một trong những năng lực suy luận phức tạp nhất của trí tuệ nhân tạo, đó là hiểu và ước lượng thời lượng của các sự kiện trong ngôn ngữ tự nhiên tiếng Việt, ví dụ như “mất bao lâu để sửa một chiếc xe đạp” hay “thời gian trung bình của một chuyến bay nội địa”…
Thay vì chỉ huấn luyện mô hình ngôn ngữ lớn (LLM) theo cách truyền thống, nhóm nghiên cứu đã phát triển phương pháp Retrieval-Guided Fine-tuning, cho phép AI tự động tra cứu các ví dụ tương tự trong dữ liệu huấn luyện trước khi trả lời, giống như cách con người liên tưởng từ kinh nghiệm quá khứ.
Cụ thể, nhóm sử dụng mô hình QLoRA để tinh chỉnh hiệu quả trên hạ tầng tính toán giới hạn, kết hợp mô-đun truy xuất động (retrieval module) nhằm hướng dẫn suy luận và cơ chế tổ hợp (ensemble voting) để đưa ra đáp án cuối cùng. Phương pháp này giúp mô hình đạt điểm F1 cao nhất trong nhóm các mô hình ngôn ngữ nhỏ, đứng thứ nhất hạng mục DurationQA với độ chính xác vượt xa baseline. Điểm đặc biệt là mô hình vừa tiết kiệm tài nguyên, vừa giữ được tính minh bạch trong quá trình suy luận.
Nghiên cứu cho thấy tiềm năng của hướng retrieval-guided learning trong việc giúp AI học và suy luận giống con người hơn, mở ra ứng dụng rộng rãi cho các hệ thống chatbot hành chính, trợ lý doanh nghiệp và công cụ hỏi/đáp học thuật tiếng Việt. Đây là một bước tiến quan trọng trong nỗ lực của FPT.AI nhằm phát triển AI tiếng Việt thông minh, tiết kiệm và có khả năng suy luận dựa trên tri thức thực tế.
Giải Ba – Hạng mục ‘DRiLL: The challenge of Deep Retrieval in the expansive Legal Landscape’
Tại hạng mục DRiLL (Deep Retrieval in the expansive Legal Landscape), nhóm nghiên cứu FPT.AI đã đạt Giải Ba với bài báo “DRiLL at VLSP 2025: A Simple Two-Stage Retrieval Framework for Vietnamese Legal Document Retrieval”. Đây là hạng mục được xem là thách thức khó nhất của cuộc thi, khi hệ thống AI phải hiểu và truy xuất chính xác các điều luật liên quan từ hàng chục nghìn văn bản pháp lý tiếng Việt chỉ dựa trên truy vấn ngôn ngữ tự nhiên.

FPT.AI đã phát triển một khung truy xuất hai giai đoạn đơn giản nhưng hiệu quả vượt trội. Ở giai đoạn đầu, mô hình kết hợp BM25 và dense retrieval (bge-m3) để lọc nhanh các điều luật tiềm năng. Ở giai đoạn hai, hệ thống sử dụng mô hình cross-encoder được tinh chỉnh chuyên biệt cho tiếng Việt nhằm tái xếp hạng các văn bản có độ liên quan cao nhất. Ngoài ra, nhóm còn áp dụng chiến lược hard-negative mining, giúp mô hình học cách phân biệt những điều luật “na ná nhau” nhưng khác về ý nghĩa pháp lý.

Anh Đào Nguyên Dương, nhóm nghiên cứu FPT.AI – Giải nhất hạng mục ‘Temporal Question Answering’
Kết quả, hệ thống đạt Top 2 trên tập kiểm thử công khai, Top 3 trên tập kín và Top 2 sau đánh giá hậu kỳ, chứng minh rằng một mô hình tối giản, được tinh chỉnh đúng cách có thể đạt hiệu quả vượt xa các hệ thống phức tạp. Giải pháp này đặt nền móng cho các ứng dụng AI pháp lý “Make in Vietnam”, từ Legal Copilot, trợ lý pháp luật số, hệ thống kiểm tra tuân thủ tự động cho đến tra cứu điều luật thông minh, khẳng định nỗ lực của FPT.AI trong việc đưa trí tuệ nhân tạo phục vụ công lý và hành chính Việt Nam.
Khẳng định vị thế của trí tuệ nhân tạo “Make in Vietnam”
Với 4 giải thưởng tại 4 hạng mục trọng điểm của VLSP 2025, FPT.AI đã chứng minh năng lực vượt trội không chỉ trong phát triển sản phẩm, mà còn ở tầm nghiên cứu công nghệ lõi. Các công trình của FPT.AI đều tập trung giải quyết những bài toán cốt lõi của AI tiếng Việt, đó là hiểu ngôn ngữ, suy luận logic, xử lý thời gian, tính toán và truy xuất thông tin chính xác. Đây đều là những năng lực nền tảng để đưa AI Việt Nam tiệm cận trình độ quốc tế, đồng thời thể hiện tầm nhìn “Make in Vietnam” mà FPT.AI kiên định theo đuổi, từ phát triển trí tuệ nhân tạo bằng chính ngôn ngữ, dữ liệu và con người Việt. Không chỉ là thành tích học thuật, những giải thưởng còn là lời khẳng định mạnh mẽ rằng Việt Nam hoàn toàn có thể làm chủ và dẫn dắt tương lai của công nghệ AI
Đại diện Tập đoàn FPT, PGS.Tiến sĩ Ngô Xuân Bách, Giám đốc khối Sản phẩm AI, FPT Smart Cloud chia sẻ: “Mỗi giải thưởng tại VLSP không chỉ là thành tích nghiên cứu, mà là lời chứng thực cho năng lực sáng tạo và tinh thần chinh phục công nghệ của người Việt. FPT.AI sẽ tiếp tục phát triển các nền tảng AI hiểu con người Việt, nói tiếng Việt và phục vụ người Việt.”
Đằng sau những giải thưởng ấy là đội ngũ kỹ sư, lập trình viên và nhà nghiên cứu trẻ của FPT.AI, những người đam mê sáng tạo, kiên trì theo đuổi sự chính xác và tinh tế trong từng dòng mã. Họ chính là hạt nhân của hành trình “Make in Vietnam”, mang trong mình khát vọng kiến tạo những sản phẩm AI chất lượng, ứng dụng thực tiễn và mang tầm quốc tế.
Thông qua các cuộc thi học thuật như VLSP, đội ngũ lập trình viên không chỉ khẳng định năng lực nghiên cứu, mà còn không ngừng tích lũy kinh nghiệm, cải tiến công nghệ và biến tri thức thành giá trị thực tiễn. Họ là thế hệ trẻ đầy nhiệt huyết đang và sẽ tiếp tục là nguồn lực cốt lõi giúp FPT.AI kiến tạo thế hệ trí tuệ nhân tạo “hiểu con người Việt & phục vụ người Việt”, góp phần đưa công nghệ Việt Nam vươn tầm thế giới.
Hải Vân.