Nhảy đến nội dung

Giữa làn sóng AI

by content 09.01.2020

Từ Deep Blue đến AlphaGo

Từ tháng 3 năm 2016 đến giữa 2017, AlphaGo lần lượt đánh bại Lee Sedol và kỳ thủ số một thế giới Ke Jie, cũng như thắng áp đảo 60:0 trước cả làng cờ vây thế giới. Cờ vây, môn thể thao vẫn được coi là lãnh địa riêng của trí tuệ con người, giờ đã hoàn toàn thất thủ. Vài tháng sau đến lượt AlphaGo đại bại trước AlphaGo Zero. Trong khi bản gốc được huấn luyện với hàng ngàn ván cờ trong lịch sử cũng như các đối thủ trực tuyến, AlphaGo Zero chỉ cần đánh với chính mình để thành tài.

Cũng như cờ vua sau Deep Blue, cờ vây vẫn sẽ tồn tại, còn AlphaGo sẽ thành công cụ huấn luyện cho con người. Đây chỉ là tiếng chuông báo hiệu sự trở lại của AI sau nhiều năm chuẩn bị. Lịch sử AI đã từng trải qua hai mùa đông trong thập niên 1970 và cuối thập niên 1980, khi kỳ vọng quá lớn dẫn đến hụt hẫng và cắt giảm đầu tư. Lần này AI không chỉ có những tiếng vang như AlphaGo mà đã âm thầm len lỏi vào mọi mặt cuộc sống. Không như trong Terminator hay The Matrix, phần lớn các ứng dụng AI chỉ thực hiện một nhiệm vụ cụ thể như dịch thuật, quản lý điện năng hay sắp xếp màn hình Youtube. Tuy nhiên nhờ hiệu năng vượt trội so với các phương pháp cũ, chúng đã trở thành không thể thiếu trong hầu hết các ngành nghề.

Làn sóng thứ ba

Sau hai mùa đông AI và nhiều thăng trầm khác, hiện tại thế giới đang đứng trước làn sóng thứ ba của AI.

Làn sóng thứ nhất đã tồn tại qua cả hai mùa đông đến ngày nay. Cách tiếp cận chính trong làn sóng này là các hệ chuyên gia do con người xây dựng bằng kiến thức của mình đối với từng tình huống cụ thể. Các hệ chuyên gia có khả năng suy luận tự động trong các tình huống đã xây dựng nhưng không có năng lực học từ các thí dụ mới hay đánh giá các yếu tố xác suất. Dù có một số thành công sớm như hệ thống XCON đã giúp Digital Equipment Corporation tiết kiệm 40 triệu USD trong thập niên 1980, bản chất cứng nhắc của phương pháp này đã dẫn đến thất bại trên thị trường và góp phần gây ra mùa đông AI lần thứ hai.

Làn sóng thứ hai đã manh nha từ lâu nhưng mới dâng cao trong khoảng chục năm gần đây. Nền tảng của làn sóng này là phương pháp học máy thống kê, mà đỉnh cao hiện tại là deep learning và các loại mạng neuron. Ngược với cách suy luận từ kiến thức chuyên gia, phương pháp học máy thống kê hoàn toàn dựa vào dữ liệu các tình huống đã xảy ra để đưa ra dự đoán cho các tình huống mới. Mô hình xác suất thống kê có chức năng phát hiện các quy luật trong dữ liệu thay cho kiến thức chuyên gia. Với khả năng tự học từ khối lượng dữ liệu khổng lồ, các hệ thống này đã vượt qua con người trong nhiều việc, từ công việc chuyên môn như chẩn đoán bệnh đến những hành động tự nhiên như nhận dạng tiếng nói. Không chỉ có vậy, việc triển khai phương pháp học máy thống kê trong các lĩnh vực hay ứng dụng mới cũng dễ dàng hơn nhiều so với việc xây dựng các hệ chuyên gia mới. Có thể nói cuộc cách mạng công nghiệp 4.0 hiện tại đang cưỡi trên làn sóng AI thứ hai này. Các ông lớn trong nền kinh tế số như Google, Facebook hay Alibaba đều dẫn đầu hoặc đầu tư mạnh vào AI, cụ thể là deep learning. Các đầu tàu kinh tế truyền thống như tài chính, xe hơi hay xăng dầu cũng đang chuyển hướng với nhận thức rằng AI có thể thúc đẩy hoặc nhấn chìm họ trong tương lai gần. Đặc biệt, các ứng dụng AI đang nở rộ trong hệ sinh thái khởi nghiệp toàn cầu nhờ quá trình dân chủ hóa AI – khi những ngọn cờ đầu về AI liên tục chia sẻ các kết quả nghiên cứu, những thư viện open source và cung cấp các năng lực AI cơ bản thành dịch vụ.

Tuy vậy, thành công hiện tại không che giấu được những nhược điểm cố hữu của AI trong làn sóng thứ hai: phạm vi ứng dụng hạn hẹp của từng mô hình, và năng lực suy luận hạn chế dẫn đến lệ thuộc quá mức vào dữ liệu mẫu. Xét trên tổng thể, độ chính xác của các mô hình deep learning hiện đại đã vượt con người, nhưng chúng vẫn mắc những sai lầm sơ đẳng. Hình ảnh dưới từ bài báo Explaining and Harnessing Adversarial Examples (Goodfellow et al.) cho thấy có thể dễ dàng sửa một tấm ảnh gấu trúc để đánh lừa AI. Dù ảnh mới gần như không khác gì ảnh cũ, hệ AI lại đoán chắc đến 99% rằng đó là hình con vượn.

AI


Gần đây ngày càng nhiều ý kiến cho rằng cần một cách tiếp cận mới để đưa AI vượt qua những hạn chế hiện tại, trong đó một số đưa ra khái niệm làn sóng thứ ba. Bên cạnh đó, các hệ thống AI cần tiếp cận gần hơn tới trí tuệ tổng quát, nâng cao năng lực suy luận và khái quát hóa. Ngoài khả năng dự đoán như hiện tại, AI của tương lai cần khả năng giải thích hoặc đưa ra bằng chứng cho dự đoán của mình.

AI@FPT

Tập đoàn FPT xác định AI là một trong những trụ cột cho chiến lược chuyển đổi số của mình, với nhiều đề tài trong các lĩnh vực khác nhau. Ngoài việc ứng dụng AI vào các giải pháp và sản phẩm, định hướng tầm trung của tập đoàn là xây dựng một nền tảng dịch vụ AI đủ sức cạnh tranh trên thị trường và biến FPT thành thương hiệu được công nhận trong cộng đồng AI quốc tế.

Hiện tại FPT đã tạo được năng lực AI nhất định về thị giác máy, xử lý ngôn ngữ tự nhiên, nhận dạng và tổng hợp tiếng nói, chatbot… và đưa AI vào các lĩnh vực xe tự hành, quản lý giao thông, y tế, báo chí, thương mại điện tử. Sắp tới FPT sẽ đẩy mạnh hoạt động nghiên cứu và ứng dụng AI trong một số mũi nhọn như tài chính ngân hàng, sản xuất công nghiệp, tự động hóa các quy trình nghiệp vụ và tương tác người-máy.

Trên chặng đường vừa qua, FPT cũng đã thu được nhiều lợi ích từ quá trình dân chủ hóa AI. Tuy nhiên cũng như ngành AI không thể lướt mãi trên làn sóng deep learning, việc duy trì và phát triển sức cạnh tranh về AI không thể chỉ dựa vào ứng dụng và vận dụng các kết quả có sẵn. Để giữ quyền chủ động trong tương lai, tập đoàn FPT cần xây dựng đội ngũ và năng lực nghiên cứu mạnh, đủ khả năng thích nghi và phát triển trước làn sóng thứ ba.

Thông tin về tác giả:

Tiến sĩ Đặng Hoàng Vũ


Tiến sĩ Đặng Hoàng Vũ – Giám đốc khoa học, Tập đoàn FPT

Sau khi tốt nghiệp Tiến sĩ tại Cambridge, ông Đặng Hoàng Vũ đầu quân cho HP Autonomy trước khi gia nhập FPT. Trong vai trò Giám đốc khoa học, ông đang phụ trách các hoạt động nghiên cứu và giám sát các dự án tại Ban Công nghệ FPT. Ông có kinh nghiệm đa dạng trên nhiều lĩnh vực như nhận dạng giọng nói và hình ảnh, phân tích dự đoán phục vụ ngành thương mại điện tử và phương tiện kỹ thuật số, phát hiện gian lận về chăm sóc sức khỏe, khai thác dữ liệu xã hội, hệ thống đề xuất.

(Bài viết được đăng trên Đặc san công nghệ FPT TechInsight No.2)