Nhảy đến nội dung
Text to Speech

FPT.AI nâng tầm Trợ lý Ảo Tổng đài với công nghệ giọng máy AceSound

by content 25.10.2021

Nâng tầm giọng máy tiếng Việt bằng công nghệ hiện đại nhất

Là công ty công nghệ hàng đầu trong lĩnh vực Trí tuệ nhân tạo (AI) cùng sự “am hiểu địa phương”, FPT.AI đã có những nghiên cứu chuyên sâu về công nghệ Xử lý Ngôn ngữ Tự nhiên (NLP) tiếng Việt từ hơn một thập kỷ. Mới đây, hàng loạt các giọng máy phát triển bằng công nghệ vượt trội AceSound đã được đội ngũ chuyên gia FPT.AI hoàn thiện và ra mắt. Công nghệ AceSound được FPT.AI đầu tư và phát triển, nhằm đưa chất lượng giọng máy Text to Speech lên một tầm cao mới. FPT.AI đón đầu xu thế ứng dụng giọng máy vào Trợ lý ảo của các trung tâm tổng đài Chăm sóc khách hàng (CSKH), thực hiện nhiều nghiệp vụ sơ cấp trong lĩnh vực Tài chính – Ngân hàng, giúp các doanh nghiệp rút ngắn thời gian phục vụ khách hàng, giảm tải áp lực cho đội ngũ nhân sự, tối ưu quy trình vận hành. Nhiều doanh nghiệp là khách hàng của FPT.AI tiên phong triển khai Trợ lý ảo tổng đài của FPT.AI đã bước đầu gặt hái nhiều thành tựu ấn tượng, tiết kiệm chi phí hơn 17 tỷ đồng mỗi tháng.

AceSound vận dụng những công nghệ tiên tiến nhất về tổng hợp giọng nói, khai thác triệt để công nghệ học sâu (deep learning). Do đó, mô hình máy tính có thể học được hàng nghìn đặc trưng về ngữ điệu, biểu cảm trong giọng nói tự nhiên của con người. Kiến trúc mô hình học sâu được tinh chỉnh riêng để tối ưu cho từng giọng nói theo giới tính, vùng miền. Để giọng máy hoàn thiện và có chất lượng tự nhiên như người thật, đội ngũ kĩ sư, các nhà khoa học của FPT.AI đã thực hiện hàng nghìn thí nghiệm nhằm phân tích mẫu, liên tục cải tiến chất lượng âm học. Đặc biệt, FPT.AI chú trọng gia tăng hiệu năng triển khai giọng máy cho các hệ thống lớn như tốc độ xử lí nhanh hơn, tiêu thụ ít nguồn lực tính toán hơn, đáp ứng lượng sử dụng lớn với cơ sở hạ tầng nhỏ.

Theo đánh giá từ các đối tác đầu tiên được trải nghiệm giọng mới của FPT.AI, có thể nói, giọng máy AceSound mới của FPT.AI có ngữ điệu, biểu cảm gần như tiệm cận với giọng người thật, thậm chí hay hơn giọng người thật, chất lượng ngang với giọng đọc của các MC chuyên nghiệp. Hầu hết người nghe không phân biệt được giọng máy TTS AceSound với giọng người thật trong 10 giây đầu tiên.

Text to speech FPT AI

Thế hệ giọng máy mới ứng dụng công nghệ AceSound của FPT.AI đã "lên kệ"

Những giọng máy nổi tiếng của FPT.AI đã “làm mưa làm gió” trên các nền tảng xã hội như Facebook, Tiktok, Instargram, Youtube phải kể đến giọng Ban Mai (nữ miền Bắc), giọng Minh Quang (nam miền Nam), giọng Thu Minh (nữ miền Bắc)… Thì nay, phiên bản ứng dụng công nghệ mới với những thay đổi về cao độ, tốc độ, cách phát âm, khả năng ngắt nghỉ… khiến giọng máy AceSound trở nên mượt mà, sống động hơn. Các giọng mới như giọng Ban Mai AceSound, giọng Minh Quang AceSound, giọng Thu Minh AceSound… hứa hẹn mang đến cho người dùng nhiều trải nghiệm thú vị.

Ứng dụng thực tế của giọng máy

Các ứng dụng sử dụng giọng nói để giao tiếp ngày càng trở nên phổ biến hơn trên thế giới. Không chỉ mang lại nhiều lợi ích cho công đồng người khuyết tật, người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc diễn đạt, công nghệ giọng nói được cá nhân hóa giúp giải quyết nhiều vấn đề về tương tác khách hàng, thu hút khách hàng trong các doanh nghiệp lớn.

Công nghệ chuyển văn bản thành giọng máy (Text to Speech) dễ dàng sử dụng trên website với giao diện người dùng, tích hợp vào các ứng dụng dành cho di động, sử dụng để sản xuất nội dung số (video, podcast, sách nói, ebook). Các nhà xuất bản, nhà sản xuất nội dung có thể chuyển đổi sách, bài báo hoặc bất kì tài liệu viết nào thành âm thanh với công nghệ text to speech một cách tiện lợi, cắt giảm chi phí và tăng hiệu quả cho quá trình sản xuất nội dung, tùy chỉnh đa dạng nhiều giọng vùng miền nhanh chóng.

Đặc biệt, bước nhảy vọt của công nghệ Text to Speech là được tích hợp vào Trợ lý ảo tổng đài Chăm sóc khách hàng tự động với chất giọng đặc trưng riêng biệt của từng thương hiệu, từng ngành nghề… Việc sử dụng giọng máy tự nhiên giúp nâng cao chất lượng của các trung tâm tổng đài Chăm sóc khách hàng. Bằng cách “huấn luyện” bot hiểu ngôn ngữ tự nhiên nhờ AI, voicebot có thể giao tiếp với con người theo thời gian thực, đưa ra phản hồi với giọng điệu tự nhiên, cảm xúc, mang lại sắc thái tự nhiên cho cuộc hội thoại. Giọng máy có thể hoạt động như người phát ngôn của công ty hoặc thương hiệu quan trọng, truyền bá thông điệp của doanh nghiệp bằng một giọng nói đặc trưng, tạo ra dấu ấn riêng các doanh nghiệp Việt thời 4.0.

Giọng nói kĩ thuật số, hay giọng máy là công nghệ không thể thiếu trong tương lai bởi tiềm năng ứng dụng sâu rộng và đa dạng vào nhiều lĩnh vực trong đời sống hàng ngày, cho phép con người tối giản nhiều hoạt động, giảm thiểu chi phí và gia tăng tiện ích. Liên tục cải tiến, liên tục đổi mới nhằm tạo ra những giọng máy chất lượng cao, và giọng máy AceSound của FPT.AI chính là “gia vị thượng hạng” mang đến những trải nghiệm xứng đáng cho người dùng.

Các giọng mới xây dựng bằng công nghệ TTS AceSound đã sẵn sàng trên tất cả các kênh của FPT.AI. Người dùng có thể demo trực tiếp tại website https://fpt.ai/vi/tts, hoặc sử dụng giao diện dành cho lập trình viên với API Text to Speech trên https://console.fpt.ai, hoặc giao diện người dùng với nhiều tính năng chỉnh sửa tại https://voicemaker.fpt.ai. Chỉ với một vài cú nhấp chuột, người dùng có thể dễ dàng chuyển đổi văn bản thành âm thanh.

----------------------------------

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

☎ Hotline: 1900 638 399

? Email: [email protected]