Chuyển đến phần nội dung
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
Bài viết

Text to speech – công nghệ chuyển văn bản thành giọng đọc thời AI

Tháng Mười 22, 2020

Chia sẻ với:

 

Giải pháp chuyển văn bản thành giọng nói tiếng việt Text to speech và cuộc cách mạng công nghệ 4.0

Thế giới đang bước vào cuộc công nghệ lần thứ 4, cùng với đó là sự phát triển mạnh mẽ của Trí tuệ nhân tạo. Hầu hết những công nghệ tiên tiến nhất hiện nay đều được trang bị AI, giúp gia tăng khả năng học hỏi và trở nên thông minh, hữu ích hơn theo thời gian. Công nghệ Text to speech cũng không ngoại lệ.

Trước đây, thông tin được truyền đạt nhiều dưới dạng văn bản, nhưng văn bản lại khô khan và ít cảm xúc. Trong thập kỉ trước, công nghệ chuyển đổi văn bản thành giọng nói đã nhen nhóm và được ứng dụng trong một số lĩnh vực. Tuy nhiên, giọng đọc vô hồn khiến người tiếp nhận thông tin cảm thấy nhàm chán, thậm chí khó chịu.

Với sự kết hợp của công nghệ Tổng hợp giọng nói, công nghệ Nhận diện giọng nói và công nghệ Xử lí ngôn ngữ tự nhiên (NLP), Text to speech không những đọc chính xác các câu chữ, mà còn có thể đọc diễn cảm một cách tự nhiên, đa dạng giọng đọc theo các vùng miền, giới tính…

Những ứng dụng nổi bật của công nghệ Text to speech

Hiện nay, công nghệ Text to speech được ứng dụng nhiều trong lĩnh vực dịch vụ, mang tới sự tiện lợi cho người dùng như:

1. Tổng đài tự động chăm sóc khách hàng: Với dịch vụ này, các doanh nghiệp có thể sử dụng trợ lý ảo để thực hiện các cuộc gọi đến, gọi đi, nhằm mục đích thông báo các thông tin mới, quảng cáo hoặc xác nhận đơn hàng. Đối với khách hàng ở nhiều vùng miền khác nhau, các doanh nghiệp có thể tùy chọn giọng địa phương để phù hợp với từng đối tượng.

Tại Việt Nam, công nghệ text to speech được FPT.AI tích hợp vào giải pháp Trợ lý Ảo tổng đài, giúp các trung tâm tổng đài tự động hóa nhiều tác vụ chăm sóc khách hàng cơ bản. Thực tế, giải pháp Trợ lý Ảo tổng đài của FPT.AI đã được công ty Tài chính tiêu dùng Home Credit Việt Nam triển khai để thực hiện hàng trăm nghìn cuộc gọi nhắc lịch thanh toán tín dụng đến khách hàng trong thời gian nhân sự hạn chế bởi nghị định giãn cách xã hội khi dịch Covid-19 xảy ra từ đầu năm nay. Trợ lý Ảo tổng đài Home Credit đã giúp doanh nghiệp tự động thực hiện khoảng 20.000 cuộc mỗi ngày, thời lượng mỗi cuộc gọi từ 1 đến 2 phút với tỉ lệ cuộc gọi thành công lên tới 98%.

Hay như Tổng công ty Điện lực miền Trung EVN CPC cũng đã mạnh dạn đổi mới và áp dụng công nghệ Text to Speech vào dịch vụ khách hàng, để thực hiện trả lời tự động qua tổng đài IVR thông báo về sự cố mất điện, thời gian cấp lại điện đến khách hàng trên địa bàn 13 tỉnh miền Trung.

Khi khách hàng gọi tới Tổng đài 19001909 của EVN CPC, “Trợ lí ảo AI” sẽ tự truy xuất dữ liệu từ phần mềm Chăm sóc khách hàng (CRM) để nhận diện, định danh khách hàng theo thông tin số điện thoại được đăng ký. Ngay khi khách hàng xác nhận thông tin chính xác, hệ thống sẽ tự động tra cứu phần mềm CRM, xác định địa chỉ của khách hàng có thuộc khu vực mất điện do sự cố lưới điện hay do lịch công tác trên lưới.

Kết quả, thông tin chi tiết theo dạng “Quý khách hàng Nguyễn Văn A địa chỉ tại…, thuộc khu vực mất điện do sự cố lưới điện/do kế hoạch công tác trên lưới điện… Thời gian dự kiến có điện vào lúc… ngày…” sẽ được hệ thống tạo lập từ việc ghép chính xác các thông tin (Text). Tiếp đó, được chuyển đổi thành file âm thanh để “nói chuyện”, trả lời khách hàng. Toàn bộ quá trình Text to Speech được “Trợ lí ảo AI” xử lý với tốc độ cao, gần như ngay lập tức đưa ra câu phản hồi khách hàng.

Theo đánh giá từ tổng công ty Điện lực miền Trung, sau giai đoạn đầu triển khai thực tế, hầu hết khách hàng đều hài lòng bởi tổng đài tự động cung cấp đúng và đủ tất cả các thông tin khách hàng cần. FPT.AI Text to Speech đã giúp Công ty điện lực miền Trung tiếp nhận và xử lí gần 46.000 cuộc gọi từ khách hàng trong vòng 6 tháng, tiết kiệm hơn 600 triệu đồng.

2. Đọc báo điện tử, sách nói: Nhiều tớ báo điện tử, trang tin đã áp dụng công nghệ text to speech để đôi mắt được nghỉ ngơi.

FPT.AI Text to speech

Ví dụ, chuyên trang công nghệ của tập đoàn FPT – TechInsight đã tích hợp công nghệ FPT.AI Text to Speech được phát triển bởi ban Công nghệ tập đoàn. Với nhiều giọng đọc nam/nữ và đa dạng vùng miền, FPT.AI Text to speech đã mang đến cho các độc giả yêu thích công nghệ nhiều trải nghiệm mới mẻ.

3. Lồng tiếng phim, bình luận video: Giọng Ban Mai của FPT.AI đặc biệt được cộng đồng review phim, lồng tiếng phim yêu thích. Những video đó sở hữu hàng trăm nghìn lượt like, chục nghìn lượt share và bình luận. So với giọng lồng tiếng truyền thống vừa khó nghe, vừa nhàm chán, giọng Ban Mai của FPT.AI với mức độ chân thực và tự nhiên như giọng người đọc, giúp các tổ chức nhanh chóng chuyển các văn bản nhàm chán thành lời bình, lời dẫn dắt, giới thiệu các bộ phim hay, đầy lôi cuốn trên nền tảng mạng xã hội.

4. Các chương trình hỗ trợ người khiếm thị: Đối với người khiếm thị, Text to speech phát huy được tối đa công dụng, cũng như thể hiện rõ rệt sự hữu ích khi ứng dụng các giải pháp công nghệ tiên tiến vào phục vụ cuộc sống hàng ngày. Từ những bài báo, phim truyện lồng tiếng, đến những chỉ dẫn sử dụng giọng máy đều hỗ trợ tối đa cuộc sống người khiếm thị.

Công nghệ chuyển văn bản thành giọng đọc Text to speech đang trở nên phổ biến và được ứng dụng rộng rãi vào đời sống con người. Để trải nghiệm những giọng máy tốt nhất trên thị trường hiện nay, hãy liên hệ ngay với FPT.AI.

————————————————————————

? Trải nghiệm giải pháp FPT.AI Text to Speech của #FPT_AI tại: https://fpt.ai/vi/tts

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

Hotline: 0911 886 353

? Email: [email protected]

 

Đánh giá

Bài viết liên quan

Cập nhật mọi tin tức mới nhất về công nghệ AI

Đăng ký nhận bản tin của FPT.AI để được phủ sóng mọi xu hướng công nghệ, câu chuyện thành công và phân tích của chuyên gia.