Nhảy đến nội dung
Text to Speech

Công nghệ chuyển văn bản thành giọng nói text to speech thay đổi thói quen đọc của con người

by content 23.10.2020

Text to speech là gì?

Công nghệ Text to speech là gì? Text to speech (TTS) là công nghệ hiểu văn bản và ngôn ngữ tự nhiên dựa trên nền tảng Trí tuệ nhân tạo AI, nhằm tạo ra các âm thanh được tổng hợp hoàn chỉnh với nhịp điệu, ngữ điệu giống giọng nói của con người.

Công nghệ Text to speech đã được nghiên cứu từ hàng trăm năm về trước, nhưng khoảng 10 năm gần đây, công nghệ Text to speech đã có những bước phát triển nhảy vọt khi được trang bị thêm Trí tuệ nhân tạo AI. Trên thế giới, công nghệ text to speech được ứng dụng vào thực tiễn, mang lại nhiều giá trị cho các doanh nghiệp và đời sống người dân.

Tại Việt Nam, công nghệ Text to speech của FPT.AI là một trong giải pháp chuyển đổi văn bản tiếng Việt thành giọng nói nổi bật trên thị trường. Bởi Text to speech của FPT.AI là sự kết hợp của công nghệ Tổng hợp giọng nói, công nghệ Nhận diện giọng nói, công nghệ Xử lí ngôn ngữ tự nhiên với những nghiên cứu chuyên sâu về tiếng Việt. FPT.AI cho ra đời nhiều giọng đọc tự nhiên, đa dạng vùng miền, giới tính.

Dưới đây là 3 điểm thể hiện công nghệ text to speech đã tác động đến thói quen đọc của người Việt:

1. Text to speech thay đổi thói quen đọc sách truyền thống

Khi công nghệ ngày càng được ứng dụng nhiều vào cuộc sống, các thiết bị điện tử phát triển, con người có thích những thứ tiện lợi. Thói quen đọc sách cũng vì vậy mà dần thay đổi. Từ sách giấy chuyển thành sách điện tử (ebook), sau đó là sách nói (audiobook).

Audiobook thể hiện nhiều ưu điểm vượt trội so với sách truyền thống như:

  • Thuận tiện: Chỉ cần một chiếc smartphone/máy tính bảng, người dùng có thể nghe các câu chuyện, bài báo vào bất kì lúc nào và ở bất kì nơi đâu (trên xe buýt, taxi, quán café, phòng chờ sân bay…)
  • Tiết kiệm thời gian: Bạn có thể nghe audiobook trong thời gian thư giãn và đôi mắt được nghỉ ngơi, trong thời gian dọn nhà…
  • Tiết kiệm chi phí: Sách điện tử là một kho kiến thức vô tận. Để có thể sở hữu tất cả các quyển sách bạn muốn đòi hỏi chi phí không hề rẻ. Tuy nhiên, với sách điện tử, bạn chỉ cần chi trả cho một khoản phí hàng tháng nhất định và có thể nghe bất kì quyển sách/truyện nào bạn thích.
  • Đa dạng đối tượng: Nếu như sách giấy truyền thống có những hạn chế với người khiếm thị thì sách nói là một giải pháp hữu ích. Đặc biệt, sách nói còn phù hợp với đối tượng trẻ con chưa biết chữ. Việc nghe đọc sách thường xuyên sẽ giúp tăng khả năng đọc hiểu và vốn từ vựng của trẻ.

Công nghệ Text to speech của FPT.AI là một giải pháp tuyệt vời, giúp các nhà xuất bản, các website truyện trực tuyến chuyển đổi sản phẩm, gia tăng những trải nghiệm thú vị cho khách hàng.

2. Text to speech tích hợp trên các trang báo điện tử

Khi Trí tuệ nhân tạo chưa phát triển, text to speech còn nhiều hạn chế. Muốn có file âm thanh của bài báo, các biên tập viên sẽ phải thu âm vào máy tính rồi chuyển thành file audio đính kèm bài viết. Cách làm đó tốn rất nhiều thời gian, công sức đọc, cắt ghép và chỉnh sửa.

Với công nghệ Text to speech của FPT.AI, việc chuyển một bài báo thành file audio chỉ diễn ra trong vài phút, với cách làm vô cùng đơn giản, để thực hiện. FPT.AI Text to speech sở hữu nhiều giọng đọc có cảm xúc, phù hợp với quy chuẩn ngôn ngữ báo chí. Công nghệ Xử lí ngôn ngữ tự nhiên giúp nhận diện chính xác mặt chữ đến 98%, đảm bảo máy đọc đúng câu từ, ngắt nghỉ nhịp nhàng tự nhiên như người thật.

Hiện nay, nhiều tờ báo điện tử tại Việt Nam đã áp dụng công nghệ Trí tuệ nhân tạo AI, giúp chuyển văn bản thành giọng nói. Độc giả sẽ không phải nhìn màn hình máy tính/điện thoại lâu nữa, đôi mắt sẽ được nghỉ ngơi, mà vẫn có thể nghe, hiểu toàn bộ nội dung bài báo.

Ứng dụng Text to speech vào các trang báo điện tử được xem là bước phát triển tất yếu, giúp nền báo chí Việt Nam theo kịp làng báo mạng thế giới.

3. Text to speech ứng dụng để review phim, lồng tiếng phim tự động

Theo nghiên cứu của Facebook, người dùng có xu hướng tương tác với các video nhiều hơn so với việc đọc chữ. Do đó, thay vì đọc một bài review phim, người dùng thích xem hình và nghe thuyết minh hơn. Tương tự với việc xem phim, thay vì phải đọc phụ đề, nhiều người thích xem phim lồng tiếng, bởi trong khi đôi tai để nghe hiểu nội dung phim, mắt vẫn có thể xem đầy đủ mọi diễn biến tình tiết xảy ra. Hình thức lồng tiếng truyền thống có rất nhiều hạn chế, khó nghe, tốn nhân sự…

Với text to speech của FPT.AI, các hãng phim có thể lồng tiếng phim một cách vô cùng nhanh chóng. Hiện nay, giọng Ban Mai của FPT.AI đặc biệt được cộng đồng review phim, lồng tiếng phim yêu thích. Những video đó sở hữu hàng trăm nghìn lượt like, chục nghìn lượt share và bình luận. So với giọng lồng tiếng truyền thống vừa khó nghe, vừa nhàm chán, giọng Ban Mai của FPT.AI với mức độ chân thực và tự nhiên như giọng người đọc, giúp các tổ chức nhanh chóng chuyển các văn bản nhàm chán thành lời bình, lời dẫn dắt, giới thiệu các bộ phim hay, đầy lôi cuốn trên nền tảng mạng xã hội.

Dưới đây là 1 video sử dụng giọng Ban Mai của FPT.AI để review phim trên mạng xã hội Facebook.

Khoa học công nghệ đang thay đổi thói quen trải nghiệm dịch vụ và giải pháp chuyển văn bản thành giọng nói tiếng Việt thay đổi thói quen đọc của con người. Nhạy bén áp dụng những công nghệ tiến tiến giúp các tổ chức, doanh nghiệp tiết kiệm chi phí, nguồn nhân lực và đặc biệt sẽ tạo ra những trải nghiệm mới mẻ thu hút khách hàng.

------------------------------------------------------------------------

? Trải nghiệm giải pháp FPT.AI Text to Speech của #FPT_AI tại: https://fpt.ai/vi/tts

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

Hotline: 0911 886 353

? Email: [email protected]