Chuyển đến phần nội dung
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
Bài viết

Chuyển văn bản thành giọng nói bằng công nghệ Text to Speech miễn phí

Tháng Mười Hai 1, 2020

Chia sẻ với:

FPT.AI Voicemaker là nền tảng tiên tiến, sử dụng công nghệ Text to Speech (TTS) để mang đến những bản ghi âm tự nhiên. Hỗ trợ 2 ngôn ngữ (Tiếng Việt, Tiếng Anh), Voicemaker không chỉ đáp ứng nhu cầu chuyển văn bản thành giọng nói mà còn cung cấp các công cụ chỉnh sửa chuyên sâu như dạy máy phát âm từ khó, thay thế từ/cụm từ nhanh chóng và thêm thời gian nghỉ giữa các câu để tạo ra trải nghiệm nghe chân thật nhất. Sau đây chúng tôi sẽ hướng dẫn cách sử dụng Text to Speech trên nền tảng AI Voice Maker của FPT.AI.

Nền tảng chuyển văn bản thành giọng nói FPT.AI VoiceMaker là gì?

FPT.AI Voicemaker là nền tảng chuyển văn bản thành giọng nói tiên tiến, ứng dụng công nghệ Text to Speech (TTS) với 13 giọng đọc tự nhiên, đa dạng vùng miền và giới tính. Nền tảng đã được Home Credit sử dụng để tự động nhắc lịch thanh toán, thực hiện 20.000 cuộc gọi mỗi ngày với tỷ lệ thành công 98%, ngay cả trong giai đoạn giãn cách xã hội.

Tương tự, Tổng công ty Điện lực miền Trung (EVN CPC) áp dụng Voicemaker để thông báo mất điện và lịch cấp lại điện, xử lý 46.000 cuộc gọi trong 6 tháng, tiết kiệm hơn 600 triệu đồng. Với các giọng đọc AI tự nhiên, đa dạng vùng miền, chân thực, FPT.AI Voicemaker giúp doanh nghiệp cải thiện hiệu suất, tối ưu chi phí và nâng cao chất lượng dịch vụ khách hàng.

chuyển văn bản thành giọng nói
FPT. AI Voicemaker nổi bật với 13 giọng đọc AI tự nhiên, chân thực

>>> XEM THÊM: Nguyên lý hoạt động của Text to Speech (TTS)

Hướng dẫn thiết lập các tính năng trên FPT.AI Voicemaker

Để thiết lập các tính năng chuyển văn bản thành giọng nói trên FPT.AI Voicemaker, đầu tiên, bạn phải có tài khoản FPT ID. Nếu chưa có tài khoản, đăng kí tài khoản tại đây: https://id.fpt.ai/accounts/signin/?next=/accounts/profile/

Tiếp theo, truy cập https://console.fpt.ai để tạo sự Project (Dự án), API Key và Kích hoạt dự án.

chuyển văn bản thành giọng nói
Kích hoạch dự án chuyển văn bản thành giọng nói với FPT.AI Voicemaker

Sau đó, truy cập: https://voicemaker.fpt.ai/ để bắt đầu chuyển văn bản thành giọng nói.

chuyển văn bản thành giọng nói
Giao diện nền tảng VoiceMaker

>>>> ĐỌC THÊM: Generative AI là gì? Xu hướng công nghệ AI tạo sinh 2024

Chọn ngôn ngữ

FPT.AI Voicemaker hỗ trợ 2 ngôn ngữ là Tiếng Anh và Tiếng Việt. Click vào biểu tượng địa cầu trên góc phải màn hình để chọn ngôn ngữ sử dụng.

text to speech
Chọn ngôn ngữ

Chọn dự án

Bạn phải chọn một dự án (Project) để bắt đầu chuyển văn bản thành giọng nói với FPT.AI Voicemaker.

  • Nếu đã có dự án, click vào (1) để chọn dự án. Chọn 1 trong các dự án đã tạo ở (2)
  • Nếu chưa có dự án, bạn phải tạo dự án mới bằng cách click vào Create new Project (3). Bạn sẽ được link sang trang console.fpt.ai.

FPT.AI Console là nền tảng quản lý và nắm bắt thông số về mọi dịch vụ của FPT.AI. Tại đây, bạn có thể thiết lập một dự án mới. Sau đó bạn quay lại trang Voicemaker.fpt.ai để tiếp thục thực hiện dự án của mình.

chuyển văn bản thành giọng nói
Chọn dự án muốn chuyển văn bản thành giọng nói

Dán link trang web cần chuyển văn bản thành giọng nói

Dán link trang web bất kì cần chuyển văn bản thành giọng nói vào ô URL. Ấn Xử lý để hệ thống bóc tách phần chữ cần chuyển đổi trong trang web.

Nghe thử và chọn giọng đọc

Nghe thử và chọn giọng đọc phù hợp ở cột bên phải giao diện.

Lợi ích của chuyển văn bản thành giọng nói bằng FPT.AI Text to Speech là nền tảng hiện đang sở hữu 8 giọng đọc chất lượng cao, đa dạng vùng miền (Bắc – Trung – Nam), giới tính (Nam/Nữ), đáp ứng nhiều nhu cầu và mục đích sử dụng khác nhau của khách hàng.

tex to speech
8 giọng đọc chất lượng cao, đa dạng vùng miền cuat FPT.AI Text to Speech

Tùy chỉnh văn bản đọc

Sau khi đã thiết lập giọng đọc chính cho cả văn bản với tốc độ phù hợp, bạn có thể tiến hành chỉnh sửa văn bản đọc với các tính năng chuyên biệt và cụ thể hơn, để tạo ra một file âm thanh chất lượng cao, chuyển văn bản thành giọng nói có cảm xúc đúng với nhu cầu sử dụng.

text to speech
Chỉnh sửa văn bản theo nhu cầu sử dụng sau khi thiết lập giọng đọc chính

>>> CÓ THỂ BẠN QUAN TÂM: Hướng dẫn tạo giọng review phim siêu nhanh và miễn phí

Các tính năng chỉnh sửa chuyên sâu của FPT.AI VoiceMaker

 Từ điển

Với từ điển, bạn có thể dạy máy phát âm các từ khó, từ nước ngoài bằng cách phiên âm sang cách đọc tiếng Việt. Chẳng hạn, trong bài báo xuất hiện danh từ riêng Mark Zuckerberg. Đây là một từ khó, máy sẽ đọc sai hoặc đọc không hay. Bạn có thể phiên âm cách đọc Việt hóa đúng nhất, sau đó ấn Thêm để dạy máy đọc theo đúng ý bạn.

text to speech
Dạy máy phát âm các từ nước ngoài bằng cách phiên âm sang cách đọc tiếng Việt

Thêm thời gian nghỉ

Các giọng đọc của FPT.AI Text to Speech đều có sự ngắt nghỉ tự nhiên, nhịp nhàng như giọng đọc thật của con người. Tuy nhiên, với những đoạn bạn muốn máy nghỉ lâu hơn, bạn có thể thiết lập tính năng thêm thời gian nghỉ.

Để con trỏ sau từ bạn muốn thêm thời gian nghỉ, ấn nút Nghỉ, sau đó điều chỉnh thời gian nghỉ phù hợp với nhu cầu sử dụng bằng cách điền thời gian vào ô Break time.

chuyển văn bản thành giọng nói
Thêm thời gian nghỉ để thu được kết quả tự nhiên hơn

Chọn giọng đọc AI khác

Trong cùng một bài đọc, bạn có thể sẽ cần nhiều giọng đọc khác nhau để đối thoại, chuyển văn bản thành giọng nói có cảm xúc hoặc làm nổi bật câu trích dẫn. Bạn có thể cài đặt giọng đọc khác bằng cách bôi đen đoạn cần sử dụng giọng đọc khác, click vào nút Giọng, sau đó chọn giọng đọc và điều chỉnh tốc độ tùy theo nhu cầu sử dụng.

chuyển văn bản thành giọng nói
Chọn giọng đọc khác để đối thoại hoặc làm nổi bật câu trích dẫn

Tìm kiếm và thay thế

Để tìm kiếm một từ/cụm từ trong đoạn văn bản, nhập từ đó vào ô Tìm kiếm và ấn Tìm. Văn bản sẽ bôi đậm tất cả các từ/cụm từ đó trong văn bản.

text to speech
Tìm kiếm và thay thế từ/ cụm từ trong đoạn văn bản

Bạn có thể thay thế từ đó bằng cách nhập từ thay thế vào ô Thay thế. Ấn nút Thay thế để thay thế từng từ như sau:

chuyển văn bản thành giọng nói
Thay thế từng từ

Hoặc bạn có thể ấn nút Thay thế Tất cả để thay thế hàng loạt.

chuyển văn bản thành giọng nói
Thay thế hàng loạt

Ở ví dụ trên, tôi đã thay thế từ “Gates” thành “Mark” và ấn Thay thế để thay thế từng từ một. Ngoài ra, để bỏ chọn các từ/cụm từ bạn tìm kiếm (các từ được bôi đậm), chọn nút Xóa.

Chọn giọng đọc và nghe thử

Để nghe thử một từ, cụm từ hoặc một đoạn văn bản, bạn bôi đen từ/cụm từ hoặc đoạn văn bản đó, chọn Giọng, chọn Tốc độ đọc và ấn Nghe thử.​​​​​​​

text to speech
Nghe thử để điều chỉnh giọng và tốc độ đọc

Undo và Redo

Để khôi phục lại một thao tác vừa thực hiện, bạn có thể nhấn vào biểu tượng nút Undo (1) trên thanh công cụ.

Để thực hiện lại các thao tác đã Undo thì nhấn vào nút Redo (2).

chuyển văn bản thành giọng nói
Khôi phục hoặc thực hiện lại các thao tác

Tải file audio

Để tải file audio, ấn vào nút Tải xuống MP3.

chuyển văn bản thành giọng nói
Tải xuống file audio đã hoàn chỉnh

Xem lịch sử

Để xem lại lịch sử hoạt động, ấn vào nút Lịch sử.

text to speech
Xem lại lịch sử hoạt động

Tại đây bạn sẽ xem được các thông tin về thời gian tạo, yêu cầu, trạng thái và đường link tải file.

chuyển văn bản thành giọng nói
Xem lại thời gian tạo, yêu cầu, trạng thái và đường link tải file

Mua thêm lưu lượng sử dụng FPT.AI Text to Speech

FPT.AI Text to Speech tặng bạn miễn phí 100.000 kí tự/tháng. Tuy nhiên, nếu có nhu cầu sử dụng lưu lượng nhiều hơn hoặc muốn tốc độ chuyển đổi cao hơn, bạn có thể mua thêm các gói trả phí bằng cách ấn vào chữ Mua thêm.

Click vào gói dịch vụ bạn chọn và thực hiện thanh toán theo hướng dẫn.

text to speech
Mua thêm dung lượng sử dụng

>>> XEM THÊM: Thông báo giao dịch bằng giọng nói – Xu thế tất yếu của Ngân hàng số

Các câu hỏi thường gặp khác về công nghệ chuyển văn bản thành giọng nói

Giọng chị Ban Mai là gì và vì sao nó lại được ưa chuộng?

Giọng chị Ban Mai (hay còn được biết đến như là giọng chị Google) là giọng đọc AI nổi bật của FPT.AI Voicemaker, mang âm sắc nữ miền Bắc nhẹ nhàng, tự nhiên, truyền cảm và dễ nghe. Giọng Ban Mai được sử dụng rộng rãi trong các video review phim, sách nói và các nội dung thuyết minh ngắn trên các mạng xã hội như TikTok, Facebook và YouTube. Giọng đọc AI này giúp người sáng tạo nội dung truyền tải thông điệp một cách rõ ràng và gần gũi, thu hút người nghe mà không cần chỉnh sửa hậu kỳ phức tạp.

text to speech
Giọng chị Ban Mai – Bí quyết tạo nên những video review phim cuốn hút, tự nhiên và đầy cảm xúc!

FPT.AI có giới hạn số ký tự khi sử dụng giọng đọc AI miễn phí không?

Có, FPT.AI Voicemaker cung cấp miễn phí 100.000 ký tự mỗi tháng để người dùng có thể thử nghiệm và tận dụng giải pháp với các dự án nhỏ mà không lo về chi phí ban đầu. Nếu có nhu cầu chuyển văn bản thành giọng nói nhiều hơn, bạn cần mua thêm dung lượng.

Làm thế nào để tạo ra giọng đọc AI phù hợp cho đối tượng khách hàng của tôi?

Bạn có thể chọn giọng đọc AI miễn phí của FPT.AI dựa trên đặc điểm vùng miền (Bắc, Trung, Nam) và giới tính (nam/nữ). Tính năng nghe thử và tùy chỉnh ngữ điệu giúp bạn dễ dàng điều chỉnh để giọng đọc phù hợp và thu hút đối tượng mong muốn, dù đó là người trẻ tuổi trên mạng xã hội hay khách hàng lớn tuổi ở các vùng miền khác nhau.

FPT.AI có cung cấp tính năng điều chỉnh tốc độ và nhấn nhá trong giọng đọc AI không?

Có. Lợi ích của chuyển văn bản thành giọng nói trên nền tảng FPT.AI Voicemaker là khẳ năng điều chỉnh tốc độ, thêm ngắt nghỉ và dạy máy phát âm các từ khó. Nhờ vậy, người dùng có thể tạo giọng đọc linh hoạt, phù hợp với nội dung khác nhau như đối thoại, bài báo, hoặc thuyết minh phim, chuyển văn bản thành giọng nói có cảm xúc và nhấn nhá như người thật.

FPT.AI có cung cấp API Text to Speech cho doanh nghiệp không?

Có, FPT.AI cung cấp API Text to Speech để doanh nghiệp tích hợp trực tiếp vào hệ thống của mình. Với API này, các doanh nghiệp có thể tạo giọng đọc AI tùy chỉnh trong các ứng dụng như tổng đài tự động, trợ lý ảo, hoặc đọc sách báo, nâng cao hiệu quả trong việc tự động hóa và chăm sóc khách hàng.

Như vậy, với FPT.AI Voicemaker, bạn có thể dễ dàng chuyển văn bản thành giọng nói tự nhiên và chân thực, đồng thời tùy chỉnh theo nhu cầu sử dụng một cách linh hoạt và chính xác. Việc áp dụng công nghệ Text to Speech không chỉ giúp tiết kiệm thời gian mà còn tối ưu hóa hiệu quả giao tiếp trong các dịch vụ khách hàng tự động. Hãy tận dụng hướng dẫn sử dụng Text to Speech trên để trải nghiệm sự tiện ích mà FPT.AI Voicemaker mang lại và nâng cao chất lượng công việc của bạn.

_____________________________

? Trải nghiệm giải pháp FPT.AI Text to Speech của #FPT_AI tại: https://fpt.ai/vi/tts

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

☎ Hotline: 1900 638 399

? Email: [email protected]

>>>XEM THÊM VỀ CÔNG NGHỆ KHÁC:

5/5 - (1 vote)

Bài viết liên quan

Cập nhật mọi tin tức mới nhất về công nghệ AI

Đăng ký nhận bản tin của FPT.AI để được phủ sóng mọi xu hướng công nghệ, câu chuyện thành công và phân tích của chuyên gia.