FPT.AI Voicemaker là nền tảng tiên tiến, sử dụng công nghệ Text to Speech (TTS) để mang đến những bản ghi âm tự nhiên. Hỗ trợ 2 ngôn ngữ (Tiếng Việt, Tiếng Anh), Voicemaker không chỉ đáp ứng nhu cầu chuyển văn bản thành giọng nói mà còn cung cấp các công cụ chỉnh sửa chuyên sâu như dạy máy phát âm từ khó, thay thế từ/cụm từ nhanh chóng và thêm thời gian nghỉ giữa các câu để tạo ra trải nghiệm nghe chân thật nhất. Sau đây chúng tôi sẽ hướng dẫn cách sử dụng Text to Speech trên nền tảng AI Voice Maker của FPT.AI.
Nền tảng chuyển văn bản thành giọng nói FPT.AI VoiceMaker là gì?
FPT.AI Voicemaker là nền tảng chuyển văn bản thành giọng nói tiên tiến, ứng dụng công nghệ Text to Speech (TTS) với 13 giọng đọc tự nhiên, đa dạng vùng miền và giới tính. Nền tảng đã được Home Credit sử dụng để tự động nhắc lịch thanh toán, thực hiện 20.000 cuộc gọi mỗi ngày với tỷ lệ thành công 98%, ngay cả trong giai đoạn giãn cách xã hội.
Tương tự, Tổng công ty Điện lực miền Trung (EVN CPC) áp dụng Voicemaker để thông báo mất điện và lịch cấp lại điện, xử lý 46.000 cuộc gọi trong 6 tháng, tiết kiệm hơn 600 triệu đồng. Với các giọng đọc AI tự nhiên, đa dạng vùng miền, chân thực, FPT.AI Voicemaker giúp doanh nghiệp cải thiện hiệu suất, tối ưu chi phí và nâng cao chất lượng dịch vụ khách hàng.
>>> XEM THÊM: Nguyên lý hoạt động của Text to Speech (TTS)
Hướng dẫn thiết lập các tính năng trên FPT.AI Voicemaker
Để thiết lập các tính năng chuyển văn bản thành giọng nói trên FPT.AI Voicemaker, đầu tiên, bạn phải có tài khoản FPT ID. Nếu chưa có tài khoản, đăng kí tài khoản tại đây: https://id.fpt.ai/accounts/signin/?next=/accounts/profile/
Tiếp theo, truy cập https://console.fpt.ai để tạo sự Project (Dự án), API Key và Kích hoạt dự án.
Sau đó, truy cập: https://voicemaker.fpt.ai/ để bắt đầu chuyển văn bản thành giọng nói.
>>>> ĐỌC THÊM: Generative AI là gì? Xu hướng công nghệ AI tạo sinh 2024
Chọn ngôn ngữ
FPT.AI Voicemaker hỗ trợ 2 ngôn ngữ là Tiếng Anh và Tiếng Việt. Click vào biểu tượng địa cầu trên góc phải màn hình để chọn ngôn ngữ sử dụng.
Chọn dự án
Bạn phải chọn một dự án (Project) để bắt đầu chuyển văn bản thành giọng nói với FPT.AI Voicemaker.
- Nếu đã có dự án, click vào (1) để chọn dự án. Chọn 1 trong các dự án đã tạo ở (2)
- Nếu chưa có dự án, bạn phải tạo dự án mới bằng cách click vào Create new Project (3). Bạn sẽ được link sang trang console.fpt.ai.
FPT.AI Console là nền tảng quản lý và nắm bắt thông số về mọi dịch vụ của FPT.AI. Tại đây, bạn có thể thiết lập một dự án mới. Sau đó bạn quay lại trang Voicemaker.fpt.ai để tiếp thục thực hiện dự án của mình.
Dán link trang web cần chuyển văn bản thành giọng nói
Dán link trang web bất kì cần chuyển văn bản thành giọng nói vào ô URL. Ấn Xử lý để hệ thống bóc tách phần chữ cần chuyển đổi trong trang web.
Nghe thử và chọn giọng đọc
Nghe thử và chọn giọng đọc phù hợp ở cột bên phải giao diện.
Lợi ích của chuyển văn bản thành giọng nói bằng FPT.AI Text to Speech là nền tảng hiện đang sở hữu 8 giọng đọc chất lượng cao, đa dạng vùng miền (Bắc – Trung – Nam), giới tính (Nam/Nữ), đáp ứng nhiều nhu cầu và mục đích sử dụng khác nhau của khách hàng.
Tùy chỉnh văn bản đọc
Sau khi đã thiết lập giọng đọc chính cho cả văn bản với tốc độ phù hợp, bạn có thể tiến hành chỉnh sửa văn bản đọc với các tính năng chuyên biệt và cụ thể hơn, để tạo ra một file âm thanh chất lượng cao, chuyển văn bản thành giọng nói có cảm xúc đúng với nhu cầu sử dụng.
>>> CÓ THỂ BẠN QUAN TÂM: Hướng dẫn tạo giọng review phim siêu nhanh và miễn phí
Các tính năng chỉnh sửa chuyên sâu của FPT.AI VoiceMaker
Từ điển
Với từ điển, bạn có thể dạy máy phát âm các từ khó, từ nước ngoài bằng cách phiên âm sang cách đọc tiếng Việt. Chẳng hạn, trong bài báo xuất hiện danh từ riêng Mark Zuckerberg. Đây là một từ khó, máy sẽ đọc sai hoặc đọc không hay. Bạn có thể phiên âm cách đọc Việt hóa đúng nhất, sau đó ấn Thêm để dạy máy đọc theo đúng ý bạn.
Thêm thời gian nghỉ
Các giọng đọc của FPT.AI Text to Speech đều có sự ngắt nghỉ tự nhiên, nhịp nhàng như giọng đọc thật của con người. Tuy nhiên, với những đoạn bạn muốn máy nghỉ lâu hơn, bạn có thể thiết lập tính năng thêm thời gian nghỉ.
Để con trỏ sau từ bạn muốn thêm thời gian nghỉ, ấn nút Nghỉ, sau đó điều chỉnh thời gian nghỉ phù hợp với nhu cầu sử dụng bằng cách điền thời gian vào ô Break time.
Chọn giọng đọc AI khác
Trong cùng một bài đọc, bạn có thể sẽ cần nhiều giọng đọc khác nhau để đối thoại, chuyển văn bản thành giọng nói có cảm xúc hoặc làm nổi bật câu trích dẫn. Bạn có thể cài đặt giọng đọc khác bằng cách bôi đen đoạn cần sử dụng giọng đọc khác, click vào nút Giọng, sau đó chọn giọng đọc và điều chỉnh tốc độ tùy theo nhu cầu sử dụng.
Tìm kiếm và thay thế
Để tìm kiếm một từ/cụm từ trong đoạn văn bản, nhập từ đó vào ô Tìm kiếm và ấn Tìm. Văn bản sẽ bôi đậm tất cả các từ/cụm từ đó trong văn bản.
Bạn có thể thay thế từ đó bằng cách nhập từ thay thế vào ô Thay thế. Ấn nút Thay thế để thay thế từng từ như sau:
Hoặc bạn có thể ấn nút Thay thế Tất cả để thay thế hàng loạt.
Ở ví dụ trên, tôi đã thay thế từ “Gates” thành “Mark” và ấn Thay thế để thay thế từng từ một. Ngoài ra, để bỏ chọn các từ/cụm từ bạn tìm kiếm (các từ được bôi đậm), chọn nút Xóa.
Chọn giọng đọc và nghe thử
Để nghe thử một từ, cụm từ hoặc một đoạn văn bản, bạn bôi đen từ/cụm từ hoặc đoạn văn bản đó, chọn Giọng, chọn Tốc độ đọc và ấn Nghe thử.
Undo và Redo
Để khôi phục lại một thao tác vừa thực hiện, bạn có thể nhấn vào biểu tượng nút Undo (1) trên thanh công cụ.
Để thực hiện lại các thao tác đã Undo thì nhấn vào nút Redo (2).
Tải file audio
Để tải file audio, ấn vào nút Tải xuống MP3.
Xem lịch sử
Để xem lại lịch sử hoạt động, ấn vào nút Lịch sử.
Tại đây bạn sẽ xem được các thông tin về thời gian tạo, yêu cầu, trạng thái và đường link tải file.
Mua thêm lưu lượng sử dụng FPT.AI Text to Speech
FPT.AI Text to Speech tặng bạn miễn phí 100.000 kí tự/tháng. Tuy nhiên, nếu có nhu cầu sử dụng lưu lượng nhiều hơn hoặc muốn tốc độ chuyển đổi cao hơn, bạn có thể mua thêm các gói trả phí bằng cách ấn vào chữ Mua thêm.
Click vào gói dịch vụ bạn chọn và thực hiện thanh toán theo hướng dẫn.
>>> XEM THÊM: Thông báo giao dịch bằng giọng nói – Xu thế tất yếu của Ngân hàng số
Các câu hỏi thường gặp khác về công nghệ chuyển văn bản thành giọng nói
Giọng chị Ban Mai là gì và vì sao nó lại được ưa chuộng?
Giọng chị Ban Mai (hay còn được biết đến như là giọng chị Google) là giọng đọc AI nổi bật của FPT.AI Voicemaker, mang âm sắc nữ miền Bắc nhẹ nhàng, tự nhiên, truyền cảm và dễ nghe. Giọng Ban Mai được sử dụng rộng rãi trong các video review phim, sách nói và các nội dung thuyết minh ngắn trên các mạng xã hội như TikTok, Facebook và YouTube. Giọng đọc AI này giúp người sáng tạo nội dung truyền tải thông điệp một cách rõ ràng và gần gũi, thu hút người nghe mà không cần chỉnh sửa hậu kỳ phức tạp.
FPT.AI có giới hạn số ký tự khi sử dụng giọng đọc AI miễn phí không?
Có, FPT.AI Voicemaker cung cấp miễn phí 100.000 ký tự mỗi tháng để người dùng có thể thử nghiệm và tận dụng giải pháp với các dự án nhỏ mà không lo về chi phí ban đầu. Nếu có nhu cầu chuyển văn bản thành giọng nói nhiều hơn, bạn cần mua thêm dung lượng.
Làm thế nào để tạo ra giọng đọc AI phù hợp cho đối tượng khách hàng của tôi?
Bạn có thể chọn giọng đọc AI miễn phí của FPT.AI dựa trên đặc điểm vùng miền (Bắc, Trung, Nam) và giới tính (nam/nữ). Tính năng nghe thử và tùy chỉnh ngữ điệu giúp bạn dễ dàng điều chỉnh để giọng đọc phù hợp và thu hút đối tượng mong muốn, dù đó là người trẻ tuổi trên mạng xã hội hay khách hàng lớn tuổi ở các vùng miền khác nhau.
FPT.AI có cung cấp tính năng điều chỉnh tốc độ và nhấn nhá trong giọng đọc AI không?
Có. Lợi ích của chuyển văn bản thành giọng nói trên nền tảng FPT.AI Voicemaker là khẳ năng điều chỉnh tốc độ, thêm ngắt nghỉ và dạy máy phát âm các từ khó. Nhờ vậy, người dùng có thể tạo giọng đọc linh hoạt, phù hợp với nội dung khác nhau như đối thoại, bài báo, hoặc thuyết minh phim, chuyển văn bản thành giọng nói có cảm xúc và nhấn nhá như người thật.
FPT.AI có cung cấp API Text to Speech cho doanh nghiệp không?
Có, FPT.AI cung cấp API Text to Speech để doanh nghiệp tích hợp trực tiếp vào hệ thống của mình. Với API này, các doanh nghiệp có thể tạo giọng đọc AI tùy chỉnh trong các ứng dụng như tổng đài tự động, trợ lý ảo, hoặc đọc sách báo, nâng cao hiệu quả trong việc tự động hóa và chăm sóc khách hàng.
Như vậy, với FPT.AI Voicemaker, bạn có thể dễ dàng chuyển văn bản thành giọng nói tự nhiên và chân thực, đồng thời tùy chỉnh theo nhu cầu sử dụng một cách linh hoạt và chính xác. Việc áp dụng công nghệ Text to Speech không chỉ giúp tiết kiệm thời gian mà còn tối ưu hóa hiệu quả giao tiếp trong các dịch vụ khách hàng tự động. Hãy tận dụng hướng dẫn sử dụng Text to Speech trên để trải nghiệm sự tiện ích mà FPT.AI Voicemaker mang lại và nâng cao chất lượng công việc của bạn.
_____________________________
? Trải nghiệm giải pháp FPT.AI Text to Speech của #FPT_AI tại: https://fpt.ai/vi/tts
? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi
? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội
☎ Hotline: 1900 638 399
? Email: [email protected]
>>>XEM THÊM VỀ CÔNG NGHỆ KHÁC:
- Xử lý ngôn ngữ tự nhiên là gì? 3 Ứng dụng thực tế của NLP
- AI Agents là gì? Sự khác biệt giữa AI Agents và AI Chatbot