Chuyển đến phần nội dung
center-gradient-cover-bg
right-gradient-cover-bg
background gradient desk
Bài viết

Công cụ chuyển văn bản thành giọng nói chân thực miễn phí tại FPT AI Voicemaker

Tháng Mười Hai 23, 2024

Chia sẻ với:

FPT.AI Voicemaker là nền tảng tiên tiến, sử dụng công nghệ Text to Speech (TTS) để mang đến những bản ghi âm tự nhiên. Hỗ trợ 2 ngôn ngữ (Tiếng Việt, Tiếng Anh), Voicemaker không chỉ đáp ứng nhu cầu chuyển văn bản thành giọng nói mà còn cung cấp các công cụ chỉnh sửa chuyên sâu như dạy máy phát âm từ khó, thay thế từ/cụm từ nhanh chóng và thêm thời gian nghỉ giữa các câu để tạo ra trải nghiệm nghe chân thật nhất. Sau đây chúng tôi sẽ hướng dẫn cách sử dụng Text to Speech trên nền tảng AI Voice Maker của FPT.AI.

>>>> ĐỌC THÊM: Generative AI là gì? Xu hướng công nghệ AI tạo sinh 2024

Lợi ích của công cụ chuyển văn bản thành giọng nói AI

Giọng AI là giọng nói được tạo ra bằng công nghệ trí tuệ nhân tạo (AI), sử dụng các thuật toán phức tạp và kỹ thuật học sâu để tái tạo giọng nói con người, bao gồm âm sắc, cảm xúc, ngữ điệu và tốc độ. Công nghệ này ngày càng phổ biến, ứng dụng trong các lĩnh vực như chatbot, Callbot, sách nói, hệ thống định vị và trợ lý ảo như Siri, Alexa, Cortana, và Google Assistant.

Để tạo ra giọng AI, các hệ thống này sử dụng trình tạo giọng đọc AI – phần mềm được thiết kế để mô phỏng giọng nói tự nhiên của con người. Công cụ này không chỉ hỗ trợ các ứng dụng như trợ lý ảo và chatbot, mà còn được dùng trong các dự án sáng tạo và hệ thống chuyển văn bản thành giọng nói, giúp việc giao tiếp với máy móc trở nên sống động và gần gũi hơn.

Quá trình tạo giọng AI trở nên đơn giản nhờ các công cụ hiện đại. Bạn chỉ cần truy cập ứng dụng qua trình duyệt web hoặc thiết bị iOS, Android, sau đó chọn ngôn ngữ, nhập nội dung kịch bản, tùy chỉnh các yếu tố như kiểu giọng và âm sắc, rồi tạo giọng nói AI chỉ trong vài giây. Công nghệ này mở ra nhiều cơ hội sáng tạo và ứng dụng hiệu quả trong cuộc sống hàng ngày.

chuyển văn bản thành giọng nói
TechInsight đã tích hợp công nghệ Text to Speech của FPT.AI để tối ưu trải nghiệm cho các độc giả

Tạo nội dung quảng cáo và video tự động hấp dẫn

Tạo nội dung quảng cáo một cách tự động mà không cần phải ghi âm thủ công là cách doanh nghiệp ứng dụng Text to Speech trong lĩnh vực truyền thông. Các video quảng cáo, các bài viết, các video hướng dẫn sử dụng sản phẩm trên blog, trang web hay mạng xã hội có thể được chuyển đổi thành dạng âm thanh một cách rõ ràng và dễ hiểu, giúp doanh nghiệp tiếp cận đối tượng khách hàng mới hoặc những người ít có thời gian để đọc.

Thuyết minh, lồng tiếng phim tự động với nhiều ngôn ngữ và ngữ điệu

Công cụ chuyển văn bản thành giọng nói giúp tạo ra các bản thuyết minh, lồng tiếng cho video, phim, chương trình truyền hình mà không cần sử dụng diễn viên lồng tiếng trực tiếp. Người dùng có thể điều chỉnh tốc độ, âm lượng và ngắt nghỉ giữa các câu, dạy máy phát âm các từ khó, phiên âm từ ngữ chuyên ngành hoặc ngữ âm đặc biệt để tạo bản lồng tiếng giọng review phim theo ý muốn.

Text to Speech giúp các kênh YouTube, các nhà sản xuất video giáo dục và các nền tảng phát thanh, truyền hình tiết kiệm chi phí, tăng tốc độ sản xuất nội dung, dễ dàng cập nhật, chỉnh sửa mà không cần thu âm lại toàn bộ. Công nghệ này cũng hỗ trợ giọng AI theo nhiều ngôn ngữ khác nhau, mở rộng khả năng tiếp cận và thu hút khán giả toàn cầu.

>>> XEM THÊM: Interactive Voice Response là gì? Ứng dụng & lợi ích của IVR trong các tổng đài cuộc gọi

Cách tạo âm thanh tự động từ tính năng chuyển văn bản thành giọng nói AI

Hiện nay, nền tảng chuyển văn bản thành giọng nói FPT.AI Voicemaker được ứng dụng nhiều trong lĩnh vực dịch vụ, mang tới sự tiện lợi cho người dùng. Lợi ích của công nghệ trí tuệ nhân tạo này trên nền tảng FPT.AI Voicemaker là khả năng điều chỉnh tốc độ, thêm ngắt nghỉ và dạy máy phát âm các từ khó. Nhờ vậy, người dùng có thể tạo giọng đọc linh hoạt, phù hợp với nội dung khác nhau như đối thoại, bài báo, hoặc thuyết minh phim với giọng nói có cảm xúc và nhấn nhá như người thật.

Bạn có thể chọn giọng đọc AI miễn phí của FPT.AI dựa trên đặc điểm vùng miền (Bắc, Trung, Nam) và giới tính (nam/nữ). Tính năng nghe thử và tùy chỉnh ngữ điệu giúp bạn dễ dàng điều chỉnh để giọng đọc phù hợp và thu hút đối tượng mong muốn, dù đó là người trẻ tuổi trên mạng xã hội hay khách hàng lớn tuổi ở các vùng miền khác nhau.

chuyển văn bản thành giọng nói
Callbot của FPT.AI để giúp Home Credit Việt Nam cung cấp dịch vụ khách hàng tự động và hiệu quả

Thiết lập các tính năng chuyển văn bản thành giọng nói

Để thiết lập các tính năng chuyển văn bản thành giọng nói trên FPT.AI Voicemaker, đầu tiên, bạn phải có tài khoản FPT ID. Nếu chưa có tài khoản, đăng kí tài khoản tại đây: https://id.fpt.ai/accounts/signin/?next=/accounts/profile/

Tiếp theo, truy cập https://console.fpt.ai để tạo sự Project (Dự án), API Key và Kích hoạt dự án.

chuyển văn bản thành giọng nói
Kích hoạch dự án chuyển văn bản thành giọng nói với FPT.AI Voicemaker

Sau đó, truy cập: https://voicemaker.fpt.ai/ để bắt đầu chuyển văn bản thành giọng nói.

chuyển văn bản thành giọng nói
Giao diện nền tảng VoiceMaker

Chọn ngôn ngữ 

FPT.AI Voicemaker hỗ trợ 2 ngôn ngữ là Tiếng Anh và Tiếng Việt. Click vào biểu tượng địa cầu trên góc phải màn hình để chọn ngôn ngữ sử dụng.

text to speech
Chọn ngôn ngữ

Chọn dự án chuyển văn bản thành giọng nói

Bạn phải chọn một dự án (Project) để bắt đầu chuyển văn bản thành giọng nói với FPT.AI Voicemaker.

  • Nếu đã có dự án, click vào (1) để chọn dự án. Chọn 1 trong các dự án đã tạo ở (2)
  • Nếu chưa có dự án, bạn phải tạo dự án mới bằng cách click vào Create new Project (3). Bạn sẽ được link sang trang console.fpt.ai.

FPT.AI Console là nền tảng quản lý và nắm bắt thông số về mọi dịch vụ của FPT.AI. Tại đây, bạn có thể thiết lập một dự án mới. Sau đó bạn quay lại trang Voicemaker.fpt.ai để tiếp thục thực hiện dự án của mình.

chuyển văn bản thành giọng nói
Chọn dự án muốn chuyển văn bản thành giọng nói

Tạo giọng nói AI cho nội dung cần chuyển văn bản thành giọng nói

Dán link trang web bất kì cần chuyển văn bản thành giọng nói vào ô URL. Ấn Xử lý để hệ thống bóc tách phần chữ cần chuyển đổi trong trang web. Nghe thử và chọn giọng đọc phù hợp ở cột bên phải giao diện.

Nền tảng chuyển văn bản thành giọng nói FPT.AI Voicemaker hiện đang sở hữu 8 giọng đọc chất lượng cao, đa dạng vùng miền (Bắc – Trung – Nam), giới tính (Nam/Nữ), đáp ứng nhiều nhu cầu và mục đích sử dụng khác nhau của khách hàng.

tex to speech
8 giọng đọc chất lượng cao, đa dạng vùng miền của FPT.AI Voicemaker

Để nghe thử một từ, cụm từ hoặc một đoạn văn bản, bạn bôi đen từ/cụm từ hoặc đoạn văn bản đó, chọn Giọng, chọn Tốc độ đọc và ấn Nghe thử.​​​​​​​

text to speech
Nghe thử để điều chỉnh giọng và tốc độ đọc

Các giọng đọc của FPT.AI Voicemaker đều có sự ngắt nghỉ tự nhiên, nhịp nhàng như giọng đọc thật của con người. Tuy nhiên, với những đoạn bạn muốn máy nghỉ lâu hơn, bạn có thể thiết lập tính năng thêm thời gian nghỉ.

Để con trỏ sau từ bạn muốn thêm thời gian nghỉ, ấn nút Nghỉ, sau đó điều chỉnh thời gian nghỉ phù hợp với nhu cầu sử dụng bằng cách điền thời gian vào ô Break time.

chuyển đổi văn bản thành giọng nói
Thêm thời gian nghỉ để thu được kết quả tự nhiên hơn

>>> XEM THÊM: Nhận diện giọng nói là gì? Đâu là 3 ứng dụng nổi bật của ASR?

Tùy chỉnh giọng đọc AI trong văn bản

Trong cùng một bài đọc, bạn có thể sẽ cần nhiều giọng đọc khác nhau để đối thoại, chuyển đổi văn bản thành giọng nói có cảm xúc hoặc làm nổi bật câu trích dẫn. Sau đó, bạn cài đặt giọng đọc khác bằng cách bôi đen đoạn cần sử dụng giọng đọc khác, click vào nút Giọng, sau đó chọn giọng đọc và điều chỉnh tốc độ tùy theo nhu cầu sử dụng.

chuyển văn bản thành giọng nói
Chọn giọng đọc khác để đối thoại hoặc làm nổi bật câu trích dẫn

Sau khi đã thiết lập giọng đọc chính cho cả văn bản với tốc độ phù hợp, bạn có thể tiến hành chỉnh sửa văn bản đọc với các tính năng chuyên biệt và cụ thể hơn, để tạo ra một file âm thanh chất lượng cao, chuyển văn bản thành giọng nói có cảm xúc đúng với nhu cầu sử dụng.

chuyển đổi văn bản thành giọng nói
Chỉnh sửa văn bản theo nhu cầu sử dụng sau khi thiết lập giọng đọc chính

Với từ điển, bạn có thể dạy máy phát âm các từ khó, từ nước ngoài bằng cách phiên âm sang cách đọc tiếng Việt. Chẳng hạn, trong bài báo xuất hiện danh từ riêng Mark Zuckerberg. Đây là một từ khó, máy sẽ đọc sai hoặc đọc không hay. Bạn có thể phiên âm cách đọc Việt hóa đúng nhất, sau đó ấn Thêm để dạy máy đọc theo đúng ý bạn.

text to speech
Dạy máy phát âm các từ nước ngoài bằng cách phiên âm sang cách đọc tiếng Việt

Để tìm kiếm một từ/cụm từ trong đoạn văn bản, nhập từ đó vào ô Tìm kiếm và ấn Tìm. Văn bản sẽ bôi đậm tất cả các từ/cụm từ đó trong văn bản.

text to speech
Tìm kiếm và thay thế từ/ cụm từ trong đoạn văn bản

Bạn có thể thay thế từ đó bằng cách nhập từ thay thế vào ô Thay thế. Ấn nút Thay thế để thay thế từng từ như sau:

chuyển đổi văn bản thành giọng nói
Thay thế từng từ

Hoặc bạn có thể ấn nút Thay thế Tất cả để thay thế hàng loạt.

chuyển văn bản thành giọng nói
Thay thế hàng loạt

Ở ví dụ trên, tôi đã thay thế từ “Gates” thành “Mark” và ấn Thay thế để thay thế từng từ một. Ngoài ra, để bỏ chọn các từ/cụm từ bạn tìm kiếm (các từ được bôi đậm), chọn nút Xóa.

Lưu ý:  Để khôi phục lại một thao tác vừa thực hiện, bạn có thể nhấn vào biểu tượng nút Undo (1) trên thanh công cụ. Để thực hiện lại các thao tác đã Undo thì nhấn vào nút Redo (2).

chuyển văn bản thành giọng nói
Khôi phục hoặc thực hiện lại các thao tác

Tải file audio về máy

Sau khi chọn được giọng AI bạn mong muốn, để tải file audio với định dạng MP3, bạn ấn vào nút Tải xuống MP3

chuyển văn bản thành giọng nói
Tải xuống file audio đã hoàn chỉnh

Xem lịch sử: Để xem lại lịch sử hoạt động, ấn vào nút Lịch sử.

text to speech
Xem lại lịch sử hoạt động

Tại đây bạn sẽ xem được các thông tin về thời gian tạo, yêu cầu, trạng thái và đường link tải file.

chuyển văn bản thành giọng nói
Xem lại thời gian tạo, yêu cầu, trạng thái và đường link tải file

FPT.AI Voicemaker tặng bạn miễn phí 100.000 kí tự/tháng. Tuy nhiên, nếu có nhu cầu sử dụng lưu lượng nhiều hơn hoặc muốn tốc độ chuyển đổi cao hơn, bạn có thể mua thêm các gói trả phí bằng cách ấn vào chữ Mua thêm. Click vào gói dịch vụ chuyển văn bản thành giọng nói AI và thực hiện thanh toán theo hướng dẫn.

text to speech
Mua thêm dung lượng sử dụng

>>> XEM THÊM: Thông báo giao dịch bằng giọng nói – Xu thế tất yếu của Ngân hàng số

Các câu hỏi thường gặp khi sử dụng công cụ chuyển văn bản thành giọng nói

Giọng chị Ban Mai là gì và vì sao nó lại được ưa chuộng?

Giọng chị Ban Mai (hay còn được biết đến như là giọng chị Google) là giọng đọc AI nổi bật của FPT.AI Voicemaker, mang âm sắc nữ miền Bắc nhẹ nhàng, tự nhiên, truyền cảm và dễ nghe. Giọng Ban Mai được sử dụng rộng rãi trong các video review phim, sách nói và các nội dung thuyết minh ngắn trên các mạng xã hội như TikTok, Facebook và YouTube. Giọng đọc AI này giúp người sáng tạo nội dung truyền tải thông điệp một cách rõ ràng và gần gũi, thu hút người nghe mà không cần chỉnh sửa hậu kỳ phức tạp.

chuyển đổi văn bản thành giọng nói
Giọng chị Ban Mai – Bí quyết tạo nên những video review phim cuốn hút, tự nhiên và đầy cảm xúc!

Công cụ tạo giọng nói bằng trí tuệ nhân tạo của FPT.AI có miễn phí không?

FPT.AI cung cấp tính năng dùng thử miễn phí, cho phép bạn nhập văn bản và nghe trước giọng AI tạo ra. Để sử dụng thêm các tính năng nâng cao hoặc áp dụng vào các dự án thiết kế của bạn, bạn có thể xem xét nâng cấp lên các gói dịch vụ trả phí.

Số lượng văn bản tối đa có thể chuyển đổi thành giọng nói là bao nhiêu?

FPT.AI hỗ trợ chuyển đổi tối đa 1.000 ký tự văn bản cho mỗi lần tạo giọng nói. Ngoài ra, thời gian tổng hợp giọng nói được giới hạn trong 10 phút mỗi lần tạo. Điều này đảm bảo hiệu suất tối ưu cho các ứng dụng của bạn.

Như vậy, với FPT.AI Voicemaker, bạn có thể dễ dàng chuyển đổi văn bản thành giọng nói tự nhiên và chân thực, đồng thời tùy chỉnh theo nhu cầu sử dụng một cách linh hoạt và chính xác. Việc áp dụng công nghệ chuyển văn bản thành giọng nói (Text to Speech) không chỉ giúp tiết kiệm thời gian mà còn tối ưu hóa hiệu quả giao tiếp trong các dịch vụ khách hàng tự động. Hãy tận dụng hướng dẫn sử dụng Text to Speech trên để trải nghiệm sự tiện ích mà FPT.AI Voicemaker mang lại và nâng cao chất lượng công việc của bạn.

_____________________________

? Trải nghiệm giải pháp FPT.AI Text to Speech của #FPT_AI tại: https://fpt.ai/vi/tts

? Trải nghiệm các sản phẩm khác của #FPT_AI tại: https://fpt.ai/vi

? Địa chỉ: Tầng 7, tháp FPT, số 10 Phạm Văn Bạch, quận Cầu Giấy, Tp. Hà Nội

☎ Hotline: 1900 638 399

? Email: support@fpt.ai

>>>XEM THÊM VỀ CÔNG NGHỆ KHÁC:

5/5 - (1 vote)
Bài viết liên quan

Cập nhật mọi tin tức mới nhất về công nghệ AI

Đăng ký nhận bản tin của FPT.AI để được phủ sóng mọi xu hướng công nghệ, câu chuyện thành công và phân tích của chuyên gia.