Cloud Polly cho phép bạn biến bất kỳ văn bản nào thành giọng nói thực tế, cho phép bạn tạo nhiều nội dung đa phương tiện như sách nói, podcast, nội dung thoại, cũng như các ứng dụng nói, cũng như tạo các danh mục sản phẩm hỗ trợ giọng nói hoàn toàn mới. Dịch vụ Chuyển văn bản thành giọng nói (TTS) của Cloud Polly sử dụng công nghệ học sâu tiên tiến từ các nhà cung cấp dịch vụ đám mây hàng đầu như Amazon Web Services, Microsoft Azure, Google Cloud Platform và IBM Cloud để tổng hợp giọng nói tự nhiên của con người. Với hơn 630 giọng nói thực tế khác nhau bằng hơn 70 ngôn ngữ, bạn có thể tạo các ứng dụng hỗ trợ giọng nói hoạt động ở các quốc gia khác nhau.
Ngoài giọng nói TTS tiêu chuẩn, Cloud Polly cung cấp giọng nói chuyển văn bản thành giọng nói (NTTS) thần kinh, giúp cải thiện chất lượng giọng nói thông qua phương pháp học máy mới. Phần lớn công nghệ Neural TTS Cloud Polly cũng hỗ trợ các kiểu nói độc đáo dành riêng cho nhà cung cấp dịch vụ đám mây cho phép bạn điều chỉnh tốt ĐỀ MÔ TẠI ĐÂYhơn phong cách nói của người nói với ứng dụng: Ví dụ: Phong cách đọc của một phát thanh viên được điều chỉnh cho phù hợp với các trường hợp sử dụng kể chuyện tin tức và kiểu nói Hội thoại lý tưởng thích hợp cho giao tiếp hai chiều, chẳng hạn như các ứng dụng điện thoại.
Tận hưởng tiện lợi khi sử dụng các thẻ SSML để thêm nhiều hiệu ứng giọng nói như điều chỉnh cao độ, âm lượng, tốc độ, nhấn mạnh, tiếng bíp cho các từ hoặc cụm từ, v.v. Bạn có thể tìm thấy danh sách đầy đủ trong bản trình diễn bằng cách chọn các giọng thích hợp.
- Hỗ trợ hơn 80 ngôn ngữ và phương ngữ
- Hỗ trợ hơn 630 giọng nói và trọng âm khác nhau
- Hỗ trợ cho tất cả Dịch vụ chuyển văn bản thành giọng nói của Amazon
- Hỗ trợ cho tất cả Dịch vụ chuyển văn bản thành giọng nói của Microsoft Azure
- Hỗ trợ cho tất cả Dịch vụ chuyển văn bản thành giọng nói của Google
- Hỗ trợ cho tất cả Dịch vụ chuyển văn bản thành giọng nói của IBM
- Giọng nói tự nhiên (Neural TTS)
- Google WaveNet Voices
- Sự kết hợp khác nhau của các hiệu ứng giọng nói cho giọng nói chuẩn
- Sự kết hợp khác nhau của các hiệu ứng giọng nói cho giọng nói thần kinh
- Hỗ trợ các định dạng đầu ra âm thanh MP3, OGG & WAV
- Lưu trữ và phân phối lại bài phát biểu
- Tổng hợp văn bản gần thời gian thực
- Tùy chỉnh và kiểm soát đầu ra giọng nói
- Tối ưu hóa âm thanh phát trực tuyến của bạn
- Điều chỉnh kiểu nói (Đối với giọng nói thần kinh)
- Điều chỉnh Tốc độ giọng nói, Cao độ và Độ ồn
- Điều chỉnh Nhấn mạnh Nói
- Phát âm các chữ số / ngày tháng / từ / viết tắt đúng cách
- Thêm hiệu ứng thay thế công việc / cụm từ
- Tắt tiếng / Tiếng bíp Phát ra bất kỳ phần nào của văn bản / câu
- Tổng hợp văn bản lớn trực tiếp vào Nhóm Amazon S3 của bạn
- Lưu trữ kết quả trong Máy chủ cục bộ / Amazon S3 / Wasabi S3
- Thuận tiện Chia sẻ kết quả tổng hợp hoặc Tải xuống
- Hệ thống liên kết / giới thiệu đầy đủ
- Giao diện hoàn toàn đáp ứng
- Dễ dàng tạo gói đăng ký hàng tháng
- Dễ dàng tạo các gói trả trước khác nhau
- Tạo mã quảng cáo cho các gói trả trước
- Cổng thanh toán PayPal & Stripe
- Cổng thanh toán ngoại tuyến
- Giám sát chặt chẽ thu nhập
- Giám sát chặt chẽ Chi tiêu ước tính cho Dịch vụ TTS đám mây
- Nền tảng SaaS
- Được phát triển với PHP 7.4.x và Laravel 8.4.x
- Tài liệu chi tiết và toàn diện