python 使用文本转语音
文字转语音 (TTS) API 指南
概述
speech
端点,基于 TTS 模型实现以下功能:重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音
基础使用
基本示例
功能特性
音频质量选项
可用声音
支持的输出格式
格式 | 特点 | 适用场景 |
---|---|---|
MP3 | 默认格式 | 通用场景 |
Opus | 低延迟 | 网络流媒体和通信 |
AAC | 高效压缩 | 移动设备播放 |
FLAC | 无损压缩 | 音频存档 |
WAV | 无压缩 | 低延迟应用 |
PCM | 原始采样 | 24kHz, 16位有符号 |
实时音频流
支持语言
注意:当前声音主要针对英语优化
常见问题
Q: 如何控制生成音频的情感?
Q: 能创建自定义声音吗?
Q: 生成的音频归属权?
修改于 2024-12-03 11:28:05