克隆音色 - 音视频通话 2.0

更新时间： 2025/09/17 09:49:21

通过上传音频文件创建个性化音色，实现文本转语音服务中的定制化语音效果。

功能描述

POST https://rtc-ai.yunxinapi.com/v1/api/tts/voice-clone

请求 Header 的参数说明请参考请求结构。

参数名称	类型	是否必选	示例	说明
file	File	是		需要上传的声音文件，目前支持 mp3、m4a、wav 格式，大小在 10M 以内
desc	String	是	睿智的导游音色	音色描述，一般用作音色 ID 的别名，方便记忆
textValidation	String	否	这段时间天气真不错。你今天过得怎么样呢？咱们晚上可以一起去散散步，听听音乐，吹吹风，一起聊聊今天发生的新鲜事。	音频复刻校验音色的参数，未填时使用示例里的文本做校验

JSON{
  "file": "binary_audio_data",
  "desc": "睿智的导游音色",
  "textValidation": "这段时间天气真不错。你今天过得怎么样呢？咱们晚上可以一起去散散步，听听音乐，吹吹风，一起聊聊今天发生的新鲜事。"
}

参数名称	类型	说明	是否必返回
code	Number	状态码，200 表示成功。出错时，错误信息在 errMsg 中	是
voiceId	String	分配的音色 ID	是
demoAudio	String	试听音色链接	是
errMsg	String	错误信息，仅在出错时返回	否

JSON{
  "code": 200,
  "voiceId": "GZ_6FXfkjpzhnZI1",
  "demoAudio": "https://yunxin-vc.nos-jd.163yun.com/146298631/GZ_FXfkjpzhn.mp3"
}

此文档是否对你有帮助？

有帮助

去反馈