克隆音色

更新时间: 2025/09/17 09:49:21

通过上传音频文件创建个性化音色,实现文本转语音服务中的定制化语音效果。

  • 克隆时自动选择一个可用的音色 ID 进行克隆。
  • 无可用音色 ID 时需先购买音色 ID,否则音色克隆返回失败。
  • 支持的音频格式:mp3、m4a、wav。
  • 音频文件大小限制:10M 以内。

功能描述

  • 支持多种音频格式的声音文件上传。
  • 自动分配可用音色 ID。
  • 提供音色描述功能,方便管理和识别。
  • 生成试听音色链接,便于效果验证。
  • 支持自定义文本校验音色质量。

请求信息

请求 URI

POST https://rtc-ai.yunxinapi.com/v1/api/tts/voice-clone

请求头参数

请求 Header 的参数说明请参考 请求结构

请求体参数

参数名称 类型 是否必选 示例 说明
file File 需要上传的声音文件,目前支持 mp3、m4a、wav 格式,大小在 10M 以内
desc String 睿智的导游音色 音色描述,一般用作音色 ID 的别名,方便记忆
textValidation String 这段时间天气真不错。你今天过得怎么样呢?咱们晚上可以一起去散散步,听听音乐,吹吹风,一起聊聊今天发生的新鲜事。 音频复刻校验音色的参数,未填时使用示例里的文本做校验

请求体示例

JSON{
  "file": "binary_audio_data",
  "desc": "睿智的导游音色",
  "textValidation": "这段时间天气真不错。你今天过得怎么样呢?咱们晚上可以一起去散散步,听听音乐,吹吹风,一起聊聊今天发生的新鲜事。"
}

响应信息

响应参数

参数名称 类型 说明 是否必返回
code Number 状态码,200 表示成功。出错时,错误信息在 errMsg 中
voiceId String 分配的音色 ID
demoAudio String 试听音色链接
errMsg String 错误信息,仅在出错时返回

响应体示例

JSON{
  "code": 200,
  "voiceId": "GZ_6FXfkjpzhnZI1",
  "demoAudio": "https://yunxin-vc.nos-jd.163yun.com/146298631/GZ_FXfkjpzhn.mp3"
}
此文档是否对你有帮助?
有帮助
去反馈
  • 功能描述
  • 请求信息
  • 请求 URI
  • 请求头参数
  • 请求体参数
  • 请求体示例
  • 响应信息
  • 响应参数
  • 响应体示例