离线转写

更新时间: 2026/05/28 10:58:07

调用该接口开启离线转写服务。该接口支持通过 AI 技术实现声纹识别(区分发言人)、字幕生成以及智能内容摘要。

请求信息

请求 URL

  • 请求方法:POST
  • URL:https://rtc.yunxinapi.com/v2/api/task/create

请求头参数

请求头部的参数说明请参考 请求结构

请求体参数

参数名称
类型
是否必选 取值示例 说明
requestId String f8f274c1-0e9f-***-c61c06a19475 随机字符串,用于问题排查。
taskType Number 102 服务器任务类型。如果是文件声纹字幕,取值固定为 102。
taskId String task_id 自定义的任务 ID。请保证此 ID 唯一,为字母数字下划线组成的 64 位以内的字符串。
- data Object - 离线转写的具体信息。
streamUrl String https://xxx.com/record_rtmp/output.mp3 点播录制文件地址。支持如下协议和格式:
协议:HTTP、HTTPS
格式:FLV、MP4、MPEG-TS、Matroska (MKV)、MP3、wav、AAC 等。
summary Bool true 是否需要生成摘要,默认 true。
summarizeFormat String - 自定义摘要格式。

请求体示例

JSON{
    "taskType": 102,
    "taskId": "task_id",
    "requestId": "f8f274c1-0e9f-4583-a243-c61c06a19475",
    "data": {
        "streamUrl": "https://yunxin-sre.nos-jd.163yun.com/record_rtmp/output.mp3",
        "summary": true,   // 是否需要摘要。 默认缺省true
        "summarizeFormat": "请根据会议记录,按参会人分别总结。【输出格式】姓名:- 核心立场:[一句话概括]- 主要情绪:[开心/平和/焦虑/激进/愤怒等]- 核心期望:[一句话概括] 要求:每人总结控制在100字以内,简明扼要。"
    }
}

响应信息

响应参数

参数名称
类型 示例 说明
code Number 200 状态码,200 表示成功,具体请参考下文状态码。
request_id String f8f274c1-0e9f-***-c61c06a19475 请求的唯一标识。
- result Object - 调用结果。
taskId String 2a784467***f6fa56333 任务唯一标识符,房间内唯一。

响应体示例

JSON{
    "code": 200,
    "requestId": "2025",
    "result": {
        "taskId": "task_id"
    }
}

状态码

  • 成功返回 code:返回内容中,code200 表示调用正常。
  • 异常返回 code:若 code 为其他值,请根据 codeerrMsg错误码和状态码 查看问题原因。

相关抄送

离线转写返回的抄送,示例如下所示,具体字段说明请参考 媒体处理事件抄送(eventType = 602

{
    "data": {
        "streamUrl": "https://xxx.net/jxxx/test.mp4",
        "summary": "**发言人员**  \n- [讲话人1]、[讲话人2]  \n\n**会议摘要:**  \n会议开始时,[讲话人1]与[讲话人2]互相问候。[讲话人2]提出因过敏性鼻炎需要开具左西替利嗪,并确认此前一直在使用该药物。[讲话人1]询问是否对青霉素过敏,[讲话人2]予以肯定答复。[讲话人1]随后表示若无其他问题可结束会议,并提醒[讲话人2]如有问题需及时复诊。会议在简短对话后结束。  \n\n**发言人重点:**  \n- [讲话人2]:因过敏性鼻炎需继续使用左西替利嗪,并确认对青霉素过敏。  \n- [讲话人1]:核实用药史及过敏情况,建议必要时复诊。  \n\n**会后待办:**  \n- 无明确待办事项(会议未提及具体行动项)。",
        "taskType": 102,
        "file": "http://rtc-subtitles-storage.xxxx.net/xxxx/proxy-1462067-102-debug-1747970417128.txt",
        "subEventType": 201,
        "text": "00:00:02.200 - 00:00:02.880 讲话人1:你好。\n00:00:03.880 - 00:00:09.880 讲话人2:你好,那个我的过敏性鼻炎需要开一些那个左西替利嗪。\n00:00:10.400 - 00:00:12.080 讲话人1:好的,用过这个药的啊。\n00:00:12.940 - 00:00:14.100 讲话人2:啊,对,一一直在用。\n00:00:14.900 - 00:00:17.060 讲话人1:啊,青霉素过敏。\n00:00:18.100 - 00:00:19.540 讲话人2:对,就就青霉素过敏。\n00:00:19.780 - 00:00:20.220 讲话人1:其他没什么问题。\n00:00:20.220 - 00:00:23.600 讲话人1:有问题的话及时到医院复诊,给您看好了再见。嗯。\n",
        "taskId": "debug",
        "timestamp": 1747970417128
    },
    "eventType": 602
}
此文档是否对你有帮助?
有帮助
去反馈
  • 请求信息
  • 请求 URL
  • 请求头参数
  • 请求体参数
  • 请求体示例
  • 响应信息
  • 响应参数
  • 响应体示例
  • 状态码
  • 相关抄送