产品简介

更新时间: 2026/06/04 13:58:24

大模型 API 是网易云信打造的统一大模型代理平台。只需对接一次,即可使用文本推理、视频生成、图像处理等各类主流大模型能力,无需为每家厂商单独维护 API、密钥和对账系统。

产品概述

网易云信将打造 统一的大模型 API 代理平台,作为 PaaS 能力向客户售卖。通过标准化 API 接口封装各大模型厂商能力,提供统一的调用入口、计费管理、权限控制、监控限流等增值服务。

传统方案痛点

直接对接多家 AI 厂商时,企业面临的典型问题:

痛点 具体表现
集成成本高 每接入一家 AI 厂商,都需要单独开发一套 API、维护一把独立密钥、建一套对账系统
维护负担重 N 家厂商 = N 套代码各自维护。厂商升级接口、调整价格、变更协议,业务方都需要变更
故障排查难 问题定位需要在 N 个厂商控制台之间来回切换
安全风险分散 密钥散落在各业务代码库,泄露后影响面不可控
成本不可见 费用分散在多个厂商后台,缺乏统一视角

使用大模型 API 后的变化:

大模型业务图.png

左:业务方自营,N 套 API、N 把密钥、N 套对账;右:接入大模型 API,1 套 API、1 把密钥、1 套对账

核心价值

对业务方:

  • 降低成本:一套接口对接多家大模型,减少 70% 的集成维护工作量
  • 统一管理:密钥、用量、费用集中管控,告别多控制台切换
  • 灵活扩展:新增模型仅需后台配置,无需修改业务代码
  • 零改造接入:兼容业界标准 API 协议(OpenAI-Compatible),现有代码改一行即可接入

对平台(网易云信):

  • 标准化产品:形成可规模化复制售卖的 PaaS 能力
  • 增值服务:计费、监控、风控等功能增加收入来源
  • 技术壁垒:将上游复杂度在网关内部吸收,对外输出稳定服务

产品架构

graph TD
    Client["业务方系统<br/>✓ 一套 API  ✓ 一把 Key  ✓ 一份账单"]
    
    Gateway["大模型 API 网关<br/><br/>🔐 统一鉴权 | 💰 统一计费 | 📊 统一监控<br/>🚦 智能路由 | 🛡️ 多层安全 | 🔄 自动容灾"]
    
    TextPool["文本推理供应商池<br/>Supplier A | B | C"]
    VideoPool["视频生成供应商池<br/>Supplier D | E | F"]
    ImagePool["图像处理供应商池<br/>Supplier G | H | I"]
    
    Note["💡 自动切换最优线路,供应商异常时秒级切换"]
    
    Client ==> Gateway
    Gateway ==> TextPool
    Gateway ==> VideoPool
    Gateway ==> ImagePool
    
    TextPool --> Note
    VideoPool --> Note
    ImagePool --> Note
    
    style Client fill:#e3f2fd,stroke:#1976d2,stroke-width:2px
    style Gateway fill:#fff3e0,stroke:#f57c00,stroke-width:3px
    style TextPool fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
    style VideoPool fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
    style ImagePool fill:#e8f5e9,stroke:#388e3c,stroke-width:2px
    style Note fill:#fffde7,stroke:#fbc02d,stroke-width:2px

核心能力

凭证收敛 — 一把钥匙通全网

  • 业务方只需拿到一把 sk- 开头的密钥。
  • 网关自动完成鉴权,代为调用上游厂商。
  • 业务方的密钥永远不会暴露给上游厂商 —— 出站前自动擦除。
  • 支持密钥轮换、禁用、IP 白名单等安全管控。

计费收敛 — 一份账单清所有

  • 采用 统一大模型积分 结算,所有模型调用消耗同一种积分。
  • 按 Token 用量或按次计费,精确到每一次请求。
  • 一次结算模型:请求终态才扣费,成功才计费,账目清晰可审计。
  • 价格版本化管理:改价不溯及既往,历史账单可 100% 重现。

监控收敛 — 一个控制台看全局

  • 调用趋势、调用明细、质量监控等关键指标统一展示。
  • 指南针 中直接查看所有模型调用的消耗情况和调用质量。
  • 不再需要穿梭 N 个厂商后台拼凑数据。

智能路由 — 自动选最优线路

  • 同一个模型可能有多个供应商提供,平台自动选择当前最优线路。
  • 上游出现波动时自动切换到备用渠道,业务方无感知。
  • 支持为客户配置专属线路策略。

跨协议桥接 — 一套 API 调所有模型

  • 使用统一的 API 协议即可调用不同厂商的模型。
  • 网关自动完成协议翻译,包括工具调用 ID、流式事件重组、推理字段映射。
  • 业务方只需换一个 model 参数,无需换 API。

多供应商、多渠道、高可用

  • 持续接入:平台保持稳健的供应商接入节奏,不断丰富模型供给。
  • 多渠道冗余:同一类模型能力配置多条渠道,避免单点依赖。
  • 自动故障转移:某条线路异常时自动切换到备用渠道,业务方零感知。
  • 跨厂商替补:同类模型能力在不同厂商间灵活调度,保障服务连续性。

多层安全防御

防御层 功能 防什么
第 1 层 格式预校验 无效请求直接拦截,不进业务链路
第 2 层 智能缓存 合法凭证快速放行,伪造凭证不穿透后端
第 3 层 失败锁定 连续异常自动熔断,阻断暴力攻击
第 4 层 并发保护 高并发时合并回源查询,避免后端过载
第 5 层 智能降级 缓存故障时自动切换备用鉴权路径,不影响服务可用

客户控制台与指南针

  • 指南针:客户查看调用趋势、调用明细、质量监控、操作日志等,全面掌握模型使用情况。
  • 控制台:管理 API 密钥关联、查看积分余额、查看费用明细,使用客户自有账号登录。
  • 所有操作有据可查,满足企业审计需求。

模型能力

能力类别 说明
文本推理 支持多家主流文本推理厂商,覆盖通用对话、代码生成、长文本理解等场景
视频生成 支持主流视频生成能力,覆盖文生视频、图生视频等场景
图像处理 支持图像生成、编辑、理解等多模态能力
持续扩展 按需接入更多能力类别和供应商,平台架构已就绪
  • 平台目前支持 35+ 逻辑模型,覆盖多个模型家族。新增同族供应商只需补充适配器即可快速上线。
  • 逻辑模型指平台对上游厂商模型的标准化封装,一个逻辑模型可对应多个供应商渠道。

产品对比

与市场其他方案对比:

维度 市场常见方案 大模型 API
技术底座 多基于开源项目二次包装 自主研发:自有鉴权/计费/路由全链路
安全深度 单层 API Key 校验 多层纵深防御:格式校验 → 智能缓存 → 失败锁定 → 并发保护 → 智能降级
可定制性 受限于上游开源项目能力边界 自主可控:可定制、可审计,需求快速响应
计费精度 多级预扣/估算模型 一次结算:请求终态才扣费,账目精准可审计
管理体验 无或极简 指南针 + 控制台:用量/费用/密钥一站式管理
异步任务 仅支持同步推理 同步 + 异步全覆盖:视频生成等长时任务完整编排
稳定性保障 依赖开源社区 多渠道冗余 + 自动故障转移 + 网易云信团队支撑
合规背书 个人/小团队 网易云信上市公司品牌背书

与直连厂商方案对比:

对比维度 直连单家厂商 使用大模型 API
接入工作量 每家 1-2 周 一次接入,永久复用
密钥管理 分散在各系统 一处管控
费用对账 多个后台拼凑 统一对账单
模型切换 改代码 + 发版 后台配置即可
故障切换 依赖客户端重试 平台自动切换
供应商冗余 需自行搭建 多渠道内置保障
审计追溯 无统一视图 集中管控,有据可查

适用场景

  • 企业内部 AI 应用开发团队:需要对接多家大模型,希望降低集成维护成本。
  • SaaS / 平台型企业:为下游客户提供 AI 能力,需要统一计费和权限管控。
  • AI 应用(如智能客服、内容生成、代码助手):需要在多家模型间灵活切换,追求成本最优。
  • 对安全合规有要求的企业:需要集中管控 AI 调用凭证,防止密钥泄露。
  • 关注业务连续性的团队:需要多供应商冗余,保障 AI 服务高可用。

使用流程

  1. 开通大模型 API 账号 → 获得一把 sk- 密钥。
  2. 按标准 API 协议调用(改一行 base_url)。
  3. 在指南针/控制台查看用量、费用、配额。
  4. 如需新增模型 → 联系平台配置,无需改业务代码。

新供应商快速接入

  • 同一协议族的供应商只需补充适配器,核心框架零改动,可快速上线。
  • 文本推理、视频生成、图像处理等能力类别按需接入。
  • 业务方提出新模型/新协议/新能力需求,平台团队直接评估并落地。对外提供的是"确定性交付",不阻塞业务推进。

常见问题

Q: 接入大模型 API 会增加延迟吗?

A: 平台经过精心设计,鉴权路径延迟在毫秒级,对模型推理(秒级/分钟级)几乎无影响。

Q: 现有代码需要改吗?

A: 基本不需要。只需将 base_url 指向大模型 API 地址,平台兼容业界标准 API 协议,其他代码保持不变。

Q: 数据安全有保障吗?

A: 业务方密钥在平台内安全存储,多级权限管控。出站请求前自动擦除所有业务方凭证,确保密钥不会泄露给上游厂商。

Q: 如果某个供应商出故障怎么办?

A: 平台内置多渠道冗余和自动故障转移机制。配置了多条渠道的同类型能力,在某条线路异常时自动切换到备用渠道,业务方零感知、零等待。

Q: 未来还能接入更多模型吗?

A: 平台架构已为持续扩展做好准备。新增同一家族的供应商只需补充适配器,核心框架不动;新增能力类别也有标准化的接入流程。供应商和渠道会持续丰富。

相关文档

此文档是否对你有帮助?
有帮助
去反馈
  • 产品概述
  • 传统方案痛点
  • 核心价值
  • 产品架构
  • 核心能力
  • 模型能力
  • 产品对比
  • 适用场景
  • 使用流程
  • 新供应商快速接入
  • 常见问题
  • 相关文档