跳到主要内容

语音文件同步接口

1. 接口介绍

该接口对语音内容进行检测识别,并同步返回识别结果,适用于时长小于 60 秒的短音频。

提示
  • 接口并发限制:默认每秒请求数不超过 50 次;
  • 语音文件大小限制:默认不超过 1M,请联系我们调整并发及文件限制;
  • 支持的编码格式:AACAC-3ADPCMAMRDSDMP1MP2MP3PCM
  • 支持的容器格式:flvmkvmp5rmvbaviwavwmv3gptsmov

2. 请求

2.1 请求地址

区域请求地址
国内https://api.speech.tuputech.com/v3.1/recognition/speech/<secretId>
国外https://api-oversea.speech.tuputech.com/v3.1/recognition/speech/<secretId>
提示

<secretId> 需替换为您的应用 SID,请联系客户经理为您开通及配置。关于 SID 详见 常见问题(FAQ)

2.2 请求方法

POST

2.3 请求头

Content-Type: multipart/form-data 或 application/json

2.4 超时时间及异常处理

建议配置超时时间 60 秒,在 HTTP 响应状态码非 200 或业务状态码不为 0 时进行重试。

危险

由于模型基于请求流量动态伸缩,在空闲一定时间后会关闭(部分专用模型空闲一定时间后会关闭全部实例)。 由于模型冷启动耗时较长,部分请求可能无法处理,最终返回非 200 HTTP 状态码或业务状态码 101。该现象可能在以下情况下出现:

  • 初次请求
  • 长时间未调用后再次请求
  • 请求流量突增
  • 请求存在规律性的流量波动(例如每隔超过 5 分钟请求一批数据,或仅在工作日期间有大量请求)

针对以上情况,我们分别建议您:

  • 间隔 2~3 分钟后重试
  • 间隔 2~3 分钟后重试,并且后续保持至少每分钟 1 次调用
  • 提前进行预热,或及时联系我们扩容
  • 调整业务请求时间间隔到 5 分钟内,或联系我们调整实例保持策略。若您的业务仅在工作日期间有大量请求,节假日期间较少,请务必联系我们

2.5 请求参数说明

参数名称类型是否必填说明
speechString 或 File语音文件内容或文件链接。

1. 提交语音文件时,指定 ContentType: multipart/form-data
2. 提交语音链接时,指定 ContentType: application/json
3. 支持的编码格式:AACAC-3ADPCMAMRDSDMP1MP2MP3PCM
4. 支持的容器格式:flvmkvmp5rmvbaviwavwmv3gptsmov
5. 出于安全考虑,语音链接端口除 80, 443 端口外,应在 1025-65535 范围内
languageString语言代码,在进行多语种语音转译或审核时必填。多语种语音转译类产品请联系客户经理进行配置使用。对应语言代码详见:语音转译审核(多语种)语言代码列表
timestampNumber当前服务器的 Unix 时间戳
nonceNumber随机数
signatureString

RSA-SHA256 算法签名。签名步骤:

  1. 将参与签名的参数(secretIdtimestampnonce)用英文半角逗号 , 拼接,得到 SignString
  2. 使用您的私钥以 RSA-SHA256 算法对 SignString 签名,然后进行 Base64 编码,得到 signature 字符串。
  • 点击 数字证书 下载私钥。私钥有 rsapkcs8 两种格式,通常 Golang,Python 使用 rsa 格式私钥,Java 使用 pkcs8 格式私钥
  • 点击 签名及验证示例 查看签名示例

2.6 请求示例

{
"speech": "<url>",
"task": "<taskId>",
"timestamp": 1685000000,
"nonce": 1685000000,
"signature": "<signature>"
}

3. 同步响应

3.1 响应参数说明

参数名称类型说明
signatureString

同步响应或回调请求签名,由图普使用私钥签名,在需要时,您可以通过 图普公钥 进行验签以确保此响应内容来自图普(与您调用接口时使用的公私钥不同)。验签步骤:

  1. json 字段内容为 SignString
  2. signature 字段内容进行 Base64 解码,得到 RawSignature
  3. 使用图普公钥以 SHA256 算法验证 RawSignatureSignString
jsonString

同步响应或回调请求经过 JSON 转义后的字符串,需进一步解析得到业务数据。

  • 字段内容示例:{\"code\":0,\"message\":\"success\"}
  • 字段详见下述 json 参数说明;
  • 为方便展示,同步响应及回调请求的示例中,均为解析后的 JSON

json 参数说明

参数名称类型是否必有说明
codeNumber状态码,详见 业务状态码
messageString状态信息
suggestionInt建议的操作,详见汇总结果解析中的 Suggestion 处理建议说明
riskTypeInt风险类型,详见汇总结果解析中的 RiskType 风险类型说明
<任务 ID>Object识别任务结果,不同任务数据结构不同,详见 3.3 各识别任务回调参数
nonceNumber随机数
timestampNumber当前服务器的 Unix 时间戳

3.2 响应示例

{
"code": 0,
"message": "success",
"nonce": 1685000000,
"timestamp": 1685000000,
"suggestion": 1,
"riskType": 4,
"5ca1bd6b3872ecc9afb99132": {
"segments": [
{
"tag": "38bde37a271a4d28a0ee7df58e48022a-0",
"content": "今天是二零一零年一月十九号星期二欢迎收看东方新闻我是小蕾我是名我们在上海的直播向各位问号今天中国二零一年上海世博会开幕还有一百零二天在快速浏览了今天的主要新闻之后我们来看详细报道",
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-12-25/15-7/38bde37a271a4d28a0ee7df58e48022a/1703487976.7751210988855430687.wav",
"startTime": 0,
"endTime": 30
}
],
"text": "今天是二零一零年一月十九号星期二欢迎收看东方新闻我是小蕾我是名我们在上海的直播向各位问号今天中国二零一年上海世博会开幕还有一百零二天在快速浏览了今天的主要新闻之后我们来看详细报道"
}
}

3.3 具体任务返回结果