跳到主要内容

语音流异步接口

1. 接口介绍

客户通过语音流异步识别接口提交识别任务,图普拉取语音流进行切片,对语音片段进行识别检测,每隔一段时间通过回调通知客户识别结果。业务流程如下:

提示
  1. 图普采用 任务并发数 对异步接口进行并发控制,即任一时刻最多允许 N 个任务同时处理。在测试期间, 任务并发数为 30(允许同时处理 30 个任务),正式使用或需要增加时请联系客户经理调整。当超出任务并发数后继续提交任务时,根据接口类型略有不同:

    • 异步文件接口:可以正常提交任务,提交的任务排队等待处理;
    • 异步流接口:提交任务时返回超出并发状态码(由于流的实时性要求,无法排队等待处理,因此无法继续提交)。
  2. 异步文件接口中,视频/语音文件建议小于 10GB,而文档文件须小于 500MB;异步流接口对流的时长没有限制,建议客户在流关闭时主动调用任务关闭接口。

2. 请求

2.1 请求地址

区域请求地址
国内https://api.speech.tuputech.com/v3.1/recognition/speech/stream/<secretId>
提示

<secretId> 需替换为您的应用 SID,请联系客户经理为您开通及配置。关于 SID 详见 常见问题(FAQ)

2.2 请求方法

POST

2.3 请求头

Content-Type: application/json

2.4 超时时间及异常处理

建议配置超时时间 1 秒,在 HTTP 响应状态码非 200 或业务状态码不为 0 时进行重试。

2.5 请求参数说明 🔥

参数名称类型是否必填说明
streamSpeechStream语音流信息,详见 SpeechStream 参数说明
tasksArray<String>指定的任务 ID。通常单个应用(接口)下会配置多个识别任务,可根据业务需要指定其中的部分任务进行识别
customInfoObject<String, Any>自定义信息,用于给请求附加额外信息或扩展参数(比如:关联的信息)。

目前支持的扩展参数:
- zego:该参数有效时,拉取即构语音流进行审核,详见 即构语音流异步接口
timestampNumber当前服务器的 Unix 时间戳
nonceNumber随机数
signatureString

RSA-SHA256 算法签名。签名步骤:

  1. 将参与签名的参数(secretIdtimestampnonce)用英文半角逗号 , 拼接,得到 SignString
  2. 使用您的私钥以 RSA-SHA256 算法对 SignString 签名,然后进行 Base64 编码,得到 signature 字符串。
  • 点击 数字证书 下载私钥。私钥有 rsapkcs8 两种格式,通常 Golang,Python 使用 rsa 格式私钥,Java 使用 pkcs8 格式私钥
  • 点击 签名及验证示例 查看签名示例

SpeechStream 参数说明

参数名称类型是否必填说明
urlString语音流地址,需避免重复提交同一个语音流地址。

1. 支持的协议:RTMPHLSHTTP-FLVRTSP
2. 支持的编码格式:AACAC-3ADPCMAMRDSDMP1MP2MP3PCM
3. 支持的容器格式:flvmkvmp5rmvbaviwmvwav3gptsmov
4. 识别即构语音流时,建议传入 zego:<roomId>,以保证同时只有一个房间在审核
callbackString识别结果回调接口地址,用于接收 POST 回调
returnPreSpeechBoolean是否返回语音前一片段(时长为 10 秒)的语音链接;值为 false 时,只返回本片段语音链接。默认为 false
callbackRuleString回调规则,主要影响审核场景的识别任务,如语音转译审核、低俗语音识别,默认为 violation

violation:仅回调违规片段的识别结果;
all:回调所有片段的识别结果

2.6 请求示例

{
"stream": {
"url": "<url>",
"callback": "<callback>",
"returnPreSpeech": false,
"callbackRule": "all"
},
"tasks": [
"<taskId>"
],
"customInfo": {
"roomId": "<roomId>"
},
"timestamp": 1685000000,
"nonce": 1685000000,
"signature": "<signature>"
}

3. 同步响应

3.1 响应参数说明 🔥🔥

参数名称类型说明
signatureString

同步响应或回调请求签名,由图普使用私钥签名,在需要时,您可以通过 图普公钥 进行验签以确保此响应内容来自图普(与您调用接口时使用的公私钥不同)。验签步骤:

  1. json 字段内容为 SignString
  2. signature 字段内容进行 Base64 解码,得到 RawSignature
  3. 使用图普公钥以 SHA256 算法验证 RawSignatureSignString
jsonString

同步响应或回调请求经过 JSON 转义后的字符串,需进一步解析得到业务数据。

  • 字段内容示例:{\"code\":0, \"message\":\"success\"}
  • 字段详见下述 JSON 参数说明
  • 为方便展示,同步响应及回调请求的示例中,均为解析后的 JSON

JSON 参数说明

参数名称类型是否必有说明
codeNumber状态码,详见 业务状态码
messageString状态信息
resultResult任务提交结果,详见 Result 参数说明
nonceNumber随机数
timestampNumber当前服务器的 Unix 时间戳

Result 参数说明

参数名称类型是否必有说明
requestIdString任务唯一 ID,回调中携带该任务 ID。字符串长度 24~128
urlString提交的语音流地址
callbackString提交的识别结果回调接口地址

3.2 响应示例

{
"result": {
"requestId": "<requestId>",
"url": "<url>",
"callback": "<callback>"
},
"code": 0,
"message": "success",
"nonce": 1685000000,
"timestamp": 1685000000
}

4. 回调请求

4.1 请求地址

callback 参数指定的地址。

4.2 请求方法

POST

4.3 请求头

Content-Type: application/json

4.4 超时时间及异常处理

回调超时时间 5 秒,在 HTTP 响应状态码非 200 时进行重试,最多重试 3 次。

建议客户在处理回调时进行异步处理,响应回调时可以返回字符串或 JSON,示例如下:

// JSON
{
"message": "ok"
}

// 字符串
success

4.5 请求参数说明 🔥🔥🔥

参数名称类型说明
signatureString

同步响应或回调请求签名,由图普使用私钥签名,在需要时,您可以通过 图普公钥 进行验签以确保此响应内容来自图普(与您调用接口时使用的公私钥不同)。验签步骤:

  1. json 字段内容为 SignString
  2. signature 字段内容进行 Base64 解码,得到 RawSignature
  3. 使用图普公钥以 SHA256 算法验证 RawSignatureSignString
jsonString

同步响应或回调请求经过 JSON 转义后的字符串,需进一步解析得到业务数据。

  • 字段内容示例:{\"code\":0, \"message\":\"success\"}
  • 字段详见下述 JSON 参数说明
  • 为方便展示,同步响应及回调请求的示例中,均为解析后的 JSON

JSON 参数说明

参数名称类型是否必有说明
codeNumber状态码,详见 业务状态码
requestIdString任务唯一 ID
suggestionInt建议的操作,详见汇总结果解析中的 Suggestion 处理建议说明
riskTypeInt风险类型,详见汇总结果解析中的 RiskType 风险类型说明
<任务 ID>Object识别任务的结果,每个识别任务会有 全局固定不变taskId 和对应数据结构,详见下述链接:

1. 图片类任务结果
2. 文本类任务结果
3. 语音类任务结果
customInfoObject提交的自定义信息,请求参数中的 customInfo
nonceNumber随机数
timestampNumber当前服务器的 Unix 时间戳

4.6 请求示例

{
"code": 0,
"message": "success",
"requestId": "<requestId>",
"suggestion": 0,
"riskType": 0,
"5c8213b9bc807806aab0a574": {
"segments": [
{
"label": 0,
"review": false,
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-05-31/15-7/ec3249c2c68c475da82acfa0e01da544/1685518035.6439307480301700542.wav",
"startTime": 1685000000,
"endTime": 1685000010
}
]
},
"5ca1bd6b3872ecc9afb99132": {
"segments": [
{
"content": "今天是二零一零年一月十九号星期二欢迎收看东方新闻我是小蕾我是袁名我们在上海的直播向各位问好",
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-05-31/15-7/ec3249c2c68c475da82acfa0e01da544/1685518035.6439307480301700542.wav",
"startTime": 1685000000,
"endTime": 1685000010
}
],
"text": "今天是二零一零年一月十九号星期二欢迎收看东方新闻我是小蕾我是袁名我们在上海的直播向各位问好"
},
"5caee6b2a76925c55a09a6d2": {
"segments": [
{
"label": "Politics",
"rate": 0.9607035630154159,
"review": false,
"action": "block",
"content": "昨天下午举行传达学习,贯彻胡锦涛总书记,在上海考察时的重要讲话精神,中共中央政治局委员上海市委书记俞正声强调",
"hasVoice": true,
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-05-31/15-7/ec3249c2c68c475da82acfa0e01da544/1685518035.7890524239124616494.wav",
"startTime": 1685000000,
"endTime": 1685000010,
"details": [
{
"keyword": "胡锦涛",
"hint": "胡锦涛",
"mainLabel": "Politics",
"subLabel": "Political_Negative_events"
}
]
}
],
"label": "Politics",
"review": false,
"rate": 0.9608212453978402,
"action": "block",
"text": "今天是二零一零年一月十九号星期二欢迎收看东方新闻我是小蕾我是袁名我们在上海的直播向各位问好。昨天下午举行传达学习,贯彻胡锦涛总书记,在上海考察时的重要讲话精神,中共中央政治局委员上海市委书记俞正声强调"
},
"5f59e4b71b29fa890e5472fb": {
"segments": [
{
"label": 1,
"review": false,
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-05-31/15-7/ec3249c2c68c475da82acfa0e01da544/1685518035.6439307480301700542.wav",
"startTime": 1685000000,
"endTime": 1685000010,
"details": [
{
"label": 1,
"rate": 0.9999990463256836,
"startTime": 2.8,
"endTime": 10
}
]
}
]
},
"customInfo": {
"roomId": "<roomId>"
},
"nonce": 1685000000,
"timestamp": 1685000000
}

5. 语音流结束回调

当客户关闭任务、流结束或异常时,图普会向客户发送语音流结束回调,可以通过标志 status=end 判断该回调是否表示语音流结束。 若业务状态码 code 不为 0,说明视频流异常结束,可以根据业务状态码判断异常类型。可能的异常包括:

  • 流结束:推流端停止推流,或一段时间内无法获取新的流数据
  • 流状态异常:流地址错误、协议错误、流数据异常或流服务器错误;流中无视频或语音数据流;拉流过程中,流提前结束
  • 拉流异常:连接超时,或拉流超时;无法拉流,流服务器拒绝连接
说明

v3.1 接口始终在语音流结束时回调;v3 接口仅在 callbackRules 设置了状态结束回调时才会回调。

5.1 请求参数说明🔥🔥🔥

参数名称类型是否必有说明
signatureString

同步响应或回调请求签名,由图普使用私钥签名,在需要时,您可以通过 图普公钥 进行验签以确保此响应内容来自图普(与您调用接口时使用的公私钥不同)。验签步骤:

  1. json 字段内容为 SignString
  2. signature 字段内容进行 Base64 解码,得到 RawSignature
  3. 使用图普公钥以 SHA256 算法验证 RawSignatureSignString
jsonString

同步响应或回调请求经过 JSON 转义后的字符串,需进一步解析得到业务数据。

  • 字段内容示例:{\"code\":0, \"message\":\"success\"}
  • 字段详见下述 JSON 参数说明
  • 为方便展示,同步响应及回调请求的示例中,均为解析后的 JSON

JSON 参数说明

参数名称类型是否必有说明
codeInt状态码,详见 业务状态码 。可能的返回值包括:

0:任务正常处理完成
51000:流结束
51001~51003:流状态异常
51004~51006:拉流异常
requestIdString任务 ID
statusString流结束标志,目前始终取 end
nonceNumber随机数
timestampNumber当前服务器的 Unix 时间戳

5.2 语音流结束状态回调示例

{
"code": 0,
"requestId": "<requestId>",
"status": "end",
"nonce": 1685000000,
"timestamp": 1685000000
}

6. 更新日志

日期说明
2024-08-09调整并优化流结束回调说明