跳到主要内容

语音性别识别

1. 任务简介

1.1 任务 ID

5f59e4b71b29fa890e5472fb

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

支持对发声人物的性别进行识别分辨。

2. 请求参数

语音文件异步接口公共请求参数详见:语音文件异步识别

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

语音文件异步接口公共返回结果详见:语音文件异步识别

3.2 任务回调请求参数

任务结果

参数名称类型是否必有说明
segmentsArray<Segment>语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构

1. 该字段始终存在;
2. 该任务非审核场景,因此与回调规则无关(详见 请求参数说明

Segment 数据结构

参数名称类型是否必有说明
labelInt识别分类,详见 任务返回标签说明
reviewBool是否需要复审,true:是, false:否
startTimeFloat语音片段在语音文件内的开始时间(取值范围为 [0, 语音时长],单位秒)
endTimeFloat语音片段在语音文件内的结束时间(取值范围为 [0, 语音时长],单位秒)
speechUrlString语音片段链接
detailsArray<Detail>语音片段识别内容详情,为空时该字段省略,详见 Detail 数据结构

Detail 数据结构

参数名称类型是否必有说明
labelInt识别分类,详见 任务返回标签说明
rateFloat吻合分数, 0 到 1 之间,分数越高,识别出来的结果越准确
startTimeFloat识别内容在该片段内的开始时间(取值范围为 [0, 片段时长],单位秒)
endTimeFloat识别内容在该片段内的结束时间(取值范围为 [0, 片段时长],单位秒)

任务返回标签说明

label 值说明
0
1
2其他

3.3 任务回调请求示例

{
"5f59e4b71b29fa890e5472fb": {
"segments": [
{
"label": 1,
"review": false,
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-0831/2023-06-01/15-7/f0cd6b256f4e42348e2d8cc80e089df7/1685605098.8143316974632338099.wav",
"startTime": 0,
"endTime": 10,
"details": [
{
"label": 1,
"rate": 0.9999997615814209,
"startTime": 0.6,
"endTime": 10
}
]
},
{
"label": 1,
"review": false,
"speechUrl": "https://static.tuputech.com/api/image/original/cloud-api/storage-233/2023-06-01/15-7/f0cd6b256f4e42348e2d8cc80e089df7/1685605098.2297555961099338289.wav",
"startTime": 10,
"endTime": 20,
"details": [
{
"label": 1,
"rate": 0.9999996423721313,
"startTime": 0.3,
"endTime": 9.98
}
]
}
]
}
}