语音性别识别
1. 任务简介
1.1 任务 ID
5f59e4b71b29fa890e5472fb
提示
任务 ID 全局固定且不变,建议客户将其定义为代码常量。
1.2 能力介绍
支持对发声人物的性别进行识别分辨。
2. 请求参数
语音文件同步接口公共请求参数详见:语音文件同步识别
3. 返回结果
3.1 公共返回结果
语音文件同步接口公共返回结果详见:语音文件同步识别
3.2 任务返回结果
- v3.1(推荐)
- v3
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
segments | Array<Segment> | 是 | 语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构。 1. 该字段始终存在; 2. 该任务非审核场景,因此与回调规则无关(详见 请求参数说明) |
Segment 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Int | 是 | 识别分类,详见 任务返回标签说明 |
review | Bool | 是 | 是否需要复审,true :是, false :否 |
startTime | Float | 是 | 语音片段在语音文件内的开始时间(取值范围为 [0, 语音时长] ,单位秒) |
endTime | Float | 是 | 语音片段在语音文件内的结束时间(取值范围为 [0, 语音时长] ,单位秒) |
speechUrl | String | 是 | 语音片段链接 |
details | Array<Detail> | 否 | 语音片段识别内容详情,为空时该字段省略,详见 Detail 数据结构 |
Detail 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Int | 是 | 识别分类,详见 任务返回标签说明 |
rate | Float | 是 | 吻合分数, 0 到 1 之间,分数越高,识别出来的结果越准确 |
startTime | Float | 是 | 识别内容在该片段内的开始时间(取值范围为 [0, 片段时长] ,单位秒) |
endTime | Float | 是 | 识别内容在该片段内的结束时间(取值范围为 [0, 片段时长] ,单位秒) |
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
speeches | Array<Speech> | 是 | 语音识别结果数组,详见 Speech 参数说明 |
Speech 参数说明
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
name | String | 是 | 请求的语音文件名称或 url |
label | Int | 是 | 识别分类,详见 任务返回标签说明 |
review | Bool | 是 | 是否复审,true :是,false :否 |
rate | Float | 是 | 吻合分数, 0 到 1 之间,分数越高,识别出来的结果越准确 |
details | Array<Detail> | 是 | 语音片段识别内容详情,为空时该字段省略,详见 Detail 参数说明 |
Detail 参数说明
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Int | 是 | 识别分类,详见 任务返回标签说明 |
rate | Float | 是 | 吻合分数, 0 到 1 之间,分数越高,识别出来的结果越准确 |
startTime | Float | 是 | 识别内容在语音文件内的开始时间(取值范围为 [0, 语音时长] ,单位秒) |
endTime | Float | 是 | 识别内容在语音文件内的开始时间(取值范围为 [0, 语音时长] ,单位秒) |
任务返回标签说明
label 值 | 说明 |
---|---|
0 | 男 |
1 | 女 |
2 | 其他 |
3.3 响应示例
- v3.1(推荐)
- v3
{
"5f59e4b71b29fa890e5472fb": {
"segments": [
{
"label": 1,
"review": false,
"speechUrl": "<url>",
"startTime": 0,
"endTime": 30,
"details": [
{
"label": 1,
"rate": 0.9999978542327881,
"startTime": 1.5,
"endTime": 10
}
]
}
]
}
}
{
"5f59e4b71b29fa890e5472fb": {
"speeches": [
{
"name": "<url>",
"label": 1,
"review": false,
"rate": 0.9640088528394699,
"details": [
{
"startTime": 5,
"endTime": 10,
"label": 1,
"rate": 0.9640088528394699
},
{
"startTime": 35,
"endTime": 40,
"label": 1,
"rate": 0.7449841499328613
}
]
}
]
}
}