跳到主要内容

低俗语音识别

1. 任务简介

1.1 任务 ID

5c8213b9bc807806aab0a574

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

支持识别分辨语音中是否存在有呻吟、娇喘、叫床、 ASMR 等违规片段。

2. 请求参数

语音流公共请求参数详见:语音流异步识别

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

语音流公共同步返回结果详见:语音流异步识别

3.2 任务回调请求参数

任务结果

参数名称类型是否必有说明
segmentsArray<Segment>语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构

1. 该字段存在时,数组长度始终为 1;
2. 若该片段识别结果正常,且未指定回调所有片段的识别结果(详见 请求参数说明),该字段省略,任务结果为:{"<TaskId>": {}}

Segment 数据结构

参数名称类型是否必有说明
labelNumber识别分类,详见 任务返回标签说明
reviewBool是否复审,true:是,false:否
startTimeFloat语音片段的截取时间(格式为 Unix 时间戳,单位秒)
endTimeFloat语音片段的结束时间(格式为 Unix 时间戳,单位秒)
speechUrlString语音片段链接
preSpeechUrlStringreturnPreSpeechtrue 时,前一语音片段(10 秒)的链接
detailsArray<Detail>语音片段识别结果详情,为空时该字段省略,详见 Detail 数据结构

Detail 数据结构

参数名称类型是否必有说明
labelNumber识别分类,详见 任务返回标签说明
rateFloat吻合分数
startTimeFloat违规内容在该片段内的开始时间(取值范围为 [0, 片段时长],单位秒)
endTimeFloat违规内容在该片段内的结束时间(取值范围为 [0, 片段时长],单位秒)

任务返回标签说明

label 值说明
0正常
1低俗

3.3 任务回调请求示例

{
"5c8213b9bc807806aab0a574": {
"segments": [
{
"label": 1,
"review": false,
"startTime": 1685000000,
"endTime": 1685000010,
"speechUrl": "<url>",
"details": [
{
"label": 1,
"rate": 0.7449841499328613,
"startTime": 5,
"endTime": 10
}
]
}
]
}
}
{
"5c8213b9bc807806aab0a574": {}
}