跳到主要内容

低俗语音识别

1. 任务简介

1.1 任务 ID

5c8213b9bc807806aab0a574

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

支持识别分辨音频中是否存在有呻吟、娇喘、叫床、 ASMR 等违规片段。

2. 请求参数

语音文件同步接口公共请求参数详见:语音文件同步识别

3. 返回结果

3.1 公共返回结果

语音文件同步接口公共返回结果详见:语音文件同步识别

3.2 任务返回结果

任务结果

参数名称类型是否必有说明
speechsArray<Speech>语音识别结果数组,详见 Speech 参数说明

Speech 参数说明

参数名称类型是否必有说明
nameString请求的语音文件名称或 url
labelInt识别分类,详见任务返回标签说明
reviewBool是否复审,true:是,false:否
detailsArray<Detail>语音片段识别内容详情,为空时该字段省略,详见 Detail 参数说明

Detail 数据结构

参数名称类型是否必有说明
labelInt识别分类,详见任务返回标签说明
rateFloat吻合分数,0 到 1 之间,分数越高,识别出来的结果越准确
startTimeFloat违规内容在语音文件内的开始时间(取值范围为 [0, 语音时长],单位秒)
endTimeFloat违规内容在语音文件内的开始时间(取值范围为 [0, 语音时长],单位秒)

任务返回标签说明

label 值说明
0正常
1低俗

3.3 任务结果示例

{
"5c8213b9bc807806aab0a574": {
"speechs": [
{
"name": "<url>",
"label": 1,
"review": false,
"details": [
{
"startTime": 5,
"endTime": 10,
"label": 1,
"rate": 0.9640088528394699
},
{
"startTime": 35,
"endTime": 40,
"label": 1,
"rate": 0.7449841499328613
}
]
}
]
}
}