跳到主要内容

语音转译审核

1. 任务简介

1.1 任务 ID

5caee6b2a76925c55a09a6d2

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术,一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规语音内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。

2. 请求参数

语音流公共请求参数详见:语音流异步识别

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

语音流公共同步返回结果详见:语音流异步识别

3.2 任务回调请求参数

任务结果

参数名称类型是否必有说明
segmentsArray<Segment>语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构

1. 该字段存在时,数组长度始终为 1;
2. 若该片段识别结果正常,且未指定回调所有片段的识别结果(详见 请求参数说明),该字段省略,任务结果为:{"<TaskId>": {}}

Segment 数据结构

参数名称类型是否必有说明
contentString语音片段转译文本,可能为空
labelInt命中的标签,详见 任务返回标签说明
reviewBool是否需要复审,true:需要,false:不需要
rateFloat吻合分数
hasVoiceBool是否有声音,true:是,false:否
startTimeFloat语音片段的截取时间(格式为 Unix 时间戳,单位秒)
endTimeFloat语音片段的结束时间(格式为 Unix 时间戳,单位秒)
speechUrlString语音片段链接
preSpeechUrlStringreturnPreSpeechtrue 时,前一语音片段(10 秒)的链接
detailsArray<Detail>转译文本命中的关键词详细信息,在未命中关键词或由 NLP 判为违规时为空,此时该字段省略,详见 Detail 数据结构

Detail 数据结构

参数名称类型是否必有说明
mainLabelInt命中的标签,详见 任务返回标签说明
subLabelString命中的二级标签
keywordString命中的关键词。

1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信)。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配
hintString检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信

任务返回标签说明

labelmainLabel说明
0正常
1暴恐
2色情
3涉政
4敏感
5广告
6谩骂
7灌水
8自定义
9未成年

3.3 任务回调请求示例

{
"5caee6b2a76925c55a09a6d2": {
"segments": [
{
"content": "<文本内容>",
"label": 3,
"review": false,
"rate": 0.896484,
"hasVoice": true,
"startTime": 1685000000,
"endTime": 1685000010,
"speechUrl": "<url>",
"details": [
{
"keyword": "<文本内容>",
"hint": "<文本内容>",
"mainLabel": 3,
"subLabel": "National_Leader"
}
]
}
]
}
}
{
"5caee6b2a76925c55a09a6d2": {}
}