语音转译审核
1. 任务简介
1.1 任务 ID
5caee6b2a76925c55a09a6d2
提示
任务 ID 全局固定且不变,建议客户将其定义为代码常量。
1.2 能力介绍
通过语音识别、文本 NLP 反垃圾等技术,一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规语音内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。
2. 请求参数
语音流公共请求参数详见:语音流异步识别
3. 同步响应 & 回调数据
3.1 公共返回结果 & 回调数据
语音流公共同步返回结果详见:语音流异步识别
3.2 任务返回结果 🎯
- v3.1(推荐)
- v3
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
segments | Array<Segment> | 否 | 语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构。 1. 该字段存在时,数组长度始终为 1; 2. 若该片段识别结果正常,且未指定回调所有片段的识别结果(详见 请求参数说明),该字段省略,任务结果为: {"<TaskId>": {}} |
Segment 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
content | String | 是 | 语音片段转译文本,可能为空 |
label | Int | 是 | 命中的标签,详见 任务返回标签说明 |
review | Bool | 是 | 是否需要复审,true :需要,false :不需要 |
rate | Float | 是 | 吻合分数 |
hasVoice | Bool | 是 | 是否有声音,true :是,false :否 |
startTime | Float | 是 | 语音片段的截取时间(格式为 Unix 时间戳,单位秒) |
endTime | Float | 是 | 语音片段的结束时间(格式为 Unix 时间戳,单位秒) |
speechUrl | String | 是 | 语音片段链接 |
preSpeechUrl | String | 否 | 当 returnPreSpeech 为 true 时,前一语音片段(10 秒)的链接 |
details | Array<Detail> | 否 | 转译文本命中的关键词详细信息,在未命中关键词或由 NLP 判为违规时为空,此时该字段省略,详见 Detail 数据结构 |
Detail 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
mainLabel | Int | 是 | 命中的标签,详见 任务返回标签说明 |
subLabel | String | 否 | 命中的二级标签 |
keyword | String | 否 | 命中的关键词。 1. 若命中算法模型,值为空字符串; 2. 若命中单个关键词,值为关键词字符串,例如: 习近平 ;3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信) 。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配 |
hint | String | 否 | 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下 ,值为:加您微信 |
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
texts | Array | 是 | 语音段结果,详见 Texts 数据结构 |
Texts 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
roomId | String | 否 | 房间 ID |
userId | String | 否 | 用户 ID |
forumId | String | 否 | 板块 ID,数据 ID |
requestId | string | 是 | 客户提交的语音流的唯一请求 ID,根据请求 ID 与请求的流地址对应起来 |
sliceStartTime | String | 是 | 开始时间点,格式:YYYY-MM-DD HH:mm:ss |
sliceEndTime | String | 是 | 结束时间点,格式:YYYY-MM-DD HH:mm:ss |
content | String | 是 | 文本内容,可能为空 |
action | String | 是 | 是否违规,block :违规,pass :通过,review :复审。 1. review 仅在开启文本 NLP 审核时生效;2. v3.1 接口中废弃 |
label | String | 是 | 命中的标签,详见 任务返回标签说明 |
review | Bool | 是 | 是否需要复审,true :需要,false :不需要 |
rate | Float | 是 | 吻合分数 |
hasVoice | Bool | 是 | 是否有声音,true :是,false :否 |
speechUrl | String | 是 | 违规语音 URL |
preSpeechUrl | String | 否 | 当 returnPreSpeech 为 true 时,前一语音片段(10 秒)的链接 |
details | Array | 是 | 命中的关键词详细信息,如果 action 为 pass ,则 details 为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见 Details 数据结构 |
SEIs | Array | 否 | 音视频流中包含的 SEI 信息 |
Details 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
mainLabel | Int | 是 | 命中的标签,详见 任务返回标签说明 |
subLabel | String | 否 | 命中的二级标签 |
keyword | String | 否 | 命中的关键词。 1. 若命中算法模型,值为空字符串; 2. 若命中单个关键词,值为关键词字符串,例如: 习近平 ;3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信) 。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配 |
hint | String | 否 | 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下 ,值为:加您微信 |
3.3 任务返回标签说明 🎯🎯
- v3.1(推荐)
- v3
label 与 mainLabel 值 | 说明 |
---|---|
0 | 正常 |
1 | 暴恐 |
2 | 色情 |
3 | 涉政 |
4 | 敏感 |
5 | 广告 |
6 | 谩骂 |
7 | 灌水 |
8 | 自定义 |
9 | 未成年 |
label 与 mainLabel 值 | 说明 |
---|---|
Normal | 正常 |
Terror | 暴恐 |
Porn | 色情 |
Politics | 涉政 |
Sensitive | 敏感 |
ADs | 广告 |
Abuse | 谩骂 |
Nosense | 灌水 |
UserDefine | 自定义 |
Minors | 未成年 |
3.4 任务结果示例
- v3.1(推荐)
- v3
{
"5caee6b2a76925c55a09a6d2": {
"segments": [
{
"content": "<文本内容>",
"label": 3,
"review": false,
"rate": 0.896484,
"hasVoice": true,
"startTime": 1685000000,
"endTime": 1685000010,
"speechUrl": "<url>",
"details": [
{
"keyword": "<文本内容>",
"hint": "<文本内容>",
"mainLabel": 3,
"subLabel": "National_Leader"
}
]
}
]
}
}
{
"5caee6b2a76925c55a09a6d2": {}
}
{
"5caee6b2a76925c55a09a6d2": {
"texts": [
{
"roomId": "<roomId>",
"userId": "<userId>",
"forumId": "<forumId>",
"requestId": "<requestId>",
"sliceStartTime": "2019-01-07 16:59:23",
"sliceEndTime": "2019-01-07 16:59:33",
"content": "<文本内容>",
"action": "block",
"label": "Politics",
"review": false,
"rate": 0.896484,
"hasVoice": true,
"speechUrl": "<url>",
"preSpeechUrl": "<url>",
"details": [
{
"keyword": "<文本内容>",
"hint": "<文本内容>",
"mainLabel": "Politics",
"subLabel": "National_Leader"
}
]
}
]
}
}