跳到主要内容

语音转译审核

1. 任务简介

1.1 任务 ID

taskId: 5caee6b2a76925c55a09a6d2

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术,一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。

2. 请求参数

语音文件同步接口公共请求参数详见:语音文件同步识别

3. 返回结果

3.1 公共返回结果

语音文件同步接口公共返回结果详见:语音文件同步识别

3.2 任务返回结果

TaskId 参数

参数名类型是否必有说明
fileListArray识别的详细结果,具体数据结构见FileList 参数

FileList 参数

参数名类型是否必有说明
file_nameString上传的语音文件名称
resultObject结果数据结构,详见 result 数据结构

result 数据结构

参数名类型是否必有说明
contentString文本内容,可能为空
actionString是否违规,block:违规,pass:通过,review:复审
labelString命中的标签,详见返回标签说明
reviewBool是否需要复审,true:需要,false:不需要
rateFloat吻合分数,分数越高,识别出来的结果越准确,取值为 0 到 1 之间或者空值 null
hasVoiceBool是否有声音,true:是,false:否
detailsArray命中的关键词详细信息,如果 actionspass,则 details 为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见 Details 数据结构

Details 数据结构

参数名类型是否必有说明
keywordString命中的关键词。
1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
2. 若同时命中多个关键词(组合规则),值为通过 + 拼接,且被括号包裹的字符串,例如:(加+微信)(A+B) 表示关键词 A 与 B 之间无顺序要求,{A+B} 表示关键词 A 与 B 之间按照出现顺序匹配
hintString检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信
mainLabelString命中的风险主标签,详见任务返回标签说明
subLabelString二级标签

任务返回标签说明

labelmainLabel 值说明

label 值说明
Normal正常
Terror暴恐
Porn色情
Politics涉政
Sensitive敏感
ADs广告
Abuse谩骂
UserDefine自定义

3.3 返回示例

{
"5caee6b2a76925c55a09a6d2": {
"fileList": [
{
"file_name": "4444.mp3",
"result": {
"content": "代打要帮打上王者的进王者荣耀代练。",
"action": "block",
"review": false,
"label": "ADs",
"rate": 0.982422,
"hasVoice": true,
"details": [
{
"keyword": "代练",
"hint": "代练",
"mainLabel": "ADs",
"subLabel": "Social_Behaviors"
}
]
},
"tag": "tag-test"
}
]
}