语音转译审核
1. 任务简介
1.1 任务 ID
taskId: 5caee6b2a76925c55a09a6d2
1.2 能力介绍
通过语音识别、文本 NLP 反垃圾等技术,一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。
2. 请求参数
语音文件同步接口公共请求参数详见:语音文件同步识别
3. 返回结果
3.1 公共返回结果
语音文件同步接口公共返回结果详见:语音文件同步识别
3.2 任务返回结果
TaskId 参数
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
fileList | Array | 是 | 识别的详细结果,具体数据结构见FileList 参数 |
FileList 参数
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
file_name | String | 是 | 上传的语音文件名称 |
result | Object | 是 | 结果数据结构,详见 result 数据结构 |
result 数据结构
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
content | String | 是 | 文本内容,可能为空 |
action | String | 是 | 是否违规,block :违规,pass :通过,review :复审 |
label | String | 是 | 命中的标签,详见返回标签说明 |
review | Bool | 是 | 是否需要复审,true :需要,false :不需要 |
rate | Float | 是 | 吻合分数,分数越高,识别出来的结果越准确,取值为 0 到 1 之间或者空值 null |
hasVoice | Bool | 是 | 是否有声音,true :是,false :否 |
details | Array | 是 | 命中的关键词详细信息,如果 actions 为 pass ,则 details 为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见 Details 数据结构 |
Details 数据结构
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
keyword | String | 否 | 命中的关键词。 1. 若命中算法模型,值为空字符串; 2. 若命中单个关键词,值为关键词字符串,例如: 习近平 ;2. 若同时命中多个关键词(组合规则),值为通过 + 拼接,且被括号包裹的字符串,例如:(加+微信) ;(A+B) 表示关键词 A 与 B 之间无顺序要求,{A+B} 表示关键词 A 与 B 之间按照出现顺序匹配 |
hint | String | 否 | 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下 ,值为:加您微信 |
mainLabel | String | 是 | 命中的风险主标签,详见任务返回标签说明 |
subLabel | String | 否 | 二级标签 |
任务返回标签说明
label
与 mainLabel
值说明
label 值 | 说明 |
---|---|
Normal | 正常 |
Terror | 暴恐 |
Porn | 色情 |
Politics | 涉政 |
Sensitive | 敏感 |
ADs | 广告 |
Abuse | 谩骂 |
UserDefine | 自定义 |
3.3 返回示例
{
"5caee6b2a76925c55a09a6d2": {
"fileList": [
{
"file_name": "4444.mp3",
"result": {
"content": "代打要帮打上王者的进王者荣耀代练。",
"action": "block",
"review": false,
"label": "ADs",
"rate": 0.982422,
"hasVoice": true,
"details": [
{
"keyword": "代练",
"hint": "代练",
"mainLabel": "ADs",
"subLabel": "Social_Behaviors"
}
]
},
"tag": "tag-test"
}
]
}