跳到主要内容

语音转译审核(多语种)

1. 任务简介

1.1 任务 ID

5caee6b2a76925c55a09a6d2

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术,一站式识别海外视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。

1.3 支持语种

英语、印尼语、印地语、阿拉伯语等。

1.4 音频时长

审核音频需小于 58 秒

2. 请求参数

2.1 公共请求参数

语音文件同步接口公共请求参数详见:语音文件同步识别

2.2 该任务特定请求参数

参数名称类型是否必需说明
languageString需要识别的语言代码。需要进行多语种语音转译审核或者多语种转译时必传。多语种语音转译类产品需联系图普进行配置使用。 对应语言代码详见底部“附表:语言代码列表”。默认为 zh-CN

3. 返回结果

3.1 公共返回结果

语音文件同步接口公共返回结果详见:语音文件同步识别

3.2 任务返回结果

任务结果

参数名称类型是否必有说明
fileListArray<File>语音识别结果数组,详见 File 参数说明

File 参数说明

参数名称类型是否必有说明
file_nameString请求的语音文件名称或 url
resultObject语音识别结果,详见 Result 参数说明

Result 参数说明

参数名称类型是否必有说明
labelString命中的标签,详见 任务返回标签说明
reviewBool是否需要复审,true:是,false:否
actionString是否违规,block:违规,pass:通过,review:复审。

1. review 仅在开启文本 NLP 审核时生效
contentString语音转译文本,可能为空
hasVoiceBool是否有声音,true:是,false:否
detailsArray<Detail>转译文本命中的关键词详细信息,在未命中关键词或由 NLP 判为违规时为空,此时该字段省略,详见 Detail 数据结构

Detail 数据结构

参数名称类型是否必有说明
mainLabelInt命中的标签,详见 任务返回标签说明
subLabelString命中的二级标签
keywordString命中的关键词。

1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信)。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配
hintString检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信

任务返回标签说明

labelmainLabel 值说明

labelmainLabel说明
Normal正常
Terror暴恐
Porn色情
Politics涉政
Sensitive敏感
ADs广告
Abuse谩骂
UserDefine自定义

3.3 响应示例

示例代码

{
"629e23efaa468d0107f75ad4": {
"fileList": [
{
"file_name": "<url>",
"result": {
"label": "Abuse",
"review": false,
"action": "block",
"content": "I was like,all right,thanks,dude,we could piss and i can get my coffee。我虽然能听懂,我估计你们大部分听不懂,看你如果能听懂的话给我留言,everybody say,thank you Shannon thank you,Shannon,谢谢您。",
"hasVoice": true,
"details": [
{
"keyword": "piss",
"hint": "piss",
"mainLabel": "Abuse",
"subLabel": "Abuse"
}
]
}
}
]
}
}

4. 附表

语言代码列表

语言地区码语言(地区)
ar-EGArabic (Egypt)
ar-SAArabic (Saudi Arabia)
ar-AEArabic (UAE)
ar-KWArabic (Kuwait)
ar-QAArabic (Qatar)
en-AUEnglish (Australia)
en-CAEnglish (Canada)
en-GBEnglish (United Kingdom)
en-INEnglish (India)
en-NZEnglish (New Zealand)
en-USEnglish (United States)
id-IDIndonesian (Indonesia)