跳到主要内容

语音转译审核(多语种)

1. 任务简介

1.1 任务 ID

taskId: 5caee6b2a76925c55a09a6d2

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术,一站式识别海外视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。

  • 支持语种

    普通话、英语、日语、韩语、泰语、越南语、马来语、印尼语、印地语、菲律宾语、阿拉伯语、土耳其语、俄语、德语、法语、意大利语、西班牙语、葡萄牙语、瑞典语、波兰语、希腊语、挪威语、荷兰语等。

2. 请求参数

2.1 公共请求参数

语音文件异步接口公共请求参数详见:语音文件异步识别

2.2 该任务特定请求参数

参数名称类型是否必需说明
languageString需要识别的语言代码。需要进行多语种语音转译审核或者多语种转译时必传。多语种语音转译类产品需联系图普进行配置使用。对应语言代码详见底部“附表:语言代码列表”。默认为 zh-CN

3. 同步返回 & 回调数据

3.1 公共返回结果 & 回调数据

语音文件异步接口公共返回结果详见:语音文件异步识别

3.2 任务回调请求参数

TaskId 参数

参数名类型是否必有说明
textString语音转译内容
actionString是否违规,block:违规,pass:通过,review:复审
labelString违规标签
reviewBool是否需要复审,true:需要,false:不需要
violationsArray<Violation>语音片段结果数组(默认每隔 10 秒切片),详见 Violation 数据结构

Violation 数据结构

注意

只包含 action违规复审的信息

参数名类型是否必有说明
contentString文本内容,可能为空
actionString是否违规,block:违规,pass:通过,review:复审
labelString命中的标签,详见返回标签说明
reviewBool是否需要复审,true:需要,false:不需要
startTimeFloat语音片段在语音文件内的开始时间(单位秒,取值范围为 [0, 语音时长]
endTimeFloat语音片段在语音文件内的结束时间(单位秒,取值范围为 [0, 语音时长]
detailsArray<Detail>命中的关键词详细信息,如果 actionspass,则 details 为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见以下 Detail 数据结构
speechUrlString语音片段链接。默认不返回,需要返回请联系我们

Detail 数据结构

参数名类型是否必有说明
mainLabelString命中的风险主标签,详见返回标签说明
subLabelString二级标签
keywordString命中的关键词。
1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
2. 若同时命中多个关键词(组合规则),值为通过 + 拼接,且被括号包裹的字符串,例如:(加+微信)(A+B) 表示关键词 A 与 B 之间无顺序要求,{A+B} 表示关键词 A 与 B 之间按照出现顺序匹配
hintString检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信

3.3 任务标签说明

labelmainLabel 取值说明

取值说明
Normal正常
Terror暴恐
Porn色情
Politics涉政
Sensitive敏感
ADs广告
Abuse谩骂
Minors未成年
UserDefine自定义

3.4 任务回调请求示例

{
"5caee6b2a76925c55a09a6d2": {
"label": "Abuse",
"review": false,
"rate": 0.996484,
"action": "block",
"text": "fxxk it",
"violations": [{
"startTime": 12,
"endTime": 15,
"content": "fxxk",
"action": "block",
"label": "Abuse",
"review": false,
"rate": 0.996484,
"speechUrl": "http://sample.com/test.mp3",
"details": [{
"keyword": "fuck",
"hint": "fuck",
"mainLabel": "Abuse",
"subLabel": "Abuse"
}]
}]
}
}

4. 附表

语言代码列表

语言地区码语言(地区)
ar-EGArabic (Egypt)
ar-SAArabic (Saudi Arabia)
ar-AEArabic (UAE)
ar-KWArabic (Kuwait)
ar-QAArabic (Qatar)
de-DEGerman (Germany)
el-GRGreek (Greece)
en-AUEnglish (Australia)
en-CAEnglish (Canada)
en-GBEnglish (United Kingdom)
en-INEnglish (India)
en-NZEnglish (New Zealand)
en-USEnglish (United States)
es-ESSpanish (Spain)
es-ARSpanish (Argentina)
fil-PHFilipino (Pilipinas)
fr-CAFrench (Canada)
fr-FRFrench (France)
id-IDIndonesian (Indonesia)
it-ITItalian (Italy)
ja-JPJapanese (Japan)
ko-KRKorean (Korea)
ms-MYMalay (Malaysia)
nb-NONorwegian (Norway)
nl-NLDutch (Netherlands)
pl-PLPolish (Poland)
pt-BRPortuguese (Brazil)
pt-PTPortuguese (Portugal)
ru-RURussian (Russia)
sv-SESwedish (Sweden)
zh-CNChinese (Mandarin, China Mainland)
zh-HKChinese (Cantonese, HongKong)
zh-TWChinese (Mandarin, Taiwan)
th-THThai (Thailand)
tr-TRTurkish (Turkey)
vi-VNVietnamese (Vietnam)