语音转译审核

1. 任务简介

1.1 任务 ID

5caee6b2a76925c55a09a6d2

提示

任务 ID 全局固定且不变，建议客户将其定义为代码常量。

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术，一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容，同时支持自定义词库配置，从而使审核结果更贴近实际场景需求。

2. 请求参数

语音文件同步接口公共请求参数详见：语音文件同步识别

3. 返回结果

3.1 公共返回结果

语音文件同步接口公共返回结果详见：语音文件同步识别

3.2 任务返回结果 🎯

v3.1（推荐）
v3

任务结果

参数名称	类型	是否必有	说明
`text`	String	是	全部语音片段的转译内容
`label`	Int	是	命中的标签，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：是，`false`：否
`segments`	Array<Segment>	否	语音片段结果数组（默认每隔 10 秒切片），详见 Segment 数据结构。 1. 该字段存在时，数组长度始终大于 0； 2. 目前默认返回违规片段结果，若语音文件全部片段识别结果正常，该字段省略，任务结果为：`{"<TaskId>": {}}`

Segment 数据结构

参数名称	类型	是否必有	说明
`label`	Int	是	命中的标签，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：是，`false`：否
`rate`	Float	是	识别分值
`content`	String	是	语音片段转译文本，可能为空
`hasVoice`	Boolean	是	片段是否有声音
`startTime`	Float	是	语音片段在语音文件内的开始时间（取值范围为 `[0, 语音时长]`，单位秒）
`endTime`	Float	是	语音片段在语音文件内的结束时间（取值范围为 `[0, 语音时长]`，单位秒）
`speechUrl`	String	是	语音片段链接
`details`	Array<Detail>	否	转译文本命中的关键词详细信息，在未命中关键词或由 NLP 判为违规时为空，此时该字段省略，详见 Detail 数据结构

Detail 数据结构

参数名称	类型	是否必有	说明
`mainLabel`	Int	是	命中的标签，详见任务返回标签说明
`subLabel`	String	否	命中的二级标签
`keyword`	String	否	命中的关键词。 1. 若命中算法模型，值为空字符串； 2. 若命中单个关键词，值为关键词字符串，例如：`习近平`； 3. 若同时命中多个关键词（组合规则），值为通过 `+` 拼接且被括号包裹的字符串，例如：`(加+微信)`。其中 `(A+B)` 表示关键词 A 与 B 之间未按顺序匹配，`{A+B}` 表示关键词 A 与 B 之间按照顺序匹配
`hint`	String	否	检测文本中的违规内容片段，例如原文为 `那我先加您微信，发您一下`，值为：`加您微信`

任务结果

参数名称	类型	是否必有	说明
`fileList`	Array<File>	是	语音识别结果数组，详见 File 参数说明

File 参数说明

参数名称	类型	是否必有	说明
`file_name`	String	是	请求的语音文件名称或 url
`result`	Object	是	语音识别结果，详见 Result 参数说明

Result 数据结构

参数名称	类型	是否必有	说明
`label`	String	是	命中的标签，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：是，`false`：否
`rate`	Float	是	识别分值
`action`	String	是	是否违规，`block`：违规，`pass`：通过，`review`：复审。 1. `review` 仅在开启文本 NLP 审核时生效
`content`	String	是	语音转译文本，可能为空
`hasVoice`	Boolean	是	是否有声音，`true`：是，`false`：否
`details`	Array<Detail>	否	转译文本命中的关键词详细信息，在未命中关键词或由 NLP 判为违规时为空，此时该字段省略，详见 Detail 数据结构

Detail 数据结构

参数名称	类型	是否必有	说明
`mainLabel`	String	是	命中的标签，详见任务返回标签说明
`subLabel`	String	否	命中的二级标签
`keyword`	String	否	命中的关键词。 1. 若命中算法模型，值为空字符串； 2. 若命中单个关键词，值为关键词字符串，例如：`习近平`； 3. 若同时命中多个关键词（组合规则），值为通过 `+` 拼接且被括号包裹的字符串，例如：`(加+微信)`。其中 `(A+B)` 表示关键词 A 与 B 之间未按顺序匹配，`{A+B}` 表示关键词 A 与 B 之间按照顺序匹配
`hint`	String	否	检测文本中的违规内容片段，例如原文为 `那我先加您微信，发您一下`，值为：`加您微信`

3.3 任务返回标签说明 🎯🎯

v3.1（推荐）
v3

`label` 与 `mainLabel` 值	说明
`0`	正常
`1`	暴恐
`2`	色情
`3`	涉政
`4`	敏感
`5`	广告
`6`	谩骂
`7`	灌水
`8`	自定义
`9`	未成年

`label` 与 `mainLabel` 值	说明
`Normal`	正常
`Terror`	暴恐
`Porn`	色情
`Politics`	涉政
`Sensitive`	敏感
`ADs`	广告
`Abuse`	谩骂
`Nosense`	灌水
`UserDefine`	自定义
`Minors`	未成年

3.4 任务结果示例

v3.1（推荐）
v3

{
  "5caee6b2a76925c55a09a6d2": {
    "segments": [
      {
        "label": 3,
        "rate": 0.9526356520517817,
        "review": false,
        "content": "昨天下午举行传达学习，贯彻胡锦涛总书记，在上海考察时的重要讲话，精神，中共中央政治局委员上海市委书记俞正声强调要成。",
        "hasVoice": true,
        "speechUrl": "<url>",
        "startTime": 20,
        "endTime": 30,
        "details": [
          {
            "keyword": "胡锦涛",
            "hint": "胡锦涛",
            "mainLabel": 3,
            "subLabel": "Political_Negative_events"
          }
        ]
      }
    ],
    "label": 3,
    "review": false,
    "rate": 0.9538463808241344,
    "text": "今天是二零一零年一月十九号星期二欢迎收看东方新闻，我是小蕾我是原名我们在上海的直播室向各位问号今天。于中国二零一一年上海世博会开幕，还有一百零二天，在快速浏览了今天的主要新闻，之后，我们来看，详细报道上海市党政负责干部会议。昨天下午举行传达学习，贯彻胡锦涛总书记，在上海考察时的重要讲话，精神，中共中央政治局委员上海市委书记俞正声强调要成。承担起中央交给上海的重任，不辜负党中央和胡锦涛总书记的殷切，期望努力，把上海世博会扮成一届成功精彩难忘的社会。努力开创上海改革开放和社会主义现代化建设的新局面，当好推动科学发展，促进社会和谐的排头兵。嗯。嗯。啊爸爸哈爸爸来哎呀！好死了好死了太乖要飞班没用呢？打出北骗你干嘛不行，我，再把微信发到发到群里面，谁加，我把明天退到群里面，我不抢不好意思骗人到头。那个幺八二幺八三三二零七七你搜索一下我看那个一号八星这样子。他普通话都不会说啊，那新疆的新疆的普通话，不会说那个人不会说实话，他找派出所帮他他找他说。我说，我操你妈呀那个操，因为啥我觉得一会儿老我和谐，我就打了个操人操骂手，打了个对。来讲一个啊，你喜欢看女孩子穿哪个颜色的内衣生。在一起啪啪啪的时候，你喜欢女生在上面，还是在下面啊，你不是说过了吗你什么时候说的呀，这个问题都没人问的。同好做科举行备谈，七月二十六号，李克强在北京会见第一总左科七月二十六号李克强不能说。不要提什么事叫涉宠什么国家领导人，对国家政治人物都一个都不能说哦我问他要不要上来，他，上来，我就下去，在我在我给我一个儿子我一天。夜假更早万米流传到今天感谢辛劳的背后都是哈。"
  }
}

{
  "5caee6b2a76925c55a09a6d2": {
    "fileList": [
      {
        "file_name": "<url>",
        "result": {
          "label": "ADs",
          "rate": 1,
          "review": false,
          "action": "block",
          "content": "我再把微信发到发到群里面谁加我把明天推到群里面，我不抢不好意思看你多那个幺八二幺八二三四二零七七你搜索一下",
          "hasVoice": true,
          "details": [
            {
              "keyword": "182182342077",
              "hint": "182182342077",
              "mainLabel": "ADs"
            }
          ]
        }
      }
    ]
  }
}

语音转译审核

1. 任务简介​

1.1 任务 ID​

1.2 能力介绍​

2. 请求参数​

3. 返回结果​

3.1 公共返回结果​

3.2 任务返回结果 🎯​

任务结果​

Segment 数据结构​

Detail 数据结构​

任务结果​

File 参数说明​

Result 数据结构​

Detail 数据结构​

3.3 任务返回标签说明 🎯🎯​

3.4 任务结果示例​

1. 任务简介

1.1 任务 ID

1.2 能力介绍

2. 请求参数

3. 返回结果

3.1 公共返回结果

3.2 任务返回结果 🎯

任务结果

Segment 数据结构

Detail 数据结构

任务结果

File 参数说明

Result 数据结构

Detail 数据结构

3.3 任务返回标签说明 🎯🎯

3.4 任务结果示例