语音转译审核

1. 任务简介

1.1 任务 ID

5caee6b2a76925c55a09a6d2

提示

任务 ID 全局固定且不变，建议客户将其定义为代码常量。

1.2 能力介绍

通过语音识别、文本 NLP 反垃圾等技术，一站式识别视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规语音内容，同时支持自定义词库配置，从而使审核结果更贴近实际场景需求。

2. 请求参数

语音流公共请求参数详见：语音流异步识别

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

语音流公共同步返回结果详见：语音流异步识别

3.2 任务返回结果 🎯

v3.1（推荐）
v3

任务结果

参数名称	类型	是否必有	说明
`segments`	Array<Segment>	否	语音片段结果数组（默认每隔 10 秒切片），详见 Segment 数据结构。 1. 该字段存在时，数组长度始终为 1； 2. 若该片段识别结果正常，且未指定回调所有片段的识别结果（详见请求参数说明），该字段省略，任务结果为：`{"<TaskId>": {}}`

Segment 数据结构

参数名称	类型	是否必有	说明
`content`	String	是	语音片段转译文本，可能为空
`label`	Int	是	命中的标签，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：需要，`false`：不需要
`rate`	Float	是	吻合分数
`hasVoice`	Boolean	是	是否有声音，`true`：是，`false`：否
`startTime`	Float	是	语音片段的截取时间（格式为 Unix 时间戳，单位秒）
`endTime`	Float	是	语音片段的结束时间（格式为 Unix 时间戳，单位秒）
`speechUrl`	String	是	语音片段链接
`preSpeechUrl`	String	否	当 `returnPreSpeech` 为 `true` 时，前一语音片段（10 秒）的链接
`details`	Array<Detail>	否	转译文本命中的关键词详细信息，在未命中关键词或由 NLP 判为违规时为空，此时该字段省略，详见 Detail 数据结构

Detail 数据结构

参数名称	类型	是否必有	说明
`mainLabel`	Int	是	命中的标签，详见任务返回标签说明
`subLabel`	String	否	命中的二级标签
`keyword`	String	否	命中的关键词。 1. 若命中算法模型，值为空字符串； 2. 若命中单个关键词，值为关键词字符串，例如：`习近平`； 3. 若同时命中多个关键词（组合规则），值为通过 `+` 拼接且被括号包裹的字符串，例如：`(加+微信)`。其中 `(A+B)` 表示关键词 A 与 B 之间未按顺序匹配，`{A+B}` 表示关键词 A 与 B 之间按照顺序匹配
`hint`	String	否	检测文本中的违规内容片段，例如原文为 `那我先加您微信，发您一下`，值为：`加您微信`

任务结果

参数名称	类型	是否必有	说明
`texts`	Array	是	语音段结果，详见 Texts 数据结构

Texts 数据结构

参数名称	类型	是否必有	说明
`roomId`	String	否	房间 ID
`userId`	String	否	用户 ID
`forumId`	String	否	板块 ID，数据 ID
`requestId`	string	是	客户提交的语音流的唯一请求 ID，根据请求 ID 与请求的流地址对应起来
`sliceStartTime`	String	是	开始时间点，格式：`YYYY-MM-DD HH:mm:ss`
`sliceEndTime`	String	是	结束时间点，格式：`YYYY-MM-DD HH:mm:ss`
`content`	String	是	文本内容，可能为空
`action`	String	是	是否违规，`block`：违规，`pass`：通过，`review`：复审。 1. `review` 仅在开启文本 NLP 审核时生效； 2. v3.1 接口中废弃
`label`	String	是	命中的标签，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：需要，`false`：不需要
`rate`	Float	是	吻合分数
`hasVoice`	Boolean	是	是否有声音，`true`：是，`false`：否
`speechUrl`	String	是	违规语音 URL
`preSpeechUrl`	String	否	当 `returnPreSpeech` 为 `true` 时，前一语音片段（10 秒）的链接
`details`	Array	是	命中的关键词详细信息，如果 `action` 为 `pass`，则 `details` 为空数组(nlp 判为违规，但未命中某个关键词也为空数组)，详见 Details 数据结构
`SEIs`	Array	否	音视频流中包含的 SEI 信息

Details 数据结构

参数名称	类型	是否必有	说明
`mainLabel`	String	是	命中的标签，详见任务返回标签说明
`subLabel`	String	否	命中的二级标签
`keyword`	String	否	命中的关键词。 1. 若命中算法模型，值为空字符串； 2. 若命中单个关键词，值为关键词字符串，例如：`习近平`； 3. 若同时命中多个关键词（组合规则），值为通过 `+` 拼接且被括号包裹的字符串，例如：`(加+微信)`。其中 `(A+B)` 表示关键词 A 与 B 之间未按顺序匹配，`{A+B}` 表示关键词 A 与 B 之间按照顺序匹配
`hint`	String	否	检测文本中的违规内容片段，例如原文为 `那我先加您微信，发您一下`，值为：`加您微信`

3.3 任务返回标签说明 🎯🎯

v3.1（推荐）
v3

`label` 与 `mainLabel` 值	说明
`0`	正常
`1`	暴恐
`2`	色情
`3`	涉政
`4`	敏感
`5`	广告
`6`	谩骂
`7`	灌水
`8`	自定义
`9`	未成年

`label` 与 `mainLabel` 值	说明
`Normal`	正常
`Terror`	暴恐
`Porn`	色情
`Politics`	涉政
`Sensitive`	敏感
`ADs`	广告
`Abuse`	谩骂
`Nosense`	灌水
`UserDefine`	自定义
`Minors`	未成年

3.4 任务结果示例

v3.1（推荐）
v3

{
  "5caee6b2a76925c55a09a6d2": {
    "segments": [
      {
        "content": "<文本内容>",
        "label": 3,
        "review": false,
        "rate": 0.896484,
        "hasVoice": true,
        "startTime": 1685000000,
        "endTime": 1685000010,
        "speechUrl": "<url>",
        "details": [
          {
            "keyword": "<文本内容>",
            "hint": "<文本内容>",
            "mainLabel": 3,
            "subLabel": "National_Leader"
          }
        ]
      }
    ]
  }
}

{
  "5caee6b2a76925c55a09a6d2": {}
}

{
  "5caee6b2a76925c55a09a6d2": {
    "texts": [
      {
        "roomId": "<roomId>",
        "userId": "<userId>",
        "forumId": "<forumId>",
        "requestId": "<requestId>",
        "sliceStartTime": "2019-01-07 16:59:23",
        "sliceEndTime": "2019-01-07 16:59:33",
        "content": "<文本内容>",
        "action": "block",
        "label": "Politics",
        "review": false,
        "rate": 0.896484,
        "hasVoice": true,
        "speechUrl": "<url>",
        "preSpeechUrl": "<url>",
        "details": [
          {
            "keyword": "<文本内容>",
            "hint": "<文本内容>",
            "mainLabel": "Politics",
            "subLabel": "National_Leader"
          }
        ]
      }
    ]
  }
}

语音转译审核

1. 任务简介​

1.1 任务 ID​

1.2 能力介绍​

2. 请求参数​

3. 同步响应 & 回调数据​

3.1 公共返回结果 & 回调数据​

3.2 任务返回结果 🎯​

任务结果​

Segment 数据结构​

Detail 数据结构​

任务结果​

Texts 数据结构​

Details 数据结构​

3.3 任务返回标签说明 🎯🎯​

3.4 任务结果示例​

1. 任务简介

1.1 任务 ID

1.2 能力介绍

2. 请求参数

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

3.2 任务返回结果 🎯

任务结果

Segment 数据结构

Detail 数据结构

任务结果

Texts 数据结构

Details 数据结构

3.3 任务返回标签说明 🎯🎯

3.4 任务结果示例