低俗语音识别

1. 任务简介

1.1 任务 ID

5c8213b9bc807806aab0a574

提示

任务 ID 全局固定且不变，建议客户将其定义为代码常量。

1.2 能力介绍

支持识别分辨音频中是否存在有呻吟、娇喘、叫床、 ASMR 等违规片段。

2. 请求参数

语音文件同步接口公共请求参数详见：语音文件同步识别

3. 返回结果

3.1 公共返回结果

语音文件同步接口公共返回结果详见：语音文件同步识别

3.2 任务返回结果 🎯

v3.1（推荐）
v3

任务结果

参数名称	类型	是否必有	说明
`segments`	Array<Segment>	否	语音片段结果数组（默认每隔 10 秒切片），详见 Segment 数据结构。 1. 该字段存在时，数组长度始终大于 0； 2. 目前默认返回违规片段结果，若语音文件全部片段识别结果正常，该字段省略，任务结果为：`{"<TaskId>": {}}`

Segment 数据结构

参数名称	类型	是否必有	说明
`label`	Int	是	识别分类，详见任务返回标签说明
`review`	Boolean	是	是否需要复审，`true`：是， `false`：否
`startTime`	Float	是	语音片段在语音文件内的开始时间（取值范围为 `[0, 语音时长]`，单位秒）
`endTime`	Float	是	语音片段在语音文件内的结束时间（取值范围为 `[0, 语音时长]`，单位秒）
`speechUrl`	String	是	语音片段链接
`details`	Array<Detail>	否	语音片段违规内容详情，详见 Detail 数据结构

Detail 数据结构

参数名称	类型	是否必有	说明
`label`	Int	是	识别分类，详见任务返回标签说明
`rate`	Float	是	吻合分数， 0 到 1 之间，分数越高，识别出来的结果越准确
`startTime`	Float	是	违规内容在该片段内的开始时间（取值范围为 `[0, 片段时长]`，单位秒）
`endTime`	Float	是	违规内容在该片段内的结束时间（取值范围为 `[0, 片段时长]`，单位秒）

任务结果

参数名称	类型	是否必有	说明
`speechs`	Array<Speech>	是	语音识别结果数组，详见 Speech 参数说明

Speech 参数说明

参数名称	类型	是否必有	说明
`name`	String	是	请求的语音文件名称或 url
`label`	Int	是	识别分类，详见任务返回标签说明
`review`	Boolean	是	是否复审，`true`：是，`false`：否
`details`	Array<Detail>	是	语音片段识别内容详情，为空时该字段省略，详见 Detail 参数说明

Detail 数据结构

参数名称	类型	是否必有	说明
`label`	Int	是	识别分类，详见任务返回标签说明
`rate`	Float	是	吻合分数，0 到 1 之间，分数越高，识别出来的结果越准确
`startTime`	Float	是	违规内容在语音文件内的开始时间（取值范围为 `[0, 语音时长]`，单位秒）
`endTime`	Float	是	违规内容在语音文件内的开始时间（取值范围为 `[0, 语音时长]`，单位秒）

3.3 任务返回标签说明 🎯🎯

label 值	说明
`0`	正常
`1`	低俗

3.4 任务结果示例

v3.1（推荐）
v3

{
  "5c8213b9bc807806aab0a574": {
    "segments": [
      {
        "label": 1,
        "review": false,
        "speechUrl": "<url>",
        "startTime": 150,
        "endTime": 179,
        "details": [
          {
            "label": 1,
            "rate": 0.5354667901992798,
            "startTime": 19.09,
            "endTime": 29.09
          }
        ]
      }
    ]
  }
}

{
  "5c8213b9bc807806aab0a574": {
    "speechs": [
      {
        "name": "<url>",
        "label": 1,
        "review": false,
        "details": [
          {
            "startTime": 5,
            "endTime": 10,
            "label": 1,
            "rate": 0.9640088528394699
          },
          {
            "startTime": 35,
            "endTime": 40,
            "label": 1,
            "rate": 0.7449841499328613
          }
        ]
      }
    ]
  }
}

低俗语音识别

1. 任务简介​

1.1 任务 ID​

1.2 能力介绍​

2. 请求参数​

3. 返回结果​

3.1 公共返回结果​

3.2 任务返回结果 🎯​

任务结果​

Segment 数据结构​

Detail 数据结构​

任务结果​

Speech 参数说明​

Detail 数据结构​

3.3 任务返回标签说明 🎯🎯​

3.4 任务结果示例​

1. 任务简介

1.1 任务 ID

1.2 能力介绍

2. 请求参数

3. 返回结果

3.1 公共返回结果

3.2 任务返回结果 🎯

任务结果

Segment 数据结构

Detail 数据结构

任务结果

Speech 参数说明

Detail 数据结构

3.3 任务返回标签说明 🎯🎯

3.4 任务结果示例