唱歌识别
1. 任务简介
1.1 任务 ID
5ceceb840dd872e9289f21e4
提示
任务 ID 全局固定且不变,建议客户将其定义为代码常量。
1.2 能力介绍
支持识别分别语音中是否存在唱歌行为。
2. 请求参数
语音文件异步接口公共请求参数详见:语音文件异步识别
3. 同步响应 & 回调数据
3.1 公共返回结果 & 回调数据
语音文件异步接口公共返回结果详见:语音文件异步识别
3.2 任务返回结果 🎯
- v3.1(推荐)
- v3
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
segments | Array<Segment> | 是 | 语音片段结果数组(默认每隔 10 秒切片),详见 Segment 数据结构。 1. 该字段始终存在,且数组长度始终为 1; 2. 该任务非审核场景,因此与回调规则无关(详见 请求参数说明) |
Segment 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Number | 是 | 识别分类,详见 任务返回标签说明 |
review | Bool | 是 | 是否复审,true :是,false :否 |
startTime | Float | 是 | 语音片段的截取时间(格式为 Unix 时间戳,单位秒) |
endTime | Float | 是 | 语音片段的结束时间(格式为 Unix 时间戳,单位秒) |
speechUrl | String | 是 | 语音片段链接 |
preSpeechUrl | String | 否 | 当 returnPreSpeech 为 true 时,前一语音片段(10 秒)的链接 |
details | Array<Detail> | 否 | 语音片段识别结果详情,为空时该字段省略,详见 Detail 数据结构 |
Detail 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Number | 是 | 识别分类,详见 任务返回标签说明 |
rate | Float | 是 | 吻合分数 |
startTime | Float | 是 | 违规内容在该片段内的开始时间(取值范围为 [0, 片段时长] ,单位秒) |
endTime | Float | 是 | 违规内容在该片段内的结束时间(取值范围为 [0, 片段时长] ,单位秒) |
任务结果
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
speechs | Array<Speech> | 是 | 识别的详细结果,具体数据结构见 Speech 数据结构 |
Speech 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
requestId | string | 是 | 客户提交的语音流的唯一请求 ID, 根据请求 ID 与请求的流地址对应起来 |
label | Number | 是 | 识别分类,详见任务返回标签说明 |
review | Bool | 是 | 是否复审,true :是,false :否 |
sliceStartTime | String | 是 | 开始时间点,格式:YYYY-MM-DD HH:mm:ss |
sliceEndTime | String | 是 | 结束时间点,格式:YYYY-MM-DD HH:mm:ss |
details | Array<Detail> | 是 | 语音片段信息,如果没有识别到唱歌,则 details 为空数组,详见 Detail 数据结构 |
speechUrl | String | 是 | 语音片段链接 |
preSpeechUrl | String | 否 | 当 returnPreSpeech 为 true 时,前一语音片段(10 秒)的链接 |
roomId | String | 否 | 房间 ID |
userId | String | 否 | 用户 ID |
forumId | String | 否 | 板块 ID,数据 ID |
SEIs | Array | 否 | 音视频流中包含的 SEI 信息 |
Detail 数据结构
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
label | Number | 是 | 识别分类,详见任务返回标签说明 |
rate | Float | 是 | 吻合分数 |
subSliceStartTime | String | 是 | 唱歌片段的开始时间点,格式:YYYY-MM-DD HH:mm:ss |
subSliceEndTime | String | 是 | 唱歌片段的结束时间点,格式:YYYY-MM-DD HH:mm:ss |
startTime | Float | 是 | 唱歌片段的起始时间(第 n 秒) |
endTime | Float | 是 | 唱歌片段的结束时间(第 n 秒) |
speechUrl | String | 是 | 语音片段链接 |
3.3 任务返回标签说明 🎯🎯
label 值 | 说明 |
---|---|
0 | 未唱歌 |
1 | 在唱歌 |
3.4 任务结果示例
- v3.1(推荐)
- v3
{
"5ceceb840dd872e9289f21e4": {
"segments": [
{
"label": 1,
"review": false,
"startTime": 1685000000,
"endTime": 1685000010,
"speechUrl": "<url>",
"details": [
{
"label": 1,
"rate": 0.7449841499328613,
"startTime": 5,
"endTime": 10
}
]
}
]
}
}
{
"5ceceb840dd872e9289f21e4": {
"violations": [
{
"label": 1,
"review": false,
"speechUrl": "<url>",
"details": [
{
"startTime": 5,
"endTime": 10,
"label": 1,
"rate": 0.7449841499328613
}
]
}
]
}
}