图像 OCR 文本审核
1. 任务简介
1.1 任务 ID
5e1d634d2809c24f6d909bd3
提示
任务 ID 全局固定且不变,建议客户将其定义为代码常量。
1.2 能力介绍
OCR 技术智能提取图片中的文字信息,同步识别文字信息中的暴恐、色情、涉政、敏感、广告、谩骂等违规内容。
支持语种: 默认识别中文和英文,如需对图片中其他语言文字进行识别审核,请联系我们进行相应配置,以保证识别效果。 可识别的其他语言文字包括:拉丁⽂字(英法德⻄葡及东南亚语种)、⻄⾥尔⽂字(俄乌⽩及独联体国家语种)、阿拉伯⽂字,以及印度地区 7 种主流本地语种。
2. 请求参数
图片接口公共请求参数详见:图片同步识别接口,图片异步识别接口
视频接口公共请求参数详见:视频同步识别接口,视频异步识别接口
3. 返回结果
3.1 公共返回结果
图片接口公共返回结果详见:图片同步识别接口,图片异步识别接口
视频接口公共返回结果详见:视频同步识别接口,视频异步识别接口
3.2 任务返回结果
任务结果
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
fileList | Array | 是 | 每张图片的识别结果,详见 FileList 参数 |
FileList 参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
name | String | 是 | 如果上传的 image 参数是 url,则该值是图片 url;如果是以图片文件上传,则该值为文件名 |
label | Number | 是 | 识别分类( -1 表示识别失败),详见任务返回标签说明 |
rate | Float | 是 | 分类得分,范围 [0.0, 1.0], 值越高机器对判定结果越有把握 |
review | Boolean | 是 | 是否需要复审,true :需要,false :不需要 |
objects | Array | 是 | 检测出来的所有文字框,详见Objects 参数 |
Objects 参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
location | Array | 是 | 物体方框坐标 [左上角坐标 ,右上角坐标 ,右下角坐标 ,左下角坐标 ], 坐标值是相对于图片大小的百分比形式。小语种 OCR 文本审核该项不返回。 |
degree | Number | 是 | 文字的旋转角度,取值范围是 [-180, 180],正表示顺时针,负表示逆时针。小语种 OCR 文本审核该项不返回。 |
text | String | 是 | 识别到的文本信息 |
scores | Number | 是 | 文本检测得分,分数越高,识别出来的结果越准确,介于 0-1 的浮点数 |
textAnalysis | Object | 是 | 文本审核结果,详见 TextAnalysis 参数 |
TextAnalysis 参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
label | Number | 是 | 识别标签,详见任务返回标签说明 |
review | Boolean | 是 | 是否需要复审,true :需要,false :不需要 |
rate | Float | 是 | 文本审核得分,分数越高,识别出来的结果越准确, 介于 0-1 的浮点数 |
details | Array | 是 | 文本违规信息,详见 Details 参数 |
Details 参数
参数名称 | 类型 | 是否必有 | 说明 |
---|---|---|---|
mainLabel | Int | 是 | 命中的标签,详见 任务返回标签说明 |
subLabel | String | 否 | 命中的二级标签 |
keyword | String | 否 | 命中的关键词。 1. 若命中算法模型,值为空字符串; 2. 若命中单个关键词,值为关键词字符串,例如: 习近平 ;3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信) 。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配 |
hint | String | 否 | 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下 ,值为:加您微信 |
任务返回标签说明
label 值 | 说明 |
---|---|
0 | 正常 |
1 | 暴恐 |
2 | 色情 |
3 | 涉政 |
4 | 敏感 |
5 | 广告 |
6 | 谩骂 |
8 | 自定义 |
9 | 未成年 |
3.3 响应示例
{
"5e1d634d2809c24f6d909bd3": {
"fileList": [
{
"name": "44444.png",
"label": 3,
"rate": 1,
"review": false,
"objects": [
{
"text": "床前明月光",
"scores": 0.9995116114616394,
"degree": 0,
"location": [
[
0.3692741635989941,
0.42063488474394733
],
[
0.6314305795423576,
0.42063488474394733
],
[
0.6314305795423576,
0.49603178192271935
],
[
0.3692741635989941,
0.49603178192271935
]
],
"textAnalysis": {
"label": 0,
"review": false,
"rate": 0.96781986951828,
"details": []
}
},
{
"text": "毛泽东",
"scores": 0.9951668977737427,
"degree": 0,
"location": [
[
0.4256518406293357,
0.5753968315895163
],
[
0.5806905895660593,
0.5753968315895163
],
[
0.5806905895660593,
0.65079364460096
],
[
0.4256518406293357,
0.65079364460096
]
],
"textAnalysis": {
"label": 3,
"review": false,
"rate": 1,
"details": [
{
"keyword": "毛泽东",
"hint": "毛泽东",
"mainLabel": 3
}
]
}
}
],
"tag": "tag-test"
}
]
},
"code": 0,
"message": "success",
"nonce": "0.07701011150215531",
"timestamp": 1585210615325
}