跳到主要内容

图像 OCR 文本审核

1. 任务简介

1.1 任务 ID

5e1d634d2809c24f6d909bd3

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

OCR 技术智能提取图片中的文字信息,同步识别文字信息中的暴恐、色情、涉政、敏感、广告、谩骂等违规内容。

支持语种: 默认识别中文和英文,如需对图片中其他语言文字进行识别审核,请联系我们进行相应配置,以保证识别效果。 可识别的其他语言文字包括:拉丁⽂字(英法德⻄葡及东南亚语种)、⻄⾥尔⽂字(俄乌⽩及独联体国家语种)、阿拉伯⽂字,以及印度地区 7 种主流本地语种。

2. 请求参数

图片接口公共请求参数详见:图片同步识别接口图片异步识别接口

视频接口公共请求参数详见:视频同步识别接口视频文件异步识别接口视频流异步识别接口

3. 返回结果

3.1 公共返回结果

图片接口公共返回结果详见:图片同步识别接口图片异步识别接口

视频接口公共返回结果详见:视频同步识别接口视频文件异步识别接口视频流异步识别接口

3.2 任务返回结果

任务结果

参数名称类型是否必有说明
fileListArray<FileResult>每张图片的识别结果,详见 FileResult 参数说明

FileResult 参数说明

参数名称类型是否必有说明
labelInt识别分类,详见 任务返回标签说明
rateFloat分类得分,范围 [0.0, 1.0], 值越高机器对判定结果越有把握
reviewBoolean是否需要复审,true:需要,false:不需要
nameString如果上传的 image 参数是 url,则该值是图片 url;如果是以图片文件上传,则该值为文件名
objectsArray<Object>检测出来的所有文字框,详见 Object 参数说明

Object 参数说明

参数名称类型是否必有说明
textString识别到的文本信息
scoresFloat文本检测得分,分数越高,识别出来的结果越准确,介于 0-1 的浮点数
textAnalysisObject文本审核结果,详见 TextAnalysis 参数说明
locationArray物体方框坐标 [左上角坐标,右上角坐标,右下角坐标,左下角坐标], 坐标值是相对于图片大小的百分比形式。小语种 OCR 文本审核该项不返回
degreeFloat文字的旋转角度,取值范围是 [-180, 180],正表示顺时针,负表示逆时针。小语种 OCR 文本审核该项不返回

TextAnalysis 参数说明

参数名称类型是否必有说明
labelInt识别标签,详见 任务返回标签说明
reviewBoolean是否需要复审,true:需要,false:不需要
rateFloat文本审核得分,分数越高,识别出来的结果越准确, 介于 0-1 的浮点数
detailsArray文本违规信息,详见 Detail 参数说明

Detail 参数说明

参数名称类型是否必有说明
mainLabelInt命中的标签,详见 任务返回标签说明
subLabelString命中的二级标签
keywordString命中的关键词。

1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
3. 若同时命中多个关键词(组合规则),值为通过 + 拼接且被括号包裹的字符串,例如:(加+微信)。其中 (A+B) 表示关键词 A 与 B 之间未按顺序匹配,{A+B} 表示关键词 A 与 B 之间按照顺序匹配
hintString检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信

3.3 任务返回标签说明

label 值说明
0正常
1暴恐
2色情
3涉政
4敏感
5广告
6谩骂
8自定义
9未成年

3.4 任务结果示例

{
"5e1d634d2809c24f6d909bd3": {
"fileList": [
{
"label": 3,
"rate": 1,
"review": false,
"name": "<name>",
"objects": [
{
"text": "毛泽东",
"scores": 0.9951668977737427,
"degree": 0,
"location": [
[
0.4256518406293357,
0.5753968315895163
],
[
0.5806905895660593,
0.5753968315895163
],
[
0.5806905895660593,
0.65079364460096
],
[
0.4256518406293357,
0.65079364460096
]
],
"textAnalysis": {
"label": 3,
"review": false,
"rate": 1,
"details": [
{
"keyword": "毛泽东",
"hint": "毛泽东",
"mainLabel": 3
}
]
}
}
],
"tag": "<tag>"
}
]
}
}