跳到主要内容

图像文字识别

1. 任务简介

1.1 任务 ID

5caeac72582e35c560667d21

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

识别图片中的文字信息并返回文字位置及其内容信息,可用于用户原创内容的图像文字信息提取、文档文字信息提取等。

支持语种: 中文与英文

2. 请求参数

图片接口公共请求参数详见:图片同步识别接口图片异步识别接口

视频接口公共请求参数详见:视频同步识别接口视频文件异步识别接口视频流异步识别接口

3. 返回结果

3.1 公共返回结果

图片接口公共返回结果详见:图片同步识别接口图片异步识别接口

视频接口公共返回结果详见:视频同步识别接口视频文件异步识别接口视频流异步识别接口

3.2 任务返回结果 🎯

任务结果

参数名称类型是否必需说明
fileListArray每张图片的识别结果,详见 FileResult 参数说明

FileResult 参数说明

参数名称类型是否必需说明
nameString如果上传的 image 参数是 url,则该值是图片 url;如果是以图片文件上传,则该值为文件名
objectsArray检测出来的所有物体,详见 Objects 参数

Objects 参数

参数名称类型是否必需说明
locationArray物体方框坐标以图片左上角为原点,分别是[左上角坐标,右上角坐标,右下角坐标,左下角坐标], 坐标值是相对于图片大小的百分比形式。小语种文字识别不返回该项。
degreeNumber文字的旋转角度,取值范围是 [-180, 180],正表示顺时针,负表示逆时针。小语种文字识别不返回该项。
textString识别到的文本信息
categoryNumber检测到的物体类别,0 表示文字
scoresNumber检测得分,得分越高结果越准确,取值范围 [0,1]

3.3 任务返回标签说明 🎯🎯

category 值说明
0文字

3.4 任务结果示例

{
"5caeac72582e35c560667d21": {
"fileList": [
{
"name": "test.jpg",
"objects": [
{
"degree": 0,
"location": [
[
0.022727264404296874,
0.1666666644725926
],
[
0.15909091186523439,
0.1666666644725926
],
[
0.15909091186523439,
0.3333333355274074
],
[
0.022727264404296874,
0.3333333355274074
]
],
"scores": 0.9978030323982239,
"text": "微信号",
"category": 0
},
{
"degree": 0,
"location": [
[
0.6306818542480469,
0.6041666208376343
],
[
0.9147727355957032,
0.6041666208376343
],
[
0.9147727355957032,
0.7500001056674208
],
[
0.6306818542480469,
0.7500001056674208
]
],
"scores": 0.9997721206058156,
"text": "15827934231",
"category": 0
},
{
"degree": -1.457413492101156,
"location": [
[
0.6359872589111328,
0.1807315155947982
],
[
0.9660818328857422,
0.1807315155947982
],
[
0.9660818328857422,
0.34521910696379554
],
[
0.6359872589111328,
0.34521910696379554
]
],
"scores": 0.9996555997775152,
"text": "15827934231",
"category": 0
}
]
}
]
},
"code": 0,
"message": "success",
"nonce": "0.3014124736010655",
"timestamp": 1506812492943
}