图像文字识别

1. 任务简介

1.1 任务 ID

5caeac72582e35c560667d21

提示

任务 ID 全局固定且不变，建议客户将其定义为代码常量。

1.2 能力介绍

识别图片中的文字信息并返回文字位置及其内容信息，可用于用户原创内容的图像文字信息提取、文档文字信息提取等。

支持语种：

普通版本: 中文与英文 (包含数字)
多语言版本（预览）: 中文，繁体中文，日文，韩文，拉丁文（英文），阿拉伯文，西里尔文（俄文）

2. 请求参数

图片接口公共请求参数详见：图片同步识别接口，图片异步识别接口

视频接口公共请求参数详见：视频同步识别接口，视频文件异步识别接口，视频流异步识别接口

3. 返回结果

3.1 公共返回结果

图片接口公共返回结果详见：图片同步识别接口，图片异步识别接口

视频接口公共返回结果详见：视频同步识别接口，视频文件异步识别接口，视频流异步识别接口

3.2 任务返回结果 🎯

任务结果

参数名称	类型	是否必需	说明
`fileList`	Array	是	每张图片的识别结果，详见 FileResult 参数说明

FileResult 参数说明

参数名称	类型	是否必需	说明
`name`	String	是	如果上传的 `image` 参数是 url，则该值是图片 url；如果是以图片文件上传，则该值为文件名
`objects`	Array	是	检测出来的所有物体，详见 Objects 参数

Objects 参数

参数名称	类型	是否必需	说明
`location`	Array	是	物体方框坐标以图片左上角为原点，分别是[`左上角坐标`,`右上角坐标`,`右下角坐标`,`左下角坐标`], 坐标值是相对于图片大小的百分比形式。小语种文字识别不返回该项。
`degree`	Float	是	文字的旋转角度，取值范围是 [-180, 180]，正表示顺时针，负表示逆时针。小语种文字识别不返回该项。
`text`	String	是	识别到的文本信息
`category`	Int	是	检测到的物体类别，`0` 表示文字
`scores`	Float	是	检测得分，得分越高结果越准确，取值范围 [0,1]
`language`	Int	否	识别到的文本所属语言类别，多语言版本模型返回此字段（预览）。 1. 如需使用，请联系客户经理进行配置； 2. 字段取值：`1`：中文，`2`：繁体中文，`3`：日文，`4`：韩文，`5`：拉丁文（英文），`6`：阿拉伯文，`7`：西里尔文（俄文）

3.3 任务返回标签说明 🎯🎯

category 值	说明
`0`	文字

3.4 任务结果示例

{
  "5caeac72582e35c560667d21": {
    "fileList": [
      {
        "name": "test.jpg",
        "objects": [
          {
            "degree": 0,
            "location": [
              [
                0.022727264404296874,
                0.1666666644725926
              ],
              [
                0.15909091186523439,
                0.1666666644725926
              ],
              [
                0.15909091186523439,
                0.3333333355274074
              ],
              [
                0.022727264404296874,
                0.3333333355274074
              ]
            ],
            "scores": 0.9978030323982239,
            "text": "微信号",
            "category": 0
          },
          {
            "degree": 0,
            "location": [
              [
                0.6306818542480469,
                0.6041666208376343
              ],
              [
                0.9147727355957032,
                0.6041666208376343
              ],
              [
                0.9147727355957032,
                0.7500001056674208
              ],
              [
                0.6306818542480469,
                0.7500001056674208
              ]
            ],
            "scores": 0.9997721206058156,
            "text": "15827934231",
            "category": 0
          },
          {
            "degree": -1.457413492101156,
            "location": [
              [
                0.6359872589111328,
                0.1807315155947982
              ],
              [
                0.9660818328857422,
                0.1807315155947982
              ],
              [
                0.9660818328857422,
                0.34521910696379554
              ],
              [
                0.6359872589111328,
                0.34521910696379554
              ]
            ],
            "scores": 0.9996555997775152,
            "text": "15827934231",
            "category": 0
          }
        ]
      }
    ]
  },
  "code": 0,
  "message": "success",
  "nonce": "0.3014124736010655",
  "timestamp": 1506812492943
}

图像文字识别

1. 任务简介​

1.1 任务 ID​

1.2 能力介绍​

2. 请求参数​

3. 返回结果​

3.1 公共返回结果​

3.2 任务返回结果 🎯​

任务结果​

FileResult 参数说明​

Objects 参数​

3.3 任务返回标签说明 🎯🎯​

3.4 任务结果示例​

1. 任务简介

1.1 任务 ID

1.2 能力介绍

2. 请求参数

3. 返回结果

3.1 公共返回结果

3.2 任务返回结果 🎯

任务结果

FileResult 参数说明

Objects 参数

3.3 任务返回标签说明 🎯🎯

3.4 任务结果示例