跳到主要内容

文本审核

1. 任务简介

1.1 任务 ID

6a27d8be5d051d0490c6631a

提示

任务 ID 全局固定且不变,建议客户将其定义为代码常量。

1.2 能力介绍

能够识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持字词、标点、语法、专名、地址纠错。

  • 字词纠错包含音近字、形近字、成语、古诗等内容的纠错;
  • 标点纠错包含中英文标点混用、成对标点符号缺失、标点冗余等内容的纠错;
  • 语法纠错包含常见的语法冗余和缺失内容的纠错;
  • 专名纠错包含专有名词、固定短语等内容的纠错;
  • 地址纠错包含地址别字、地址搭配、地址缺失纠错;

2. 请求参数

文本同步识别接口公共请求参数详见:文本同步识别

文本异步识别接口公共请求参数详见:文本异步识别

文档异步识别接口公共请求参数详见:文档异步识别

3. 同步响应 & 回调数据

3.1 公共返回结果 & 回调数据

文本同步识别接口公共返回结果详见:文本同步识别

文本异步识别接口回调请求参数详见:文本异步识别

文档异步识别接口回调请求参数详见:文档异步识别

3.2 任务返回结果 🎯

任务结果

参数名称类型是否必有说明
textsArray<Text>文本内容识别结果, 详见 Text 参数说明

Text 参数说明

参数名称类型是否必有说明
rateFloat识别分值
contentString请求的文本内容
correctQueryString请求文本纠正后内容
errorNumInt错误数目
contentIdString文本内容 ID
userIdString用户 ID
forumIdString版块 ID
detailsArray<Detail>文本纠错的关键词详细信息,详见 Detail 数据结构

Detail 数据结构

参数名称类型是否必有说明
sentenceString原始子句文本
sentenceFixedString纠正后的子句文本
beginSentenceOffsetInt子句在content中的起始位置(长度单位)
endSentenceOffsetInt子句在content中的结尾位置(长度单位)
beginPsentContOffsetInt子句所属句子在content中的起始位置(长度单位)
endPsentContOffsetInt子句所属句子在content中的起始位置(长度单位)
vecFragmentArray<Detail>文本纠错候选片段信息,详见 VecFragment 数据结构

VecFagment 数据结构

参数名称类型是否必有说明
operationInt建议操作类型,0:检查,1:交换,2:替换,3:插入,4:删除
explainString纠错释义
labelString错误类型。010100:别字,010200:别词, 010600:诗词错误, 020100:标点误用,020200:标点缺失,020300:标点冗余,030100:语法错误-冗余,030200:语法错误-缺失,030300:语法错误-乱序, 030400:语法错误-语句不通, 040101:人名专名错误,040102:职务专名错误,040200:专名搭配错误,040300:专名排序错误,040400:术语错误,060100:地址别字,060200:地址搭配错误,060300:地址缺失错误
scoreFloat模型置信度打分。备注:若score返回为数字7,表示输入不合法,比如输入过长或过短。该情况没有纠错结果。
beginPosInt片段起始
endPosInt片段结束
oriFragString原片段
correctFragString替换改段

3.4 任务结果示例

{
"6a27d8be5d051d0490c6631a": {
"texts": [
{
"code": 0,
"contentId": "test",
"userId": "Test",
"forumId": "test",
"content": "实现祖国完全统一,是全体中华儿女共同愿望,解决台湾问题,是中华民族根本利益所在。推动两岸关系和平发展,必须继续坚持“和平统一、一郭两制”方针,退进祖国和平统一。",
"correctQuery": "实现祖国完全统一,是全体中华儿女共同愿望,解决台湾问题,是中华民族根本利益所在。推动两岸关系和平发展,必须继续坚持“和平统一、一国两制”方针,推进祖国和平统一。",
"details": [
{
"sentence": "必须继续坚持“和平统一、一郭两制”方针,",
"sentenceFixed": "必须继续坚持“和平统一、一国两制”方针,",
"beginSentenceOffset": 51,
"endSentenceOffset": 71,
"beginPsentContOffset": 40,
"endPsentContOffset": 80,
"vecFragment": [
{
"operation": 2,
"explain": "建议用“一国两制”替换“一郭两制”",
"label": "040400",
"score": 1,
"beginPos": 63,
"endPos": 67,
"oriFrag": "一郭两制",
"correctFrag": "一国两制"
}
]
},
{
"sentence": "退进祖国和平统一。",
"sentenceFixed": "推进祖国和平统一。",
"beginSentenceOffset": 71,
"endSentenceOffset": 80,
"beginPsentContOffset": 40,
"endPsentContOffset": 80,
"vecFragment": [
{
"operation": 2,
"explain": "建议用“推进”替换“退进”",
"label": "010200",
"score": 0.9138557314872742,
"beginPos": 71,
"endPos": 73,
"oriFrag": "退进",
"correctFrag": "推进"
}
]
}
]
}
]
},
"summary": [],
"riskType": 0,
"suggestion": 0
}