当前位置: 首页 > news >正文

西安网站维保公司沈阳seo排名外包

西安网站维保公司,沈阳seo排名外包,重庆做网站制作公司,上海科技网站设计建设前处理: DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction (1)几何矫正 给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取&#xf…

前处理

DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction

(1)几何矫正

给定一张存在几何和光照畸变的文档图像,我们首先用一个包含六个卷积模块的特征提取器对其进行特征提取,并降低特征图分辨率至输入图像的1/8尺度,以保证网络的推理效率。然后,我们将提取的特征图展平后,输入至Transformer编码器,解码器,以及我们设计的可学习的上采样模块,得到坐标位移矩阵。最后,我们用对坐标位移矩阵对输入的图像进行几何矫正(即基于双线性插值的在输入图像上按坐标进行像素重采样)。

(2)光照恢复

给定一张几何矫正输出的高分辨率图像,我们首先将其切分成相互之间有1/8重叠的图像块。然后,我们将每一个图像块输入至卷积特征提取器,Transformer编码器,解码器,以及卷积输出头,从而输出光照恢复的图像块。最后,我们将每一个恢复的图像块进行空间上的拼接,完成文档图像的光照恢复。

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集:

英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别。

中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像

2、文本分析

文本检测:改进了基于分割的DBNet (Differentiable Binarization)

数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)

数据集:

 

 3、表格

1. 文字检测模型:用于检测表格里的文本

2. 文字识别模型:用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

数据集:

PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

参考来源: GitHub - PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR

http://www.ds6.com.cn/news/63942.html

相关文章:

  • 做网站和优化公司的宣传语图片外链生成
  • 宁波建设局网站网站外部优化的4大重点
  • 做网站的公司有哪些建网站怎么建
  • 南阳网站建设域名公司免费网页制作平台
  • 上海专业做网站服务商网址检测
  • 单页面网站模板怎么做电脑培训班在哪里有最近的
  • 太原做网站兼职百度关键词推广怎么做
  • 怎么用FTP做网站网站如何做seo排名
  • 网站制作产品营销方案策划
  • 用html5做京东网站代码湘潭seo培训
  • 建设一个网站的步骤百度热搜榜排行
  • 非盈利性备案网站 淘宝客网站网络推广怎么收费
  • 延边网站建设优化搜索引擎
  • 成都公司做网站的申请网站域名要多少钱
  • 服务器 网站建设蜜雪冰城推广软文
  • 网站插入地图中铁建设集团有限公司
  • 本地网站架设工具网站改进建议有哪些
  • 广州牌手表网站西安专业网络推广平台
  • 专业做卖菜的网站网站alexa排名
  • dede添加网站背景网络营销的概念与含义
  • 轮播网站网站seo在线诊断分析
  • 个人做慈善网站营销助手
  • 如何建设 营销型 网站企业网站建设需求分析
  • 做我的世界皮肤壁纸的网站品牌推广方式都有哪些
  • 赌博网站做代理微信群卖房卡免费发seo外链平台
  • 阿里云ecs做网站苏州百度推广代理商
  • 网站百度权重怎么提升想卖产品怎么推广宣传
  • 网站建设英语翻译附近的电脑培训班在哪里
  • 网站建设 系统维护汕头网站建设方案推广
  • 可以做课程的网站百度应用商店app下载安装