Skip to content

Releases: PaddlePaddle/PaddleOCR

v3.0.3

26 Jun 10:04
a00f633

Choose a tag to compare

v3.0.2

18 Jun 16:38
db3bf4a

Choose a tag to compare

  • 功能新增:

    • 模型默认下载源从BOS改为HuggingFace,同时也支持用户通过更改环境变量PADDLE_PDX_MODEL_SOURCEBOS,将模型下载源设置为百度云对象存储BOS。
    • PP-OCRv5、PP-StructureV3、PP-ChatOCRv4等pipeline新增C++、Java、Go、C#、Node.js、PHP 6种语言的服务调用示例。
    • 优化PP-StructureV3产线中版面分区排序算法,对复杂竖版版面排序逻辑进行完善,进一步提升了复杂版面排序效果。
    • 优化模型选择逻辑,当指定语言、未指定模型版本时,自动选择支持该语言的最新版本的模型。
    • 为MKL-DNN缓存大小设置默认上界,防止缓存无限增长。同时,支持用户配置缓存容量。
    • 更新高性能推理默认配置,支持Paddle MKL-DNN加速。优化高性能推理自动配置逻辑,支持更智能的配置选择。
    • 调整默认设备获取逻辑,考虑环境中安装的Paddle框架对计算设备的实际支持情况,使程序行为更符合直觉。
    • 新增PP-OCRv5的Android端示例,详情
  • Bug修复:

    • 修复PP-StructureV3部分CLI参数不生效的问题。
    • 修复部分情况下export_paddlex_config_to_yaml无法正常工作的问题。
    • 修复save_path实际行为与文档描述不符的问题。
    • 修复基础服务化部署在使用MKL-DNN时可能出现的多线程错误。
    • 修复Latex-OCR模型的图像预处理的通道顺序错误。
    • 修复文本识别模块保存可视化图像的通道顺序错误。
    • 修复PP-StructureV3中表格可视化结果通道顺序错误。
    • 修复PP-StructureV3产线中极特殊的情况下,计算overlap_ratio时,变量溢出问题。
  • 文档优化:

    • 更新文档中对enable_mkldnn参数的说明,使其更准确地描述程序的实际行为。
    • 修复文档中对langocr_version参数描述的错误。
    • 补充通过CLI导出产线配置文件的说明。
    • 修复PP-OCRv5性能数据表格中的列缺失问题。
    • 润色PP-StructureV3在不同配置下的benchmark指标。
  • 其他:

    • 放松numpy、pandas等依赖的版本限制,恢复对Python 3.12的支持。

v3.0.1

05 Jun 03:27
18936e0

Choose a tag to compare

  • 优化部分模型和模型配置:
    • 更新 PP-OCRv5默认模型配置,检测和识别均由mobile改为server模型。为了改善大多数的场景默认效果,配置中的参数limit_side_len由736改为64
    • 新增文本行方向分类PP-LCNet_x1_0_textline_ori模型,精度99.42%,OCR、PP-StructureV3、PP-ChatOCRv4产线的默认文本行方向分类器改为该模型
    • 优化文本行方向分类PP-LCNet_x0_25_textline_ori模型,精度提升3.3个百分点,当前精度98.85%
  • 优化3.0.0版本部分存在的问题
    • 优化CLI使用体验: 当使用PaddleOCR CLI不传入任何参数时,给出用法提示。
    • 新增参数: PP-ChatOCRv3、PP-StructureV3支持use_textline_orientation参数。
    • CPU推理速度优化: 所有产线CPU推理默认开启MKL-DNN。
    • C++推理支持: PP-OCRv5的检测和识别串联部分支持C++推理
  • 修复3.0.0版本部分存在的问题
    • 修复由于公式识别、表格识别模型无法使用MKL-DNN导致PP-StructureV3在部分cpu推理报错的问题
    • 修复在部分GPU环境中推理报FatalError: Process abort signal is detected by the operating system错误的问题
    • 修复部分Python3.8环境的type hint的问题
    • 修复PPStructureV3.concatenate_markdown_pages方法不存在的问题。
    • 修复实例化paddleocr.PaddleOCR时同时指定langmodel_namemodel_name不生效的问题。

v3.0.0

20 May 12:16
a847428

Choose a tag to compare

  • 发布全场景文字识别模型PP-OCRv5: 单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代提升13个百分点。

  • 发布通用文档解析方案PP-StructureV3: 支持多场景、多版式 PDF 高精度解析,在公开评测集中领先众多开源和闭源方案。

  • 发布智能文档理解方案PP-ChatOCRv4: 原生支持文心大模型4.5 Turbo,精度相比上一代提升15个百分点。

  • 重构部署能力,统一推理接口: PaddleOCR 3.0 融合了飞桨 PaddleX3.0 工具的底层能力,全面升级推理、部署模块,优化 2.x 版本的设计,统一并优化了 Python API 和命令行接口(CLI)。部署能力现覆盖高性能推理、服务化部署及端侧部署三大场景。

  • 适配飞桨框架 3.0,优化训练流程: 新版本已兼容飞桨 3.0 的 CINN 编译器等最新特性,静态图模型存储文件名由 xxx.pdmodel 改为 xxx.json

  • 统一模型名称: 对PaddleOCR3.0支持的模型命名体系进行了更新,采用更规范、统一的命名规则,为后续迭代与维护奠定基础。

v2.10.0

07 Mar 07:03
e218c0a

Choose a tag to compare

What's Changed

Read more

v2.9.1

22 Oct 05:57
0760342

Choose a tag to compare

What's Changed

  • [cherry-pick] update paddle2onnx doc by @inisis in #14051
  • [cherry-pick] fix isnan is not supported and update pyproject by @GreatV in #14061
  • [cherry-pick] ci: Fixed docs multi version error by @GreatV in #14063

Full Changelog: v2.9.0...v2.9.1

v2.9.0

18 Oct 15:43
ee1aa57

Choose a tag to compare

What's Changed

Read more

v2.8.1

17 Jul 10:48
40c5662

Choose a tag to compare

What's Changed

  • [cherry-pick] add project url and fix a bug by @GreatV in #13281
  • [cherry-pick] fix slice op parameters not being passed correctly (#13319) by @GreatV in #13324
  • Fix the dictionary bug in tablerec inference by @Topdu in #13364

Full Changelog: v2.8.0...v2.8.1

v2.8.0

04 Jul 11:45
7a3c580

Choose a tag to compare

终于等到你!PaddleOCR 新版本发布!

What's Changed

Read more

PaddleOCRv2.7.5

29 Mar 09:48
261d6c2

Choose a tag to compare

fix broken v2.7.4