一个开源 OCR 工具,能够处理超过 90 种 语言 的文本识别,支持图像和 PDF 格式文档的 文字 提取、布局分析以及行检测。
支持批量处理,并针对 GPU 优化,能够提高处理 效率 ,还提供了交互式界面让用户更方便地测试功能。
Surya 的主要功能包括识别文档中的文本行、标题、图像、页眉等元素,并通过 JSON 格式输出结果。
开源地址:https:// github .com/VikParuchuri/surya
本站夸克网盘精选资源合集:https://pan.quark.cn/s/936c760dd840
评论列表
发表评论