盘天下 | 免费精选资源分享

MinerU:开源高质量数据提取工具,支持PDF/网页/多格式电子书提取

编程开发 2024-11-22 1053 0
紫微斗数命中贵人八字精批六道轮回


MinerU:开源高质量数据提取工具,支持 PDF/ 网页 / 多格式电子书提取

MinerU 是一款由上海 人工智能 实验室 OpenDataLab 团队 开发 的开源高质量 数据 提取工具,专注于从复杂 PDF 文档、网页和 电子书 中高效提取内容。它能够将包含图片、公式和表格的多模态 PDF 转化为 Markdown 格式(如 markdown 、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为 LaTex、保留文档结构,支持 176 种 语言 的准确识别,适用于 学术财务法律 等领域,兼容 Windows/Linux/Mac 平台。

开源地址:https:// github .com/opendatalab/MinerU

本站夸克网盘精选资源合集:https://pan.quark.cn/s/936c760dd840

冲上云霄

转载请注明出处,本文链接:https://www.80srz.com/pantx/20961.html

(1)
收藏 (0)
取消

感谢您的支持,我们会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开 支付宝 扫一扫,即可进行扫码打赏哦

评论列表