使用 TESS4J 的光学字符识别 (OCR)
💡一则或许对你有用的小广告
欢迎加入小哈的星球 ,你将获得:专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
- 新项目:《从零手撸:仿小红书(微服务架构)》 正在持续爆肝中,基于
Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...
,点击查看项目介绍 ;- 《从零手撸:前后端分离博客项目(全栈开发)》 2 期已完结,演示链接: http://116.62.199.48/ ;
截止目前, 星球 内专栏累计输出 82w+ 字,讲解图 3441+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,权限管理,Spring Cloud Alibaba 微服务等等,已有 2800+ 小伙伴加入学习 ,欢迎点击围观
Tess4j 是 基于 JNA 的 Tesseract OCR DLL 包装器,该库提供光学字符识别 (OCR) 支持:
- TIFF、JPEG、GIF、PNG 和 BMP 图像格式
- 多页 TIFF 图像
- PDF文档格式
如何运行示例
第 1 步:从 此处 下载 Maven 项目
第 2 步:运行示例
添加 VM 参数
64位
-Djna.library.path=${workspace_loc:/ocr-tess4j-example}/dlls/x64
32位
-Djna.library.path=${workspace_loc:/ocr-tess4j-example}/dlls/x86
第三步:输出