查看原文
科技

23.1K Star这OCR太强!!!支持83种语言识别

开源日记 开源日记
2024-08-13



相关阅读:

8.5K 强强强!!!支持90多种语言的强大OCR
1.9K Star开源OCR翻译神器,很顺手

项目介绍

EasyOCR 是一个强大且多功能的光学字符识别工具,专为需要从图像中提取文本的开发者设计。它支持超过80种语言和书写体系,包括拉丁文、中文、阿拉伯文、天城文、西里尔文等。这种全面的语言覆盖使其适用于广泛的场景,从文档扫描到标志翻译。

路牌精准识别

特点

EasyOCR是一款支持本地或云端部署、具备高精度识别能力、高度可定制且能处理复杂版式与非文本元素的先进OCR工具,配备半自动标注工具以简化数据准备流程。

  • 本地部署或云API:EasyOCR 可以在本地服务器上部署,也可以通过云API服务使用,提供灵活的选择以满足特定需求。
  • 高精度:能够根据用户的数据将准确度提升至99%以上,确保文本提取的可靠性。
  • 高度可定制:完全可定制化,支持80多种语言,并允许用户用自己的数据训练模型。
  • 版式识别:EasyOCR 能够识别复杂的版式结构,如表格和表单。
  • 条码与二维码提取:可以提取图像中的签名、二维码和条形码。
  • 半自动标注工具:简化了数据集的标注过程,提高效率并减少人工劳动。

开源成就

目前已经取得23.1K Star

主要功能

EasyOCR 的核心功能包括:

  • 支持多种语言和书写体系的文本识别。
  • 布局分析,用于理解并从结构化的文档中提取文本,例如表格和表单。
  • 提取额外元素,如条形码、二维码和签名。

安装指南

为了安装 EasyOCR,请使用 pip 获取最新稳定版本:

pip install easyocr

对于最新的开发版本,使用:

pip install git+https://github.com/JaidedAI/EasyOCR.git

在 Windows 系统上,需先根据官方 PyTorch 指南安装 torchtorchvision。如果仅使用 CPU 运行,则在安装时选择 CUDA=None。

使用示例

首先,导入库并初始化 Reader 类,指定所需的语言,这里我们用中文

import easyocr
reader = easyocr.Reader(['ch_sim','en'])
result = reader.readtext('路牌.png')
for res in result:
     print(res)

识别结果

No.TextConfident Score
0西0.3276
1凤台路0.7183
2末来路0.4655
3[890.0066
47。;0.0002
5尺40.0218
6凤凰东路0.8949
7凤鸣路0.9243
8「890.0139
9怊490.0002
10旧)0.028
110.0019
12「890.0133
13英协路0.7195
14川90.0016
15尺40.0587
16货站街0.9771
17金水路0.9369
18勺;^ :^0.0468

图片识别标注

命令行运行

通过命令行执行 OCR,命令如下:

easyocr -l ch_sim en -f chinese.jpg --detail=1 --gpu=True

此命令将在图像 chinese.jpg 上进行 OCR 处理,使用中文和英文作为目标语言,并显示详细输出,利用 GPU 加速。

EasyOCR 为希望在其应用程序中集成 OCR 功能的开发者提供了强大的解决方案,具有广泛的语言支持、高精度以及可定制性。

近期热文:

15.6K Star功能超强!!!这个多设备屏幕共享神器太赞了
14.8K Star火爆全网!!!微软开源,一键翻新老照片
29.7K Star颜值极高!!!力荐下一代文件管理系统
15.1K Star极速快感!!!全平台下载的终极解决方案
36.2K Star颜值不错!!!再见Notion,全能型知识管理工具
继续滑动看下一个
开源日记
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存