百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 Paddle Inference 模型推理

发布日期：2023-05-19 09:24:08 来源：博客园

Paddle Inference 模型推理流程分别介绍文字检测、方向分类器和文字识别3个模型，基于Paddle Inference的推理过程。

Paddle Inference 的 Python 离线推理

离线推理，即在特定机器上部署的代码只能在这台机器上使用，无法通过其他机器进行访问

使用whl包预测推理

“WHL”是“WHeeL”的英文缩写,意思是“车轮” ，whl 格式本质上是一个压缩包,里面包含了py文件,以及经过编译的pyd文件为了更加方便快速体验OCR文本检测与识别模型，PaddleOCR提供了基于Paddle Inference预测引擎的whl包，方便您一键安装，体验PaddleOCR。

(资料图)

安装whl包

pip install paddleocr -i https://pypi.tuna.tsinghua.edu.cn/simple  --verbose

使用whl包预测推理

paddleocr whl包会自动下载PP-OCRv2超轻量模型作为默认模型，也支持自定义模型路径、预测配置等参数，参数名称与基于Paddle Inference的python预测中参数相同。

单独执行检测

import cv2import matplotlib.pyplot as pltimport numpy as npimport osfrom paddleocr import PaddleOCR, draw_ocrocr = PaddleOCR(use_gpu=False)  # need to run only once to download and load model into memoryimg_path = "./images/006.jpg"result = ocr.ocr(img_path, rec=False)for line in result:    print(line)# 显示结果from PIL import Imageimage = Image.open(img_path).convert("RGB")im_show = draw_ocr(image, result, txts=None, scores=None, font_path="./fonts/simfang.ttf")plt.figure(figsize=(15, 8))plt.imshow(im_show)plt.show()

单独执行识别

可以指定det=False，仅运行单独的识别模块。

import matplotlib.pyplot as pltfrom paddleocr import PaddleOCR, draw_ocrocr = PaddleOCR(use_gpu=False)  # need to run only once to download and load model into memoryimg_path = "./images/006.jpg"result = ocr.ocr(img_path, det=False)for line in result:    print(line)

单独执行方向分类器

可以指定det=False, rec=False, cls=True，仅运行方向分类器。

import cv2import matplotlib.pyplot as pltfrom paddleocr import PaddleOCR, draw_ocrocr = PaddleOCR(use_angle_cls=True, use_gpu=False)  # need to run only once to download and load model into memoryimg_path = "./images/006.jpg"result = ocr.ocr(img_path, det=False, rec=False, cls=True)for line in result:    print(line)img = cv2.imread(img_path)plt.imshow(img[...,::-1])plt.show()

全流程体验(检测+方向分类器+识别)

import cv2import osimport matplotlib.pyplot as pltfrom paddleocr import PaddleOCR, draw_ocr# PaddleOCR目前支持中英文、英文、法语、德语、韩语、日语，可以通过修改lang参数进行切换# 参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=False)  # need to run only once to download and load model into memorysave_results = []img_path = "images/003.jpg"save_dir = "ocr_result"result = ocr.ocr(img_path, cls=True)[0]# 将结果写入文件with open(        os.path.join(save_dir, "003_result.txt"),        "w",        encoding="utf-8") as f:    for line in result:        f.writelines(str(line)+"\n")        print(line)# 显示结果from PIL import Imageimage = Image.open(img_path).convert("RGB")boxes = [line[0] for line in result]txts = [line[1][0] for line in result]scores = [line[1][1] for line in result]im_show = draw_ocr(image, boxes, txts, scores, font_path="./fonts/simfang.ttf")cv2.imwrite(os.path.join(save_dir, "003_result.jpg"), im_show)plt.figure(figsize=(15, 8))plt.imshow(im_show)plt.show()

使用源码推理

下载源码，并解压：https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.6

安装依赖包

https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.6/requirements.txt将文件 requirements.txt 保存到运行目录下如 D:\OpenSource\PaddlePaddle\PaddleOCR-release-2.6

shapelyscikit-imageimgaugpyclipperlmdbtqdmnumpyvisualdlrapidfuzzopencv-python==4.6.0.66opencv-contrib-python==4.6.0.66cythonlxmlpremaileropenpyxlattrdictPolygon3lanms-neo==1.0.2PyMuPDF<1.21.0

安装运行所需要的包

D:\OpenSource\PaddlePaddle\PaddleOCR-release-2.6>pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple  --verboseD:\OpenSource\PaddlePaddle\PaddleOCR-release-2.6>pip install paddlenlp -i https://pypi.tuna.tsinghua.edu.cn/simple  --verbose

文字检测

PaddleOCR中，在基于文字检测模型进行推理时，需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir, 指定检测的 inference模型路径。百度OCR源码中提供了样例图片：https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.6/doc/imgs

准备数据和环境

import cv2import matplotlib.pyplot as pltimport numpy as npimport os# 选择2张图像可视化img1 = cv2.imread("doc/imgs/00006737.jpg")img2 = cv2.imread("doc/imgs/00056221.jpg")plt.figure(figsize=(15, 6))plt.subplot(1, 2, 1)  # 定义 1行2列plt.imshow(img1[:, :, ::-1])  # 第1列 放 img1 ，::-1 => axis 3 倒序plt.subplot(1, 2, 2)  # 定义 1行2列plt.imshow(img2[:, :, ::-1])  # 第2列 放 img1plt.show()

准备推理模型

下载模型：https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv3_det_infer.tar解压放至：inference目录如果您希望导出自己训练得到的模型，使用Paddle Inference部署，那么可以使用下面的命令将预训练模型使用动转静的方法，转化为推理模型。

# 参考代码# https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/tools/export_model.py# 下载预训练模型(V2)wget https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_det_distill_train.tar && tar -xf ch_PP-OCRv2_det_distill_train.tar && rm ch_PP-OCRv2_det_distill_train.tar# 导出推理模型(V2)python tools/export_model.py -c configs/det/ch_PP-OCRv2/ch_PP-OCRv2_det_cml.yml \    -o Global.pretrained_model="ch_PP-OCRv2_det_distill_train/best_accuracy" \    Global.save_inference_dir="./my_model"

文字检测模型推理

CMD 进到代码目录如图使用V3模型预测

# 预测 python tools/infer/predict_det.py --image_dir="./doc/imgs/00018069.jpg" --det_model_dir="./inference/ch_PP-OCRv3_det_infer" --use_gpu=False

输出

定义参数设置PaddleOCR-release-2.6\tools\infer\utility.py更多参数说明：doc\doc_ch\inference_args.md文字检测PaddleOCR-release-2.6\tools\infer\predict_det.py部分代码说明：https://aistudio.baidu.com/aistudio/projectdetail/6180758方向分类器模型推理

//TODO 现在还不知道这玩意具体是用来干嘛的。将角度不正确的文字处理成正常方向的https://www.paddlepaddle.org.cn/modelsDetail?modelId=17下载模型：https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar解压放至：inference目录

# 预测 python tools/infer/predict_cls.py \    --image_dir="./doc/imgs_words/ch/word_1.jpg" \    --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer" \    --use_gpu=False

方向分类器的具体实现代码: PaddleOCR-release-2.6\tools\infer\predict_cls.py

文字识别

https://www.paddlepaddle.org.cn/modelsDetail?modelId=17下载模型：https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar解压放至：inference目录

# 预测 python tools/infer/predict_rec.py \    --image_dir="./doc/imgs_words/ch/word_4.jpg" \    --rec_model_dir="./inference/ch_PP-OCRv3_rec_infer" \    --use_gpu=False

文字识别的具体代码：PaddleOCR-release-2.6\tools\infer\predict_rec.py

系统串联预测推理

在执行PP-OCR的系统推理时，需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir, cls_model_dir和 rec_model_dir分别指定检测、方向分类和识别的 inference模型路径。参数 use_angle_cls用于控制是否启用方向分类模型。use_mp表示是否使用多进程。total_process_num表示在使用多进程时的进程数。以图像文件 ./doc/imgs/00018069.jpg为例，预测的原始图像如下。

# 预测 python tools/infer/predict_system.py \    --image_dir="./doc/imgs/00018069.jpg" \    --det_model_dir="./inference/ch_PP-OCRv3_det_infer/" \    --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" \    --rec_model_dir="./inference/ch_PP-OCRv3_rec_infer/" \    --use_angle_cls=True

可视化识别结果默认保存到 ./inference_results文件夹里面。在图象中可视化出了检测框和识别结果，在上面的notebook中也打印出了具体的识别文件以及文件读取路径信息。

如果希望保存裁剪后的识别结果，可以将save_crop_res参数设置为True，最终结果保存在output目录下，其中部分裁剪后图像如下所示。保存的结果可以用于后续的识别模型标注与训练。

python tools/infer/predict_system.py \    --image_dir="./doc/imgs/00018069.jpg" \    --det_model_dir="./inference/ch_PP-OCRv3_det_infer/" \    --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" \    --rec_model_dir="./inference/ch_PP-OCRv3_rec_infer/" \    --use_angle_cls=True \    --save_crop_res=True

参考引用

PP-OCRv3文字检测识别系统PaddleOCR GithubPP-OCRv2预测部署实战代码中 v2 改 v3

标签：

上一篇:兰州：禁止酒店哄抬价格世界今亮点 下一篇:最后一页

百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 Paddle Inference 模型推理

百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 Paddle Inference 模型推理

PaddleInference模型推理流程分别介绍文字检测、方向分类器和文字识别3个模型，基于PaddleInference的推理

兰州：禁止酒店哄抬价格 世界今亮点

为营造良好的营商和旅游环境，维护消费者合法利益，该局召开宾馆、酒店行业价格提醒告诫会，要求经营者切实

不爱说话怎么办(不爱说话一般是性格的原因) 资讯推荐

有些人是话唠很喜欢说话，而有些人就是不爱说话，那么不爱说话怎么办？请看下文。

天天微速讯：如何在炉子上的平底锅中烹饪汉堡滑块_15岁男孩适合送什么生日礼物

你需要的东西滑块肉饼（每个约2盎司）盐胡椒抹刀滑块汉堡面包使用坚固的抹刀方便翻转。微型汉堡——或称...

sq从你的名字开始漫画在线阅读 sq从你的名字开始漫画-天天热点

今天来聊聊关于sq从你的名字开始漫画在线阅读，sq从你的名字开始漫画的文章，现在就为大家来简单介绍下sq从

焦点快播：尤文高管：阿莱格里让这赛季看起来几乎正常，他配得上称赞

在欧联杯半决赛次回合尤文客战塞维利亚的比赛开始前，斑马军团的首席足球官卡尔沃在采访中力挺球队主帅阿莱

年内首份研报罚单出炉：署名分析师因盈利预测论证不充分等情况遭警示

年内首份研报罚单出炉：署名分析师因盈利预测论证不充分等情况遭警示：据媒体，券商研报发布工作“严监...

天天头条：“金门历史文化专题讲座”福建漳州开讲

中新网漳州5月14日电(柯秋红)由福建漳州市金门同胞联谊会和漳州市图书馆共同主办的“金门历史文化专题讲座

北京，5.5G来了！

近日，位于北京市昌平区的国际信息港建设开通了北京地区首个5G-A（5GAdvanced）实验基站，并已完成5G-A实验

留学生反诈骗指南

国内首家中文网络媒体、79家中央新闻网站之一。内容涵盖国家公派留学、自费出国留学、国际教育、教育科技人

【热闻】德云社在怕什么？曹云金三管齐下，郭德纲有些疲于招架

曹云金看来是要熬出头了，线上直播场场爆满，线下商演已经排开了20场，作为一名相声演员，像这样流量和关注

今日关注：首钢技师学院毕业算什么学历（首钢技师学院）

1、是的，首钢技师学院始建于1954年，其前身为首钢技工学校，2009年6月被北京市政府批准成为全市五所技师学

肺出问题有什么症状(肺上有问题有什么症状有哪些) 世界今亮点

本文目录一览：1、肺病的症状有哪些2、肺上有问题有什么症状有哪些3、肺不好的人，身体会有哪些表现？肺

视焦点讯！昌吉州：加快推进“链式集群”发展观察

新疆昌吉回族自治州（以下简称昌吉州）聚焦自治区“八大产业集群”，锚定重点产业链，把传统产业做大做...

头条：互联网电商板块异动拉升 华凯易佰涨20%

观点网讯。5月18日午后，A股互联网电商板块异动拉升，华凯易佰涨20%，凯淳股份、吉宏股份、焦点科技、壹网

【世界播资讯】东芝推出具有更低导通电阻的小型化超薄封装共漏极MOSFET，适用于快充设备

中国上海，2023年5月18日——东芝电子元件及存储装置株式会社（“东芝”）今日宣布，推出额定电流为20A...

上海海湾国家森林公园可以飞无人机吗 全球快看点

上海海湾国家森林公园可以飞无人机吗?答：不可以。上海海湾国家森林公园禁止非无人机、禁止携带代步工具、

福岛民众的坚决抗议，日本政府这样装作“听不见”

编者的话：5月19日，七国集团（G7）峰会将在日本首相岸田文雄的老家、世界上第一个遭受原子弹打击的城市广

【预告】企业所得税相关优惠政策等多场培训，欢迎报名参加 世界独家

天津税务尊敬的纳税人缴费人：为帮助您及时了解、学习最新税费政策及办税操作指引，天津市税务局开办【纳税

谷歌联合 8 家机构，在美国推进 20 Gig 光纤宽带项目落地

根据谷歌Fiber官方发布的公告，正寻觅8家企业、非营利组织、教育机构，在美国Austin、Huntsville、Raleigh-

种草莓的技巧该怎么吸视频_种草莓的技巧该怎么吸-今日快看

1、想象自己在吸奶，吸不出来。2、其实草莓吸的越痛，吸的越深。有办法的。你应该用嘴吸。慢慢吸。3、吸气

呼和浩特：幼升小信息采集 这些事项要知

2023年呼和浩特市幼升小入学信息采集工作已经于5月1日开始，半个月过去了，教育管理部门总结了家长们的一些

【环球新要闻】《深圳市技工院校办学水平评估办法》发布 得分领先院校可获优先支持

读特客户端·深圳新闻网2023年5月18日讯（深圳特区报记者樊怡君）记者从最新一期市政府公报获悉，《深圳市

全球热头条丨吉林化纤05月17日获深股通增持130.81万股

05月17日，吉林化纤获深股通增持130 81万股，最新持股量为1093 54万股，占公司A股总股本的0 44%。

环球热推荐：微软(MSFT.US)CEO分享对AI担忧 称社会必须团结一致

微软(MSFT US)首席执行官纳德拉在一次媒体采访中谈到了他对人工智能的担忧

中国奢饰品市场数据分析： 55.3%男性的消费者会选择皮带类奢侈品

银行保函是什么需要怎么办理_银行保函办理流程-全球时讯

宁波新房、二手房价环比涨幅双双缩窄 但两者分化严重|世界微头条

c#构建具有用户认证与管理的socks5代理服务端

OPPO造芯的局散了，这些大佬也要重新找工作了_世界热头条

艾融软件董事长张岩：快速响应客户需求 决定在八城新设分公司

科乐美起诉Cygames旗下人气游戏《赛马娘》侵犯专利权-全球热头条

Mysteel解读：5月，白羽肉鸡各环节走势均陷困局

汇通菜鸟快递单查询_汇通菜鸟单号查询

龙岗区2023年和2024年义务教育阶段学位申请资料准备指引|环球实时

环球微资讯！ai路径上文字怎么设置_AI路径文字建立后怎么调整

蕾奥规划（300989）：该股换手率大于8%（05-17）

系统教程篇：Foxmail出现Status3远程系统拒绝网络连接怎么办

天天看点：心理学类专业大学（心理学类专业）

天天微动态丨鹰潭将环保理念带进童心

全球视讯！在2023年特斯拉股东大会上，马斯克释放了哪些信息？

全球新资讯：总盯着百姓的口袋，专家又提燃油车禁售时间表

每日热讯!长青中国白镜亮：做公益和做工作相同，贵在用心与坚持

热讯：人民日报钟声：做经济胁迫的同谋和帮凶害人害己

茶叶妙用_茶叶妙用是什么_天天即时

招商银行商务卡额度

国米队史第6次晋级欧冠决赛，此前5次夺得3冠_当前简讯

全球快资讯：Python学习之十三_pip的学习

桥架型号

浙江：义新欧班列金东平台至中亚五国双向对开满千列

中超第7轮跑动榜：莫伊塞斯高居榜首，周定洋连续4轮进前五|焦点快播

每日观察!加拿大4月通胀率略有上升

麻省理工大学世界排名（新加坡麻省理工大学世界排名）

宁德时代与中国农业银行签署银企战略合作协议_世界微头条

兰州：禁止酒店哄抬价格世界今亮点

头条：互联网电商板块异动拉升华凯易佰涨20%

上海海湾国家森林公园可以飞无人机吗全球快看点

【预告】企业所得税相关优惠政策等多场培训，欢迎报名参加世界独家

呼和浩特：幼升小信息采集这些事项要知

【环球新要闻】《深圳市技工院校办学水平评估办法》发布得分领先院校可获优先支持

环球热推荐：微软(MSFT.US)CEO分享对AI担忧称社会必须团结一致

宁波新房、二手房价环比涨幅双双缩窄但两者分化严重|世界微头条

艾融软件董事长张岩：快速响应客户需求决定在八城新设分公司

世界热消息：夏日赏春花醉美霍林河

*ST炼石（000697）5月16日11点23分触及跌停板天天即时

男童在客房误食安全套，妈妈吓哭，担心被感染艾滋病毒每日头条

七巧板的由来和历史七巧板的由来简介

盈盛控股乔迎宾：不显山露水潜心打造“智能办公”

中沃防火门马忠良：前半生守国门后半生护家门

港股异动 | 信达生物(01801)升7% mazdutide III期临床完成首例给药招商大幅上调公司目标价

陕西建工：2022年累计实现营收1895亿元前沿资讯