
近日,百度文心负责发布新一代OCR模子PP-OCRv6,一次性推出Tiny、Small、Medium三档模子,因循 50 多种说话,袒护浏览器端、镶嵌式配置到劳动器等主流场景。公开服从裸露,PP-OCRv6再次刷新OCR规模评测记载,轮廓性能位居天下第一。
其中,PP-OCRv6 Tiny的尺寸仅1.5MB,可径直部署于土产货浏览器环境,单图瞻望最快仅需 97 毫秒。用户数据无需上传云霄即可完成OCR处理,在保险隐痛安全的同期,大幅缩小部署门槛。有斥地者评价,PP-OCRv6可能是天下独一可在浏览器环境开动的高精度OCR模子,一区二区欧美日韩高清免费为 Agent 装上一对眼睛,简略在智能办公、教授、工业等场景提供愈加轻量、高效的视觉感知才气。
在性能方面,PP-OCRv6在保捏轻量化上风的同期进一步耕作识别精度和推理速率,轮廓性能权臣增强。PP-OCRv6在文本检测和文本识别任务均永诀得回86.2和83.2的获利,双双刷新此前由PP-OCRv5保捏的OCR规模最好水平,欧美va视频网站永久免费观看合座分解最初于Qwen3-VL-235B、GPT-5.5、Gemini-3.1-Pro等国表里主流多模态大模子,在OCR专科任务上展现出更强竞争力。

手脚文心大模子多模态才气的遑急构成部分,PP-OCR系列比年来捏续鼓吹文本检测与识别时间升级,先后推出PP-OCRv1至PP-OCRv6等多个版块。当今,PP-OCR系列地方的PaddleOCR技俩已因循超110种说话识别,劳动袒护天下170多个国度和地区。
凭借轻量化、高精度等特色,PP-OCR系列已被鲁莽集成至UmiOCR、MinerU、TurboOCR等业界OCR器用链中,并期骗于文档通晓、数据处理、常识库构建等场景,成为斥地者和企业常用的开源OCR责罚决议之一;同期,PP-OCR系列也成为各大模子团队开展数据预处理、文档通晓和常识索取的遑急器用,为模子张望与期骗落地提供因循。在GitHub上,PaddleOCR的Star数目已陡立8.22万,朝上谷歌旗下开源OCR标杆居品Tesseract OCR,成为天下最受眷注的开源OCR技俩之一。
当今,PP-OCRv6 已上线 PaddleOCR 官网,用户可通过网页或API阵势快速使用,代码和模子权重也已开源至Github 和 HuggingFace,劳动稠密用户下载和使用。


