hans/wt_ocr_and_docker

紹介

PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。

📣 最新アップデート

🔥2022.8.24 リリース PaddleOCR release/2.6
- PP-Structurev2がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、レイアウトの復旧さらに1 行のコマンドをPDFへ転換、そして Wordに変換可能。
- レイアウト分析の最適化：モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
- 表認識最適化：3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
- キー情報抽出最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
🔥2022.7 リリース OCR scene application collection
- デジタルチューブ、液晶画面、ナンバープレート、手書き認識モデル、高精度 SVTR モデルなど、9つの垂直モデルをリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
🔥2022.5.9 リリース PaddleOCR release/2.5
- PP-OCRv3リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
- PPOCRLabelv2リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
- インタラクティブな電子書籍 "OCR に没入"、をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
もっと

🌟 PaddleOCRとは？

PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション PP-OCR や PP-Structure を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。

⚡ 今すぐトライアル

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr

Python環境がない場合は環境の準備に従ってください。チュートリアルから始めることをお勧めします。

📚 電子書籍：OCRに入る

OCRに没入

👫コミュニティー

他国の開発者の方は PaddleOCR Discussions を国際的なコミュニティプラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。

🛠️ シリーズモデル式一覧

モデル紹介	モデル名	推奨のシーン	検出モデル	認識モデル
日本語超軽量 PP-OCRv3 モデル(14.8M)	japan_PP-OCRv3_xx	モバイル & サーバー	推論モデル/トレーニングモデル	推論モデル/トレーニングモデル
英語超軽量PP-OCRv3モデル（13.4M）	en_PP-OCRv3_xx	モバイル & サーバー	推論モデル / トレーニングモデル	推論モデル / トレーニングモデル
中国語と英語の超軽量 PP-OCRv3 モデル（16.2M）	ch_PP-OCRv3_xx	モバイル & サーバー	推論モデル / トレーニングモデル	推論モデル / トレーニングモデル