Azure×AI技術で実現する高精度OCRパイプライン
手作業データ入力を96%超精度の自動化で業務効率化

プロジェクト目的
社内業務データの手作業入力コストを削減し、迅速で正確なデータ活用を実現するために、生成AI×OCRの専門性を持つパートナーを探していた。
株式会社ファブリカコミュニケーションズ様は、データ分析・活用業務に不可欠な各種業務データを活用されていましたが、データは紙媒体資料でのみ提供されており、全てのデータ化作業を手作業で実施されていました。
この手作業によるデータ入力は高いコストがかかり、タイムリーなデータ活用を阻害する課題となっていました。また、データの鮮度向上と迅速な分析を可能にする自動化システムの構築により、競争力強化と収益向上に繋げたいというニーズがありました。
弊社の高度なAI技術とAzure環境での豊富な実装経験をご評価いただき、OCR自動化システムの構築をご依頼いただきました。
支援内容
Azure上での高精度AI OCRパイプライン構築と内製化支援
複数カテゴリのデータ形式に対応した最大26項目の自動抽出システムを開発
複雑な表形式データの認識には、単純なOCRでは限界があるため、Microsoft Azure の先進的なAIサービスを組み合わせた多段階処理パイプラインを設計・開発しました。
お客様が自社でシステムを運用・改善できる体制構築を重視し、詳細な技術移転と運用手順書の提供も併せて実施しました。
[ 実際の支援内容 ]
・Azure Document Intelligence カスタムモデル開発: データ形式別分類モデル(精度100%)と抽出モデルの構築・学習
・Azure Custom Vision 画像分類モデル開発: OCRが困難な項目の高精度分類システム
・Azure OpenAI GPT-4o 後処理システム: グレード推定、値補完、データ正規化の自動化
・ベクトル検索システム構築: マスターデータからの効率的なメーカー・車名マッチング機能
・表構造補正アルゴリズム開発: 行・列ずれの自動検出と補正による精度向上
・Azure Container Apps バッチ処理環境: 月次自動実行とスケーラブルな処理基盤
・Cosmos DB データベース設計: OCR結果とconfidence score管理の最適化
・継続的改善フレームワーク: 学習データ自動収集とアノテーション優先度付けシステム
結果
96%超の高精度を実現し、手作業コストを大幅削減 353ページを1時間40分で処理する高速自動化システムを構築
複数のAI技術を組み合わせたマルチモーダル処理により、従来困難とされていた複雑な表形式データの高精度認識を実現しました。
[ 関連技術キーワード ]
OCR、Document Intelligence、Custom Vision、GPT-4o、ベクトル検索、Azure Container Apps、マルチモーダルAI、表構造認識
[ 定量的成果 ]
データタイプA: 平均精度 96.8%(25項目対応)
データタイプB: 平均精度 97.1%(26項目対応)
データタイプC: 平均精度 96.8%(26項目対応)
処理速度: 353ページを1時間40分で処理
コスト効率: 月額変動費 $58.6
自動化率: 手作業修正が必要な項目は全体の約12-16%のみ
[ 技術的成果 ]
マルチモーダル処理(OCR + 画像分類)による精度向上
表構造の自動補正技術による認識率向上
Confidence Score活用による効率的な品質管理フロー
継続的改善のための学習データ自動収集システム

お客様の声
データ入力業務の自動化により、より戦略的な業務にリソースを集中できるようになりました。96%を超える高精度により、手作業での確認工数も最小限に抑えられています。

【ご担当者様の声】
これまで社内業務データの入力作業に多大な時間とコストをかけていましたが、LeapWellさんのAI OCRシステム導入により、業務効率が劇的に改善されました。
特に印象的だったのは、単純なOCRではなく、Document Intelligence、Custom Vision、GPT-4oなど複数のAI技術を組み合わせることで、我々が想像していた以上の高精度を実現していただけた点です。異なるデータ形式にも対応し、96%を超える精度を達成できたのは驚きでした。
また、Azure上でのシステム構築により、将来的な拡張性やコスト最適化も考慮されており、長期的な運用面でも安心できる設計になっています。詳細な技術移転により、社内でのシステム改善や運用も可能になり、継続的な精度向上を図ることができています。
データ入力作業から解放されたことで、社員がより戦略的なデータ分析や業務改善に集中できるようになり、結果として事業競争力の向上にも繋がっています。
今後の展望
今回構築したOCR自動化システムは、社内業務データ処理の効率化における重要な基盤となりました。
継続的な精度向上のための学習データ蓄積フレームワークや、他の帳票類への展開可能性など、
さらなる業務自動化とDX推進に向けて、LeapWellが引き続きご支援できることがあると考えております。
高精度なAI技術による業務自動化を通じて、貴社のさらなる競争力強化と収益向上に貢献できれば幸いです。