AI OCR検討・導入企業必見!Irwin&Co、不規則なPDFも精度99.9%でデータを抽出する「AI PDF構造化技術」を正式リリース
—データ入力業務の真の自動化を実現
2026年01月06日
PR TIMES で見るIrwin&Co株式会社(所在地:東京都渋谷区)は、生成AIを活用し、不規則なPDFデータから精度99.9%で情報を抽出する「AI PDF構造化技術」を正式にリリースしたことをお知らせいたします。
背景 — 「OCRの目視チェック」という課題を解消
不動産マイソク(販売図面)、登記簿謄本、各種帳票など、非定型フォーマットのPDFデータをデジタル化する際、従来のAI OCR技術では誤読が避けられず、最終的な「目視チェックと手修正」に多大な工数がかかっていました。
Irwin&Coは、この課題を根本から解決するため、単なる文字認識(OCR)ではなく、ファイル内部の構造を直接解析する独自の「構造化技術」を開発しました。
精度99.9%を実現する3つのプロセス
本システムは、投入されたファイルに対して以下の3段階のプロセスを自動で実行します。
(1) ファイル判別
投入されたファイルが「テキストデータを保持したPDF」か「スキャンデータ(画像)」かを瞬時に判断し、最適な解析ルートへ振り分けます。
(2) 構造化技術による読み取り(全体の99%)
テキストデータを保持しているファイルに対して、データ内部のテキスト構造を直接解析します。これにより、従来のOCRでは困難だった複雑なレイアウトでも、約100%の精度で情報を抽出します。
(3) OCR技術による読み取り(全体の1%)
スキャンデータ(画像データ)に対しては、従来のOCR技術を用いて読み取りを行います。精度は90%程度となりますが、構造化技術と組み合わせることで、全体として99.9%という驚異的な精度を実現しています。
主な活用シーン
- 不動産業界:マイソク(販売図面)からの物件情報自動抽出、登記簿謄本のデータ化
- 金融・法務:契約書、決算書、請求書などの大量の書類データ化
- 製造・流通:納品書、発注書などの非定型帳票の入力自動化
「導入するだけのAI」から「成果を出すAI」へ
Irwin&Co株式会社は、「成果を出すAI」を理念に掲げ、生成AIを活用した受託開発を主力事業として展開しています。本技術を通じて、企業のDX(デジタルトランスフォーメーション)を強力に支援してまいります。