AI OCR検討・導入企業必見!Irwin&Co、不規則なPDFも精度99.9%でデータを抽出する「AI PDF構造化技術」を正式リリース

—データ入力業務の真の自動化を実現

2026年01月06日
PR TIMES で見る
AI PDF 構造化技術 - 不規則なPDFも精度99.9%でデータ抽出

Irwin&Co株式会社(所在地:東京都渋谷区)は、生成AIを活用し、不規則なPDFデータから精度99.9%で情報を抽出する「AI PDF構造化技術」を正式にリリースしたことをお知らせいたします。

背景 — 「OCRの目視チェック」という課題を解消

不動産マイソク(販売図面)、登記簿謄本、各種帳票など、非定型フォーマットのPDFデータをデジタル化する際、従来のAI OCR技術では誤読が避けられず、最終的な「目視チェックと手修正」に多大な工数がかかっていました。

Irwin&Coは、この課題を根本から解決するため、単なる文字認識(OCR)ではなく、ファイル内部の構造を直接解析する独自の「構造化技術」を開発しました。

精度99.9%を実現する3つのプロセス

本システムは、投入されたファイルに対して以下の3段階のプロセスを自動で実行します。

(1) ファイル判別

投入されたファイルが「テキストデータを保持したPDF」か「スキャンデータ(画像)」かを瞬時に判断し、最適な解析ルートへ振り分けます。

(2) 構造化技術による読み取り(全体の99%)

テキストデータを保持しているファイルに対して、データ内部のテキスト構造を直接解析します。これにより、従来のOCRでは困難だった複雑なレイアウトでも、約100%の精度で情報を抽出します。

(3) OCR技術による読み取り(全体の1%)

スキャンデータ(画像データ)に対しては、従来のOCR技術を用いて読み取りを行います。精度は90%程度となりますが、構造化技術と組み合わせることで、全体として99.9%という驚異的な精度を実現しています。

主な活用シーン

  • 不動産業界:マイソク(販売図面)からの物件情報自動抽出、登記簿謄本のデータ化
  • 金融・法務:契約書、決算書、請求書などの大量の書類データ化
  • 製造・流通:納品書、発注書などの非定型帳票の入力自動化

「導入するだけのAI」から「成果を出すAI」へ

Irwin&Co株式会社は、「成果を出すAI」を理念に掲げ、生成AIを活用した受託開発を主力事業として展開しています。本技術を通じて、企業のDX(デジタルトランスフォーメーション)を強力に支援してまいります。

会社概要

会社名

Irwin&Co株式会社

代表取締役

アーウィン 海

所在地

東京都渋谷区円山町5丁目5号 Navi Shibuya・V 3階