フランスの AI スタートアップ Mistral AI は 2025 年 5 月 22 日、企業向けの文書処理ツール「 Document AI 」を発表しました。これは従来の文字読み取り技術を大幅に進歩させ、様々な文書から情報を自動で抽出できる画期的なサービスです。
Document AI の最大の特徴は、単なる文字の読み取りにとどまらないことです。文書全体の構造や意味まで理解し、レシートや契約書、手書きメモ、 PDF ファイル、表、グラフなど多様な形式から正確に情報を取り出すことができます。抽出した情報は、後で使いやすいように JSON や Markdown といった形式で整理して出力されます。
処理速度の面でも業界最高水準を実現しており、 1 分間に最大 2,000 ページを処理できます。これは Google Document AI の 1,800 ページ、 Microsoft Azure OCR の 600 ページを上回る性能です。大量の文書を扱う企業にとって、作業時間の大幅な短縮が期待できます。
精度については、英語文書で 94.89% という高い認識率を記録し、 Google Document AI の 83.42% や Microsoft Azure OCR の 89.52% を大きく上回っています。特に多言語処理では 99.02% という更に高い精度を達成しており、世界中の様々な言語で書かれた文書に対応できます。
対応言語は 40 以上で、日本語、英語、中国語、ヒンディー語、アラビア語、ロシア語、フランス語など幅広い言語をカバーしています。ただし、現時点では日本語の手書き文字については認識精度が 72.3% と他の言語より低く、改善の余地があることが指摘されています。
料金設定も競合他社と比べて非常に安く設定されており、通常利用で 1,000 ページあたり 1 ドル(約 145 円)、大量処理では 2,000 ページあたり 1 ドル(約 145 円)となっています。 AWS Textract などの競合サービスと比較すると大幅に低コストで利用できます。
企業向けの機能として、自社のサーバー内やプライベートクラウドでの運用が可能で、金融や医療業界など厳格なデータ管理が求められる分野でも安心して使用できます。また、 EU のデータ保護規則に準拠した設計となっており、プライバシーを重視する企業にとって大きな魅力となっています。
技術的な特徴として、個別の要素(表、図、署名など)を識別する機能と、文書全体の構造を把握する機能を備えており、企業の業務に合わせて柔軟に情報を抽出できます。さらに、科学論文に含まれる複雑な数式も正確に読み取ることができ、研究機関での利用も期待されています。
Mistral AI は同日、アブダビのテクノロジー企業 G42 との戦略的パートナーシップも発表しており、今後のサービス拡充と市場展開が加速される見通しです。
Document AI は現在、 Mistral AI の開発者向けプラットフォーム「 la Plateforme 」で利用可能で、近日中に AWS 、 Azure 、 Google Cloud などの主要クラウドサービスでも提供される予定です。政府機関、エネルギー、研究、法務など大量の文書を扱う組織にとって、業務効率化の強力なツールとなることが期待されています。