Microsoft、小型言語モデルの可能性を再定義するPhi-3ファミリーを発表

投稿者:

Microsoftが新しい言語AIモデルファミリー「Phi-3」を発表しました。Phi-3は、小型でありながら高性能で、コスト効率に優れています。Microsoftはそれを「SLMs(Small Language Models)」と呼んでいます。

最初にリリースされたPhi-3-mini(3.8B)は、言語理解、推論、コーディング、数学など様々なタスクで、大きなモデルを上回る性能を示しています。最大128Kトークンという長い文脈を処理できるのも特徴です。Phi-3-miniは、ONNX RuntimeとNVIDIA GPUに最適化されており、Azure AI Studio、Hugging Face、Ollamaといったプラットフォームで利用可能です。

近日中に、Phi-3-small(7B)とPhi-3-medium(14B)がリリースされる予定で、さらに品質とコストのオプションが広がります。Phi-3モデルは、GPT-3.5Tのような大型モデルと比べても、多くのタスクで一貫して優れた性能を発揮します。ただし、サイズが小さいため、事実に関する知識では少し見劣りする可能性があります。

Phi-3の開発には、Microsoftが独自に定める「責任あるAI標準(Responsible AI Standard)」が適用され、安全性、公平性、包括性が重視されています。厳格な評価、人間のフィードバックを用いた強化学習、有害な発言の削減などの様々なプロセスを経て、信頼性の高いモデルに仕上げているとされています。

Phi-3の主な利点は、リソース効率の高さ、高速性、アクセシビリティ、推論能力です。小型サイズのため、計算リソースが限られた環境やスマートフォンでの使用に適しており、コストを抑えられます。また、レスポンスが素早いので、リアルタイム性が求められるタスクにも向いています。微調整やカスタマイズも、より簡単で少ない予算で行えます。例えば、インドのITCでは、Phi-3を同社が提供する農業支援アプリ「Krishi Mitra」に組み込み、インターネットが限られた状況でも、農家にAIによる効率的なサポートを提供することに成功しています。

Microsoftは、適切なトレーニングデータと技術を用いれば、小型言語モデルでも大きなモデルに匹敵する性能を発揮できることを示しました。特にPhi-3-miniの高い性能は、スマートフォンでも高性能なAIが動作する可能性を開くものであり、大きな飛躍と言えるでしょう。