OpenAIが開発者向けに新機能を発表、推論特化型モデル「o1」のAPIを公開

OpenAIは、2024年12月18日に開催したライブストリームイベント「12 Days of OpenAI」の9日目で、開発者向けの新機能を発表しました。9日目の発表は「Mini Dev Day」と位置付けられ、開発者向けの発表に終始しています。

はじめに、最新の推論特化型AIモデル「o1」のAPIが正式に公開されました。このo1モデルは、外部APIやデータへのスムーズな接続、JSONスキーマに準拠した安定した出力生成、トーンやスタイルの指示の反映、さらには画像を活用した推論、といった新機能を備えています。これにより、科学、製造、コード解析など多岐にわたる分野での活用が期待されています。

さらに、リアルタイムでの音声・テキスト対話を可能にする「Realtime API」も大規模なアップデートが行われました。これにより、WebRTCへの対応、低遅延化、コスト削減、セッションの延長、開発者向け制御機能の強化が実現されています。このアップデートにより、音声アシスタント、ライブ翻訳ツール、仮想チューター、顧客サポートデスクなど、リアルタイム性が求められるアプリケーションの開発が一層容易になりました。

また、新たな微調整手法である「Preference Fine-Tuning」も導入されています。この手法により、開発者はモデルのトーンやスタイルをより詳細に制御できるようになります。これにより、ユーザーのニーズに応じた応答の生成や、特定の用途に最適化されたモデルの構築が可能になります。

OpenAIは、これらのアップデートにより、開発者により強力で柔軟なツールを提供し、OpenAIのモデルを活用したAIアプリケーションの開発を加速させることを目指しています。特に、o1モデルの高度な推論能力とRealtime APIの低遅延性は、複雑なタスクやリアルタイム性が求められるシナリオでの活用が期待されます。

今後、AI開発の主戦場は、チップや基盤モデルそのものではなく、基盤モデルを活用して多様な実生活のニーズに応える専用アプリケーションの開発へと移行していくと考えられます。こうしたアプリケーションの背後で稼働するモデルとしてOpenAIのモデルが選ばれるよう、今後も改良が続けられるものと思われます。