Perplexity AI、高速処理と高精度を両立した新モデル「Sonar」を発表

Perplexity AIが、1秒あたり1,200トークンという驚異的な処理速度を実現する新しいAIモデル「Sonar」を発表しました。MetaのLlama 3.3 70Bをベースに開発されたこのモデルは、従来のトップモデルと同等以上の精度を維持しながら、処理速度で約10倍の性能を発揮しています。

Sonarの開発には、Cerebras Systemsの最先端AI推論インフラストラクチャが活用されています。同社のWafer Scale Engine（WSE）と呼ばれる特殊なハードウェアにより、従来のプロセッサを遥かに超えた処理速度を実現しました。

Perplexityの内部テストでは、SonarはGPT-4o miniやClaude 3.5 Haikuといった同等クラスの軽量モデルを大きく上回り、さらにGPT-4oやClaude 3.5 Sonnetなどのより大きなパラメーターを持ったトップモデルに匹敵、あるいはそれ以上の性能を示しています。特に事実の正確さと回答の読みやすさの面で高い評価を得ています。

コスト面でも、入力トークンは100万トークンあたり3ドル、出力トークンは100万トークンあたり15ドルと、高い効率性を実現。1,000回の検索あたり5ドルという価格になり、より多くのユーザーが高度なAI検索体験を利用できるようになります。

Sonarは2025年2月11日からPerplexity Proの有料サービス加入者向けに提供が開始されており、ユーザーは設定でデフォルトモデルとして選択することができます。

また、PerplexityはSonarの機能をさらに拡張する計画も明らかにしており、「Voice Mode」という音声対応機能の開発も進めています。これにより、リアルタイムでの音声による情報提供を無料で行うことを目指しています。

筆者の視点：Perplexityが肝心の検索機能に関するアップデートを発表しました。最近はAI検索のサービスが乱立し、Perplexityの優位性が揺らいできていますので、（ショッピングや広告などの周辺機能ではなく）ぜひ本業の「検索」部分に関して、より正確で満足感のある検索体験ができるようなアップデートを次々発表してもらいたいと思います。