Perplexityは、中国のDeepSeekが開発した推論モデル(R1)をベースに、検閲機能を排除した新たな大規模言語モデル「R1 1776」をオープンソースとして公開しました。このモデルは、DeepSeek R1の優れた推論能力を維持しながら、中国政府による検閲の影響を受けないよう設計されています。
R1 1776の開発にあたって、Perplexityは約300件の検閲対象トピックを特定し、それらに対して事実に基づいた回答を生成できるよう、改良を重ねました。具体的には、4万件以上の多言語プロンプトを含むデータセットを構築し、NVIDIAのNeMo 2.0フレームワークを活用して再学習を実施。これにより、天安門事件や台湾独立といった政治的なトピックについても、バイアスのない情報提供が可能となっています。
興味深いことに、R1 1776という名称は、アメリカ独立宣言が発表された1776年に由来しており、情報アクセスの自由を象徴しています。Perplexityは、このモデルをMITライセンスの下でオープンソース化することで、開発者や研究者が自由にカスタマイズや活用できる環境を整えました。
現在、R1 1776はHugging FaceのレポジトリやSonar APIを通じて利用可能となっています。元のDeepSeek R1が持っていた高い推論能力を損なうことなく検閲を解除できたことは、AIの透明性と情報の自由な流通という観点で、重要な一歩となりそうです。
筆者の視点:Perplexityは、すでに自社のサービスの中にR1の検閲を排除したモデルを組み込んでおり、今回それをオープンソースで公開しました。これにより、R1を使いたくても自社システムに組み込むことを躊躇していた企業にとっては自社で手間をかける必要がなくなり、大変助かると思います。今後R1を組み入れる企業やサービスが増えていくと思われます。