仏 H Company 、ウェブブラウジング AI 「 Holo1 」をオープンソースで公開

投稿者:

パリを拠点とする AI スタートアップ H Company は 2025 年 6 月、ウェブブラウジング AI エージェント「 Surfer H 」の中核となる「アクションモデル」 Holo1 をオープンソースで公開しました。同社は 2024 年に 2 億 2,000 万ドル(約 318 億円)という歴史的なシードラウンドで注目を集めた企業で、元 DeepMind の研究者が創業メンバーに名を連ねています。

Holo1 は、画像と言語を組み合わせてウェブ上の操作を自律的に実行できる「アクション VLM ( Vision-Language Model )」です。人間のようにウェブ画面を見て、クリックや入力などの操作を自動で行えることが特徴で、業界標準ベンチマーク WebVoyager で 92.2 %のスコアを記録しています。これは OpenAI の Operator ( 87 %)や Google の Project Mariner ( 90.5 %)を上回るトップランクの性能です。

技術的には、 Alibaba Cloud の Qwen 2.5-VL-Instruct をベースに、 H Company 独自のデータと訓練技術で改良されています。従来の AI がウェブサイトの HTML コード(技術的な構造情報)を読み取って操作していたのに対し、 Holo1 は人間と同じように画面を「見て」判断します。スクリーンショットだけで「ここにボタンがある」「ここをクリックすれば良い」と視覚的に理解し、クリックや文字入力などの操作を実行できる画期的な仕組みです。

Holo1 を搭載したウェブブラウジングエージェント「 Surfer H 」は、企業情報の検索や求人情報の収集など、複雑なウェブタスクを自動で実行します。特に注目すべきは、 1 回のフルブラウジングフローが 0.11 ~ 0.13 ドル(約 16 ~ 19 円)で実行可能という圧倒的なコスト効率です。同等の精度を持つ競合よりも平均 5.5 倍安価とされています。

H Company は Holo1 と併せて、 30,000 エピソードの「 WebClick 」データセットもオープンソース化しています。これは、人間がウェブサイトをどのように操作するかを詳細に記録したデータで、どのボタンをクリックし、どんな結果が得られたかが詳細に記録されています。このデータを使うことで、 AI は人間のようなウェブ操作を学習でき、誰でもこれらのリソースを利用して独自のウェブ自動化システムを開発できるようになっています。

同社は現在、パリとロンドンに 70 名以上のチームを持ち、米国への進出も計画中です。 Holo1 と Surfer H 以外にも、企業向けのワークフロー自動化ツール「 Runner H 」や、 QA エンジニア向けのノーコード自動化ツール「 Tester H 」も提供しており、エージェント技術の実用化を幅広く進めています。

この技術は「 LLM はアシスタントからオペレーターへ」というトレンドを象徴しており、単なる会話型 AI ではなく、自律的に行動するエージェントとしての進化を示しています。 API 依存のソリューションとは異なり、ウェブインターフェースと直接対話するため、カスタム統合なしでどんなウェブサイトでも柔軟かつ低コストで自動化を実現できる点が大きな強みです。

H Company は世界トップクラスのウェブブラウジング AI エージェントをオープンソースで公開することで、精度・コスト効率・汎用性で業界をリードし、今後 RPA や情報収集、業務自動化の分野で大きなインパクトを与えることが期待されています。