AIブラウザは、AIエージェント時代の覇者としての可能性を秘めている。
日々凄まじい勢いで進化する生成AI。直近のトレンドは"AIエージェント"。各社が開発と研究に勤しんでいます。私もPdMやデザイナー、リサーチとしてその開発に携わる1人です。エージェント開発現場の視点から、業界の動向と、AI各社にあり得る負け筋 / 勝ち筋をシェアします。
AI大好きデザイナーPdMの吉永です。
本メルマガでは、AI製品開発の現場で働くPdMおよびUXデザイナー・リサーチャーの視点から、AIトレンドについての情報を発信します。
”AIエージェント”
最近、AI開発の現場ではAIエージェントという言葉がそこかしこで飛び交っています。どの会社も、現在進行系でエージェント構築に勤しんでいるようです。
その理由の1つは、AIエージェントを開発するコストが大幅に下がっていることにあります。非エンジニアの私でも、ChatGPTと一緒に多少頑張れば作れそうなほどに。
環境が整ったがゆえの疑問
OpenAIのAgent SDKやGoogleのVertex AI Agent Builder、OSSのAgno、Langmanusなど開発環境が整ってきただけでなく、MCPという、LLMによる外部ツール利用のための規格が生まれAIエージェントの能力拡張が飛躍的に簡単になりました。
MCPを使えば、今やメールにもカレンダーにも、FigmaやGithubのような専門的なツールにだって簡単にLLMに接続することが出来ます。
誰でも便利なエージェントを構築でき、アイデア次第の世界。AI製品の開発者にとっては天国のような状況ですが、さて、いざAIエージェントを作ろうとすると、つい気になってしまうことがあります。
それは、どんなAIエージェントなら、来たる(既に来ている?)AIエージェント戦国時代を生き残れるだろう?ということです。
AIに勝者はまだない
現在のAI市場には、まだ明確な勝者はいません。以前は圧倒的に見えたOpenAIも、最近はGoogleの追随を受けLLMのベンチマークテストでGeminiを下回ることも多くなりました。
また、著名LLM(特にChatGPT)はまだ商業的に赤字であり、世界を変えつつあるものの完全に成功したとは言えません。Googleでさえ、Google検索を強化し「AIオーバービュー」の実装により間接的に収益貢献したに留まり、唯一の勝者はGPUを得意とする半導体メーカー(NVIDIA, TSMCなど)だけです。
さらに、少し視点を変えてみると、戦場は既にLLMの戦いではなくアプリケーションの戦いに移っています。
AIアプリケーション、
汎用か、特化か。
LLMからAIエージェントに視点を移してみると、一口にAIエージェントと言っても様々で、その像が人によってバラバラなのが現状です。
そこで、理解しやすくするために以下では①タスク型、②特化型、③汎用型の3種に分けてみます。どれもある程度自律的に動くことは共通していますが、その業務範囲が異なります。
①タスク型AIエージェント
従来、教科書的なAIエージェントはいわゆる「弱いAI」と呼ばれました。ある特定の1タスクにのみ能力を発揮するものを指します。タスク型AIエージェントとでも呼称しましょう。
タスク型AIエージェントの例👇
顧客の発話データ分析AI
契約書レビューAI
メール作成AI
②特化型AIエージェント
そういったタスク型AIエージェントを含め、より広範なツールを駆使して特定ドメインやコンテキストの広い業務を出来るようにすることもできます。これが特化型AIエージェントです。
特化型AIエージェントの例👇
顧客インタビューを様々な手法で分析・レポートするAI
契約書の受取・処理・レビュー・やりとりを自律的に完了するAI
動画制作〜納品まで完了するAI
アプリ開発を開発者と共に自律的に行うAI(例: Devin)
材料収集からプレゼン資料作成までを行うAI
ユーザーの検索意図に沿ったDeepResearch
③汎用型AIエージェント
一方、昨今AIエージェントとい言った時に理想として思い浮かぶのは、抽象度の高い目標を渡せば柔軟に動いてくれる、ほとんど人のような汎用的なAIでしょう。これが汎用AIエージェントです。
汎用AIエージェントの例👇
社長秘書エージェント
科目横断的な家庭教師エージェント
生活環境や家計をケア・保守するライフサポートエージェント(あるいは家政婦ロボット)
ある論文では、これをAgentic AIと呼称して整理し、パラダイムシフトであると定義づけています。
以上3種類のAIエージェントの話は、
また後で重要なファクターとして登場します。
生き残るための戦略
Winners take all
今後、タスク型 / 特化型 / 汎用いずれにおいても、かなり多くのAIエージェントが登場することが予想されます。一方で、その中で人気を博し定着するエージェントはそれほど多くはないでしょう。
システムは無数にあっても、人はそれほど多くのものを使いこなしたいとは思いません。これまでも、個人なら20〜40個、企業なら5〜100個くらいしかシステムやアプリを使っていないと言われています。
そして、そのいくつかの枠を占めることの出来た勝者が全てを持っていきました。AIエージェントにおいても、このWinners take allの時代が再来します。
誰が勝つか?
SaaSはただのデータ置き場に矮小化される
AIエージェント時代においては、様々なシステムがLLMと接続されます。
LLMはMCP等の手段で、SaaSをToolsとして接続していくことになり、特に固有のデータを溜め込むタイプのSaaSはRAG検索、CoTの情報ソース等のデータベースとして重宝されるようになります。
例えばSlackやNotionといった、
コミュニケーションに頻繁に活用されるものがそうでしょう。
しかしこの時、ユーザーはAIエージェントを利用しているのであり、SaaSを使っている感覚はありません。存在感が非常に希薄で、いわばSaaSはミドルウェアとなり認知しづらくなります。
こうなると、SaaSはただのデータベースであり、人間のユーザーではなくAIのユーザー(つまりAIエージェント)と対話するバックエンドシステムへと矮小化されます。SaaSとしてのブランド価値は消え去るでしょう。
MetaのCTO・アンドリュー・ボスワース氏は、こういったことを指して、次のように述べています。
"AIは人々がテクノロジーを使う主な手段として、
アプリに取って代わる可能性がある"
"多くの企業のブランド名が抽象化され、
それはブランド全体にとって非常に困難なことになると思う
── 「AIはアプリを無意味にするだろう」…MetaのCTOが予測
データの収集場所としての価値はあるので既存の売上は安泰かもしれませんが、新たなアップセル獲得や新たなSaaSの台頭といった流動性は極端に低下するでしょう。
また、認知されづらくなればSaaSのスケーラビリティは無くなります。
ただし、AIエージェントにいかにサジェストしてもらうか というところは、逆に言えば新たな露出経路として活かすこともできるかもしれません。SEOやASOのAI版といったところですね。
実際、既にAIO、LLMOといった概念や、LLMs.txtという具体的な規格も登場してきています(これはあくまでLLM向けなので若干粒度が違うのですが、AIに選んでもらうための努力という意味では共通コンテキストにあります)。
鎖国は難しい
あるいは、自社SaaSを外部のAIエージェントが利用出来ないようにするいわば「鎖国戦略」を取る(例えばAPIを閉じたり、MCPサーバーを立てたり利用するのを利用規約等で禁じたりする等)ことも出来ますが、これは通常、得策ではありません。
鎖国しても、AIユーザーが増える中で置いてけぼりを食らい、競合にAIユーザー増加という新たな波に乗って差をつける隙を与えるだけです。
AIエージェントは新たな面であり、機会でもあります。SaaS各社は乗り遅れないようにその波に対し門戸を開くしかありません。しかし問題は、先にも述べた通り、SaaSは人間に従来ほど認知されなくなっていくことです。
ユーザーがAIであるため、SaaSにおけるUIUXの優位性も小さくなるでしょう。結果生き残るのは、より多くの機能やAPIを備える大手の成熟したSaaSのみになると予想が付きます。
タスク型や特化型は容易に代替される
また、同じAIエージェントでも、タスク型や特化型といった、ある程度絞られたスコープのドメインで動くエージェント製品も、SaaSに近い苦しみを味わうことになるかもしれません。
まずタスク型のAIエージェントの弱点は、一言で言えば参入障壁の低さにあります。
ここまでに述べてきた通り、自社開発するにせよOSSを利用するにせよ、AIが他社ツールにアクセスするのは、ほぼ可能になっています(また、精度や速度を無視すればBrowser Useでも実現できます。Browser UseのためのOSSやSDK、フレームワークもPlaywright MCP、Browserbase、Stagehandなど数多く登場しています。)
一昔前では考えられないほど下がった実装コストは、個人から企業まで多くの人にとって簡単なAIエージェントを開発する理由になります。
数が多くなるため、より便利な方、あるいはより安い方へとユーザーは流れていきます。つまり生半可なエージェント製品では簡単に代替されてしまうのです。
もう少しドメインを広げて、あるドメイン全体をカバーする特化型AIエージェントはどうでしょうか。
この場合、ライバルは汎用エージェントです。LLMの進化速度はかなり早く、特化していたと思っていた分野でLLMがその能力を追い越していっているからです。
例えば私の所属する会社では法律ドメインを扱っていますが、LLMによって契約書のレビューは難しくなくなりました。これはとてつもない驚異です。契約書レビューを提供するAI各社は現在、あの手この手で差別化を図って、生成AIトレンドに置いていかれないように、波に乗れるようにと必死にならざるを得ません。
しかも今後は、単純なライバルであるだけでなく、特化型AIエージェントが汎用AIエージェントのツールに矮小化される可能性もあります。
つまり、ユーザーが汎用AIエージェントに業務を依頼し、同エージェントが特化型AIエージェントに指示を出す、という像です。
そうすると特化型AIエージェントは、SaaSと同じ苦しみ(ブランドの存在感・価値の希薄化)を抱えることになります。
生き残りそうなのは汎用エージェントだが…
こうして突き詰めていくと、最終的に生き残るAIエージェントは、汎用AIエージェントだけです。ですが、一足飛びに汎用AIエージェントは作れません。現在もAIは進化の過渡期にあります。
技術の進化速度を考慮すると、生き残る可能性のあるAIエージェントは、汎用化する意思と計画を持ち、かつ極めて広い属性の人々を捉えられる特化型エージェントです。
では、”極めて広い属性の人々を捉えられる”は存在するでしょうか。
候補となるドメイン
例えば「メール」「チャット」「タスク管理」「カレンダー」「ブラウジング」といったドメインはこの候補でしょう。どれもかなり広いターゲット属性を持ちます。
例えばLINEは先日、"パーソナルエージェント"という構想を発表しました。LINEは様々な機能を有するチャットアプリケーション。ポジションを活かすことができるのではないかと思います。
メールやチャットは物足りないドメイン
ただ、「メール」や「チャット」あるいは「タスク」は、ターゲットとしてはたしかにかなり広いものの、その広さは「カレンダー」や「ブラウジング」と比較すると正直見劣りします。
誰もがメールやチャットする とは言い切れません。メールをしない/見ない人は若年層を中心にかなり多いものです。チャットは非若年層において同じくです(最近はそうでもないかもしれませんが)。
また、誰もがタスク管理する とは言い切れません。非デスクワーカーを中心に、自分の脳みそと体だけでタスクをこなす人の方が多いものです。
カレンダーよりブラウジングの方が広い
では「カレンダー」はどうでしょうか?ほとんどの人が何らかのカレンダーを毎日使っているはずです。
結論から言えば、「カレンダー」でさえ最適ではないかもしれません。比較対象は「ブラウジング」です。
何故なら、
ブラウジングはおよそのWEBサービスとの連続性を持っています。
例えばGoogleカレンダーを使っている状態というのは「Googleカレンダー」とブラウザで検索して行き着いた状態であると捉えることができます。つまりブラウジングとカレンダーという外部ツールの繋がりは自然です。
一方で、Googleカレンダーからブラウジングしたり他サービスと繋がるというのは、少なくともユーザーの感覚としてはブラウジングの場合より数枚厚い壁を感じずにはいられません。
カレンダーアプリに「メール」という機能が付いたとして、それが何故カレンダーアプリに付いているのか、すんなり理解し受け入れられるでしょうか?
ユーザーはカレンダーを使おうとしているのでありメールに興味は無いので(当然ですが)、そういった機能はむしろただのノイズに映るかもしれません。
よって、ターゲットが最も広いカテゴリーの1つであると思われる「カレンダー」は、しかし他ツールを接続ないし拡張したとしてもそれを自然な体験に落とし込める蓋然性が低いように思えます。
AIブラウザは
AIエージェント時代の勝者になるか
まとめると、
AIブラウザとして今からユーザーを獲得しておけば、AIエージェントらしいUXに自然と接続できるため、技術や市場がより進展した際にAIエージェントとして市場を取るのが容易である
というのが私の見立てです。
(ただしAIブラウザだけでAIエージェント時代を生き抜くことは難しいでしょう。特化型エージェントの域を出ないからです。しかし進化の端緒として優秀なのは間違いありません)
Perplexity
この主張を補足するように、検索AIエージェントを提供するPerplexityは独自ブラウザのウェイトリストを公開していますし、最近はボイスをツールとして取り込みアシスタント化し、様々なツール利用を自然な体験に落とし込みました。
ただし同社の製品のクオリティは、いちユーザーとしては既に物足りなくなってきています。彼らがどれだけ製品を磨き込めるか、独自ブラウザでどれだけ巻き返せるか見どころです。
Genspark
また、同じく検索AIエージェントのGensparkは最初の外部ツール利用機能として資料作成の能力をリリースしました。
また、スーパーエージェントと呼称する、多くのことが出来るAIエージェントもリリース。Gensparkで作るスライドやシートはクオリティも高く、Wowな体験を提供してくれます。
OpenAI × Chrome?
さらに、最も著名なブラウザ「Chrome」の独占禁止法の訴訟に関連して、OpenAIなどAI企業がこれを買収したがっているといいます(主目的は検索データでしょうし、実現は難しいでしょうが)。
Fellou
さらにさらに、新興勢力として、FellouというAIブラウザも登場。
実際に驚くような体験を見せてくれます。
Fellouは世界初のエージェンティック・ブラウザを謳っており、ブラウザを通してツール連携して、様々な作業を勝手に行います。
落合陽一さんが2025年5月にXで触れたことで、日本でも多くの人の目に触れたようで、その後多くの方が登録・Postしています。同氏はFellouで作ったアウトプットもPostしており、ユーザーでない人でも見ることが出来ます。
(なお、Fellouは現在はあまりに秘匿性が高くセキュリティ懸念のため、個人的には現時点では使用を推奨できないと感じました)
Dia
ブラウザApp「Arc」を提供するThe Browser Company社も、AIブラウザ「Dia」を開発中であり、その体験動画とともにウェイトリストを公開しており、またArcユーザーにはアーリーアクセスも配られています。
ブラウジングを長期記憶することで、パーソナライズされたAIエージェントの挙動を実現しているといいます。AIエージェントを強力にするコツはいかにAIにコンテキストを渡すかという点にあるので、ブラウジングを記憶できるというのはかなりの強みでしょう。さすがに目の付け所が素晴らしいです。
このように、ブラウジングは芽が出つつある有利なポジションであり、また依然として魅力的なポジションなのです。
(予断ですが、日本にも昔、「Smooz」というアプリブラウザを運営する会社がありました。彼らは2020年にある事情で撤退してしまいましたが、もし彼らが今この時代にいたら…と少し残念に思います)
まとめ
汎用AIエージェントの時代
時代が進むにつれ、AIは汎用AIエージェントに近づいていきます。
汎用AIエージェントは特化型AIエージェントやSaaSにとっては売上を獲得できる新たな面でありつつも、認知を獲得出来なくなるため戦略的に苦しい立場に追いやられることでしょう。
おそらく彼らは、「より多くのAIエージェントに対応する」「そのために公開APIや公式MCPサーバーを用意する」という戦略以外に選択肢が無くなりましょう。そして勝ち残るのは大手の多機能なSaaSくらいです。
ブラウジングは有利なポジション
ではAIエージェント時代に勝者足り得るのは誰かというと、ブラウジングやカレンダーを起点とするAIエージェントです。
なぜなら汎用化するのに充分な体験的余地があり、外部ツールとの接続体験に蓋然性もあるためです。PerplexityやGensparkは現在、最も有利な立場にいるでしょう。
今回のオチ
ChatGPTがすべてを持っていく
可能性もある という話
本稿の主張の枠を飛び越えて、ブラウザではないけれど圧倒的に有利なポジションを築いているプレイヤーもいます。
OpenAI…というよりChatGPTです。
ChatGPTは2024年時点で既に優秀な検索ツールでした。それが2025年初頭にはProプランのみながらOperatorでBrowser Useも登場。その翌月にはDeepResearchが可能になりました。
さらに2025年6月には「コネクター」という、外部ツールと連携してDeepResearchを行える機能もリリース。カスタムコネクタとしてオープンソースや自前のMCPサーバーと接続することも可能です。
こういったアップデートによりAIの利便性への期待値は常にChatGPTにより牽引されています。
ChatGPTだけは本稿の主張にとって例外です。ブラウザだとかドメインだとかの議論を飛び超えて、新しい魔法の杖になりつつあります。
あえていうなら「ChatGPTで出来ること」という新しいドメインさえ生み出しています。それほど、ChatGPTは多くのAI企業にとって引き続きベンチマークであり強大なライバルです。
機能はマネできても「AIと言えばChatGPT」というポジションを覆すことは生半可ではないでしょう。LLMの性能向上だけでなくChatGPTというアプリケーションをいち早く世に送り出した先見の明は、素晴らしかったと言わざるを得ません。
ただし、大赤字なのですが。
Substackアプリを使うと読みやすいのでおすすめです。