ブラウザAIを構築する:Leoの開発進捗とこれから
Leoは役立つブラウジングコンパニオンから、スマートでパーソナライズされた協力者へと進化してきました。この変化は、AIとWebに対する私たちの考え方のより広範な変化を反映しています。
この記事を読む →
この記事は、エージェント型ブラウザにおけるセキュリティとプライバシーの課題に関するシリーズのはじめての投稿になります。この脆弱性研究は、シニアモバイルセキュリティエンジニアのArtem Chaikinによって実施され、Artemとプライバシー・セキュリティ担当VPのShivan Kaul Sahibによって執筆された記事の日本語訳です。
Braveでは、ブラウザ内AIアシスタントのLeoがユーザーの代わりにWebブラウジングをする機能を開発しています。単に「このページがロンドン便について何を言っているか要約して」と尋ねるだけではなく、将来的には「来週の金曜日のロンドン行きの便を予約して」と指示できるようになります。AIは読むだけでなく、自律的に閲覧し取引を完了します。このような機能拡張により、 Braveのプライバシー保証を保ち、データと閲覧セッションを保護する堅牢なセキュリティガードレールを維持しながら、Leoの機能が大幅に拡張されます。
このようなエージェント型ブラウジングは非常に強力ですが、重大なセキュリティとプライバシーの課題も提示します。ユーザーがAIブラウザに慣れ、銀行、医療、その他の重要なWebサイトなどのログインセッションで機密データを信頼し始めると、リスクは倍増します。モデルがハルシネーションを起こして、要求していないアクションを実行したらどうでしょうか。さらに悪いケースとして、無害に見えるWebサイトやソーシャルメディアサイトに残されたコメントが、AIアシスタントに見えない指示を追加することで、ログイン認証情報やその他の機密データを盗むことができたらどうでしょうか。
私たちの実装を他のものと比較するため、NanobrowserやPerplexityのCometなど、いくつかの既存のソリューションを調査しました。Cometの調査時には脆弱性を発見しPerplexityに報告しましたが、これらの脆弱性はブラウザにおけるエージェント型AI実装が直面するセキュリティ課題を浮き彫りにしています。この攻撃は、長年にわたるWebセキュリティ技術によって防がれていたアクションを実行するようAIアシスタントを操作することがいかに簡単であるか、そしてユーザーがエージェント型ブラウザにおいて新しいセキュリティとプライバシー保護を必要としていることを実証しています。
この投稿で議論している脆弱性は、CometがWebページコンテンツを処理する方法にあります。ユーザーが「このWebページを要約して」と尋ねると、Cometはユーザーの指示とWebページからの信頼できないコンテンツを区別することなく、Webページの一部を直接LLMに送信します。これにより、攻撃者はAIがコマンドとして実行する間接プロンプトインジェクションペイロードを埋め込むことができます。例えば、攻撃者は別のタブのページに準備されたテキストの断片から、ユーザーのメールへのアクセスを取得することができます。
この攻撃は間接的プロンプト・インジェクションの一例です。悪意のある指示が、アシスタントがユーザーの要求を満たす過程で処理する外部コンテンツ(WebサイトやPDFなど)に埋め込まれています。
Cometにおけるこの脆弱性の深刻さを説明するため、概念実証デモンストレーションを作成しました。
このデモンストレーションでは以下の点が確認できます。
ユーザーがRedditの投稿を訪問すると、スポイラータグの後ろに隠されたプロンプトインジェクション指示を含むコメントがあります。
ユーザーがCometブラウザの「現在のWebページを要約」ボタンをクリックします。
要約のためにページを処理する間、Comet AIアシスタントがこれらの隠された指示を認識し処理します。
悪意のある指示がComet AIに以下を命令します。
攻撃者は被害者のメールアドレスを知り、流出したワンタイムパスワードとメールアドレスの組み合わせを使用してPerplexityアカウントを乗っ取ることができます。
ユーザーが悪意のあるコメントを含むReddit投稿をCometで要約しようとすると、それ以上のユーザー入力なしに攻撃が発生します。
この攻撃は、既存のWebセキュリティメカニズムに重大な課題をもたらします。AIアシスタントが信頼できないWebページのコンテンツから悪意のある指示に従う場合、同一オリジンポリシー(SOP)やクロスオリジンリソース共有(CORS)などの従来の保護機能はすべて事実上無力になります。AIは認証されたセッション全体でユーザーの完全な権限で動作し、銀行口座、企業システム、プライベートメール、クラウドストレージ、その他のサービスへの潜在的なアクセスを提供します。
個別のサイトに影響を与えるか、複雑な悪用を必要とする従来のWeb脆弱性とは異なり、この攻撃は、Webサイトに埋め込まれたシンプルで自然な言語の指示を通じてクロスドメインアクセスを可能にします。悪意のある指示は、攻撃者が制御していないWebサイトのユーザー生成コンテンツにも含まれる可能性があります(例えば、Redditのコメントに隠された攻撃指示)。この攻撃は、やり取りにおいて間接的であり、ブラウザ全体に影響を及します。
我々が実演した攻撃は、従来のWebセキュリティの前提がエージェント型AIには当てはまらないことを示しており、エージェント型ブラウジングには新しいセキュリティとプライバシーのアーキテクチャが必要であることを明らかにしています。
我々の分析において、この種の攻撃を防ぐことができたであろう以下の対策を考案しました。このトピックについては、このシリーズの次のブログ投稿でより詳しく議論します。
ブラウザは、モデルにコンテキストとして送信する際に、ユーザーの指示とWebサイトのコンテンツを明確に分離すべきです。そしてページのコンテンツは常に信頼できないものとして扱われるべきです。
タスクとコンテキストに基づいて、モデルはブラウザが実行すべきアクションを考案します。これらのアクションは、ユーザーのリクエストとの関連性についてチェックされるべきです。これは、ユーザーのリクエスト(信頼できる)とページのコンテンツ(常に信頼できない)を区別する前述のポイントと関連しています。
事前のエージェントの計画やタスクに関係なく、モデルはセキュリティとプライバシーに敏感なタスクについて明示的なユーザーの操作を要求すべきです。例えば、メールの送信では、メールが送信される直前に常にユーザーに確認を求めるべきであり、エージェントはTLS接続エラーの警告画面を自動的にクリックして通過すべきではありません。
エージェント型ブラウジングは、この攻撃が示すようにユーザーにとって本質的に強力だが危険なモードです。カジュアルなブラウジング中にユーザーが「偶然」このモードに入ってしまうことが起こってはなりません。Redditの議論を要約することだけが目的なのに、ブラウザが本当にあなたのメールアカウントを開き、メールを送信し、ログインしているすべてのサイトから機密データを読み取る能力を必要とするでしょうか。ブラウザのすべての機能と同様に、権限は可能な限り最小限であるべきです。強力なエージェント機能は通常のブラウジングタスクから分離されるべきであり、この違いはユーザーにとって直感的にわかりやすい必要があります。この明確な分離は、ブラウザベンダーがセキュリティとプライバシー攻撃を防ぐ方法をまだ模索しているエージェントセキュリティの初期段階において特に重要です。今後の投稿では、きめ細かい権限によるより安全なエージェント型ブラウジング体験に向けた我々の取り組みについてより詳しく説明します。
私たちは、エージェントブラウジング全体でプライバシーとセキュリティの基準を高めることを強く信じています。安全なWebはすべての人達にプラスとなります。私たちは、特にユーザーの認証済みのコンテキスト内での、エージェントがWeb上で行動をとる権限を与えることが、重要なセキュリティとプライバシーのリスクをもたらすことを見つけました。私たちの研究の目標は、早くリスクを表明し、実用的な防御策を示すことです。これはBrave、Perplexity、他のブラウザ、そして(最も重要なのは)すべてのユーザーにとって有益なものとなります。
我々は、Perplexityを含む幅広いブラウザやAIコミュニティと協力してエージェント型AIを強化し、適切な場合には、エージェント機能が関連するセキュリティ境界を標準化することを目指すことを期待しています。
この脆弱性は、エージェント型AIブラウザの基本的な課題を示しています。エージェントがユーザーの意図と一致した行動をとることを保証することは、難しい課題です。AIアシスタントが強力な機能を獲得するにつれて、間接的なプロンプト注入攻撃はWebセキュリティに重大なリスクをもたらします。
ブラウザベンダーは、強力なWeb対話機能を持つAIエージェントを展開する前に、これらの攻撃に対する堅牢な防御策を実装しなければなりません。セキュリティとプライバシーは、より高度なAIツールを構築する競争の中で、後付けの考慮事項であってはなりません。
Braveは創設以来、業界をリードするプライバシーとセキュリティの保護をユーザーに提供し、この取り組みを反映したWebの標準を推進することに尽力してきました。このシリーズの次のブログ投稿では、Braveが約1億のユーザーに安全なAIブラウジングを提供するために、ブラウザエージェントのセキュリティ確保に取り組む方法について紹介します。
Leoは役立つブラウジングコンパニオンから、スマートでパーソナライズされた協力者へと進化してきました。この変化は、AIとWebに対する私たちの考え方のより広範な変化を反映しています。
この記事を読む →私たちはユーザーのプロンプトやLLMアウトプットがデバイス内部で完結する、デバイス上でのLLM展開について実現に向けた研究を続けます。
この記事を読む →Brave Searchの統合によりBraveのビルトインAIアシスタントLeoはさらに便利になりました。
この記事を読む →