Leoのこれから:BraveのビルトインAIブラウザアシスタントのロードマップ
2023年8月、BraveはネイティブAIアシスタントであるLeoをNightlyチャンネルでリリースし、それ以来、私たちは多くのユーザーからのフィードバックを取り入れ、この機能に多くの改良を加えてきました。現在も引き続き様々な改善を行なっており、近日中にフルリリースチャンネルでLeoをリリースし、6000万人のユーザーの皆様にご利用いただけるようになる予定です。
本日はBraveがLeoについてどのように考えているのか、そしてブラウザ内での将来のAI統合について、詳しくお伝えさせていただこうと思います。
背景:ユーザーエージェントとしてのBrave
Braveは常にユーザーエージェントです。ユーザーエージェントとは、サードパーティを含むサーバー運営者とユーザーとの間で利害が対立することなく、ユーザーがインターネット上でアクセスするコンテンツを適切にコントロールできるようにするクライアントアプリケーションです。Leoはこのコンセプトをさらに一歩進め、作者やクリエイターが意図した方法でコンテンツを閲覧するという限定されてきたブラウザのあり方をさらに進化させます。Leoを使えば、Webページやビデオを受動的に消費するのではなく、むしろ積極的にコンテンツを探索することができます。関連性のある質問をしたり、詳細を追求したり、多様な視点を探求したりなど、総合的に自分の好みに合わせてWebをカスタマイズすることができるのです。
Leoは、あなたが今訪問しているページを「理解」します。Leoは著者との直接対話に次ぐ体験を提供します。実際、Leoは著者やクリエイターのバイアスに左右されることなく独自にページを分析し、推論することができるため、多くの点で優れています。
ここで明確にすると、Braveは世界をリードする大規模言語モデル(LLM)をゼロから作ろうとしているわけではありません。その代わり、私たちは、ユーザーをトップクラスのLLMと結びつけ、革新的で、可能な限りプライバシーを保護する方法でそれらを利用することを目標にしています。私たちの目標は、多くのケースで特定のユーザーのブラウジングセッションのコンテキストでのみ可能となる、斬新、便利でプライベートなユースケースを開拓することです。
すべてのBrave製品と同様に、LeoはBraveのコアバリューを遵守し、プライバシー・バイ・デザインで構築されています。ユーザーの入力は常にリバースプロキシを通じて匿名で推論インフラに送信され、ユーザーに比類のないプライバシーを持つAI体験を提供します。また、会話は返信が生成された直後に破棄され、Braveのサーバーに保存されることはありません。Leoの開発を拡大するにつれて、私たちはプライバシーをその機能に統合し、ユーザーが期待するプライバシーを提供するための新しいアプローチで革新を続けていきます。

一般リリースチャンネルでの実現性:コストと実行可能性
この素晴らしい機能を一般リリースチャンネルに開放するための第一歩は、Braveがその全ユーザー層に提供するためのコストが現実的なものであるかを確認することです。全世界で6,000万人以上のユーザーを抱える私たちの一般リリース・チャンネルでLeoをそのまま運用すると、有料オプションなしでは困難なものになるでしょう。そのため、私たちは間もなくLeoのプレミアム・バージョンを提供する予定です。無料版の機能に追加して、プレミアム版ではプレミアムモデルのホスティング費用と、他のプレミアムモデルを選ぶのためのAPIアクセス費用が必要になります。
Leoの今後のアップデートには以下が含まれる予定です。
- プレミアムアップグレードのためのシームレスなオンボーディング体験。BATでのプレミアムアクセスの支払いも検討中です。
- Leoのメイン画面で異なるモデルを直接選択できるようになります。
- ブラウザの他機能からLeoへのインテグレーションポイントの追加。
- Llama 2 70BやClaude Instant(Anthropic社製)など、より優れたモデルへのアクセス。
無料版とプレミアムオプションの比較表はこちらです。
機能 | Leo無料版 | Leoプレミアム |
---|---|---|
モデル | Llama 2 13B Code Llama 13B |
Llama 2 13B Llama 2 70B Code Llama 13B Code Llama 70B Anthropic Claude Instant |
利用制限 | 妥当な制限ライン | より利用可能な制限ライン |
会話の品質 | 限定的なモデル | 高品質 |
プライバシー | 入力は常にリバースプロキシを通じ匿名化され、保持されない | 入力は常にリバースプロキシを通じ匿名化され、保持されない |
LeoのリリースはQ4の中頃から下旬を検討しています。
モバイル・パリティ
モバイル版のパリティは、デスクトップ版のリリースの後まもなくとなる可能性が高いです。
モバイルリリースの焦点は、デスクトップリリースのすべてがAndroidとiOSで動作するようにすることです。
ロードマップ
Leoの主な機能強化は以下のカテゴリーに分類されています。これらの機能の一部は最初のリリースで利用可能になり、その他の機能はその後のブラウザのアップデートで展開されます。
会話のローカル永続化、およびフルページ・インタラクション
- 過去の会話をデバイスに保存し、参照可能にし、後日会話の続きを可能にする。
- Brave Syncを使用し、デバイス間でこれらの会話を同期する。
- brave://chat(またはbrave://leo)のようなURL経由でのフルページのインタラクティブUI。
回答品質の向上
- Brave Searchの結果をモデルに提供し、情報を最新化する。
- ユーザーからの質問に対応するBrave Q&AとBrave Supportをモデルに提供する。
- Braveニュースの結果をモデルに提供し、ユーザーの質問に答える手助けをする。
- Web3関連の質問に答えるために、暗号通貨のコンテキストをモデルに提供する。
- 一般化された拡張フレームワークを提供するか、ChatGPTプラグインのような既存の拡張機能のフォームを取り入れる。
よりリッチな回答
- Leoのアウトプットの一部としてのイメージ生成。
- Leoの出力に対応した、現在閲覧中のページ内のテキストをハイライトする。
- Leoがユーザーに代わってアクションを起こす機能。例えば、LeoがWeb検索を開始したり、現在のページをダークモードに変更したり、ブラウザの設定を変更したりする機能)。
- Brave Searchにリンクするための応答テキストのエンティティハイライト(例えば、出力がBraveについて触れた場合、Braveをハイライトし、Brave Searchのクエリにすることができる)。
モデルの拡張
- 最新かつ最高のモデルへのアクセスを継続的に追加する。
- プレミアムユーザーにより多くのモデルの選択肢を提供するために、コマーシャルな提携を拡大する。
- コンテキストのサイズを大きくする。
言語サポートの向上
現在Leoが英語以外の言語でプロンプトを受けた場合、Leoはすでにその言語で答えることができます(フランス語やスペイン語など)。しかし、すべての言語がカバーされているわけではなく、ページのコンテキストが使用されたときに、おそらく応答言語が決定されます。私たちは、より良い国際的なモデルを追加することによって、言語に対するより良いハンドリングを追加し、全体的に言語の数とそれらの言語の出力の質を拡大したいと考えています。
Chatインターフェイスとカスタマイズ性
- この記事を書いている時点では、Leoインタラクションのコンテキストはページ全体から派生することも、コンテキストがまったくない状態で動作することもできます。将来的には、ユーザーがページの特定の部分を選択してモデルにインタラクションコンテキストを提供できるように、コンテキストメニューによってこれを改善したいと思います。
- オムニボックス(アドレスバー)のサジェストや新しいタブカードなどを通じてLeoへのアクセスを提供する。
- CodeLlamaが開発者ツールとサイドバーに統合され、オプションで現在のページコンテキストに挿入される。
モデルの個人化と擬人化
- Leoの口調や要約スタイルをカスタマイズして、パーソナライズされた対話を実現する。
- ユーザー定義による境界線、ムード、コンテキスト認識。
コンテンツ消費
- PDFの要約:Webページやビデオだけでなく、PDF文書のインターフェイス機能。
- モデルがWebページをよりよく理解できるように、アクセシビリティやその他の情報を利用する。
- ドラッグ・アンド・ドロップによる画像理解。
書き込みツール
- Webページの編集可能なフィールドに入力するためのツール(書式設定やテキスト生成など)。
- 文法、スペル、その他の提案。
- コンテンツ提案、コンテンツ自動補完。
ローカルモデルサポート
- ローカルで動作するモデルを提供し、さらにユーザーが自分のモデルを設定できるようにしたいと考えています。そうすることで、ローカルのプライベートなBraveデータでユーザーを支援する可能性が広がります(例えば、より良いサジェストバーやオートコンプリートのサジェストを作るなど)。
Brave AdsやBrave Rewardsとの統合
- 私たちは、プレミアムサブスクリプションを購入したくないが、プレミアム機能を必要とするユーザーのために、プライバシーを保護する広告サポートオプションを提供するかもしれません。
- ディスプレイ広告の枠を超えて、詳細な製品情報などのコンテキストを通じて、ユーザーの購買意思決定を支援するモデルにしたいと考えています。これは、広告カタログや、広告の背後にある製品に関するあらゆる知識を含みますが、広告を表示したり、インチキや偏った情報を与えたりするものではありません(例:テレビを買おうとしているときに、Leoがより安価なテレビを知っている、現在質問しているテレビにはない機能を提供している、など)。
- このレコメンデーション・エンジンをBrave Rewardsに結びつける方法の検討。
- このようなショッピングのシナリオでは、モデルは常に純粋にユーザーのエージェントとして最初に行動します。例えば、あなたが見ていたテレビが、あなたが見たかもしれないオンライン広告よりも、他の場所がより良い価格だったと答えるかもしれません。
Leoがそばにあれば、ユーザーは画期的な新しい方法でWebに接することができます。このロードマップに描かれているLeoの未来は、私たちにとってエキサイティングなものです。他のAIアシスタントとは異なり、Leoは単純なチャット・インターフェースではありません。Leoは、あなたのプライバシーを守り、あなたが自分の体験を管理できるようにしながら、あなたがブラウジングしながらWebの意味を理解するのを助けるコンパニオンなのです。
私たちはコミュニティからの意見を心から大切にしています。ご意見・ご感想は、コミュニティの質問・回答サイトにお寄せください。