MELTing Point: 言語トランスフォーマーのモバイル評価
私たちはユーザーのプロンプトやLLMアウトプットがデバイス内部で完結する、デバイス上でのLLM展開について実現に向けた研究を続けます。
この記事を読む →
Braveプレミアムプロダクト&サービス シニアディレクター Matt McAlister寄稿
2023年後半に、BraveのAIブラウザアシスタントLeoの最初のロードマップを公開しました。その投稿では、ユーザーのコントロールとプライバシーを保護しながら、Webを最大限活用するためのサポートコンパニオンとしてのLeoのビジョンを概説しました。
それ以来、Leoは役立つブラウジングコンパニオンから、スマートでパーソナライズされた協力者へと進化してきました。この変化は、AIとWebに対する私たちの考え方のより広範な変化を反映しています。モデル品質、検索機能、マルチプラットフォーム対応といった中核的な約束を果たしてきた一方で、最もエキサイティングなイノベーションのいくつかは、当初のロードマップには含まれていませんでした。マルチタブコンテキスト、タブフォーカスモード、エージェンティックAIなどの機能は、ユーザーフィードバックと、AIをブラウザの動作の基盤にするという私たちの継続的なコミットメントから生まれました。
変わらないのは、プライバシー・バイ・デザインとユーザーの選択権に対する私たちのコミットメントです。2023年後半以降の製品の進化を踏まえ、Leoの歩みを記録し、今後の方向性を共有させていただければと思います。
過去18か月間で、私たちは基盤的な機能と革新的な機能の両方で進歩を遂げてきました。
Leoの最初のローンチは、Llama 2モデルからはじまりました。それ以来、モデルの選択肢を拡大し、より多くの選択肢とオプションを提供しています。
Leoで使用できるAIモデルの特徴の違いについて詳細はこちらをご覧ください。
デスクトップ版BraveでのLeoの使用方法について詳細はこちらをご覧ください。
LeoがBrave Search APIを通じて最新の情報を取得する方法について詳細はこちらをご覧ください。
新機能が追加される際に、ドキュメント化とメッセージングの一貫性により、元々のプライバシー保護機能の強化を続けています。
これらの基盤の上に、現在私たちはWebブラウザを変革する新機能に取り組んでいます。
ブラウザがエージェント型AI機能とともに進化するにつれ、Webアクセスにおけるより積極的なパートナーとなります。実装をリリースする前に安全機能を引き続き改良中ですが、ブラウザがあなたの代わりに行動するエージェント型AIがいかに有用であるかは明らかです。
一部のブラウザでは、AIがあなたのデータやログイン中のWebページセッション(メール、カレンダー、銀行口座、ソーシャルメディアアカウントなど)にアクセスできてしまいますが、Braveはユーザーが自身のAIの活動を完全にコントロールできるよう取り組んでいます。私たちは、拡張機能へのアクセス制限、独立したストレージパーティション、起動中の明確な警告と視覚的インジケーターなど、複数の保護機能とコントロール機能を実装しています。私たちの実装では、AIがあなたの代わりに行動する前に、必ずあなたの同意を得るようにします。
ブラウザベースのAIは、あなたが起動を選択した際に既存のワークフロー内で動作し、クラウドベースやスタンドアロンのAIチャットアプリで行うようなコピー&ペーストや意図の説明は不要です。Braveのマルチタブコンテキスト機能により、学校の課題、会社のレポート、研究プロジェクトなど、どのような作業であっても、ブラウザで既に開いているリソース(PDF、記事、スプレッドシートなど)にまたがる質問をすることができます。
まもなく “@” 記号でタブ、ブックマーク、履歴を言及することで、それらを添付として追加できるようになり、コンテキスト管理がさらに簡素化されます。
私たちは多くの機能強化も実装しており、最高品質の洞察と出力を提供するために、コンテンツ処理の改善を続けています。
Leoは現在、画像を理解・分析できるようになり、ブラウジング体験にマルチモーダル機能をもたらします。
開発者やビジネスユーザーは、クライアントプロジェクト、調査、個人的なブラウジングにわたって、複数のウィンドウで数多くのタブを開いている状況によく陥ります。このデジタルな混乱を手動で探し回るのではなく、今ではLeoにワークフローの段階、文書の種類、言語、またはその他多くのカスタム構造によってタブを整理してもらうことができます。
タブフォーカスモードについて詳細はこちらをご覧ください。
ブラウザがより多くのAI機能を備えて進化するにつれ、AIが単に個別のタスクを支援するのではなく、あなたのデジタル活動を統合的に管理する自然なプラットフォームとなります。そのため、これらの継続的な改善と今後のリリースに加えて、以下のような機能追加を計画しています。
上記で言及したエージェント機能の基盤を基に、以下のことを可能にするタスクスケジューリングシステムを追加予定です。
あなたの予算範囲内のコンサートチケットをチェックしたり、あなたに言及するGitHubの課題を監視したり、関心のあるトピックのニュースを収集したりするようにLeoを設定することを想像してみてください。これらすべてを自動的に、あなたが定義したスケジュールで実行します。
私たちはまた、より多くのオンデバイスAIに向けて、LeoのBYOM(Bring Your Own Model)機能を拡張する方法を探求しています。これには、モデルを実行するための完全に統合されたローカルモデルサポートと、デスクトップとモバイルデバイスの両方で、さらに高いセキュリティが必要なタスクに対してオフラインAI機能を有効にすることが含まれます。
Brave Search APIなどの最新のモデルとツールを使用することで、ユーザーはより高品質な出力を生成できるようになります。商品データ、スポーツデータ、暗号通貨価格、そして画像、表、その他のコンテンツ形式を含むより豊富な出力により、あなたの個人的な興味についてより多くを学ぶことができます。音声モードでは、あなたが選択した声で応答します。また、仕事、学校、家庭向けのより堅牢で専門的な文書を作成することもできるようになります。
これらの強固な基盤が整うことで、私たちはブラウザでAI機能を運用し提供する方法を進化させることができます。
私たちはユーザーが求めていることに注意深く耳を傾けています。ユーザーの皆様は使用しているモデル、ブラウザのどこに統合すべきか、そして仕事で何が役立つかについて教えてくれています。また、AIをより制御できるようにする方法についても教えてくれています。
私たちも自身がパワーユーザーであり、より速く学習し、より多くを達成するためにAIツールを内部で使用しています。この経験が、AIは働き方に合わせて機能すべきだという私たちの信念を後押ししています。
それこそが私たちが構築しているものです。ユーザーがAIに合わせるのではなく、ユーザーのワークフローに適応するAI。より速く学習し、より多くのことを実行し、より良い判断を下すのに役立つツールとサービスで最適化されています。私たちは、あなたのフィードバック、派手な機能よりも有用なツールへの焦点、そしてユーザーの選択とプライバシーへの揺るぎないコミットメントに導かれて、包括的なAI動作環境を通じて提供します。
以下の表はこれまでの歩みを振りつつ、私たちが提供したもの、まだ完了していないもの、そして機能リリースや性能向上をする中で私たちの理解がどのように進化したかを示しています。
戦略的方向性 | 対応済み | 未対応 | 当初のロードマップを超えて | 今後 |
---|---|---|---|---|
プライバシーファーストのアーキテクチャ |
|
|
|
|
AIモデル基盤 |
|
|
|
|
文脈理解 |
|
|
|
|
生産性と実用性 |
|
|
|
|
ユーザー・エクスペリエンス |
|
|
|
|
ビジネスモデル |
|
|
|
|
AI機能を使用したくないユーザーは、Leoを無効化でき、一度試した後にオフにしたい場合は、いつでもBrave Leoを完全に無効にすることができます。
私たちはユーザーのプロンプトやLLMアウトプットがデバイス内部で完結する、デバイス上でのLLM展開について実現に向けた研究を続けます。
この記事を読む →Brave Searchの統合によりBraveのビルトインAIアシスタントLeoはさらに便利になりました。
この記事を読む →Answer with AI は、プライバシーを第一に考え、Big Techの検索エンジンを使用しない、唯一の大規模なリアルタイムに回答を行うエンジンです。
この記事を読む →