Bard が Gemini へと名称変更
2024年2月8日、これまで「Bard」と呼ばれていた生成AIモデルは、「Gemini」に改名されることが発表されました。
最上位の対話型生成AI「Gemini Advanced」も発表し、日本では月額2900円で提供を開始しました。現在、言語は英語のみですが順次日本語にも対応する予定となっています。
また、GeminiやGemini Advanced が使えるスマートフォンアプリが提供されます。
https://japan.googleblog.com/2024/02/bard-gemini-ultra-10-gemini.html
本記事では、記事公開時点での「Google Bard」の情報について執筆しているため、現在の内容と異なる点がある可能性がございます。
そもそも生成AIとは何か
これまでのAIというと、大量のデータを学習し、それをベースとして、データの予測であったり、あるデータから特徴を抽出するというのが基本でしたが、生成AIは学習したデータを元に創造的なアウトプットを生み出すことができます。これまでのAIにはできなかったようなアウトプットができるようになったのは、2018年に登場した大規模言語モデル(Large Language Model: LLM)の存在があります。LLMは言語パターン、要は文章の次に来る確率の高い単語を学習します。例えば、「海は」に続く単語は「広い」よりも「青い」が来る可能性が高い、という予測を学習することができます。また、学習データの中から、パターンや法則をメタ学習することで、人間の予測が難しいアウトプットを生み出すことができます。この「独創的なアウトプット」こそ、私たちの世界を大きく変えるイノベーションになる可能性があります。
大規模言語モデル(Large Language Model: LLM)とは何?
大規模言語モデルについての、最もわかりやすい説明は「野村総合研究所(NRI)」の用語説明ページかもしれません。この「大規模」というのが、重要なキーワードで、とにかく大量のデータと大量の計算量、パターンで優れたAIを作ろうということです。
大規模言語モデル(Large Language Models、LLM)とは、非常に巨大なデータセットとディープラーニング技術を用いて構築された言語モデルです。ここでいう「大規模」とは、従来の自然言語モデルと比べ、後述する3つの要素「計算量」「データ量」「パラメータ数」を大幅に増やして構築されていることに由来します。大規模言語モデルは、人間に近い流暢な会話が可能であり、自然言語を用いたさまざまな処理を高精度で行えることから、世界中で注目を集めています。
(引用元) 野村総合研究所(NRI) 用語解説より
Google Bard とは何?
Google Bard は Google が提供する生成AI
Google Bard は Google が提供する生成AIです。Bard の言葉の由来は、「鳥(Bird)」ではなく、「詩人」です。質問に対して自然言語で回答を返してくれるところから「詩人」という言葉が由来になったようです。 Google Bard は、創造力や生産性を高めるパートナーとして、私たちの生活をサポートします。それは決して私たちのビジネスに関わる活動に限りません。例えば、友人との旅行プランを考える、新しい自社サービスのプレゼンテーション資料の構成を考える、初めての海外旅行の持ち物リストを作成するなど、日常のさまざまな場面で役立ちます。
Google Bard は日本でも一般公開されている
Google Bard は現在試験運用中のAIサービスですが、2023年3月22日に米国と英国、2023年5月11日からは日本で一般公開されています。日本ではChatGPTが非常に注目されていますが、 Google Bard は一般公開されて以降、高頻度で機能のアップデートを実施しており、今後の進化が非常に楽しみなサービスです。
Google Bard が日本語にも対応
2023年5月11日、 Google Bard は日本語と韓国語のサポートを発表しました。 Google Bard は現在、40 以上の言語に対応し、欧州連合(EU)全体(27 か国)、ブラジルなど、より多くの地域で利用できるようになっています。ちなみに英語版については、世界180の国と地域で展開されています。
Google Bard は無料で利用可能
Google Bard は Google アカウント(無料アカウント、及び Google Workspace アカウント)があれば誰でも利用可能です。 Google Workspace で利用したい場合は、 Google Workspace のライセンス費用が必要になります。もちろん、 Google Bard の利用料金が別途かかることはありません。ただし、利用規約上、 Google Bard は18歳未満のユーザーは利用することができません。
Google Bard の基盤となる大規模言語モデル「 Gemini 」とは
Google Bard が搭載するLLMは何かというと、リリース当時は LaMDA というLLMを搭載していましたが、2023年5月には PaLM2 への切り替えを行い、なんと2023年12月には Gemini(ジェミニ)という次世代LLMへの切り替えを随時行っていくことを発表しています(※1)。
※1 現時点では英語版にのみ Gemini は搭載されていますが、近いうちに日本を含めた他の言語にも対応する予定になっています。
Gemini (ジェミニ)の性能は GPT-4 を凌駕する
Google は Gemini(ジェミニ)のリリースが「Bard の発売以来最大のアップグレード 」と言い切っています。それだけ Google は Gemini に対して大きな期待を抱いています。もちろん、それは口だけではありません。 Google は多くのベンチマークで Gemini が GPT-4 を上回っていることを数値で証明しています。
Google Bard はAIのリスクを考慮した設計になっている
そもそも生成AIのリスクとは何?
生成AIは我々の生活をポジティブな面で進化させてくれる可能性を持っていますが、一方でネガティブな問題も存在します。例えば、以下のような課題が存在します。
- 機密情報の流出
- 誤情報の拡散と偏見の助長
- 著作権の侵害
これらの問題は全世界を巻き込んだ社会的な分断を生み出す可能性もあり、重大なリスクとして、各国は足並みを揃え始めています(※2)。
※2 生成AIのリスクについて詳しく知りたい方は「生成AIの危険性とは何? Google はどのようにリスクに向き合っているのか 」をご参考ください。
AIを提供するビッグテックには社会的責任が問われている
2023年4月に閉幕した主要7ヶ国(G7)によるデジタル技術相会合で、「責任あるAIの推進」が共同声明に明記されたことからもわかる通り、世界規模で生成AIに関する取り決めが進んでいます。日米と欧州では多少の考え方の違いはあるものの、AIの社会的道義(民主主義的価値の保護、AIリスク対応の必要性)に対する価値観は一致しています。
Google は自社で掲げるAI原則に沿って Google Bard を開発している
他のビッグテックも同様ですが、 Google も「産業の発展には規制も必要である」という意思の元、独自のAI原則を掲げた上で、その方針に沿ってAIの開発を進めています。また、米国政府も第三者機関による監査機関の立ち上げ、及びAI開発を推進する企業に対して監査結果の公表も求めていく方針です。
Google Bard の利用方法
Google Bard の利用条件
Google Bard は Google アカウント( Google Workspace 含む)を保持している、且つ18歳以上のユーザーであれば誰でも利用可能です。もちろん、 Google Workspace のユーザーも Google Bard を利用することはできますが、前提として Google Workspace の管理者がユーザーの利用を許可する必要があります。
Google Workspace で Google Bard を有効化する手順
Google Bard を Google Workspace で有効化する手順は以下の通りです。
- Google Workspace の管理者アカウントを準備する
- コチラのURLをクリックし、1のアカウントでログインする
- Early Access Apps 設定画面から、アプリを有効化する組織を選択
- 組織に対して、Early Access Apps のステータスを「オン」にし、保存する
この手順が完了すると、 Google Workspace ユーザーは Google Bard が利用できるようになります。
Google Bard を利用するまでの手順
Google Bard を利用する手順はとても簡単です。以下は無料の Google アカウントユーザーが Google Bard を利用するための手順となります。
①「 Google Bard 」をブラウザで検索する
②「 Google Bard 」の画面にアクセスし、「ログイン」を押下する
③ Google アカウントでログインする
④「 Bard を試す」をクリックする
⑤ 「利用規約とプライバシー」に同意する
以下の画面が表示されたら、 Google Bard のセットアップは完了です。
Google Bard の使い方
Google Bard で何ができるのか
Google Bard に限らず、生成AIの使い方は一つではありません。人間の発想によって使い方の数は変わってくると言っても過言ではないと思います。以下の例は、私が実際に日々行っている Google Bard の使い方です。是非参考にしてみてください。
具体的な要件をインプットすることで、要件に沿ったソースコードを出力することができます。
人生の悩みを Googel Bard がコーチング形式で掘り下げながら、聞いてくれます。もちろん、悩みに対するいくつかの選択肢も提示してくれます。
③ マーケコンテンツの作成
セミナー内容(タイトル含む)、記事コンテンツ等、マーケティングに関わるクリエイティブなアイディアを Google Bard から提示してもらっています。
④ 資料の要約
長文の資料を Google Bard に要約してもらうことで、資料確認のための工数を削減することができます。
Google Bard への質問方法
Google Bard の使い方はとても簡単です。セットアップが完了したら、入力ボックスに「あなたが持っている課題」を解決するための質問を投げかけるだけです。
例えば、「日記を書く習慣を作る方法を教えて!」と打ち込むと、以下のように回答してくれます。Google Bard のような生成AIを活用し、対話を通じて課題を解決する手法に「プロンプトエンジニアリング」というものがあります。 Google Bard をより活用したい場合は、このプロンプトエンジニアリングが有効ですので、ご参考ください。
他の回答案の表示方法
前述した通り、LLMは文章の次に来る可能性の高い単語を表示する仕組みです。あくまで確率が高い回答であり、もしかするとユーザー自身が欲しい情報ではない可能性があります。 Google Bard ではそういったケースを想定してだと思いますが、他の回答を表示する機能を実装しています。これにより、ユーザーが欲しい回答にたどり着ける可能性が向上します。
Google Bard の新機能を日本で誰よりも早く試す方法
Google Bard の新機能は、Google が公式で提供するコチラのページから確認することができますが、日本語版 Bard では、これら新機能をすぐに利用することができません。どうやら Google Bard の新機能は、英語版の Bard に先行リリースされ、日本語版バージョンのリリースには時間がかかるようです。実際、6/7にリリースされた「 Bard が生成したテーブルを Google スプレッドシートにエクスポート 」という機能は6/26現在、日本語版 Bard では利用することができません。
しかし、実は Google Bard の新機能を日本からすぐに試す方法があります。この方法が知りたい方はコチラの記事をご参考ください。
Google Bard の体験は今後 Google Workspace に統合されていく
2023年5月10日、 Google I/O 2023にて、 Google が「 Duet AI for Google Workspace (※3)」の発表を行いました。Duet AI の基盤は「PaLM2」であるため、実質「 Duet AI は Google Workspace に Bard が組み込まれていくサービス」という解釈で間違いないと思います。例えば、以下のような機能を Google は紹介しています。
- Gmail や Google ドキュメントでの執筆活動サポート
- Google スライド内でテキストから画像生成
- スプレッドシート上のデータから次のアクションを提案
これはあくまで一例であり、今後はさらに Google Workspace サービスと生成AIとの統合が進んでいき、私たちは今以上に、業務効率化だけでなく、クリエイティビティの面でも大きな恩恵を受けることができるようになります。
※3 Duet AI for Google Workspace について詳しく知りたい方はコチラの記事をご参考ください。
Google Bard APIの最新情報(2023/07/01時点)
厳密にいうと、 Google Bard API は存在しません。しかし、 Google Bard のようなアプリを生成するためのAPIやツール群は用意されています。例えば、 Google Cloud Platform の Vertex AI というサービスには、最先端の基盤モデル向けの API と、独自のデータを使用して生成モデルをプロトタイピング、テスト、調整するためのツールが用意されています。Vertex AIには「Generative AI Studio 」というツールが用意されており、このツールを利用すると、簡単に言うと「独自の Google Bard アプリ」の開発が可能になります。一方で、 Google の生成AI関連で、もう一つ気になる動きがあります。
Google Bard に搭載されているPaLM2に直接アクセス可能なAPIが一部公開中
実は「PaLM API」というAPIがパブリックプレビュー版として、試験的に一部ユーザーに公開されているようです。コチラのページにアクセスしてみてください。トップページに「The PaLM API and MakerSuite make it fast and easy to use Google’s large language models to build innovative AI applications」という英文の説明文が記載されています。これを日本語に翻訳すると「PaLM API と MakerSuite により、Google の大規模な言語モデルを使用して革新的な AI アプリケーションを迅速かつ簡単に構築できるようになります」となります。
気になる2つのサービスがリリース間近?
どうやら、 Google が提供している生成AI関連のサービスには2種類が存在するようです。
PaLM API
Googel Bard の基盤となる大規模言語モデル(LLM)である「PaLM2」に接続するためのAPI。公式ドキュメントを見ると、コンテンツ生成、ダイアログ エージェント、要約、分類などのユースケース向けの生成 AI アプリケーションを構築することができるようです。
MakerSuite
生成AIのプロトタイプをWeb上で構築するためのツールのようです。WebのGUIから直接、視覚的にPaLM APIに接続することができるイメージでしょうか。作成したプロトタイプアプリのソースコードをGUI上から出力できるようです。もちろん、生成したプロトタイプは、他の Google アカウントユーザーとも共有が可能です。
気になる方はウェイトリストに登録しよう
ここまで説明したサービスが気になる方は、とりあえずパブリックプレビュー版のウェイトリストに登録しておきましょう。コチラのリンクをクリックし、「Jon the waitlist」から利用申請を行いましょう。
Google Bard アプリはいつからダウンロード可能?
2023年5月26日、ChatGPTのiPhone版アプリが日本からもダウンロードできるようになりました。私も早速インストールしてみましたが、やはりスマホから利用できるのは非常に便利です。 Google Bard については、ネイティブアプリがリリースされる予定は今のところありませんが、今回のChatGPTの動きはもちろん意識していると思いますので、そう遠くない未来にはリリースされるのではないでしょうか。もちろん、お手持ちのスマホからブラウザを立ち上げて、 Google アカウントでログインすれば、スマホからでも利用可能です。
Google Bard が画像検索にも対応
2023年5月23日、Google I/O 2023にて Google は Bard が画像検索に対応したことを発表しました。現在「英語による入力」にしか対応していませんが、以下のように「猫の画像が欲しい」と呼びかけることで、 Bard 上で画像を表示することができます。また、英語版のUIでは直接画像を入力することもできるようです。ちなみに画像をクリックすると、画像の参照元ページが表示されます。
Google Bard が位置情報に対応
ご利用の端末の位置情報を Google Bard に許可する場合、より高い関連性の高い、制度の高い回答を得られるようになりました。例えば、ユーザーが現在いる場所の周辺に存在するレストランやコンビニ等、お住まいの地域に関連する情報を得ることができます。
ChatGPTと比較した場合の Google Bard の強み
現在、日本語版ではサポートされていませんが、2023年7月13日、 Google Bard はマルチモーダル対応を発表しました。マルチモーダルとは、画像や音声、テキストを関連付けて処理するための機能であり、2023年8月4日時点では、ChatGPTにはない Google Bard 独自の機能になっています。ただ、ChatGPTがマルチモーダルに対応するのは時間の問題であり、あくまで現時点でのアドバンテージであると言えます。
まとめ
先日開催された Google I/O 2023 にて、 Google のスンダー・ピチャイCEOが、生成AIの Google の出遅れの指摘に対して「スタートだけみて未来が決まったと思われるのは困る」という趣旨の発言をしました。スンダー・ピチャイCEOの言う通り、確かに生成AIが盛り上がりを見せたのはここ最近の話です。私の感想としても、 Google Bard はChatGPTと比較すると出遅れ感は否めませんが、ピチャイCEOの言う通り、生成AIはこれからの技術であるため、過去どの企業よりもAIに力を入れてきた Google が本来の力を発揮するのは、これからだと期待しています。今後、 Google Bard がどのような進化を遂げていくのか、とても楽しみです。