【Googleの最先端AIモデル】Gemmaとは?Geminiとの違いも解説

Googleから誰でも利用可能なオープンソースAIモデルがリリースされました。

その名も「Gemma」!(発音は「ジェンマ」)

「Gemma」とはイタリア語から派生した言葉で、日本語で「宝石」や「ジュエリー」といった意味があるようです。大手テック企業が考えたとは思えないほどロマンチックな名前ですね笑

今回は、Googleの最先端AIモデル、Gemmaについての説明とGemmaで出来ることについて解説していきたいと思います。

Gemmaはこの記事執筆時点で Gemma 3 というものが最新モデルで、どんどん進化しています。

1.「Gemma」とは何か?

「Gemma」とは、2024年2月21日にGoogleからリリースされたAIモデルです。メタ社(旧フェイスブック)やMistral AIといった他社のAIモデルに対抗して作られました。

「Gemma」は「Gemini」と比べると小さなサイズの言語モデルで、グーグルの子会社であるディープマインド社とグーグルのチームによって開発されました。

「Gemini」がChatGPTに対抗してつくられた大きなAIモデルの一方、「Gemma」はチャットボットや文章生成などの特定のタスクに向いているモデルです。

Googleがリリースした大規模言語モデルの「Gemini」と同様の製法で作られており、6兆トークンものテキストによって事前学習とファインチューニングを経て、文章生成が強みとなっています。

学習の際のAIチップにはGPU(Graphical Processing Unit)とGoogle独自のTPU(Tensor Processing Unit)が使われています。

2.「Gemini」と何が違うの?

Geminiとの一番の大きな違いは、Gemmaは「オープンソースAIモデル」といって一般公開されているため、誰でも無料で使うことができる点です。

Geminiは「クローズドAIモデル」と呼ばれており、AIモデルが一般公開されていません。

そのため、個人の開発者や他社企業はGeminiのAIモデルを自由に使うことはできないのです。

そのほかに「Gemma」はGeminiと違い、英語をメインとしたデータで訓練されているので、英語以外の言語があまり得意ではないとテクニカルレポートには書かれていました。

しかし、実際に日本語でGemmaに話しかけたプログラマーの方もいるようで、その方によれば流暢な日本語が返ってきたそうです。

また、「Gemma」は主に文書、数学、コーディングを扱うデータをもとに作られています。

ただ、Geminiのようにマルチモーダル(テキスト、音声、画像などの複数のメディアの情報処理)ではないため、マルチモーダルAIと比べた場合性能に差がでると思われます。

3. Gemmaには「2B」と「7B」の2つのサイズのモデルがある

Gemmaには2つのサイズのモデルがあり、「2B」と「7B」というサイズに分かれています。

このサイズというのは、「パラメーターの数」のことです。パラメーターとはAIが言葉を理解したり、生成したりするのに必要な数値です。

「パラメーター」について簡単に説明すると、赤ちゃんは「バナナ」と「りんご」の違いを学ぶときに似ています。赤ちゃんはそれぞれの特徴を色、形、味などで覚えるのです。

AIも赤ちゃんに似たように特徴をパラメーターという数値で理解するのです。

「Gemma 2B」には20億のパラメーターがあり、「Gamma 7B」には70億のパラメーターがあるのです。

この「B」というのは英語で「Billion=10億」という意味になります。つまり、2Bは20億となり7Bだと70億になるのです。

ちなみにChatGPT-3.5は3550億パラメーターで、GPT-4.0だと約1兆、Geminiも1兆に近い数だと言われています。公式には発表されていないので、あくまで推測です。

ChatGPTやGeminiなどの大規模言語モデルと比べると「Gemma」のモデルはかなり小さいことがわかります。

4. Geminiのパラメーター数は少ないからといって侮るべからず

ChatGPTやGeminiのパラメータ数が多いけど、Geminiは少なくて残念…と考える方もいるかと思います。

私も子供のとき、アイスクリームの量が他の兄弟よりも少なかったら悲しい気もちになりました。

しかし、アイスクリームとは違って、パラメーターが少ないから仕事ができないことにはなりません。

確かにパラメーターに数が多いとChatGPT-4やGeminiのように高い性能を発揮できることが多いです。

しかし、パラメーターの数が多いと処理が重くなったりして、AIが思い通り動かなくなったりします。

また、数が多い場合、質の良いデータを集めないとバイアスが大きくなることがあるので、良い点だらけとは言えないのです。

イメージでは、ハーゲンダッツは値段が高くてカロリーもあって食べると太る。

しかし、ガリガリくんの方はさっぱりで美味しいし太りにくいから自分に合ってる!みたいな感じかもしれません。

5. 実際に「Gemma」のパフォーマンスをメタ社のLlama-2と比べてみる

下の表がGoogleが出した「Gemma」のパフォーマンスを、メタ社のだしているAIモデルLlama-2とMistral AIというモデルを比べたものです。

これらのAIは「Gemma」とパラメーターの数が近いオープンソース化されたAIモデルを使っています。

一番右の緑色の棒が「Gemma」で左の2本の青と赤の棒が「Llama-2」、黄色が「Mistral AI」です。

Gemma performance chart

(引用元:Gemma: Introducing new state-of-the-art open models

この表では、4つの指標でAIのパフォーマンスを比べています。左から「質問への返答能力」、「推論能力」、「数学/科学」、「プログラミング」です。

質問への返答能力の項目では、LLaMA 2(13B)がかすかにほかのモデルよりも高いスコアを出しています。

しかし、他の項目においては、Googleの「Gemma」が一番高い成績をつけました。

一般的にはパラメーター数が多いほどパフォーマンスが高いとも言われていますが、AIモデルによってはパラーメーター数が低いものでもパフォーマンスが高くなることがありえるのです。

今回の結果では、Gemmaが相対的に良いパフォーマンスを出せることがわかりました。

6.「Gemma」が出来ること

Gemmaは「主要ベンチマークで大型AIモデルを上回る性能」を持っているとGoogleが公式サイトに書いています。

AI開発を考えている企業にとっては、Mistral AIやLLaMAよりも「Gemma」を選ぶ理由になるかもしれません。

主にはチャットボットをつくったり、AIアプリを作るというのが用途になりそうです。

Gemmaには「AIツールキット」と呼ばれる開発者をサポートするソフトウェアがついてきます。

開発者が独自にガイドラインを作れたり、使ってはいけない言葉の設定、デバッグをサポートしてくれるのでぜひ活用していきましょう。

また、クラウド上で動かすだけではなく、ラップトップやデスクトップ内でGemmaを動かすことができるそうなので、アクセス性の良さやコスト削減にもつながりそうです。

組織の人数やユーザー数にかかわらず、Gemma 2B / 7Bともに、商用利用が可能ということも覚えておきたいですね!

7.「Gemma」が出来ないこと

Gemmaは、社会通念に反することができません。

例えば、爆弾や拳銃の作り方といった人を傷つけるようなことをサポートすることができないことが明記されています。

モデルには危険な情報を排除するフィルターをかけたり、セキュリティー上の問題がないか専門チームとの密なやり取りをしてはいるようです。

しかし、オープンモデルということから、危険な使い方をしようとする人がいることも確かでしょう。

オープンソース化する場合には安全に十分に注意する必要があり、Googleはこれからも悪質な使い方には警戒を強めていくようです。

8. 最後に

これからはAIモデルのオープンソース化もどんどん進んでいくと思われます。

噂によるとOpenAIもオープンソース用のAIモデルを作っているようで、AIモデル戦国時代に突入しそうな勢いです。

こんなときに大事なのは、しっかりとそのモデルの良い点と悪い点を見定めて、自分のプロジェクトに合ったモデルを選ぶことが重要です。

参考文献

Gemma: Introducing new state-of-the-art open models

google/gemma-2b-it

Google Introduces Gemma, a New Open Source AI Model for Developers

Read more

リアルタイム投票アプリ5選【ライブ配信やイベントで】

リアルタイム投票アプリ5選【ライブ配信やイベントで】

ウェビナーやセミナー、社内研修を実施する際、「参加者が受け身になってしまう」「質問がなかなか出てこない」といった課題を感じたことはないでしょうか。 オンラインでの情報発信が当たり前になった今、一方的な配信だけでは参加者の満足度を高めることが難しくなっています。そこで注目されているのが、リアルタイムで参加者の意見を集約し、その場で結果を共有できる投票・質問ツールです。 本記事では、ライブ配信やイベント、研修などで活用できるリアルタイム投票アプリを5つ厳選してご紹介します。 リアルタイム投票でつながる参加者とイベント リアルタイム投票やQ&A機能を使うと、視聴者や参加者の意見を即座に集計・表示できます。講義や会議の進行を妨げず、参加者全員が自分の意見を簡単に表明できる仕組みです。 従来の挙手による質疑応答では、発言しづらいと感じる参加者も少なくありません。特にオンラインイベントでは、カメラがオンになっていることへの抵抗感や、大人数の前で質問することへのハードルが存在します。 しかし、スマートフォンから匿名で投票やコメントができる仕組みがあれば、参加者は気軽に自分の意見を伝えら

By 阿部 隼也
質問受付ツールの選び方とおすすめ5選を紹介

質問受付ツールの選び方とおすすめ5選を紹介

セミナーや講演会、社内研修などで「質問はありませんか?」と投げかけても、なかなか手が挙がらない経験はないでしょうか。参加者に有益な情報を提供しても、疑問や意見が共有されないまま終わってしまうのは、主催者にとっても参加者にとっても大きな機会損失です。 こうした課題を解決するために注目されているのが「質問受付ツール」です。参加者がスマートフォンから匿名で質問を投稿できるため、発言への抵抗感が下がり、活発なコミュニケーションが生まれます。 本記事では、質問受付ツールの基本機能から、実際に役立つおすすめツール5選、そして選定時に押さえておきたいポイントまで、実務に活かせる情報をまとめて解説します。 質問受付の現場課題 イベントやセミナーの運営で最も頭を悩ませる問題の一つが、参加者からの質問をいかに引き出すかという点です。質問タイムを設けても、会場がシーンと静まり返ってしまい、仕方なく「それでは時間になりましたので」と締めくくる光景は珍しくありません。 この背景には、日本特有の文化的要因も関係しています。大勢の前で発言することへの恥ずかしさ、自分の質問が的外れではないかという不安、他

By 阿部 隼也
オンラインセミナーアプリの選び方。参加者エンゲージメントを高めるポイント

オンラインセミナーアプリの選び方。参加者エンゲージメントを高めるポイント

近年、オンラインセミナーの活用が急速に広がっています。会場のコストや移動時間を気にすることなく、全国・世界中から参加者を集められる点は大きな魅力です。 しかし、せっかく開催しても 「参加者が途中で離脱してしまう」 「ただ見ているだけで反応が薄い」 といった課題を抱えている企業も少なくありません。 本記事では、参加者のエンゲージメントを高め、成果につながるオンラインセミナーアプリの選び方と、実務に役立つ具体的なポイントを解説します。 参加者とのつながりを生むオンライン環境の設計 オンラインセミナーにおける最大の課題は、画面越しの距離感です。会場で直接顔を合わせる機会がないからこそ、参加者が「ただ見ているだけ」にならないような仕組みが求められます。適切なツールと機能選びが、参加者のエンゲージメントを左右します。 従来のオフラインセミナーでは、会場の雰囲気や参加者同士の反応が自然と生まれましたが、オンラインではそうした「空気感」が伝わりにくくなります。だからこそ、双方向のコミュニケーション機能や、参加者の行動データを活用した設計が重要になるのです。 エンゲージメントを高

By 阿部 隼也
参加者の質問を効率的に管理!ZoomウェビナーQ&A機能の使い方を徹底解説

参加者の質問を効率的に管理!ZoomウェビナーQ&A機能の使い方を徹底解説

オンラインでのセミナーやイベントが日常化する中で、Zoomウェビナーを活用している企業が増えています。しかし、ウェビナーの開催で意外と頭を悩ませるのが「参加者からの質問をどう管理するか」という点ではないでしょうか。 セミナーが盛り上がり、次々と質問が寄せられるのは嬉しいことです。一方で、質問が多すぎて整理しきれない、どの質問に優先的に答えるべきか判断に迷う、といった課題も生じます。こうした問題を解決するために役立つのが、ZoomウェビナーのQ&A機能です。 本記事では、ZoomウェビナーのQ&A機能の基本的な使い方から、参加者の質問を効率的に管理する実践的なテクニックまで、詳しく解説していきます。 ZoomウェビナーのQ&A機能とは ZoomウェビナーのQ&A機能は、ウェビナー開催中に参加者が質問を投稿し、主催者側が回答を行うための専用機能です。この機能を使うことで、質問と回答がスレッド形式で整理され、効率的なコミュニケーションが可能になります。 チャット機能との違い Zoomには「チャット機能」もあるため、「Q&A機能とチャット機能の違いは何か」と疑問に思う方も多いで

By 阿部 隼也