Googleの最新生成AI『Gemini』がすごそう!
こんにちは。唐沢農機サービス ビーズクリエイトの日野です。
今回は、2023年12月にリリースされるとウワサのGoogleの最新生成AI『Gemini』をご紹介します。
『Gemini』の概要
「初めからマルチモーダル化を前提として開発されている」ことが大きな特徴の一つです。
マルチモーダルAIとは、文字・画像・映像・音声などの複数の情報を、
統合して処理することのできるAIシステムを指します。
リンクの動画は、GoogleのYouTubeチャンネルにも公開されている、Geminiデモンストレーション動画です。
印象的なシーンをピックアップすると
- 人が描いたアヒルの絵を認識できる。
- アヒルが青色に塗られていることについて、違和感があると言及できる。
- 左右のどちらの手にコインがあるかという手品を見破ることができる。
- 人が描いたアコースティックギターに対し、アコースティックギターの音声を流す。
- その絵にアンプが書き加えられると、エレキギターの音声を流す。
映像を認識し、リアルタイムでコミュニケーションが取れるということでしょうか。
なんだかとてもすごそうです。
『Gemini』の特徴
①3つのモデルがある
Ultra・Pro・Nanoの3つがリリース予定です。
Ultraはまだ開発中とのことですが、2024年の早い時期には公開されるようです。
ProはGoogleの会話型AI『Bard』ですでに利用することができます。(ただし英語版)
Nanoはスマホに実装されるサイズであり、Googleスマホである『Pixel』において一部アプリで利用できるそうです。
②Ultraの性能はGPT-4を超える!?
Googleからの情報では、32のベンチマークのうち30で、GPT-4よりも高いスコアをたたき出したようです。
「Gemini Ultra は、数学、物理学、歴史、法律、医学、倫理など 57 の科目の組み合わせて知識と問題解決能力をテストする MMLU (大規模マルチタスク言語理解) で 90.00% をスコアし、人間の専門家を上回るパフォーマンスを示した初のモデルです。」
(引用:GoogleJapanBlog「最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに」)
普段GPT-4を使うことが多い人にとっては衝撃の結果なのではないでしょうか。
私も今から使うのが楽しみです。
③『Bard Advanced』に進化
すでに英語版ではGemini Proが実装されているBardについてです。
BardはGoogleが開発・提供している会話型人工知能であり、2023年3月にリリースされました。
ChatGPTと比べるとイマイチな使用感で、正直あまり触れてきませんでした。
しかしすでに一部の言語ではBardでGeminiProを体験できることに加え、
2024年には「Bard Advansed」というアップグレードされたサービスがリリースされるようです。
そのBard AdvansedにはGemini Ultraが実装される予定らしく、こちらも今から非常に楽しみです。
サイト制作・採用応募のお問い合わせをお待ちしています!
私たちビーズクリエイトは、目的達成のためのWEBサイト制作を得意としております。
WEBサイト制作のご依頼は下のボタンをクリック
また、ビーズクリエイトでは、一緒に働く仲間を募集しています。
ご興味のある方は下のボタンをクリック
会社説明会の日程は下のボタンをクリック
株式会社 唐沢農機サービス
B’sCre8 (ビーズクリエイト)
〒389-0518
長野県東御市本海野1642
TEL. 050-3154-1124(平日 9:00-17:00)
FAX. 0268-63-7085