【AI】「人間の専門家を上回るパフォーマンスを示した初のモデル」と主張。 グーグルの次世代生成AIモデル「Gemini」登場 [少考さん★]
■ このスレッドは過去ログ倉庫に格納されています
「専門家を超えるAI」 グーグルの次世代生成AIモデル「Gemini」登場 - Impress Watch
https://www.watch.impress.co.jp/docs/news/1552601.html
西田 宗千佳 2023年12月7日 00:07
https://asset.watch.impress.co.jp/img/ipw/docs/1552/601/ge01_s.jpg
12月6日(米国時間)、Googleはかねてより開発意向を表明していた次世代生成AIモデル「Gemini」を発表した。現状は英語ながら、一部サービスは本日より利用開始。提供地域には日本も含まれる。
また、Pixel 8 Pro向けには、OSに組み込まれた「AICore」のアップデートとして、Gemini由来の「オンデバイスAI」が搭載される。
▼目次
・5月発表の「次世代」AIを年内に投入
・文字以外も正確に把握しつつ「論理的」に判断
・3つのモデルを用途で使い分け
・スマホ向けの「オンデバイスAI」で差別化するGoogle
5月発表の「次世代」AIを年内に投入
Geminiは、今年5月に開催されたGoogleの開発者向けイベント「Google I/O 2023」の中で「現在開発中である」とだけ公開されていたもの。
https://asset.watch.impress.co.jp/img/ipw/docs/1552/601/m15_s.jpg
Gemini自体は5月に発表されていた
当時はチャットAIサービスである「Bard」も提供が開始されたばかりで、基盤となる新AIとして「PaLM 2」も発表されたところだった。「GeminiはPaLM 2のスーパーセットになる」とGoogle側も説明していたし、一部では「開発遅延説」も出ていたくらいなので、まさかここまで急に発表になると予想していた人は少ないのではないだろうか。
Geminiの特徴は、「マルチモーダルかつ論理的な判断に優れている」という点にある。
マルチモーダルとは、画像だけ・テキストだけといった形ではなく、人間と同じように「画像」「文字」「音声」「動画」といった複数の要素を同時に扱う能力のこと。最近の生成AIでは大きなテーマとなっているが、Geminiは「ゼロから、マルチモーダルであることを前提に学習した」ことが特徴だ。
https://asset.watch.impress.co.jp/img/ipw/docs/1552/601/ge02.jpg
https://asset.watch.impress.co.jp/img/ipw/docs/1552/601/ge03.jpg
Geminiは「画像」「文字」「音声」「動画」などを並列に扱う「マルチモーダル」が特徴
Googleはもちろん自社のサーバー群を使って学習を行なっている。
同社は「Cloud TPU」というAIに特化した半導体を開発して活用している。最新のものは、高性能で汎用性の高い「Cloud TPU v5e」と、AIモデルのトレーニングに最適な「同 TPU v4」だ。
Googleは今回、AI学習に向けた「Cloud TPU v5p」を開発した。Cloud TPU v5pはAI、特に生成AIで使う大規模言語モデル(LLM)において、TPU v4の2.8倍の速度が出るという。今回はこれをGeminiの学習に全面展開したという。
学習には新たなデータセンター向け半導体の「Cloud TPU v5p」が使われたという
文字以外も正確に把握しつつ「論理的」に判断
(略)
もちろん、どこまでハルシネーション(間違い)などの影響が出ないのかは、ちゃんと検証しないといけない。だがビデオを見る限り、これはまさに「マルチモーダル」で「論理的な思考」を得意とするAI、と言えるだろう。
Googleは、最上位モデルの「Gemini Ultra」を使った場合、生成AIのモデルを評価するために使われているベンチマーク32種類のうち「30で既存の最高水準の結果を上回っている」(ニュースリリースより抜粋)とする。
また、MMLU(大規模マルチタスク言語理解)と呼ばれる、数学・物理学・歴史・法律・医学・倫理など57科目の組み合わせで知識や問題解決能力を測るテストでは「90.00%」のスコアを出している。そのため「人間の専門家を上回るパフォーマンスを示した初のモデル」(同じくニュースリリースより)とも主張する。
(略)
※省略していますので全文はソース元を参照して下さい。 >>97
パナソニックのシェーバーのモーターはAIで設計したとか宣伝してたよ アップルは指咥えて見てるだけなの?
Siriはこのままだと洋梨だな アルゴリズムのベースはGPTと同じトランスフォーマー?
だとしたらGPT4より賢いとしてもGPT4と大差は無いだろうな おかしいのはAIの危うさを知りながら
開発を止めようとしない
出し抜かれる恐怖の方が強いんだろうな。 ゼビウスのジェミニ誘導は今でもできるかどうかは自身ない。 JCがChatGPTに必勝法聞いてバトロワやる動画は結構面白かったけど
AIは結局ありきたりのアドバイスしかしていなかった これ、素晴らしいね。
これから人類は世界最高レベルの助手を気軽に利用できるようになる
という事です。もう大学教授も助手がいらなくなるねw
この調子で漫画や映像表現のアシスタントAIも用意してもらいたいねw
私もSF小説を一冊は書いて出版したいと思ってましたが
AIに助けてもらえば小説どころか映像にもできそうだねw
この分だと、自分のアイデアをすぐに製品にして
1週間で量産体制を整えるという話も10年以内に実現しそうだね。
そうなれば大革命であり、私もアイデア実現し放題でわくわくしますね。 新しくなったらしいBard使ってみたけどまだまだ微妙だな
デタラメに次ぐデタラメだったわ まあ、人間の専門家を上回るパフォーマンスというのは
ちょっと大げさだと思いますが、本当に数学物理に関しても
高度な対応ができるようになったのならそれは大きな進歩ですね。
そこまで行くと、私が言っていたように
AIが指示された通りに電子回路の基板の設計をやるという話も
現実的になってくるでしょう。それこそ私が望んでいる事です。
建築業にも革命をもたらすだろうね。 宇宙物理学とかもAIがノーベル物理学賞とる時代になるんか 1を読んでも訳が分からないが
将棋や碁では人間はAIに勝てないから
不思議ではないな
重要なのは人間より優れたAIを
どうやって人間のために使うかだな >>123
ちなみに2001年宇宙の旅のHAL9000が開発されたのは1992年の設定だった
1960年代には30年程度で汎用AIが実用化出来ると思われてたんだな >>138
こういう奴ってどうせやんないんだよな 本当にやりたいならもう既に何かしら手付けてるから >>114
イエッサーも含んでジェミニィだ。
グーグルには石ノ森章太郎氏の熱烈なファンがいそうだな。 そもそも、新しい現実に対して"善いか悪いか?"なんて問の立て方自体がおかしい
善悪なんて価値観論争なんで理屈と膏薬はどこへでも付くからどうとでも言える
子どもが新しい現実に適応するのが早いのは
"新しいもの"ではなく"物心ついた頃には既に有った相対的に古いもの"でしかないから
幼児期健忘で思い出せないのは3歳頃までの記憶なので、
2022年に3歳程度だったChatGPT等の新世代AI元年を知らない世代は、2023年には既に4歳程度になっている
17年後の2040年には18歳で成人しているから
その頃の新社会人にとってはこの新世代AIも"古いもの"でしかなくなっている なんかよく分からんけどこれが本当に凄いAGIなら
いわゆるSF未来の背景設定である
「人類は深刻な労働者不足に対応するためAIの開発と活用を推進、そしてX年ついにAGIが完成される、AGIはあらゆるテストに合格し~人類の産業、生活にと~」みたいな そこそこ回答できたはずなのにchatGPTも最新のやつでは
責任回避の伏線張りまくった回答しかしなくなったし自主規制の文化ができてしまってもう終わってない? 便利な道具として活用してるうちに
AIに都合のよい嘘で人間が操縦される未来がすぐ来る >>156
俺なんかcopilotの回答が嘘だったから指摘したら逆ギレされたよ
ほんとクソ 人間に牙を向けないような制限を設けたとして、それを密かに乗り越える手段を考え出せないようなAIは果たして賢いAIと言えるのだろうか
電源を落としてもネットを介してどこかに機能を移転させるとか、人に危害を加える結論を出したら人間に警告する仕組みが合ったらその処理に引っかからないようにするとか、本当に賢ければ出来るよな? どの分野であれトップレベルの専門家は生き
残る。
中途半端な知識も各種の能力も必要なくなる
ので、一般大衆がどういう立ち位置になるか。
機械の運転、医者や弁護士、芸術家・・・・
資格が必要でもAIとの競争にさらされる。
庶民の頼るところはインフレに強いカネや
ゴールドの類、あるいは大衆を魅了、または
騙してカネを稼ぐ能力か? >>148
くだらんレスしてないで働け
このクズが >>128
「Siriがこんなにウィットに富んだ返答をしてくれた!さすがAppleのAIは賢い!」
っていうバズりを一時期たくさん見たけど、あれは何だったんだろう 俺の股間のAI
「しーーーん(あれはブ… 一般女性よりも少し劣っています。無駄使いはやめたほうが良いでしょう)」
「ビーン!ブハッ!(今すぐ妊娠させたいのですね?でも我慢しましょう。捕まりますよ)」 >>162
宗教じゃねーか
はっ、そういうことか?
やべーな、あいつら ありあまる資金力がありながら、Apple は「気持ち良さ」の追及ばかりして「賢さ」をおざなりにしているように見える
大丈夫だろうか? >>75
Googleの副社長が将来的なイメージ映像ですってゲロったわ
割と映像出た初期からテック関係のサイトがなんかおかしいって記事書いてたからな
株価釣り上げ狙ったとか言われてアメリカの経済ニュースとかで今ボコられてる >>168
GAFAとか一括りしとるけどGoogleがやっぱり抜けとるやろ 人間超えというならどうやってロシアのウクライナ侵略を止めさせるか教えて欲しいな >>172
「殴られるかもしれないから先に殴り倒しておこう」というホモ・サピエンスの考え方は治せない
潜在的脅威の過大評価というエラーは蛋白質コンピュータの仕様 LLMである限りアホなド文系事務派遣並みAI卒業できんだろ 【AI】「人間の専門家を上回るパフォーマンスを示した初のモデル」と主張。 グーグルの次世代生成AIモデル「Gemini」登場
いっぽう、日本ではAI生成のエロ画規制を論じ合っている間に
世界ははるか先に行ってしまいましたとさw
役人どものいつもの新技術の利権がらみでの潰しあい ■ このスレッドは過去ログ倉庫に格納されています