X



世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ GPU不要になる可能性も [お断り★]
■ このスレッドは過去ログ倉庫に格納されています
0001お断り ★
垢版 |
2024/02/29(木) 16:34:34.47ID:/Cz/NJMF9
Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits(https://arxiv.org/pdf/2402.17764.pdf)」だ。
彼らが発表したグラフを引用しよう。
画像
https://wirelesswire.jp/wp-content/uploads/2024/02/21622e3ce0b3cdc355c5a6679c4ea640-1536x1031.png

この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。

通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。

しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。

このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。
詳細はソース 2024/2/28
https://news.goo.ne.jp/article/wirelesswire/business/wirelesswire-20240286094.html

Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。

[2402.17764] The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
https://arxiv.org/abs/2402.17764

従来のモデルであれば入力に対して「0.2961」などのウェイトをかけ算してから足し引きする必要がありましたが、「-1」「0」「1」の3値のみであればかけ算が不要になり、全ての計算を足し算で行えるようになります。

今回の手法を利用することで行列演算に必要なかけ算の量を大幅に削減できるため、論文では「1bitの大規模言語モデル用の新たなハードウェア設計への扉を開く」と述べられています。

詳細はソース 2024/2/29
https://gigazine.net/news/20240229-microsoft-1bit-llm/
0102アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:07:17.78ID:LDMUem+e0
ビビッときた
0103アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:07:50.39ID:C+VOGX8D0
光ディスクの容量を飛躍的に多くする話といい、飛ばし記事としか思えない
中国人のニュースではそのくらい慎重でいい
0104アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:08:19.39ID:woPnTNKF0
-1, 0, 1 の3状態を表現するには1bitじゃなくて1.58bit必要なわけだが
どこから「1ビット」なんて話になった?
0106アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:09:49.17ID:GWFoCZ060
1と0でΦって事か
0107アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:10:18.78ID:rWXkqFuC0
>>104
中国の抱える巨額の負債を減らすには埋めるという(´・ω・`)
でも無理だから着手した時点で中国はジンバブエに(´・ω・`)
0108アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:10:31.11ID:aGgv3amt0
>>18
俺の8bit脳の計算では既に彼女いると出てたよ
男女がくっつくパターンなんかそんな複雑さはない
日ハム時代から彼女はいた
0111アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:13:12.36ID:twXkiOP50
64ビット
18446744073709551616

64ビットPCでは一度にこの桁の計算をしてるらしい
どれだけすごいのかよく分からん
0113アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:13:26.84ID:EBg7tS+Q0
これがまじならnVidia株暴落やん
0115アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:14:24.94ID:aGgv3amt0
>>104
記事にMicrosoftが成功と書いてある
論文元は中国

数式で表現すると
中国論文+Microsoft=ジャップの嫉妬
0116アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:14:33.28ID:OPHQlx7p0
よくわからんがこういうことらしい

Microsoftの中国のチームが作った「BitNet 1.58Bits」というプログラムは、今までのプログラムよりも3倍速くて、正確に動く特別なプログラムです。
普通のプログラムは計算するのにたくさんの数字を使いますが、BitNetは「-1」「0」「1」の3つの数字だけを使って計算します。
これで、計算がとても簡単になり、速くて、パソコンのメモリもあまり使わなくて済みます。
つまり、Microsoftはパソコンがサクサク動く新しい方法を見つけたということです。
これにより、将来はもっと速いパソコンや新しい機械が作られるかもしれません。
0118アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:14:59.61ID:28epNnoO0
>>104
データ量増やしてるよな
新しい単位でも作られるだろうな
>>109
データの取り扱いが肥大化
処理時間が還元
0121アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:16:11.35ID:EBg7tS+Q0
これって特許の対象?
0123アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:17:14.25ID:Bobbg/hF0
1ミリもわからんからプリキュアで例えてくれ
0124アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:17:48.39ID:sCp1aOVS0
量子GPUの発売はまだ ?
0127アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:18:43.74ID:Zm62848f0
三進法コンピュータは1950年代にソ連で実際に作られてたんじゃねえかな?
0128アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:18:57.29ID:PfoYhZ2n0
AIの学習はある入力に対してどんな出力をすればいいかという論理に重み付けをして学習していくイメージだけどその重み付けのパラメータを1固定にして乗算を不要にしたって事なのかな?いや多分違うよな…
0129アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:19:06.21ID:8rO9Tpt80
中国チームてのがポイントだよね
0130アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:20:05.52ID:XbXqT5Ed0
マシン語か?
0131アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:20:21.81ID:s4ly51910
実用に15年、普及には20年かかりそう
新理論が出来た出来たいいながらいまだに燃えながらリチウムバッテリー使ってるんだぜ
0133アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:20:57.19ID:BIVFq34P0
中国のGDPは日本の4.2倍です
日本の特許出願件数は中国の18%、日本の科学研究論文の数は中国の8%しかありません
0134アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:21:07.88ID:IzXLNBhO0
>>109
物凄く簡単に言うと、今まではデータにシリアルに番号を振っていた
番号が凄い大きな桁になったりして計算に時間が掛かっていた
MSが言うにはそのデータを-1、0、1のみに単純化して計算に掛かる時間を削減した
ということ

でもデータ量がでかくなるからメモリ消費量が多くなる気がするがw
気のせいかw
0135アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:21:14.17ID:YvanOMww0
問題は中国人の言うことを信用するかどうかだな
0140アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:24:44.93ID:SNoEtV3H0
理系分野ですらもう中国が圧倒的になりつつあるな 
0142アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:25:10.54ID:Zm62848f0
>>133
そういうのを出してる中国人研究者の7割は日本留学組だし、
いまでも大勢の中国人研究者が本邦に留学している。日本から中国に留学ないし
仕事を求めて中国に行ってる研究者はほとんどいないですがねw
0143アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:25:30.01ID:1tMordP20
パソコンとプリンタとの接続も昔はパラレルだったけどシリアルに取って代わられて久しいからな
0144アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:25:35.48ID:lLTfL3Y80
-1,0,1
これをビットとか1ビットと呼んでいいのか?
0145アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:25:51.58ID:z4Pg1ofP0
日本の技術者(裏切り者)が高級住宅と高給を与えられて開発してるからな
まあ日本の社畜社会が悪いんだけどね
0146アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:26:40.17ID:rWXkqFuC0
数学的に破綻してんだよ。これだから中国人は信用ならない。>>1
0147アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:27:04.94ID:Z16RTHiS0
今までは行列の計算(実数の乗算)を大量にする必要があった
それを-1/0/1に置き換えることで乗算しなくて済むようにして計算コストを下げた
中学のときにならった行列の計算方法を思い出そう!
0148アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:27:10.43ID:lLTfL3Y80
ウェイトの話じゃん
そりゃ効くかもな
なるほど
0149アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:27:24.17ID:Zm62848f0
>>134
ハードウエアからの設計になるんじゃまいかな?素子というか。
量子キュービッドもジョセフソン素子も3値だったかなw
0150アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:27:57.31ID:lLTfL3Y80
大規模になると強いのは確かだろうが、、、、、って感じだな
0151アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:28:03.38ID:rWXkqFuC0
>>147
一度に処理したら

どうやってメモリオーバーをフォローすんだよw
0152アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:28:16.26ID:yhR36WQr0
リリムん参上
0154アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:28:44.95ID:sCp1aOVS0
0と1と-1
つまり、男と女とオカマが混じった新しい世界だ
0155ぷる猫
垢版 |
2024/02/29(木) 17:28:56.18ID:OL8gJcNc0
2^2を計算するのに
(1+1)(1+1)=1+1+1+1
としたほうがチップ内では速いということだろ
0156アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:28:56.84ID:V4rcsWAL0
本当だとしたらって書いてあるぞ?
0159アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:29:16.29ID:CMbe/i4p0
1.58ビットって2ビットやん
+-を切り替え方式でやってビット数減らすんだろうけど
0160アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:29:26.80ID:TYrLDlA30
不動産不況の中国からインドへオルカン入れ替え
https://news.yahoo.co.jp/articles/ed8a423771ec3fba5d73f12b0c3b78676b61915b
アメリカのMSCIはオール・カントリー・ワールド・インデックスの構成銘柄を入れ替えた
オルカンから外れる101銘柄のうち、66銘柄は中国株。代わりに入ってくるのがインドです。

完全に見放されてて笑えるw
0161アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:29:28.15ID:Zm62848f0
>>153
すでに80年代に東北大でやってないかなw
0162アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:29:30.09ID:lLTfL3Y80
>>32
ハードウェアのビットの話じゃないよこれ
ソフトウェアですぐ真似できる
0167アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:30:30.56ID:Zm62848f0
>>162
まあな。だから1.53ビットとか怪しい数字をだしているw
0168アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:30:34.75ID:IMX3i0Dp0
ゴミ箱は撤退します

サードになります
0170アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:30:50.15ID:XMpi+iRm0
中国人は数が多いだけあって天才も多いよね
ルービックキューブ3個をジャグリングしながら全て6面揃えてる中国人の動画見た時は、こりゃ日本人じゃ勝てんわと思ったっけ
0171アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:31:09.29ID:Xl7fCJa30
>>164
windowsが終わって、このままずるずる落ちていくんやろなーと思ってたら
いつのまにか、世界時価総額ランキングで1位になってた
0172アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:31:28.56ID:lLTfL3Y80
なおさらGPUも使えば早くなるぞこれ
0173アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:32:16.07ID:lLTfL3Y80
解像度めっちゃ下がりそう
超大規模データには強そうだけど
0174アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:32:30.30ID:Zm62848f0
>>165
それは2進法で動くコンピュータってことね。3進法で動くのもあるのさ。
そして3進法のほうがかなり効率がいいのよw
0175アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:32:47.40ID:sZw2QyoT0
>>112
AI界隈は論文からの応用がとにかく爆速なのが特徴だから実用化は早いと思うけど、ハードウェア設計からとなるとやはり数年はかかるしnvidiaも似たようなの出すだろうから大して変わらんと思う
というか、GPUの場合はもともとゲーム向け用途で量産できるしエコシステムがあるから
単純に性能だけならセレブラスとかもっと成長してるはず
0176アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:33:26.81ID:Zm62848f0
ちなみに中国人には3進法で動くチップは作れないw
0177アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:33:44.41ID:PfoYhZ2n0
>>138
1bitの3つの状態を単純に-1, 0, 1 という値の表現に割り当てるのって違和感しかない
3値の各bitに符号の意味合いも持たせるなんて符号を最上位1bitだけで表せる2進法に比べてリソースの無駄だし一体どう使うのかな
0178アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:34:06.52ID:F2DKVqD70
ODAの成果が出たな
0179アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:34:17.78ID:WiSY36kr0
行列の掛け算の次元を落とすという話があったな
確かにすごいけど実用的じゃないという
0182アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:35:35.20ID:Zm62848f0
>>177
量子コンのキュービッドは3つだし、スピンも左回り右回り静止の3つ。より自然ですけどねw
0183アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:35:37.23ID:J9af4bdv0
鷺だね 真っ赤な色してる
0185アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:36:18.67ID:4IGfemCD0
量子コンピューターと一緒で製品化してから言え
0187アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:36:35.43ID:S0Bbkc7W0
どういう意味?エヌビディアはオワコン?
0188アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:36:42.73ID:fTsUPfMI0
>>177
昔から
コンピュータ理論の界隈には、3進数を推す派閥があるんだよね
自然対数の底なeに近いのが良いとかなんとかで
0189アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:37:11.50ID:SNoEtV3H0
日本って論文の注目度でイランにすら負けるくらい尋常じゃないくらい落ちぶれてるけど
資源も無いのに科学分野疎かにするってどういうつもり何だろう
0190アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:37:17.05ID:+kc+IXIO0
あーLLMね、LLM
LLMはまだ食べたことないなぁ
0191アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:38:11.03ID:ECdO5ElR0
嘘くせーな
で、どんな意味なの?
0192アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:38:13.33ID:wtxxAesp0
3進なので1.58bitってことか
Setunを現代の技術で復活させてくれないかな
0195アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:38:50.44ID:Zm62848f0
>>188
そだよ。今後の計算機のリミティングファクターは計算に用いるエネルギー量で
上限が設定される。省エネを考えないとオワコン。3進法はめちゃめちゃ効率が良いw
0196アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:38:59.06ID:Z16RTHiS0
-1/0/1を使ったのは掛け算を簡略化するためやぞ
-1*-1とか-1*1は考えなくても結果が分かるだろ
0/1/2を使ったら2*2とかは計算が必要になる
ハードウェアは関係ない
0198アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:39:50.02ID:nJA4CNfK0
NVIDIAの立場が危うくなってMSの立場が上がることになろうが
FANG+持ってたらトントンだからどうでもいいわ
0199アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:40:06.46ID:Zm62848f0
>>194
だから生成系AIは間抜けなのね。「そのどちらでもない」という理論値を扱えないからねw
0200アフターコロナの名無しさん
垢版 |
2024/02/29(木) 17:40:18.59ID:lLTfL3Y80
>>188
物理にも居るよな
誰だっけなあ
晩年は3が基礎になってるとか言ってたの
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況