世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ　GPU不要になる可能性も [お断り★]

**お断り ★** · 2024/02/29(木) 16:34:34.47

Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits(https://arxiv.org/pdf/2402.17764.pdf)」だ。
彼らが発表したグラフを引用しよう。
画像
https://wirelesswire.jp/wp-content/uploads/2024/02/21622e3ce0b3cdc355c5a6679c4ea640-1536x1031.png

この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。

通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。

しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。

このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。
詳細はソース 2024/2/28
https://news.goo.ne.jp/article/wirelesswire/business/wirelesswire-20240286094.html

Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。

[2402.17764] The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
https://arxiv.org/abs/2402.17764

従来のモデルであれば入力に対して「0.2961」などのウェイトをかけ算してから足し引きする必要がありましたが、「-1」「0」「1」の3値のみであればかけ算が不要になり、全ての計算を足し算で行えるようになります。

今回の手法を利用することで行列演算に必要なかけ算の量を大幅に削減できるため、論文では「1bitの大規模言語モデル用の新たなハードウェア設計への扉を開く」と述べられています。

詳細はソース 2024/2/29
https://gigazine.net/news/20240229-microsoft-1bit-llm/

**アフターコロナの名無しさん** · 2024/02/29(木) 17:07:00.80

>>18
😨🥹😨😨🥲

**アフターコロナの名無しさん** · 2024/02/29(木) 17:07:17.78

ビビッときた

**アフターコロナの名無しさん** · 2024/02/29(木) 17:07:50.39

光ディスクの容量を飛躍的に多くする話といい、飛ばし記事としか思えない
中国人のニュースではそのくらい慎重でいい

**アフターコロナの名無しさん** · 2024/02/29(木) 17:08:19.39

-1, 0, 1 の3状態を表現するには1bitじゃなくて1.58bit必要なわけだが
どこから「1ビット」なんて話になった？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:09:21.49

よく考えたら世界三大発明は全部中国だもんな
発明の国だわ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:09:49.17

1と0でΦって事か

**アフターコロナの名無しさん** · 2024/02/29(木) 17:10:18.78

>>104
中国の抱える巨額の負債を減らすには埋めるという(´・ω・`)
でも無理だから着手した時点で中国はジンバブエに(´・ω・`)

**アフターコロナの名無しさん** · 2024/02/29(木) 17:10:31.11

>>18
俺の8bit脳の計算では既に彼女いると出てたよ
男女がくっつくパターンなんかそんな複雑さはない
日ハム時代から彼女はいた

**アフターコロナの名無しさん** · 2024/02/29(木) 17:11:10.08

お前らの解説頼み
3行で明確に誰か

**アフターコロナの名無しさん** · 2024/02/29(木) 17:12:09.36

C#のbool?型は初めて知った時感動したな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:13:12.36

64ビット
18446744073709551616

64ビットPCでは一度にこの桁の計算をしてるらしい
どれだけすごいのかよく分からん

**アフターコロナの名無しさん** · 2024/02/29(木) 17:13:15.35

つまりはNVIDIAの株は将来どうなると？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:13:26.84

これがまじならnVidia株暴落やん

**アフターコロナの名無しさん** · 2024/02/29(木) 17:13:56.66

トンデモ発明が続いて景気がいいな中国さんよ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:14:24.94

>>104
記事にMicrosoftが成功と書いてある
論文元は中国

数式で表現すると
中国論文＋Microsoft＝ジャップの嫉妬

**アフターコロナの名無しさん** · 2024/02/29(木) 17:14:33.28

よくわからんがこういうことらしい

Microsoftの中国のチームが作った「BitNet 1.58Bits」というプログラムは、今までのプログラムよりも3倍速くて、正確に動く特別なプログラムです。
普通のプログラムは計算するのにたくさんの数字を使いますが、BitNetは「-1」「0」「1」の3つの数字だけを使って計算します。
これで、計算がとても簡単になり、速くて、パソコンのメモリもあまり使わなくて済みます。
つまり、Microsoftはパソコンがサクサク動く新しい方法を見つけたということです。
これにより、将来はもっと速いパソコンや新しい機械が作られるかもしれません。

**アフターコロナの名無しさん** · 2024/02/29(木) 17:14:57.35

>>111
65536桁の計算とか無理って思うやろ？
それよりずっとすごい

**アフターコロナの名無しさん** · 2024/02/29(木) 17:14:59.61

>>104
データ量増やしてるよな
新しい単位でも作られるだろうな
>>109
データの取り扱いが肥大化
処理時間が還元

**アフターコロナの名無しさん** · 2024/02/29(木) 17:15:04.09

トライ木とかBitapみたいにビット演算で安く早く並列処理できてうまいってことなんかね

**アフターコロナの名無しさん** · 2024/02/29(木) 17:15:29.66

なんだよリリムって

**アフターコロナの名無しさん** · 2024/02/29(木) 17:16:11.35

これって特許の対象？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:17:10.61

中国が開発したなら逆に情報海外に出さない気がするんだが…接収して独占しそう

**アフターコロナの名無しさん** · 2024/02/29(木) 17:17:14.25

1ミリもわからんからプリキュアで例えてくれ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:17:48.39

量子GPUの発売はまだ ?

**アフターコロナの名無しさん** · 2024/02/29(木) 17:18:26.60

>>121
アルゴリズムは特許取れる
GIFとかAACとか問題になった

**アフターコロナの名無しさん** · 2024/02/29(木) 17:18:27.24

NVDAがペニー株化する可能性が微レ存？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:18:43.74

三進法コンピュータは1950年代にソ連で実際に作られてたんじゃねえかな？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:18:57.29

AIの学習はある入力に対してどんな出力をすればいいかという論理に重み付けをして学習していくイメージだけどその重み付けのパラメータを1固定にして乗算を不要にしたって事なのかな？いや多分違うよな…

**アフターコロナの名無しさん** · 2024/02/29(木) 17:19:06.21

中国チームてのがポイントだよね

**アフターコロナの名無しさん** · 2024/02/29(木) 17:20:05.52

マシン語か？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:20:21.81

実用に15年、普及には20年かかりそう
新理論が出来た出来たいいながらいまだに燃えながらリチウムバッテリー使ってるんだぜ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:20:43.93

直感では
加算のみに出来るなら苦労しないような

**アフターコロナの名無しさん** · 2024/02/29(木) 17:20:57.19

中国のGDPは日本の4.2倍です
日本の特許出願件数は中国の18%、日本の科学研究論文の数は中国の8％しかありません

**アフターコロナの名無しさん** · 2024/02/29(木) 17:21:07.88

>>109
物凄く簡単に言うと、今まではデータにシリアルに番号を振っていた
番号が凄い大きな桁になったりして計算に時間が掛かっていた
MSが言うにはそのデータを-1、0、１のみに単純化して計算に掛かる時間を削減した
ということ

でもデータ量がでかくなるからメモリ消費量が多くなる気がするがｗ
気のせいかｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:21:14.17

問題は中国人の言うことを信用するかどうかだな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:21:43.55

>>63で完了
これ以上、議論の必要性はない

**アフターコロナの名無しさん** · 2024/02/29(木) 17:21:45.79

頭悪いから何言ってんだかわからんがGPUが欲しいんだな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:21:47.27

1ビットで3値を表現？符号ビットの共有とかすんのかね

**アフターコロナの名無しさん** · 2024/02/29(木) 17:22:41.80

嘘でしょ…何もわからん

**アフターコロナの名無しさん** · 2024/02/29(木) 17:24:44.93

理系分野ですらもう中国が圧倒的になりつつあるな　

**アフターコロナの名無しさん** · 2024/02/29(木) 17:24:46.01

ワイnvidia一株800ドルで10株買ったんやが😨

**アフターコロナの名無しさん** · 2024/02/29(木) 17:25:10.54

>>133
そういうのを出してる中国人研究者の7割は日本留学組だし、
いまでも大勢の中国人研究者が本邦に留学している。日本から中国に留学ないし
仕事を求めて中国に行ってる研究者はほとんどいないですがねｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:25:30.01

パソコンとプリンタとの接続も昔はパラレルだったけどシリアルに取って代わられて久しいからな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:25:35.48

-1,0,1
これをビットとか1ビットと呼んでいいのか？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:25:51.58

日本の技術者(裏切り者)が高級住宅と高給を与えられて開発してるからな
まあ日本の社畜社会が悪いんだけどね

**アフターコロナの名無しさん** · 2024/02/29(木) 17:26:40.17

数学的に破綻してんだよ。これだから中国人は信用ならない。>>1

**アフターコロナの名無しさん** · 2024/02/29(木) 17:27:04.94

今までは行列の計算(実数の乗算)を大量にする必要があった
それを-1/0/1に置き換えることで乗算しなくて済むようにして計算コストを下げた
中学のときにならった行列の計算方法を思い出そう！

**アフターコロナの名無しさん** · 2024/02/29(木) 17:27:10.43

ウェイトの話じゃん
そりゃ効くかもな
なるほど

**アフターコロナの名無しさん** · 2024/02/29(木) 17:27:24.17

>>134
ハードウエアからの設計になるんじゃまいかな？素子というか。
量子キュービッドもジョセフソン素子も3値だったかなｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:27:57.31

大規模になると強いのは確かだろうが、、、、、って感じだな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:28:03.38

>>147
一度に処理したら

どうやってメモリオーバーをフォローすんだよｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:28:16.26

リリムん参上

**アフターコロナの名無しさん** · 2024/02/29(木) 17:28:41.45

日本が先駆者として振る舞えるのは不可能な領域だなもはや

**アフターコロナの名無しさん** · 2024/02/29(木) 17:28:44.95

0と1と-1
つまり、男と女とオカマが混じった新しい世界だ

**ぷる猫** · 2024/02/29(木) 17:28:56.18

2^2を計算するのに
(1+1)(1+1)=1＋1＋1＋1
としたほうがチップ内では速いということだろ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:28:56.84

本当だとしたらって書いてあるぞ？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:05.89

ペレルマンもarXivだったな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:08.18

Pen4復活

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:16.29

1.58ビットって2ビットやん
+-を切り替え方式でやってビット数減らすんだろうけど

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:26.80

不動産不況の中国からインドへオルカン入れ替え
https://news.yahoo.co.jp/articles/ed8a423771ec3fba5d73f12b0c3b78676b61915b
アメリカのMSCIはオール・カントリー・ワールド・インデックスの構成銘柄を入れ替えた
オルカンから外れる101銘柄のうち、66銘柄は中国株。代わりに入ってくるのがインドです。

完全に見放されてて笑えるｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:28.15

>>153
すでに80年代に東北大でやってないかなｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:30.09

>>32
ハードウェアのビットの話じゃないよこれ
ソフトウェアですぐ真似できる

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:37.65

実用化されるのはいつなんだよ
とりあえずAMDの株でも買っとけばいいんか？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:53.90

ゲイツやバルマーの頃のMicrosoftは胡散臭かったけど、ナデラになってからV字回復してるな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:29:58.82

>>144
1と0だけだよ

-1,0,1だと3進数
コンピューターが扱うのは2進数

**アフターコロナの名無しさん** · 2024/02/29(木) 17:30:24.50

書いてあることが全くわからんローグに戻るって事？@

**アフターコロナの名無しさん** · 2024/02/29(木) 17:30:30.56

>>162
まあな。だから1.53ビットとか怪しい数字をだしているｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:30:34.75

ゴミ箱は撤退します

サードになります

**アフターコロナの名無しさん** · 2024/02/29(木) 17:30:48.01

韓国の常温超伝導体と同じ匂いがするｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:30:50.15

中国人は数が多いだけあって天才も多いよね
ルービックキューブ３個をジャグリングしながら全て６面揃えてる中国人の動画見た時は、こりゃ日本人じゃ勝てんわと思ったっけ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:31:09.29

>>164
windowsが終わって、このままずるずる落ちていくんやろなーと思ってたら
いつのまにか、世界時価総額ランキングで1位になってた

**アフターコロナの名無しさん** · 2024/02/29(木) 17:31:28.56

なおさらGPUも使えば早くなるぞこれ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:32:16.07

解像度めっちゃ下がりそう
超大規模データには強そうだけど

**アフターコロナの名無しさん** · 2024/02/29(木) 17:32:30.30

>>165
それは2進法で動くコンピュータってことね。3進法で動くのもあるのさ。
そして3進法のほうがかなり効率がいいのよｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:32:47.40

>>112
AI界隈は論文からの応用がとにかく爆速なのが特徴だから実用化は早いと思うけど、ハードウェア設計からとなるとやはり数年はかかるしnvidiaも似たようなの出すだろうから大して変わらんと思う
というか、GPUの場合はもともとゲーム向け用途で量産できるしエコシステムがあるから
単純に性能だけならセレブラスとかもっと成長してるはず

**アフターコロナの名無しさん** · 2024/02/29(木) 17:33:26.81

ちなみに中国人には3進法で動くチップは作れないｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:33:44.41

>>138
1bitの3つの状態を単純に-1, 0, 1 という値の表現に割り当てるのって違和感しかない
3値の各bitに符号の意味合いも持たせるなんて符号を最上位1bitだけで表せる2進法に比べてリソースの無駄だし一体どう使うのかな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:34:06.52

ODAの成果が出たな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:34:17.78

行列の掛け算の次元を落とすという話があったな
確かにすごいけど実用的じゃないという

**アフターコロナの名無しさん** · 2024/02/29(木) 17:34:29.21

nvidiaはaiでしょ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:35:13.56

なるほどわからん

**アフターコロナの名無しさん** · 2024/02/29(木) 17:35:35.20

>>177
量子コンのキュービッドは３つだし、スピンも左回り右回り静止の３つ。より自然ですけどねｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:35:37.23

鷺だね　真っ赤な色してる

**アフターコロナの名無しさん** · 2024/02/29(木) 17:36:03.47

株価は微動だにしてないぞ。

**アフターコロナの名無しさん** · 2024/02/29(木) 17:36:18.67

量子コンピューターと一緒で製品化してから言え

**アフターコロナの名無しさん** · 2024/02/29(木) 17:36:18.73

新技術は既得権益者に潰される

**アフターコロナの名無しさん** · 2024/02/29(木) 17:36:35.43

どういう意味？エヌビディアはオワコン？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:36:42.73

>>177
昔から
コンピュータ理論の界隈には、3進数を推す派閥があるんだよね
自然対数の底なeに近いのが良いとかなんとかで

**アフターコロナの名無しさん** · 2024/02/29(木) 17:37:11.50

日本って論文の注目度でイランにすら負けるくらい尋常じゃないくらい落ちぶれてるけど
資源も無いのに科学分野疎かにするってどういうつもり何だろう

**アフターコロナの名無しさん** · 2024/02/29(木) 17:37:17.05

あーLLMね、LLM
LLMはまだ食べたことないなぁ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:11.03

嘘くせーな
で、どんな意味なの？

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:13.33

3進なので1.58bitってことか
Setunを現代の技術で復活させてくれないかな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:20.51

グラボ安くなるの？それだけ教えて

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:45.70

AI学習とか最終的にはtrue or falseだし

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:50.44

>>188
そだよ。今後の計算機のリミティングファクターは計算に用いるエネルギー量で
上限が設定される。省エネを考えないとオワコン。3進法はめちゃめちゃ効率が良いｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:38:59.06

-1/0/1を使ったのは掛け算を簡略化するためやぞ
-1*-1とか-1*1は考えなくても結果が分かるだろ
0/1/2を使ったら2*2とかは計算が必要になる
ハードウェアは関係ない

**アフターコロナの名無しさん** · 2024/02/29(木) 17:39:25.94

ARMが1bitになったってコト？
ΔΣ変調みたいな

**アフターコロナの名無しさん** · 2024/02/29(木) 17:39:50.02

NVIDIAの立場が危うくなってMSの立場が上がることになろうが
FANG+持ってたらトントンだからどうでもいいわ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:40:06.46

>>194
だから生成系AIは間抜けなのね。「そのどちらでもない」という理論値を扱えないからねｗ

**アフターコロナの名無しさん** · 2024/02/29(木) 17:40:18.59

>>188
物理にも居るよな
誰だっけなあ
晩年は3が基礎になってるとか言ってたの