【IT】Twitter、字数上限を280文字に正式拡大 日本語は対象外
■ このスレッドは過去ログ倉庫に格納されています
Twitterは11月8日、ツイートできる文字数の上限を140文字から280文字に正式に拡大すると発表した。日本語、中国語、韓国語を除く言語に適用するという。
文字数制限の変更は、9月から一部ユーザーを対象にテストしていた。Twitterによれば、テスト導入以前は英語によるツイートのうち、9%が140文字の上限に到達していた。
「投稿する前に単語を削除したり編集に時間を使ったりして、途中でツイートを諦めるユーザーもいた」(同社)。試験的に投稿できる文字数を拡大したところ、280文字の上限に達したツイートは全体の1%だったという。
「文字数制限が緩和したことで1つのツイートに考えを収めやすくなり、言いたいことを発言しやすく、編集の時間をかけずにツイートできるようになった」(同社)
一方で、140文字以上のツイートは5%、190文字超のツイートは2%だった。「タイムラインは現在のものと大きく変わることなく、タイムライン上にはあまり変わらない数のツイートが表示される」と説明している。テスト開始当初は多くのツイートが140文字を超え、ツイートサイズを大きくしようと試みるユーザーもいたが、一時的な状況だったという。
ツイートの文字数に余裕があるユーザーは、ツイート回数が増えるだけでなく「いいね」やリツイート、@を使ったリプライ(返信)など、他ユーザーからの反応が多く、フォロワー数が増え、Twitterの利用時間も長くなる――という傾向も分かったとしている。
日本語、韓国語、中国語は、引き続き140文字を上限にする。英語などと比べると言語の「密度」が違い、同じ文字数でも伝えられる情報量に差が出るためという。
http://www.itmedia.co.jp/news/articles/1711/08/news038.html
140文字(左)と280文字(右)のツイート。日本語、中国語、韓国語は対象外
http://image.itmedia.co.jp/news/articles/1711/08/kf_tweet_02.jpg
280文字の上限に達したツイートは全体の1%だったという
http://image.itmedia.co.jp/news/articles/1711/08/kf_tweet_03.jpg
同じ内容のツイートを異なる言語で表示したもの。言語によって「密度」が違い、同じ文字数でも伝えられる情報量に差が出る
http://image.itmedia.co.jp/news/articles/1711/08/kf_tweet_01.jpg 一投稿280バイト制限だから
日本語では140文字なのね >>1
これ見ると日本語(漢字?)って情報密度高いよな
1文字あたりの画数が多いから? >>1
ポイント
『日本語、中国語、韓国語を除く言語に適用する』
という 日本語、中国語はともかくも
朝鮮語にはお気の毒。
だって、ハングル・オンリーでは
端的に 正確に 意思を伝えること
など 到底できないから。 漢字が情報密度多いって事は
日本語より全部漢字の中国語は
もっと密度高いのか 中国韓国には和製熟語が行っている為 日本と同類扱い >>12
「的」が「の」に相当
そういう中国語もある
言葉によっては日本語の方が簡略されてる 良い事だな
英語圏の人らは字数制限あるから
ネット用に省略した言葉使われたら
翻訳ソフト使えないんだよな >>4
それだったら140文字だった時の英語の方の制限はなんだったんだ? >>12
ひらがなカタカナのおかげで処理速度は最高
物書きは味付け出来る要素が多いし個性の幅も最大級だろうな
漢字の読みが多いせいで煩雑度も最悪だが 韓国語って全部ひらがなで喋ってるようなもんなんでしょ?
140文字だとあまり伝えられなさそう 2バイト文字が除かれたのは
無理に画像を使わせるからだな
AAにしろ ハングルって文字の情報密度高いか?
あれってただの発音記号じゃね
今時の朝鮮人は日本人みたいに漢字の熟語を使えるのか >>19
中国の王朝ごとに読み方が違って、
日本だと、中国から伝わってきた漢字には
3つの音読みがついてるからな
まあ、中国はもっと多そうだが… >>21
違うぞ
日本語は50文字でやり取りする人が大多数だからだわ まあどうせ朝鮮人なんて元々意味ある言葉発してないからハングルだけ10文字でもいいかも >>12
一般的に言って、中国語は日本語よりもっと少ない文字数で同じ内容を表現できるからね >>16
そーなのか
中国語は全然勉強した事無いから分からないけど
中国語は料理は料理名の漢字で何となくどんな料理か想像つくから
日本語に無い中国だけの漢字の意味だけでも覚えたら中国語の文章がボンヤリとは意味分かるようになるかな >>22
ハングルやひらがなでもアルファベットの二倍密度がある
韓国語が二倍、日本語が2.5倍、中国語が3〜4倍と考えれば妥当 AIの処理能力が上がったんだろうな
アカウントの半分以上はAIだろ >>6
画数は関係ない。なんなら一筆書きでも無限に複雑な文字は作れる。
漢字は一文字あたりの情報量が多い 文字数ていうか、バイト数で280バイトに統一したってことじゃ? 統計取ったら日本語による書き込みの文字数は平均15字だったんだってな
そりゃ字数倍にする必要ねえわ >>27
文章として読むだけなら、漢字って言う基礎があるので比較的簡単
問題は実際に発音する場合で、これが非常に難解な上に地域差がでかすぎる
読めてもしゃべれない >>22
ハングルはタダの発音記号だけど
ローマ字の1〜3字をセットにしたのが一文字みたいなのだから
密度はアルファベットよりは高いよ
漢字一字に対してハングル一字を当てる感じになってるから(元)漢字の熟語は使ってる ひらがなをフルに140文字詰め込むと420バイトなので実は増えてない >>27
日本語と中国語で同じ文字でも意味違う場合も多いのがね。あと簡体字がそもそも読めなかったり。 日本語が有能ってことだな
漢字かな混じり文なんて他に類がないだろう
しかもカタカナとひらがなに分かれてる
韓国はアホだから漢字を捨ててしまった >>20
そこは誤解、例えば「韓国」は漢字で2文字でハングルでも2文字。ひらがなで書くと4文字。ひらがなだけなら文章が長くなるだろうね。ただハングルは文字種が少ないのに漢字や熟語までハングルで書くから問題が出るのかな。見にくいから見間違えもありそうw >>6
画数つか文字の数が多い(英語26文字<日本語数千〜数万文字)。
でそれぞれの漢字には読み方が複数あるから。その分、習得に時間がかかるというデメリットもある。 >>10
それはTwitterの制限じゃなくて、言語の欠陥だ >>23
日本語はただでさえ音読み訓読みが難しいからせめて音読みの中国王朝の時代を統一してくれと言いたいw隋辺りで良いから纏めてくれw 日本語は従来と同じで良かった
滝のように流れてくるTLで長文が延々と流れてきたらゲンナリするわ 何時までShiftJISのつもりで2bytesとか280bytesなんて言ってるんだw 日本語は絶妙だ
Japanese (language) is exquisite
日語很精緻
일본어는 절묘하다 >>6
単純に種類が多いから一文字で細かい表現が出来る >>43
そんなことすればますます同音異義語が増えるだろ むしろ日本語は全角100文字に減らしてもらって構わんよ >>45
そこをドヤ顔で指摘するのはかなり恥ずかしい。 >>6
漢字の画数や漢字自体の文字数の多さを比べたら
表記する文字数の少なさは利点にはならんだろ 2バイト文字も同じ文字数だったのが問題だったからな
本来なら英語の文字数増やすより、日本語の文字数減らした方が有意義 日本語は書くと情報密度が英語の数割り増し
でも話す場合は英語の7割ぐらいしか情報密度が無い 日本語は5・7・5(字余り程度は許す)
にしたら面白いのに 2バイト文字だから半分って言うけど
twitterもとっくにUTF8だからね >>18
>それだったら140文字だった時の英語の方の制限はなんだったんだ?
Twitterの投稿文字数制限は、なぜ英語でも日本語でも140文字なのですか
http://q.hatena.ne.jp/1293155434
この辺かなぁ >>49
同音異義語は日本語がクソ扱いされる原因の一つだし本当にわりとクソだけど
敢えてダブルミーニング、トリプルミーニングを発生させて
言葉遊びで情報密度を2倍、3倍にしやすいんだよなw
これがないと親父ギャグも覚束ない >>12
>全部漢字の中国語は
今はIT時代だからまだいいけど
手書きが当たり前だった時代は大変だったろうな
逆に時代が下るにつれ昔はなかった新しい概念・学術の用語が増えるため
それを表現するために漢字を当てて新語つくるのが大変らしいね 同音異義語を 表記上の不合理という人も
いるが、これこそ 大間違い。
アルファベットで僅か26文字+αの英語で
様々な多彩な表現ができるのは、同じ一文字
でもいろんな音素を表すから。
具体的には sun と son. is と sit のs 。
意味のない文字が一万以上も在りながら
混乱してしまうハングル表記と比べれば
その優れもの具合が分かる。
更に言えば、表意文字の中の語文字である
漢字は二次元的表記の縦横さと含意・視認性に
優れ 組み合わせによる多様な広がりを可能に
する大変な言語道具であり、これだけは中国に
感謝したい。
しかも(表音文字の中の)音節文字である2種類の
仮名もアルファベットもギリシャ文字も駆使できる
日本語は最高。 2byte文字はこの世から消えていいローカル言語ばっか >>42
現実に使われている使用言語と
無関係にツイッターやSNSを
論ずるのは 全くの空論。 日本語は無駄に画数が多いから1文字辺りの容量が大きい
もっと簡素な文字にしたらいいのにね >@を使ったリプライ(返信)
これな
文字数で無理なことが多い ♡ (文字化けしてなきゃいいが)
↑ これをアルファベットで表すと
何文字必要なの?
漢字は一文字でも 組み合わせで 更に
抽象的なことが表現できる人類の叡智。 >>66
ヨーロッパ人が主として文字セットを開発したから1バイトが1アルファベットになってるだけやん
中国人がやったら部首一個一個が1バイトになってたかもしれない
日本人だったら仮名一字が1バイト
そんでアルファベット系の言語は1Word2バイトにしてやるわー
そしたら英語やフランス語は1文字当たりの画数と容量が大きいね
もうちょっと簡素になんないのーwってことになる >>71
OKグーグル、炭素は英語で?
「ドゥン、カーボン」
簡単 いつも言ってるが
言語において、会話と表記文の複雑さや多様性が異なるのは
当たり前で、建前上 言文一致としたいの判るが、事実上無理。
なぜって、人が聞き分け 発音できる音素の数は精々数十位
なのに比べ表記できる二次元文字は事実上無限大。
分母や分子が込み入った数式をイメージしてみればいい。
だから、公演や茶の間のTVやネットでも、相手にイメージを
伝えるのにはプロジェクターやスクリーン。モニターなのど
画面表示は大事。 放送大学ラジオでも テキストがないと
授業が難しいのは当然。 >>73
語源からいってcarbo/n
だから2文字ってことにしようぜw 妥当な対応だな。
もっと早くからやっておくべきだったが。 >>79
ユニコード万歳やな
2バイトがどうちゃら言ってたふざけた時代から大逆転よ きちんと伝わる言葉にしようとすると、英語は文字が長くなるからな。
そもそもさ、英語圏でネットゲームしてて、
まだヴォイスチャットが主流じゃなくて文字によるコミュニケーションが主流だった時、
やつらの打ち込む言葉はほとんど文字を省略した略語とか
言い回しがスラングで、まともに通じたことは無かったよ。
「俺日本人だからフルスペルで書いてくれたら通じるよ」って言えば
母国語が英語の人らも判るような言い回ししてくれた。
ドイツ人とかはなから英語圏じゃ無い人は最初からちゃんとわかりやすい英語で
入力してくれたけど。 >>40
ハングルは圧縮度は日本語や中国語みたいに高いけど
なんでも同じ字に圧縮しちゃうから、復元率が低いってことか 情報量が少ないハングルしか使えない朝鮮人は割りを食ったなw
これは差別ではないか?w 対象にならなかった日中は筆記言語として優秀だと言う事だな >>56
竹田つねやすの動画でも言ってたな
季語が入ってないといけないルールとか面白いと思うw 日本語だと欅坂48は4文字だけど
アルファベットで書くとKEYAKIZAKA48の12文字だもんな
漢字って便利だね >>94
中国語なんか、あれだけで話一つ書けちゃう >>93
非論理的なおれおれルールを美化するのはネトウヨ。 日本語中国語の密度が高いってのはわかるが韓国語はそうじゃないだろ
あれは表音文字なんだし
これは韓国人は怒っていい 文字数増やすよりも就職活動で俺のツイートこんなに閲覧されてるんやでとか友達多いんやでって見栄をはらないといけない風潮とインチキアカウントを削減しろよ >>28
俺も同じ疑問を持ったけどなるほどよく分かった。 >>56
短歌にしてリツイートは連歌形式でも良いかもな >>86
濁点の概念が存在していないから、清音と濁音の区別は単語単位でしか出来ない
fとpに至っては、発音の区別自体が存在していない 日本語、中国語、韓国語で同じ文章書くと日本語が一番文字数使うんだけどね >>100
非論理的なおれおれルール?
詳しく解説してくれ、そこの朝鮮人 日本語でも英数字は0.5文字分としてカウントされるそうだ。
試してみたら英数字でも全角だと1文字分になった、ついてに半角カタカナも打ってみたらこっちは1文字分。 >>55
ロックでも英語で歌うのと日本語で歌うのでは前者の方が圧倒的に情報量多いしな。英語の曲を日本語に直訳して歌うとたいてい字余りになるw >>23
日本の坊さんの読む阿弥陀経には、
漢音読みと呉音読みの2種類ある。 だから昔、そうアドバイスしたじゃない。
私の直感と思考実験は伊達じゃない事がよくわかったでしょう?w
ドーシー君も、ちゃんと私のアドバイスは読んだ方がいいですよ?
一部の人の手によって英訳されてるらしいからね。
もうちょっと早く対応すべきだったかもね。Twitterは言論のツールとしての道を今後は考えていかないと。 >>1
日本では持て囃されて居るけど米国じゃ業績は下降している
文字数を増やしたのは業績改善の為の小手先対応 Unicodeって言えばハングルは使いもしない文字で1万文字以上占有して他の少数言語が迷惑してたな 最近の高校生は、了解と「り」って書くだけだそうだ。
これなら140文字制限も問題ないな。 >>99
まあまだまだ万歳するほどじゃないよね
中国語や台湾語の似た文字と同じ文字コード割り当てられちゃってるもんね
今の1000倍くらいの種類の文字が使えるコードが開発されたときが本当の勝利 >>56
>>93
五七五の俳句サイズじゃつらいから、七七足して短歌サイズで >>104
それとは無関係に低年齢層の馬鹿が増えたんだよ
読解力を調べるテストでも小中学生における能力低下がはっきりと示されている >>106
在日アナウンサーが日本語の濁点を上手く発音出来ないので放送業界だけでなく広告業界も巻き込んで
濁点有りの発音は無理やり濁音なしの発音に置き換えるというのを改悪し強行しているので
テレビやラジオを聞いていると変な日本語になりつつある 仮名があるから 幼稚園児でも手紙が書ける。
漢字があるから 高度な学術・実務・芸術が表せる。 >>116
考えてみればうちでは「おかえり」を「り〜」とか、「ただいま」を「ま〜」とか言って親子で通じてたがw 山
mountain
英語圏も簡単な単語だけでも漢字導入すればいいのにな
I go to 山 みたいに マルチバイト文字使ってる国は140字でも多いくらいなんだよな てか、ツイッターの内部での処理は文字コードなに使ってんだろうな?
16ビット?32ビット?
記事を見る限りは8ビットぽいけど >>20
漢文を全てのハングルにしても文字数は変わらない
漢字一文字にハングル一文字が対応する
固有語はまた別だけど、日本のかな漢字混じりと同じような文字数 >>125
マジ それ賛成。 といってもオレは日本住みだけどね。
普通ならアルファベットでもいいが、特に多く出て来る
単語も一、二字で表せるのが感じの強み。
たとえば、エネルギー、エントロピー さらに専門用語らしい
エンタルピーとかも 中国語では
能源
熵
焓 の一、二字 (繁体字で、読み方は知らんが)
まあ良し悪しはあるが、その単語が頻発するなら
漢字表記がいいし、 漢字の良い所は限定的に
ある記述内で「定義して」使える所。 全く余計なお世話だが
朝鮮語は ハングルの発音記号ともいうべき
字母と 五千位の基本漢字だけで記載するのが
最適じゃないのか? 恨愚留は とにかく一万も
要らん。
分からない単語でも発音通り字母の組み合わせで
十分。
と、一行の諺文も読み書きできないオレが提案
してみる。 140文字制限はAIに学習させる都合上あっただけだろう
140文字までの学習が終わったと言う事 日本語は中国語と違って文字数は大してすくなくないから
これはおかしい >>136
バルス祭りなんてバカな事を何度もやるからだよ
日本語ツイートの平均値が少なくなるので140文字で十分だろうという事になるから >>56
これ面白いね
ツイッター使う人は激減すると思うけどww >>1
英語ってそんなにスカスカ文字なんかな?
1単語内の意味が多いくて長いから日本語よりは短くて意味は濃い
まあじき日本語も対応されるだろうがな >>125
一応、山にはMt、mountという略式があるし、書くのが面倒というなら問題になるのは字数でなく画数で、
海→sea、道→rord、砂糖→sugarなんかは英語の方が書きやすい。
あと漢字がないので古くからタイプライターが使えたというのもある。 そこら辺の問題もPCとネットの普及であってないようなもんだしぜひ世界中で外来語を使うってのやって欲しいね。
日本も無理矢理カタカナにしないで英単語はアルファベットで書く方がいい >>27
あと中国語は、日本語の『はし』と同じように発音で意味が変わるものもあるのでムズい ロシア語って1バイト文字だっけ?
2バイトなら日中韓対応できない理由がないんだが バイト数の問題じゃないよ。
140文字じゃ文字数が少なくて利用者が使い辛いので増やします、
でも足りてる言語もあるからそいつらは据え置きな。
ってこと。 >>86
同音異義語の区別が劣るという意味ではひらがなだけに似てるらしいね、文章の長さではなくて
漢字ハングル混じりを日本への反発でやめたことが原因らしいけど
>>104
それは一行の短さとか削れる情報であることも >>125
すでに導入されてきている。それがemoji🌋 >>147
絵文字ってあれだろ?文章をビットマップ画像にして載っけるやつ 英語のASCII文字1文字は1バイト8ビット(実質7ビット)であるが、
日本語の文字はシフトインとかシフトアウトが入るので、
全角1文字が16ビットでは収まらないのが普通ではないかな。
あaあaあa みたいなのは9バイトにはならないです。 「本」の一文字にしても,
英語だと"book"で四文字必要だもんな マジックが無いと仕事の出来ない役立たずが逆ギレしたのか。 >>143
twitterだとUTF-8だから理由は違うけど
9オクテットではなく12オクテットだね
>>155
漢字にすると見事にオクテット数が減りましたの典型例w >>151
ところが日本語ツイートでも半角英数字は1文字/280文字としてカウントされるから無関係ではない。
色々試してみると欧米の言語で使う文字は1/280文字分としてカウントされ、それ以外の記号と日本語(全角英数含む)・中国語・韓国語の文字は2/280文字分のようだ。 >>72
簡体字ってほとんどそのまま草書体だよ
日本の新字体より意味的歴史的に正しい略し方してる文字も多い
活字のセンスが絶望的にないだけ
あと草書なのに横書きなのが致命的 日本語のツイートは一言二言で本当のつぶやきが多いからな
長文はブログ作って書いてろと思う それより前に極左冒険主義バカに乗っ取られたTwitter社が破産しそうだな nowなら3バイトなのにわざわざ「なう」なんて4バイト使うとか、馬鹿だろwww 漢字だと一文字二文字で表記出来ても、欧米諸言語やロシア語だと何文字も使うんだろ。
漢字って効率良いんだな。 >>6
鬱 melancholia
英語だと11文字が漢字だと一文字 同じ内容の文を書いても日本語は短くなるからな。
>>127
ユニコードでしょう。
何バイトなのかは知らないけど。 >>117
バイト数増えて困ってんだけど・・
既存のカラムに入らんがな 英語圏では依然からもっと書かせろって意見が多かったのか
というかツイッターにそんな長文書くやついるんだな >>86
なるほど、ハングルってのは非可逆圧縮なのか >>172
もともと日本の半分しか書けない状態で
たまにちょっと長いこと書こうと思うと辛い状態だったようだ >>80 ■ このスレッドは過去ログ倉庫に格納されています