X



【新元号】「令和」と文字コード(主にUnicode)の問題 見た目は同じ、でもビット表現が違う U+4EE4 U+F9A8
■ このスレッドは過去ログ倉庫に格納されています
0001ばーど ★
垢版 |
2019/04/02(火) 11:59:47.21ID:lQi/WBRZ9
https://togetter.com/li/1333809
見た目は同じ、でもビット表現が違うといういつものアレ (編集可にしておくので、情報交換用にどうぞ)

https://twitter.com/yabuki/status/1112565487995518979
U+FA98 https://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=F9A8 … は互換漢字,トラブルのもとです.

たとえば,
・Twitterで使うと,U+FA98はU+4EE4に変わります.
・U+FA98とU+4EE4を(Ctrl+Fで)検索するときに同一視するかどうかはブラウザによります.

お仕事がちょっと増えた人がいるかもしれません.

https://pbs.twimg.com/media/D3CdVVaUYAIX2dh.png
https://twitter.com/5chan_nel (5ch newer account)
0002名無しさん@1周年
垢版 |
2019/04/02(火) 12:02:33.72ID:kyZ0bJsw0
中国の漢字でいつまでも大騒ぎする日本
韓国の漢字廃止とハングル文字専用は正しかった
0003名無しさん@1周年
垢版 |
2019/04/02(火) 12:02:49.11ID:KdxJce0g0
めんどくせえな
0004名無しさん@1周年
垢版 |
2019/04/02(火) 12:03:06.52ID:GYtT81nZ0
テキスト入力なら気にしなくていいけど
紙文書をOCR入力するときに注意が必要っぽい
0006名無しさん@1周年
垢版 |
2019/04/02(火) 12:04:48.14ID:0+vGkhOx0
>>2
おまエラのおつむじゃハングルが精一杯だもんな
0009名無しさん@1周年
垢版 |
2019/04/02(火) 12:05:51.68ID:I9yBx61C0
「"、" + "マ"」か「"一" + "刀"」が殆どなのに、菅が掲げたのは「"、" + "刀"」
これは例外中の例外。日和ったか?
0010名無しさん@1周年
垢版 |
2019/04/02(火) 12:07:01.82ID:jWObilxF0
合紫順~
0012名無しさん@1周年
垢版 |
2019/04/02(火) 12:07:26.33ID:f34i2L0n0
やっぱりな
本当にIT土方ってさ、必ずネジ緩んだことやるのな
もしかしたら本当に勉強できなかった奴の最終就職先なのかもしれない
0013名無しさん@1周年
垢版 |
2019/04/02(火) 12:07:40.21ID:GYtT81nZ0
ちなみに互換文字の U+F9A8 は韓国語用の文字セットらしい

いま韓国では漢字使われていないから、ほとんど気にすることはないが
技術者は注意したほうがいいかもね
0014名無しさん@1周年
垢版 |
2019/04/02(火) 12:09:36.21ID:k7+7AFUR0
>>12
これを土方がやったかは知らんが、
日本は待遇が悪過ぎて能力あるのは片っ端から転職しちまうんじゃないのかねぇ。
0015名無しさん@1周年
垢版 |
2019/04/02(火) 12:11:42.19ID:7g8gzX1o0
>>12
Unicode策定したのはIT土方だって説初めて見た
0016名無しさん@1周年
垢版 |
2019/04/02(火) 12:12:55.59ID:enzxd4v70
Unicode的には見た目が違うから別の文字として登録されてる
同じ漢字だけどU+4EE4は教科書体、U+F9A8は明朝体で登録されてるから
異体字だと思われたんだろうか
0017名無しさん@1周年
垢版 |
2019/04/02(火) 12:13:47.10ID:K2191z+a0
>>6
元々漢字覚えられないので考えたのが始まりだしな
0019名無しさん@1周年
垢版 |
2019/04/02(火) 12:15:07.39ID:ra4LCPBx0
この問題って韓国語のせいらしいな
0020名無しさん@1周年
垢版 |
2019/04/02(火) 12:15:38.61ID:sT7ku+Vi0
>>1
U+FA98って書いてあるけど、
画像だとU+F9A8って書いてあるじゃん。間違ってるの?
0021名無しさん@1周年
垢版 |
2019/04/02(火) 12:16:54.40ID:GYtT81nZ0
>>20
当初、元記事書いた人が間違えたらしい
その後「U+F9A8です.すいません.」と訂正している
0022名無しさん@1周年
垢版 |
2019/04/02(火) 12:18:47.67ID:enzxd4v70
韓国語の文字セット登録する人たちが令は令と別の文字って勘違いして標準化しちゃったのだろうか...
0023名無しさん@1周年
垢版 |
2019/04/02(火) 12:22:57.21ID:N9YNlbK+0
Unicodeはややこしいことしてくれるね
日本語と中国語とでは明らかに形状が異なる文字に
1つのコードを割り振ってみたり…
0024名無しさん@1周年
垢版 |
2019/04/02(火) 12:24:29.07ID:CTR/koFu0
これはそもそも、見た目がおなじだけで違う漢字?
それとも同じ漢字に別コードがふってあるの?
0025名無しさん@1周年
垢版 |
2019/04/02(火) 12:24:48.97ID:f34i2L0n0
>>15
現実をみろよ
たかが文字の入れ物自体だけで大騒ぎ
改元にしたって必ず追加されること知らないわけじゃないのにこの大騒ぎ
要はちょっと先を見越すことさえできない頭の弱いやつが創ったからだろ
0026名無しさん@1周年
垢版 |
2019/04/02(火) 12:24:51.73ID:4ga3cXoN0
ハイフンとマイナスの違いみたいなもんか
0027名無しさん@1周年
垢版 |
2019/04/02(火) 12:26:18.53ID:tL1EZRZG0
>>14
正解
0029名無しさん@1周年
垢版 |
2019/04/02(火) 12:28:37.17ID:WOZA5KuX0
aとdの違いが判らん
0031名無しさん@1周年
垢版 |
2019/04/02(火) 12:29:58.73ID:sT7ku+Vi0
小学生の時クラスの吉川くんが、「吉」の土のトコは下の棒のが長いのが正しい漢字だって言ってきかなかった。
そんなんどっちでもいいじゃんっていつも思ってた。
0036名無しさん@1周年
垢版 |
2019/04/02(火) 12:32:18.79ID:BjDtKDSY0
互換漢字云々の話でしょ?
互換漢字なんて、今時誰も使わんだろ。
0037名無しさん@1周年
垢版 |
2019/04/02(火) 12:33:11.29ID:GYtT81nZ0
>>31
「つちよし」ってやつだよね

普通は入力できない文字だが
名前だけに、こだわる人はこだわるらしい
0038名無しさん@1周年
垢版 |
2019/04/02(火) 12:33:48.22ID:1EB/f7af0
>>2
あれは失敗だよ
英語みたいに音と表記が別ならよかったのに

日本人が整備したハングル(≒平仮名)だけだと目から入ってくる情報が少ない同音異義語の区別が難しい

よい点は学習時間が少なくてすむだけ
0039名無しさん@1周年
垢版 |
2019/04/02(火) 12:34:19.95ID:enzxd4v70
どうも韓国の文字セットだと同じ漢字で複数の読みがあるのを別の文字として登録してあって
それをUnicode上で区別して元の文字コードに戻せるようにするための互換漢字らしい
0041名無しさん@1周年
垢版 |
2019/04/02(火) 12:35:13.65ID:i5a5B4bV0
>>37
たぶん戸籍が下の長い吉で登録されてんだわな
0042名無しさん@1周年
垢版 |
2019/04/02(火) 12:35:27.87ID:X1xnqBU10
>>2
ホントウニ、ハングルモジヲミルタビニソウオモイマスヨ。
0044名無しさん@1周年
垢版 |
2019/04/02(火) 12:35:55.57ID:axABBQMC0
どちらでもいいだろ
0045名無しさん@1周年
垢版 |
2019/04/02(火) 12:37:24.55ID:enzxd4v70
>>40
韓国は別に統合しちゃっていいよって言ったらしいが
Unicode側が分離しろって言って互換漢字が用意されたらしい
0046名無しさん@1周年
垢版 |
2019/04/02(火) 12:37:55.40ID:1EB/f7af0
そういう文字は他にもあるよ
公的な文書ではという決まりがすぐに出来るよ
0047名無しさん@1周年
垢版 |
2019/04/02(火) 12:38:06.81ID:5v9wDM4j0
>>25
たかが文字だが、2バイト文字は大変なんだぞ
0048名無しさん@1周年
垢版 |
2019/04/02(火) 12:40:39.69ID:W0PxYNN60
アベがわるい
0049名無しさん@1周年
垢版 |
2019/04/02(火) 12:43:18.12ID:+T83dDzf0
日本語教科書体は何なんだよ
鈴みたいだろ、マはマスゴミのマ
0050名無しさん@1周年
垢版 |
2019/04/02(火) 12:45:54.67ID:HkKdFdkd0
>>2
そんなことあらすか
ひらがなばっかりになるとどうおんいぎごがおおすぎてこまるでかんわ
にほんごだとかんじのしゅうとくがむずかしくてもいちどおぼえればあたらしいがいねんを
かんじのもじでもりかいしやすいけど
ぜんぶはんぐるになったり、えいごのようにらてんごゆらいのがいねんもぜんぶあるふぁべっとだと
まるおぼえするしかなくて、むずかしいがいねんがりかいできなくなって
いちぶのせんもんかのかしこいひといがいのだいたすうのいっぱんじんはかんがえるちからがおちる
0051名無しさん@1周年
垢版 |
2019/04/02(火) 12:53:37.95ID:iZb1VREP0
ひらがなですら濁点と本体を分離したビット表現があって、同じ文字とみなすかはプログラム次第
0052名無しさん@1周年
垢版 |
2019/04/02(火) 12:54:05.03ID:aEdNTfzS0
>>42
>>50

分かち書きしてないのにこの読みやすさ
表音文字でカナほど読みやすい文字はない
0053名無しさん@1周年
垢版 |
2019/04/02(火) 12:56:15.25ID:5uoa0rlE0
漢字は日本の発明物だよ
「清では識字率はわずかに1%だった。これにはため息をつかざるを得ない」 (今日頭条2017年8月30日)
ネットでさえ伏せられているけどこれが都市部での話
正確な数値を伏せているのは理由があるということ
中国の識字率は公表されている数値でも驚くほど低いでしょう
しかも70年代からしか統計をとっていない
でもこれを0%といわないことだけでも十分に大嘘だというのがまたw
ところで誰か生粋の日本人の中で親類にでも中国系文化の専門家や学者さんはいますかね?
いたらこのレスを見せてよく検証してもらうのも面白いかと思います
でも恐らくそうした学者や専門家に生粋の日本人の方はおりません
それが戦争に負けた今の日本の現状なのです
そして教育が共産党と深くかかわる理由でもあるのです
中国に今は高価な古い漢文、漢書は存在してはいますがそれが本当はどこから出てきたのかは大概伏せられているのが現状です
すべて日本です
日本人は欧米の威を借りた中国人、及び古くから日本にいた華僑人が好きにこねくり回した戦後の偽の自虐史観の一環にいつまでも付き合う必要はありません!
これは犯罪というよりほかない歴史冒涜ですよ
犯罪としてもかなり大胆不敵といわざるをえない事実です
そもそも漢字は本当の中国語ではない
遣唐使や遣隋使ということばには外交使者であるという以上の含意は無いよ
そこに勝手に学びに来たとかなんとかがすごくうざいよね、大ウソだしw
彼らは今はうわべだけにわか仕立てにようやく見れるようにはしてはいるけど中身は邪悪な原始人、犯罪者のそのまま、だから黙っていられる
日本人とは中身は大きく異なる
そもそも遊牧民の言葉ツングース言語特有の同じ音に異なる意味という好い加減な中国語と漢字が共存しえないでしょ
漢字を「 汉字 」と略す彼等には漢字の素養すらない
部首のなんたるかすらわかっていません
そして漢文は完全に別言語であります!
漢文≠中国語
漢文は中国語にあらず!日本語なのです!
これは無視できない大きな事実だよ?
中国の歴史と言われている小説なんかも全部漢文で書かれて日本から与えられている
中国語でかかれた古代の書物はただの一冊も中国大陸からは発見されてない
現状嘘前科百犯の中国共産党とそれの手先の江戸しぐさ日教組の大ウソをまだ信じて書き込んでるのは全部仕込みと白痴でしょw
街の外観だって日本、朝鮮、中国と劣化していって西洋化して悪化していっているっていうのがハッキリ分るのが古い写真の力w
レンホーのような在日華人の祖先が昔から日本における中国の歴史をねつ造している
挙句に文化振興だとかの国費を横流してる
論語などもこういう奴らの祖先のでっち上げなのは明らか、全くインチキナンセンス!
繰り返すけど漢文と中国語は文体から漢字や単語の意味からすべて違う
元号も中国に存在していた物的証拠は一つも中国にはない
正倉院にだけ存在している!
彼らは革命という火の中から大ウソという魔物をかたどって誕生させようとしている!!!
文化大革命ですべてが失われたわけではない
そんなわけはないでしょw
もーいいかげん朝日新聞と同様の陰謀だと気付こう!
全て中国人が生み出したのではない
潜んでいる華人にだまされた我々日本人が偽の神を創り出そうとしていたのだ!
いうまでもなく中国、韓国は特に不当に高く評価されている
詭弁と嫉妬、嘘と犯罪は人類の滅びの元
共産党はそれらすべての源

http://livedoor.blogimg.jp/dqnplus/imgs/4/c/4c5a6827.jpg

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓  
日本と中国の漢字、なんでそれぞれ違う簡略化をしちゃったの? しかも日本のほうが合理的だった・・・=中国メディア 2018/11/01
https://rosie.5ch.net/test/read.cgi/editorialplus/1541044230/
0054名無しさん@1周年
垢版 |
2019/04/02(火) 13:02:56.92ID:JaKi9M7k0
令和
令和
0055名無しさん@1周年
垢版 |
2019/04/02(火) 13:03:57.40ID:enzxd4v70
まあ日本語の入力環境ならU+F9A8が出てくることはないだろう
0056名無しさん@1周年
垢版 |
2019/04/02(火) 13:08:20.63ID:RKKo+9Qt0
>>2
韓国って名前に漢字使ってるじゃん
金とか
0057名無しさん@1周年
垢版 |
2019/04/02(火) 13:10:52.36ID:IuBWYB3A0
>>56
あれ本人しか読めないらしいぞ
0058名無しさん@1周年
垢版 |
2019/04/02(火) 13:11:03.61ID:XGgmfCQC0
>>2
ハングル大移動でUnicodeの標準化に大迷惑かけたクソ民族がエラそうに あらゆる分野で我儘をゴリ押しして文明科学の発展を阻害する悪意に満ちた生物
0060ドクターEX
垢版 |
2019/04/02(火) 13:13:54.61ID:CuJBFzla0
さすがの漢学者も、文字コードには気が付かなかった。www
0062名無しさん@1周年
垢版 |
2019/04/02(火) 13:24:14.86ID:RKKo+9Qt0
>>57
そうなのか、知らんかった
ありがとう
0066名無しさん@1周年
垢版 |
2019/04/02(火) 13:55:11.08ID:Ty9OCFGh0
>>2
漢字の廃止で自国の公文書が読めなくなった歴史を忘れた憐れな民族w
0067名無しさん@1周年
垢版 |
2019/04/02(火) 13:58:04.64ID:6iAPKO5A0
「令」の中身は、漢代の隷書のころより「マ」の形が主流。
「令」の字体で書かれたものはほとんどなく、清代の『康煕字典』にいきなり正字とされた字体(説文篆文準拠の字体)。
「令」は印刷字体。
手書きの楷書では、常用漢字通り中身は「マ」と書くのが昔から一般的
  
  
0068名無しさん@1周年
垢版 |
2019/04/02(火) 14:05:33.58ID:dTNiVpzi0
>>2
そだね、早く日本語圏から出た方がいい
0069名無しさん@1周年
垢版 |
2019/04/02(火) 14:07:50.84ID:d50YBeFI0
ID:f34i2L0n0
0070名無しさん@1周年
垢版 |
2019/04/02(火) 14:23:33.71ID:xjM226Ac0
>>2
日本は漢字と、平仮名のおかげなのか
世界一の文書の理解力の持ち主だということが
OECD調査と、韓国の記事で認められました。
韓国は子供レベルの文書の理解力1位でしたが
高度な文書になると世界最低基準になると認められました。

リンク先行けばなんとなくわかるけど
ラテン語圏もラテン語の高級語の普及率が悪くて、
高度だと韓国の方が理解率高いが
最高度な文書になると韓国を圧倒して抜かすみたいだな


・韓国人の文章理解力が下位圏であり、特に高度なドキュメントの理解は最低水準点であると権威ある調査に公認されたわけである。このような不思議は漢字を排斥したことによって不具化された言語生活と切り離せないだろう。

・高度の文章力と語彙力を持った4、5級の割合を見ると、日本が22.6%で1位である。続いてフィンランドが22.2%、カナダ18.7%、オランダ18.1%、スウェーデン16.1%。
韓国人は8.1%に過ぎない。

・5級の文書理解力は学者、ジャーナリスト、思想家として適正能力となるものだが、
韓国は0.2%である。すなわち、1000人に2人の割合である。
中略
日本は1.2%で、韓国の6倍である。

http://rakukan.net/archives/5065142.html
0071名無しさん@1周年
垢版 |
2019/04/02(火) 14:47:57.61ID:kuof4UQ30
>>40
日本語は漢字・平仮名・片仮名で、コードを物凄く使ってるんだけどね。
0072名無しさん@1周年
垢版 |
2019/04/02(火) 14:48:09.27ID:kERnVpCq0
>>1
『4ee4』にしないでうっかり『fa98』にしたらアウトってことやね
0073名無しさん@1周年
垢版 |
2019/04/02(火) 14:51:14.73ID:swERMr8X0
>>52
それは、読み手が頭の中で
仮名ー漢字変換してるから
漢字を知らなければ
そうすらすらとは読めない
0074名無しさん@1周年
垢版 |
2019/04/02(火) 14:51:33.48ID:kuof4UQ30
>>54
どっちも同じにしか見えないな。冷蔵庫の『冷』は、偶に『マ』の方で書いてる時があるな。
0080名無しさん@1周年
垢版 |
2019/04/02(火) 17:01:53.30ID:xjM226Ac0
>>73
現状の韓国でのハングルではそれが出来ないので

韓国人が文書、本を読むのを好きじゃないのもわかるかな
0081名無しさん@1周年
垢版 |
2019/04/02(火) 17:48:03.27ID:vy5+eVhS0
これは、U+4EE4の令でCtrl+Fで検索してもそこに書かれてるのがU+F9A8の令だった場合は拾ってくれないということ?
ブラウザによっては同一視したりそもそもU+F9A8をU+4EE4に変換していたりする場合は拾ってくれるだろうけど
0082名無しさん@1周年
垢版 |
2019/04/02(火) 17:58:57.34ID:yCF0Z6tN0
>>37
吉野家もな
いいか、オメーラ間違えんなよ!𠮷野家だからな!
0083名無しさん@1周年
垢版 |
2019/04/02(火) 18:01:26.03ID:0ceyWWtO0
>>9
刀のある年号は不吉。
昭和にも刀があった。
0087名無しさん@1周年
垢版 |
2019/04/02(火) 18:03:30.80ID:RoVZ9lfP0
>>2
朝鮮人は黙ってろw
0088名無しさん@1周年
垢版 |
2019/04/02(火) 19:22:45.31ID:dV/LNOo40
とりあえず理系がバカなのはわかった
0090名無しさん@1周年
垢版 |
2019/04/02(火) 22:25:59.97ID:DsADqDy10
>>89
マルチオクテット文字
ちなみに今回問題になっているのはUTF-8だと3オクテット
0091名無しさん@1周年
垢版 |
2019/04/03(水) 03:13:54.48ID:ALCDsiVj0
>>88
馬鹿はお前だよ

ユニコードなんて、政治的な話だろ、馬鹿
理系とは関係ない

>>40
これ読めよ、馬鹿
0093名無しさん@1周年
垢版 |
2019/04/03(水) 16:01:32.03ID:pnVp7+ph0
元号見て最初に思ったのがコレだった
そういうのに厳しいとこに勤めてたから
「令」の字が入る名前を登録するときには
必ずここは「刀」ですか「マ」ですかって
必ず確認していたよ

複数あって技術屋さんには大変かもしれんが
元号っていう大事なものなのに
「どっちでも使って大丈夫だよ〜」ってことになってそう
ニホンでもニッポンでもいいみたいにw
0095名無しさん@1周年
垢版 |
2019/04/03(水) 16:27:52.37ID:LfrmVkbV0
令和は
0○
でok
0096名無しさん@1周年
垢版 |
2019/04/03(水) 17:18:52.90ID:zmQf+P6S0
鈴和
いいかも
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況