X



【技術】古文書や浮世絵に書かれた「崩し字」、AIで解読します 立命館大と凸版印刷が支援システム
■ このスレッドは過去ログ倉庫に格納されています
0001ガーディス ★
垢版 |
2019/05/14(火) 12:26:34.27ID:Dd/F8ptD9
古文書や浮世絵などに書かれた「崩し字」を、人工知能(AI)が画像から解読するシステムを立命館大文学部の赤間亮教授らのチームが、凸版印刷(東京)と共同開発したと13日、発表した。

 チームによると、同様の解読アプリなどは他にもあるが、AIの導入は全国初という。

 システムは、立命館大が所蔵する古文書や浮世絵など約76万件のデータベースと、凸版印刷が保有する崩し字を蓄積したデータをもとに開発。パソコンの画面に映った文書で読めない文字を1文字選択すると、崩し字データの中から形が似ているものをAIが抽出し、合致する可能性が高い文字を順に表示する仕組み。

http://news.livedoor.com/lit
e/article_detail/16453138/
http://image.news.livedoor.com/newsimage/stf/7/6/76387_1675_8ee7be4eaa8bc2ee04ac8bb2448b5db8.jpg
0002名無しさん@1周年
垢版 |
2019/05/14(火) 12:27:45.16ID:CLJKc0bO0
ハングルで読めます とか言い出すぜ
0003名無しさん@1周年
垢版 |
2019/05/14(火) 12:28:29.90ID:ObSdJG4/0
草書とかただのミミズがのたくった字にしか見えない
0005名無しさん@1周年
垢版 |
2019/05/14(火) 12:28:57.10ID:Sf3Tc7Js0
書いた自分でも読めない崩し字も判別可能ですか?
メモの意味がありません
0006名無しさん@1周年
垢版 |
2019/05/14(火) 12:29:49.62ID:wedUlfR10
漢字を廃止したら古文書が読めなくなるなんていかにアホな主張かわかるだろ
じっさいはカナすら古文書など読めない
0008名無しさん@1周年
垢版 |
2019/05/14(火) 12:30:17.91ID:qW+HKzT50
戦国時代の書状とか
受け取った人どーすんのこれ
みたいなのもあるな
0010名無しさん@1周年
垢版 |
2019/05/14(火) 12:31:22.13ID:SVvbtco20
江戸時代の三陸の地震、伊達家の文書を読めた歴史学者等は知ってたけど
読めなかった地震学者は知らなかった、とかいうのがあったんだっけ
0011名無しさん@1周年
垢版 |
2019/05/14(火) 12:31:39.36ID:FdejcIw30
デジャヴってAI 導入では初になるのか。
一般公開して家宝の書物とかを個人が読めるようになると面白いだろね。
0015名無しさん@1周年
垢版 |
2019/05/14(火) 12:37:21.03ID:FSxAL3OT0
こういうのが欲しかった
0017名無しさん@1周年
垢版 |
2019/05/14(火) 12:39:04.65ID:NznFxE990
学者「げっ、わいの唯一の特技が無効になるで」
0018名無しさん@1周年
垢版 |
2019/05/14(火) 12:40:41.85ID:PIVwaUNA0
>>4
>>9
ポンと出てくるって凄いな
それだけ頭が良いのに、ニートをやらせとくのがもったいない
0019名無しさん@1周年
垢版 |
2019/05/14(火) 12:41:06.02ID:pvf7hkMS0
江戸時代中期以降の庶民向けの本は
基本的に漢字に全部振りなが振ってあるので
くずし字のイロハが読めるようになるとほとんど判読できるようになる
あとくずし字のイロハ覚えるのはアルファベットより簡単
0020名無しさん@1周年
垢版 |
2019/05/14(火) 12:41:20.98ID:C+6k5hVy0
江戸のくずし字入門なんて本買ったけど、崩し具合の幅が広すぎてすぐ挫折した
0022名無しさん@1周年
垢版 |
2019/05/14(火) 12:41:56.87ID:/5jqOjax0
関東大震災や米軍の空爆で多くの古文書が永久に失われました
ニホンオオカミやニホンカワウソは将来科学の力で復活させられるかもしれないけど
焼けた古文書はタイムマシンが出来ないかぎり取り戻せない
残念ですね
0024名無しさん@1周年
垢版 |
2019/05/14(火) 12:44:40.85ID:o6c5m3b60
読める専門家が少なくて研究が進まないからねぇ
今はデジタルアーカイブ化で
閲覧可能の資料も増えたし

今までは専門家が所有者の許可とって読むしか無かったけど
0025名無しさん@1周年
垢版 |
2019/05/14(火) 12:46:58.75ID:lWKFKIh90
>>8
ヨーロッパ中世の文書とか、崩し字でない上にラテン語だから使われてる字の種類が23なのに、さっぱし読めんよ
0026名無しさん@1周年
垢版 |
2019/05/14(火) 12:47:24.55ID:bvx3WwsA0
信長「牛一の話は信じるな
0028名無しさん@1周年
垢版 |
2019/05/14(火) 12:53:54.08ID:cCOVV/TP0
右筆が書いたような綺麗なくずし字はちょっと勉強すれば読める
だけど、江戸時代の庄屋や商家に残ってる書状なんかは酷い
何通も比べながらなんとなく読み進めていくうちになぜか読めるようになるんだが、AIを活用すると言うのはこういうことができるようになるということなのか
0029名無しさん@1周年
垢版 |
2019/05/14(火) 13:09:49.42ID:1Sv8qLGz0
>>1
さすが立命館。
白川先生も喜んでいるよ。
0030名無しさん@1周年
垢版 |
2019/05/14(火) 13:10:48.03ID:7zfPAjhE0
こういうことされると俺の爺ちゃんの仕事がなくなって困るな・・・
平安朝や江戸期の古文書の解読で長年頑張ってきたのに
便利になるって誰かが犠牲になるもんなんだな
0031名無しさん@1周年
垢版 |
2019/05/14(火) 13:10:56.96ID:1Sv8qLGz0
>>25
ドイツのヒゲ文字も読めん。
0032名無しさん@1周年
垢版 |
2019/05/14(火) 13:12:19.08ID:1Sv8qLGz0
>>30
技術論における昔からの課題だ。
0034名無しさん@1周年
垢版 |
2019/05/14(火) 13:30:56.90ID:cHWXSIY20
「達筆」な上司の指示書に難儀した時代に、このAIが有ったらな
0036名無しさん@1周年
垢版 |
2019/05/14(火) 13:33:21.82ID:NRh+OgJd0
父の字が達筆過ぎて年賀状に何が書いてあるのか毎年悩んでたの思い出すな

息子はド下手文字だ
0037名無しさん@1周年
垢版 |
2019/05/14(火) 13:34:34.89ID:NyhgarCI0
なんか楔文字とかの方がノイズに強いらしいねww
0039名無しさん@1周年
垢版 |
2019/05/14(火) 13:39:04.84ID:hU97Ilth0
筆で字を書くことからああいう崩し字に必然的になったんだろう
あれが読めるのは文章がワンパターンだったからだ
0040名無しさん@1周年
垢版 |
2019/05/14(火) 13:39:50.66ID:8JAxMirn0
くずし字の何が面倒かというと、元字の漢字が同じ
ひらがななのに、何種類もあってどれをクズしてひらがなに
当ててるのか見て覚えないといかんところな。
慣れるしか無い。
漢字の候文の方が読みやすくて意味が取れる。
スタンダードには価値があるってことだな。
0041名無しさん@1周年
垢版 |
2019/05/14(火) 13:41:36.89ID:5IKYdaGt0
Google翻訳とかYouTube字幕とかアホみたいなのばっかだからまともな解読ができるようになるのはまだまだ先だろ
0042名無しさん@1周年
垢版 |
2019/05/14(火) 13:43:43.19ID:8ceMT4IV0
>>1
この画像のくらいは読めるだろよw
江戸中期以降や幕末あたりのなんかは当時の言い回しや語彙を知ってれば少し慣れれば大抵読める
読みたいのは戦国までの文書よ
0043名無しさん@1周年
垢版 |
2019/05/14(火) 13:48:09.32ID:FUfw6wO10
赤間先生懐かしー
学部は都留文だっけ
0044名無しさん@1周年
垢版 |
2019/05/14(火) 14:30:38.59ID:cCOVV/TP0
>>40
それに手癖が合わさるから読めないのは本当に読めない
帳面とかはいいけど、書状のような私信は結構厳しい
江戸後期から明治ぐらいが厳しい
0045名無しさん@1周年
垢版 |
2019/05/14(火) 14:38:30.27ID:ndVHYNl20
「’」みたいなので「カ」だったりするからな
一字だけより連続する何字かで候補出してもらう方が有難い
0046名無しさん@1周年
垢版 |
2019/05/14(火) 14:57:12.64ID:NyhgarCI0
あの蛇見たいのとかホント大変だわww
0047名無しさん@1周年
垢版 |
2019/05/14(火) 14:57:22.98ID:L/490Xie0
>>30
いや、その成果がAIとして継承されたんだろ
AIそのものは先人の成果が無けりゃなんもできん
AIからすりゃおまいさんの爺さんは神そのもの
0048名無しさん@1周年
垢版 |
2019/05/14(火) 14:59:25.28ID:L/490Xie0
>>44
手癖を手癖として認識できないAIはどんどん変な学習をしていく
ちゃんと手癖として分別してくれるんかね
0051名無しさん@1周年
垢版 |
2019/05/14(火) 15:54:00.33ID:OA3YU+n20
>>18
それ以前に“か”なんだけどなw


可の変体仮名で“の”じゃなくて“か“
0053名無しさん@1周年
垢版 |
2019/05/14(火) 15:57:56.04ID:OA3YU+n20
>>19
どれだけ現代人の教養が寂しいかって話だよなぁ
たかだか編変体がなも読み下せないとは
0054名無しさん@1周年
垢版 |
2019/05/14(火) 16:43:52.60ID:+jUqE9Lc0
タイ文字同士の字の見分けがつかないとか発音の規則が難しいとか言われるけど、
江戸時代の本読むと大体同じ事を感じるよ。楷書体だと差がわかる字がわかりづらかったり、
なんでこの発音表すのにこの文字使ってんだよってのがあったり
0055名無しさん@1周年
垢版 |
2019/05/14(火) 16:59:03.39ID:+jUqE9Lc0
こういう草書体や変体仮名が多用されるのって近世・近代ぐらいまでのイメージが強いけど、
昭和の年金の古い台帳を見ると崩し字や変体仮名が使われてるケースが結構あるよ
その結果が5000万件もの年金記録問題を生み出したけどw
0056名無しさん@1周年
垢版 |
2019/05/14(火) 17:09:12.77ID:FrbNWdNw0
>>48
その辺はかなり興味あるな
史料の原本じっくり見て墨の濃淡から書き順で判別したりするからそういうのができたりするとすごい

>>55
史料整理してた経験からすると戦後しばらくまではわりかし普通に使われてたような印象を受けるな
0058名無しさん@1周年
垢版 |
2019/05/14(火) 17:48:00.70ID:lWKFKIh90
>>39
そうなのか?
江戸時代の庶民向けの印刷物、瓦版とか草子物とか春画のキャプションとか、そっちのが好まれるからと、
わざわざ崩し字で木版を彫って刷ってたというよ。
楷書で書くと、お寺の経文やらお役人が橋のところに掲げるお触書とかみたいでお固いから嫌がられたんだとか。
0059名無しさん@1周年
垢版 |
2019/05/14(火) 17:54:43.69ID:ZPPxSQEO0
>>17
古本屋!
0060名無しさん@1周年
垢版 |
2019/05/14(火) 17:57:02.38ID:gtR9IpbX0
AIの得意分野でもあるが、学習のためのサンプルが少なすぎるから十分に育てられない
せいぜい人間の見落としチェックのための参考情報程度
0061名無しさん@1周年
垢版 |
2019/05/14(火) 19:06:18.65ID:xCSRYnKr0
日本の古文書はカッコ悪い
西洋の羊皮紙のギリシャ語とかラテン語はカッコいい
0062名無しさん@1周年
垢版 |
2019/05/14(火) 19:34:06.47ID:4aMC9K2u0
>>61
日本は庶民も文書残してるからね。西洋の貴族と坊主の残したものと比べたら、そりゃ見劣りする
0063名無しさん@1周年
垢版 |
2019/05/14(火) 19:47:09.38ID:U1CkgH1s0
>>44
野口英世母の手紙が一番わかりやすい例だよね
聞きかじりで書いてるから音につられて字がズーズー訛り
0064名無しさん@1周年
垢版 |
2019/05/14(火) 19:59:02.22ID:KK0taYvT0
おれ、「崩し字」が「隠し字」に見えていた。それ可能か?何て思ってさ。

崩し字なら、ちゃんとトレーニングしろよ。読めるよ。
0066名無しさん@1周年
垢版 |
2019/05/14(火) 20:04:01.73ID:zwQhzOT/0
速記文字書けるようになりたい
タイピングより速く
言い間違いも記録出来るレベルで
0067名無しさん@1周年
垢版 |
2019/05/14(火) 20:08:26.18ID:182V5NnO0
>>19
漢字の崩し字は、どうやって憶えるの?
0068名無しさん@1周年
垢版 |
2019/05/14(火) 22:21:42.43ID:XvNvkXXL0
ふーん、これは快挙じゃないかな。
というのも近世の文書ってのはもう本当に膨大に残ってるからね
膨大すぎてほとんど手付かず、当たり前か。

しかもだねその中には雑記随筆とか山のようにあるっていうんだから
その中には今の人間の鑑賞にたる捧腹絶倒クッソ面白い一大傑作、あると思うんだよなア
0069名無しさん@1周年
垢版 |
2019/05/14(火) 22:26:05.47ID:XvNvkXXL0
>>62
庶民www

まあいいけどさ、字が読めるどころか書けるようになると
どこまでを庶民とするかってのはなかなかムツカシーもんだけどねwww
しかしねえ、江戸パラダイス論とかニホンスゴイ論は眉に唾つけた方がいいぜ
識字についてはそんなよくはなかったと思うよ。
寺子屋原理主義みたいなやつもいるけど、
あれ本質的にはボランティアみたいなもんだからねw 公教育とかないのよwww
しかも近代的マスプロ教育なしにどうやって不学の戸をなくすんだよwww

もちろん識字率がネトウヨがホルりながら言うほど高いなんてことはありえないけどさwww
それはまあ現代ジャップの、他ならぬネトウヨの反知性主義を見ればわかるよね。
0070名無しさん@1周年
垢版 |
2019/05/14(火) 22:43:17.22ID:yoa02b750
こういう虱潰しはAI大得意だから良さげ
0071名無しさん@1周年
垢版 |
2019/05/14(火) 22:47:19.72ID:uur2YCZv0
>>25
ラテン語くらい読めなくて、研究するな。

俺はある世界に行きたかったが、「サンスクリットを読めるのは当たり前」と知って挫折した。
0072名無しさん@1周年
垢版 |
2019/05/14(火) 22:48:34.49ID:4gBEE9kH0
定型表現で「候」の文字は何度も使うから、みんなめんどくさがって「丶」になってるのは笑った。
0073名無しさん@1周年
垢版 |
2019/05/14(火) 22:49:29.59ID:1ys2N3A90
アルファベットの崩し字はマジわからんな。
あれネイチブは読めるんか?
0074名無しさん@1周年
垢版 |
2019/05/14(火) 22:50:42.93ID:uur2YCZv0
じいちゃん二人の字が両方とも読めない。
最近は自分の字が読めない。
AIに読んでもらおうかな?
0075名無しさん@1周年
垢版 |
2019/05/14(火) 23:02:21.83ID:FrbNWdNw0
>>72
だってあんな字画多いのいちいち書いてられへんやん
w
0076名無しさん@1周年
垢版 |
2019/05/15(水) 00:28:03.64ID:Rix3A1C+0
ハズキルーペ掛けえ。
0077名無しさん@1周年
垢版 |
2019/05/15(水) 07:59:21.16ID:/0kIWDEu0
>>1
●偏差値50私立理系新設バイオ大学へ入学して卒業した。
すると、無職(むしょく)の私を見て親は混乱、動揺(どうよう)、狼狽(ろうばい)した。
親が混乱、動揺、狼狽する姿を見たくない。
そうなら、中学生は進学高校へ、高校生は上位大学へ入学したほうがいいよ。
私は明石家さんまの名言「生きてるだけで丸儲け」だ。

●一部の愛情のない田舎娘たちの金銭欲婚活だとこうなる。
偏差値50のバイオ大学だ。
バイオ女は手先が器用で、教授のバイオ実験を無賃代行するので、教授の次に発言力が強い。
バイオ女たちの側がカネ目当てで婚活すると、不良をテコに悪に手を染め、弱い金持ちを恐喝する。
(女に無賃労働させ1千万円以上の研究費を浮かす教授の要素は複雑なので、あえて説明から抜く。)
不良は女を仲間と思ってないので、イジメの口実を女からもらい私から金を奪い、女にはあげない。
奪われた側が女に「不良へ戦え」と呼びかけると、女は奇声発作で口から電子音を鳴らし記憶を失う。
女は脳医学的な病気だった。そういう女が田舎出身者に大勢いる。これが田舎っぺ婚活の現実だ。

●普段、問題児の女たちは、モヤシ金持ちのことをコキ下ろして振り向かせ、セックスを迫る。
私は体調不良で何年も休学し復学した。
復学の4月から再びイジメが始まり、半年過ぎの12月で私は、なかば女たちに屈服した。
女の住所電話番号を聞いて、ウソのラブレターでお世辞オベッカを言うようになった。
世間向けに言えば、7ヶ月間、私の悪口を言ってる女が、私から住所を聞かれる。
聞かれると、1分以内に女自身の住所を書いてよこすのは異常だった。

●証拠を取るときの軋轢
カツアゲといっても私のほうから「どうか受け取ってください。」と不良へ渡してるので法的には恐喝ではない。
卒業単位を邪魔されてる証拠があれば法的に恐喝にできたろう。
女のボスの将軍H教授とは赤の他人のバイオ学科長の教授が証拠写真を撮る行為を私にだけ差別して禁止した。
「肖像権の侵害だ」と私個人に面と向かって直接差別した。私だけ写真が撮れない。証拠取りは大変だ。

web-n17-0081 2019-05-14 08:20
https://files-uploader.xzy.pw/upload/20190514083356_784a385a56.gif
https://medaka.5ch.net/test/read.cgi/kouri/1547360809/7-
あいう
0078名無しさん@1周年
垢版 |
2019/05/15(水) 07:59:38.25ID:/0kIWDEu0
>>77
●色目は男に粉をかけるインチキ行為

色目は不慣れな成長途上の愛情シグナルにも解釈できるが、男に粉をかけるインチキ行為の場合もある。
不良の縄張りにいる理由は、不良をテコにモヤシ金持ちを半殺しにし金を奪うためだ。次の手を考えてある。
色目をつかっても金は手に入らないので、ストーカー濡れ衣で不良をテコに痛めつけて金を取ろうとする。
親睦技術の齟齬とは違う。目安は女の年齢。高校卒業年齢の女ならカネ目当てのワルダクミだ。
(女に無賃労働させ1千万円以上の研究費を浮かす将軍H教授の要素は複雑なので、あえて説明から抜く。)

「あの女たちは、誰と結婚しても、不倫で俺(不良)たちの子を産むリモコン女だ。」
不良は私にこう男便所でほのめかす。私の隣で音出し放尿しながら、犬の壁ション、マーキングだ。
仮に、私が不良の縄張りの女へ先払いしたら、金で不良の縄張りを攻撃したとみなされ、卒業単位が危ない。
不良は女を仲間と思ってないので、イジメの口実を女からもらい私から金を奪い、女にはあげない。

卒業単位を邪魔されてる証拠があれば法的に恐喝にできたろう。
女のボスの将軍H教授とは赤の他人のバイオ学科長の教授が証拠写真を撮る行為を私にだけ差別して禁止した。
「肖像権の侵害だ」と私個人に面と向かって直接差別した。私だけ写真が撮れない。証拠取りは大変だ。

問題解決は、彼女たちが私のチンコを5分以内に学科長の目を盗んでしゃぶり、5分なら強行してでも写真を撮れる。
(女は将軍H教授の実験を無賃で肩代わりするので、仮に女性器を出して歩いても、何のお咎めも無いだろう。)
不良たちはストーカー退治の建前で私をカツアゲするのに、女が私のチンコしゃぶる写真あれば、口実を失う。
しかし、彼女たちにとってゴムフェラは換金行為の商売であり、前金なしだから、ゴムフェラ奉仕しない。

不良をテコに坊ちゃんを痛めつけても彼女たちは金がもらえないので、さらにでっち上げて攻撃をエスカレートさせる。
私がその田舎娘たちと話し合うと、四つんばいで女性器突き出す姿で錯乱し、手当たり次第に攻撃してくる。
何か偶然が重なると、坊ちゃんは変死するかもしれない。
0079名無しさん@1周年
垢版 |
2019/05/15(水) 08:48:23.40ID:5/5ryT0I0
>>58
楷書だらけの現代の文章は仮に内容がアホアホだろうと字的に江戸の人からしたら超お固いってわけか
ポップ体さえ緩く感じないってなんか不思議だな
0081名無しさん@1周年
垢版 |
2019/05/15(水) 12:55:15.69ID:57GzB4Gc0
>>71
ローマ時代の碑文とかなら今のラテン字と書体が殆ど同じだから楽々読めるよ。
なんで中世のは縦画をぶっとく横画を細く短くして可読性悪くしてんだか。
0082名無しさん@1周年
垢版 |
2019/05/16(木) 01:45:10.71ID:4GAeXLWV0
崩し字は上級国民にしか読めないというのが利点だったんだよ。つまり知識階級に
よる一種の平民に対する暗号としての機能があった。愚民には読めない文書ですよ。
0083名無しさん@1周年
垢版 |
2019/05/16(木) 02:49:33.42ID:ALm6AX960
>>47
横だが、素晴らしい返しだな
しっかり指摘しつつ相手も立ててやれる
惚れるわ
■ このスレッドは過去ログ倉庫に格納されています