【技術】古文書や浮世絵に書かれた「崩し字」、AIで解読します 立命館大と凸版印刷が支援システム
■ このスレッドは過去ログ倉庫に格納されています
古文書や浮世絵などに書かれた「崩し字」を、人工知能(AI)が画像から解読するシステムを立命館大文学部の赤間亮教授らのチームが、凸版印刷(東京)と共同開発したと13日、発表した。
チームによると、同様の解読アプリなどは他にもあるが、AIの導入は全国初という。
システムは、立命館大が所蔵する古文書や浮世絵など約76万件のデータベースと、凸版印刷が保有する崩し字を蓄積したデータをもとに開発。パソコンの画面に映った文書で読めない文字を1文字選択すると、崩し字データの中から形が似ているものをAIが抽出し、合致する可能性が高い文字を順に表示する仕組み。
http://news.livedoor.com/lit
e/article_detail/16453138/
http://image.news.livedoor.com/newsimage/stf/7/6/76387_1675_8ee7be4eaa8bc2ee04ac8bb2448b5db8.jpg 書いた自分でも読めない崩し字も判別可能ですか?
メモの意味がありません 漢字を廃止したら古文書が読めなくなるなんていかにアホな主張かわかるだろ
じっさいはカナすら古文書など読めない 戦国時代の書状とか
受け取った人どーすんのこれ
みたいなのもあるな 江戸時代の三陸の地震、伊達家の文書を読めた歴史学者等は知ってたけど
読めなかった地震学者は知らなかった、とかいうのがあったんだっけ デジャヴってAI 導入では初になるのか。
一般公開して家宝の書物とかを個人が読めるようになると面白いだろね。 >>4
>>9
ポンと出てくるって凄いな
それだけ頭が良いのに、ニートをやらせとくのがもったいない 江戸時代中期以降の庶民向けの本は
基本的に漢字に全部振りなが振ってあるので
くずし字のイロハが読めるようになるとほとんど判読できるようになる
あとくずし字のイロハ覚えるのはアルファベットより簡単 江戸のくずし字入門なんて本買ったけど、崩し具合の幅が広すぎてすぐ挫折した 関東大震災や米軍の空爆で多くの古文書が永久に失われました
ニホンオオカミやニホンカワウソは将来科学の力で復活させられるかもしれないけど
焼けた古文書はタイムマシンが出来ないかぎり取り戻せない
残念ですね 読める専門家が少なくて研究が進まないからねぇ
今はデジタルアーカイブ化で
閲覧可能の資料も増えたし
今までは専門家が所有者の許可とって読むしか無かったけど >>8
ヨーロッパ中世の文書とか、崩し字でない上にラテン語だから使われてる字の種類が23なのに、さっぱし読めんよ >>9
ネタだと思うが
あかよろし
(安可良呂之)
可の変体仮名 右筆が書いたような綺麗なくずし字はちょっと勉強すれば読める
だけど、江戸時代の庄屋や商家に残ってる書状なんかは酷い
何通も比べながらなんとなく読み進めていくうちになぜか読めるようになるんだが、AIを活用すると言うのはこういうことができるようになるということなのか こういうことされると俺の爺ちゃんの仕事がなくなって困るな・・・
平安朝や江戸期の古文書の解読で長年頑張ってきたのに
便利になるって誰かが犠牲になるもんなんだな 「達筆」な上司の指示書に難儀した時代に、このAIが有ったらな 父の字が達筆過ぎて年賀状に何が書いてあるのか毎年悩んでたの思い出すな
息子はド下手文字だ https://i.imgur.com/3ICf7Nd.jpg
横向けになっちゃった
「右ハしもふべどう 左ハひろせみち」でいいかな
筆で字を書くことからああいう崩し字に必然的になったんだろう
あれが読めるのは文章がワンパターンだったからだ くずし字の何が面倒かというと、元字の漢字が同じ
ひらがななのに、何種類もあってどれをクズしてひらがなに
当ててるのか見て覚えないといかんところな。
慣れるしか無い。
漢字の候文の方が読みやすくて意味が取れる。
スタンダードには価値があるってことだな。 Google翻訳とかYouTube字幕とかアホみたいなのばっかだからまともな解読ができるようになるのはまだまだ先だろ >>1
この画像のくらいは読めるだろよw
江戸中期以降や幕末あたりのなんかは当時の言い回しや語彙を知ってれば少し慣れれば大抵読める
読みたいのは戦国までの文書よ >>40
それに手癖が合わさるから読めないのは本当に読めない
帳面とかはいいけど、書状のような私信は結構厳しい
江戸後期から明治ぐらいが厳しい 「’」みたいなので「カ」だったりするからな
一字だけより連続する何字かで候補出してもらう方が有難い あの蛇見たいのとかホント大変だわww
>>30
いや、その成果がAIとして継承されたんだろ
AIそのものは先人の成果が無けりゃなんもできん
AIからすりゃおまいさんの爺さんは神そのもの >>44
手癖を手癖として認識できないAIはどんどん変な学習をしていく
ちゃんと手癖として分別してくれるんかね 「当寺の本尊釈迦阿弥陀ゆえ二尊院」
と書いてある。 >>18
それ以前に“か”なんだけどなw
可の変体仮名で“の”じゃなくて“か“ >>19
どれだけ現代人の教養が寂しいかって話だよなぁ
たかだか編変体がなも読み下せないとは タイ文字同士の字の見分けがつかないとか発音の規則が難しいとか言われるけど、
江戸時代の本読むと大体同じ事を感じるよ。楷書体だと差がわかる字がわかりづらかったり、
なんでこの発音表すのにこの文字使ってんだよってのがあったり こういう草書体や変体仮名が多用されるのって近世・近代ぐらいまでのイメージが強いけど、
昭和の年金の古い台帳を見ると崩し字や変体仮名が使われてるケースが結構あるよ
その結果が5000万件もの年金記録問題を生み出したけどw >>48
その辺はかなり興味あるな
史料の原本じっくり見て墨の濃淡から書き順で判別したりするからそういうのができたりするとすごい
>>55
史料整理してた経験からすると戦後しばらくまではわりかし普通に使われてたような印象を受けるな >>39
そうなのか?
江戸時代の庶民向けの印刷物、瓦版とか草子物とか春画のキャプションとか、そっちのが好まれるからと、
わざわざ崩し字で木版を彫って刷ってたというよ。
楷書で書くと、お寺の経文やらお役人が橋のところに掲げるお触書とかみたいでお固いから嫌がられたんだとか。 AIの得意分野でもあるが、学習のためのサンプルが少なすぎるから十分に育てられない
せいぜい人間の見落としチェックのための参考情報程度 日本の古文書はカッコ悪い
西洋の羊皮紙のギリシャ語とかラテン語はカッコいい >>61
日本は庶民も文書残してるからね。西洋の貴族と坊主の残したものと比べたら、そりゃ見劣りする >>44
野口英世母の手紙が一番わかりやすい例だよね
聞きかじりで書いてるから音につられて字がズーズー訛り おれ、「崩し字」が「隠し字」に見えていた。それ可能か?何て思ってさ。
崩し字なら、ちゃんとトレーニングしろよ。読めるよ。 速記文字書けるようになりたい
タイピングより速く
言い間違いも記録出来るレベルで ふーん、これは快挙じゃないかな。
というのも近世の文書ってのはもう本当に膨大に残ってるからね
膨大すぎてほとんど手付かず、当たり前か。
しかもだねその中には雑記随筆とか山のようにあるっていうんだから
その中には今の人間の鑑賞にたる捧腹絶倒クッソ面白い一大傑作、あると思うんだよなア >>62
庶民www
まあいいけどさ、字が読めるどころか書けるようになると
どこまでを庶民とするかってのはなかなかムツカシーもんだけどねwww
しかしねえ、江戸パラダイス論とかニホンスゴイ論は眉に唾つけた方がいいぜ
識字についてはそんなよくはなかったと思うよ。
寺子屋原理主義みたいなやつもいるけど、
あれ本質的にはボランティアみたいなもんだからねw 公教育とかないのよwww
しかも近代的マスプロ教育なしにどうやって不学の戸をなくすんだよwww
もちろん識字率がネトウヨがホルりながら言うほど高いなんてことはありえないけどさwww
それはまあ現代ジャップの、他ならぬネトウヨの反知性主義を見ればわかるよね。 >>25
ラテン語くらい読めなくて、研究するな。
俺はある世界に行きたかったが、「サンスクリットを読めるのは当たり前」と知って挫折した。 定型表現で「候」の文字は何度も使うから、みんなめんどくさがって「丶」になってるのは笑った。 アルファベットの崩し字はマジわからんな。
あれネイチブは読めるんか? じいちゃん二人の字が両方とも読めない。
最近は自分の字が読めない。
AIに読んでもらおうかな? >>72
だってあんな字画多いのいちいち書いてられへんやん
w >>1
●偏差値50私立理系新設バイオ大学へ入学して卒業した。
すると、無職(むしょく)の私を見て親は混乱、動揺(どうよう)、狼狽(ろうばい)した。
親が混乱、動揺、狼狽する姿を見たくない。
そうなら、中学生は進学高校へ、高校生は上位大学へ入学したほうがいいよ。
私は明石家さんまの名言「生きてるだけで丸儲け」だ。
●一部の愛情のない田舎娘たちの金銭欲婚活だとこうなる。
偏差値50のバイオ大学だ。
バイオ女は手先が器用で、教授のバイオ実験を無賃代行するので、教授の次に発言力が強い。
バイオ女たちの側がカネ目当てで婚活すると、不良をテコに悪に手を染め、弱い金持ちを恐喝する。
(女に無賃労働させ1千万円以上の研究費を浮かす教授の要素は複雑なので、あえて説明から抜く。)
不良は女を仲間と思ってないので、イジメの口実を女からもらい私から金を奪い、女にはあげない。
奪われた側が女に「不良へ戦え」と呼びかけると、女は奇声発作で口から電子音を鳴らし記憶を失う。
女は脳医学的な病気だった。そういう女が田舎出身者に大勢いる。これが田舎っぺ婚活の現実だ。
●普段、問題児の女たちは、モヤシ金持ちのことをコキ下ろして振り向かせ、セックスを迫る。
私は体調不良で何年も休学し復学した。
復学の4月から再びイジメが始まり、半年過ぎの12月で私は、なかば女たちに屈服した。
女の住所電話番号を聞いて、ウソのラブレターでお世辞オベッカを言うようになった。
世間向けに言えば、7ヶ月間、私の悪口を言ってる女が、私から住所を聞かれる。
聞かれると、1分以内に女自身の住所を書いてよこすのは異常だった。
●証拠を取るときの軋轢
カツアゲといっても私のほうから「どうか受け取ってください。」と不良へ渡してるので法的には恐喝ではない。
卒業単位を邪魔されてる証拠があれば法的に恐喝にできたろう。
女のボスの将軍H教授とは赤の他人のバイオ学科長の教授が証拠写真を撮る行為を私にだけ差別して禁止した。
「肖像権の侵害だ」と私個人に面と向かって直接差別した。私だけ写真が撮れない。証拠取りは大変だ。
web-n17-0081 2019-05-14 08:20
https://files-uploader.xzy.pw/upload/20190514083356_784a385a56.gif
https://medaka.5ch.net/test/read.cgi/kouri/1547360809/7-
あいう >>77
●色目は男に粉をかけるインチキ行為
色目は不慣れな成長途上の愛情シグナルにも解釈できるが、男に粉をかけるインチキ行為の場合もある。
不良の縄張りにいる理由は、不良をテコにモヤシ金持ちを半殺しにし金を奪うためだ。次の手を考えてある。
色目をつかっても金は手に入らないので、ストーカー濡れ衣で不良をテコに痛めつけて金を取ろうとする。
親睦技術の齟齬とは違う。目安は女の年齢。高校卒業年齢の女ならカネ目当てのワルダクミだ。
(女に無賃労働させ1千万円以上の研究費を浮かす将軍H教授の要素は複雑なので、あえて説明から抜く。)
「あの女たちは、誰と結婚しても、不倫で俺(不良)たちの子を産むリモコン女だ。」
不良は私にこう男便所でほのめかす。私の隣で音出し放尿しながら、犬の壁ション、マーキングだ。
仮に、私が不良の縄張りの女へ先払いしたら、金で不良の縄張りを攻撃したとみなされ、卒業単位が危ない。
不良は女を仲間と思ってないので、イジメの口実を女からもらい私から金を奪い、女にはあげない。
卒業単位を邪魔されてる証拠があれば法的に恐喝にできたろう。
女のボスの将軍H教授とは赤の他人のバイオ学科長の教授が証拠写真を撮る行為を私にだけ差別して禁止した。
「肖像権の侵害だ」と私個人に面と向かって直接差別した。私だけ写真が撮れない。証拠取りは大変だ。
問題解決は、彼女たちが私のチンコを5分以内に学科長の目を盗んでしゃぶり、5分なら強行してでも写真を撮れる。
(女は将軍H教授の実験を無賃で肩代わりするので、仮に女性器を出して歩いても、何のお咎めも無いだろう。)
不良たちはストーカー退治の建前で私をカツアゲするのに、女が私のチンコしゃぶる写真あれば、口実を失う。
しかし、彼女たちにとってゴムフェラは換金行為の商売であり、前金なしだから、ゴムフェラ奉仕しない。
不良をテコに坊ちゃんを痛めつけても彼女たちは金がもらえないので、さらにでっち上げて攻撃をエスカレートさせる。
私がその田舎娘たちと話し合うと、四つんばいで女性器突き出す姿で錯乱し、手当たり次第に攻撃してくる。
何か偶然が重なると、坊ちゃんは変死するかもしれない。 >>58
楷書だらけの現代の文章は仮に内容がアホアホだろうと字的に江戸の人からしたら超お固いってわけか
ポップ体さえ緩く感じないってなんか不思議だな >>71
ローマ時代の碑文とかなら今のラテン字と書体が殆ど同じだから楽々読めるよ。
なんで中世のは縦画をぶっとく横画を細く短くして可読性悪くしてんだか。 崩し字は上級国民にしか読めないというのが利点だったんだよ。つまり知識階級に
よる一種の平民に対する暗号としての機能があった。愚民には読めない文書ですよ。 >>47
横だが、素晴らしい返しだな
しっかり指摘しつつ相手も立ててやれる
惚れるわ ■ このスレッドは過去ログ倉庫に格納されています