古文書を解読できるスマホアプリ 凸版印刷が開発 くずし字対応AI-OCRを活用 [朝一から閉店までφ★]
■ このスレッドは過去ログ倉庫に格納されています
2022年09月13日 12時02分 公開
[松浦立樹,ITmedia]
凸版印刷は9月13日、古文書などのくずし字資料をスマートフォンで撮影し、その場で解読できるアプリを発表した。資料館などの調査業務効率化を効率化する狙い。
9月から複数の資料館で実証実験を進め、23年1月にiOS版アプリのβ版を公開、3月に正式版を一般販売する予定。
https://image.itmedia.co.jp/news/articles/2209/13/l_tm1636144_09131_1_w490.jpg
凸版印刷、古文書を解読できるスマホアプリを開発
AIを活用したOCR(光学的文字認識)エンジンを搭載し、手書きや木版でつくられた古文書の読み取りが行える。資料館の業務効率化を支援する他、
一般利用者の「手元にある古文書の概要を知りたい」「くずし字を読めるようになりたい」などのニーズにも対応し、貴重な歴史資料の破棄や散逸の防止にも貢献するとしている。
https://www.itmedia.co.jp/news/spv/2209/13/news117_0.html 俺がこれを上回る精度のアプリをリリースしてやるぜ! 解読されても、何を言ってるかわからん
現代の言葉に翻訳してくれよ 結構前からデータセット整えて頑張ってたもんな
ようやく実用化か
よかったよかった
何で、スマホなんかでやっている。
うっとうしい。
まるで台湾だな。
源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai
https://ledge.ai/tkasasagi-interview/
これとは別に開発してたソフトウェア? おわっ、これはすごい発明
凸版印刷は日本文化のために偉大な貢献をしている すげえなあ
ここからさらに現代語訳にするのは楽そう ネガフィルムをスマホのカメラで取り込んで
ネガポジ反転してくれるアプリのオススメ教えて 1文字単位で解読するポンコツアプリは既にあるけどこれも1文字単位か 昔は資料をマイクロフィルムに写してから翻刻してたからなあ
スマートフォンがあれば出先ですぐに翻刻できる 世界中の仲間達がdoujinshiをダウンロードするついでに
少しずつ手伝ってくれるシステム もう新しい史料とかほとんどないし
歴史学者要らねえな 歴史を語るときに 公文書読めるやつが幅利かせてる時代は終わったな
こういうのがひとつでも出てくれば 次はもっと精度のいいのが出てくるだろうから 5年後10年後には サクサク読めちゃうんだろうな 今でも解読できていないものがあるのか?
従来の解読が誤りだったものが発見できるといいな まだ読めてない古文書は膨大にあるから
いよいよ日本史が書き変わるだろうな 似たようなフリーアプリが既にあるけどな
「みを」ってやつ 俺の汚い字も読み取って
綺麗な字に置き換えて書いてくれ >>44
俺もだw
「ミミズのような字」ってガキの頃から言われてて
実際、自分でも何書いていたか読めない場合が多々あるw >>38
先祖にまつわる古いものらしいということでありがたく保存してあるけどちゃんと読める人がいなくて何が書いてあるのか分からないといったものもまだまだ多数ありそうだからな 郷土資料館にある資料をテキトーに10万字くらい翻刻すると博士取れた時代が懐かしいな くずし字って読みにくいよね
なんであんな書き方したんだろう 日本は明治になって文字体系が激変したからな。
ひいひい爺さんくらいになると、書いたものが全く読めない。
「日本人は古典も読める」というのは、あくまで文字を変換してるからだ。 既に読み解ける学者なら研究の効率化をはかれるけど
古文書を学びたい人は草書体を自分ひとりの力である程度読み解けないと後々苦労しそう >>38
それを誰がやるのっていう問題は同じだからなあ 俺の崩れた顔も撮影ではイケメンナイスガイに
整形される写真アプリ作ってくれ。 山奥に読めない石碑があったりするけどああいうの読めたら素敵ね >>64
結構興味深い由来と書いてあるよね
「え?こんなところに天皇が…?」とかw >>56
なんかね、家系図で横にいっぱい説明書いてあんだけど読めねえっての見せられたことがあるよ このAIでも俺の字は読めまい
時間が経つと自分でも読めんしな… CoC現代シナリオでこのアプリ使わせれば
古文書読めんキャラでも調査が捗るのはいいな
理解しやすい分失うSAN値は多めにするべきか? 古文書解読とかマジで苦痛
13世紀の仏文読む授業とかあったけど全然読めねえ もう日本の技術は信用できない
これもなんか不具合あるはず >>64
大抵もとが筆書きだし、イケるんではあるまいか 植物の名前とかグーグルレンズが役に立つ
「何だこの植物美味そうだな」
グーグルレンズ…っと
「ドクウツギ」ぎゃあああ! 古文書読めるのかっこいいよな
読めるようになりたいけど崩し字とかあれ個人差大きすぎね? 文字を解読して文章入力してそれを翻訳して整理して
っていうそういう手続きは人力要素も大きいから大変だろうけど
その後の研究じたいはAIと歴史学は相性よさそうだな アプリ使って古文書の所在地が記録されるだけでも研究が捗る >>86
なんのこっちゃわからんけど
金は朝借りろ
みたいなことかな? >>86
最後の文字は「候」の読み違えだな
あまり信用できんな 学習させてない古文書持ってきたらポンコツの精度なんだろうな これで古文書解析用途のカメラが販売規制されることになってしまうのか。 今まで必死に勉強してやっと古文書を読めるようになった人涙目だな >>86
谷商人「の(之)」が抜けてないかな
あとその下の字は「物」では? これぐらい読めないとかほんとにおまえら日本人と言えるのだろうか >>1
これ欲しいな
崩字読めなくて先祖の文献読めなくて困る >>103
誤差が出るから、知識ないと誤読するよ
あくまでも補助ツール 上司の汚い文字も解読出来ますか?
「これなんて書いてんですか?」って聞き辛いんだよ これ良いな
展示してある古文書とか中身知りたくても判読できなくてイライラする時けっこうあるし 癖の無い文字だったら読めるだろうけど
癖がある文字だと途端に読めなくなる予感しかしない
つまりはポンコツアプリよ >>116
「食人」とかなんか物騒な事書いてあるみたいだけど >>112
これを使ったら覚えるのめちゃくちゃはかどりそうって意味では涙目かもなw
30年前にこれがあったらなー ようやく古文書を解読できるAIが登場したか年代も自動で鑑定してくれるのはありがたい https://youtu.be/LQ1zc5IsAfQ?t=27
https://youtu.be/mw6WUgPltZI?t=454
正直、がんばって読んでみようとしても
よく分からん時がある。
(仮名だけの文章でも、同じ読みの仮名がイッパイある訳だし)
それに文章じゃなくて、文脈で読まないと行けない。
どうみても、みためはユだけど
文脈がコで読むべきなら、コと読むべきだし。
ケだかクだか判別できず、文脈的にも
どっちでも読めちゃう場合は
とりあえず、どっちかにせざるをえない。
あと、伝書とかはあきらかに
わざと分かりにくく書いてある。
(当時としてもヘンな日本語になってたり
違う文字や隠語を使っていたり。
あるいは…雑談みたいな寄り道に重要な事かいてたり、
ながなが書いてた説明の方に意味がなかったり)
だから、その手のアプリが出来ても
読みにくい物は読みにくい物として
やっぱり、残っていくと思う。 >>116
内外国?
文政八年七月七日
そのあとはピンボケすぎてようわからん >>1
解読対象をサーバーへ送信
個人所有の公になっていない古文書を発見
その後はどうなるんだろう >>40
そうですね。
知らないと、「こ」「ぶんしょ」と読むよりありません。 >>8
かなり前に古文書用ソフトだかアプリあったよねあれと同じ? >>14
これが一番有り難いような
達筆すぎて読めない手紙とか 俺も>>10と違うのか知りたい
>>10の人はマジすごいよ >>1
一般人でも
歴史系のTV番組で「…と言う記述があります」なんて古文書が映ると
他の部分も読んでみたくなるもんね
値段次第だけどスマホに入れておきたいアプリかも グーグルのイメージ検索よりいいの?
アレこそポンコツだわ。 >>17
ネガをスマホに取り込む。
トーンカーブを使えるアプリでトーンカーブを逆にすればいい。
(左下から右上のラインを左上から右下) これによって更に戦国武将の
ホモ手紙とか発掘されるんかねぇ、、、、 解読やら翻訳やら便利なものが増えると人がバカになる これで筆記体みたいな日本語を書く人の文章解読が楽になるんだな >>142
このアプリを利用して歴史解読進める
賢いのも出てくるさ これ、上手く改造したら、
CAPTCHAを抜くのも夢じゃなさそうだな。
いや、別に何に使うとかそういうのは別として。 格調高く見えて翻訳したら凄い下らない内容だったりしてな。 >>148
2ちゃんねらに解読出来るヤツ現れて
都市伝説YouTuberがつい最近ネタにしてた さっぱり読めないくずし字が分かっても
古文なので何を言ってるのか分からないでござる
多くの日本人は明治時代の書籍も厳しいだろう 「みを」なら、ちょっと使ってみたけど半分くらいかな
専門家なら少し楽になるかも
一般人は不安だらけで使えないよ 自虐史観の学者が韓国の学者はアプリで解読したら腰抜かすなw >>157
むしろ゛適切に育てた゛AIで゛正しい歴史゛を作り出すぞ。 >>139
Yahoo!知恵遅れかよ
質問に答えられないならレスすんなバカ >>113
「何でもっと早く聞かないんだ。オレにも読めないじゃないか!」
と怒られたことがある >>54
筆で書く場合は楷書より行書、草書の方が楽だからなぁ
楷書はトメ、ハネをきっちり書くためにあらかじめ紙を机の上に敷かなければならないが
行書、草書なら紙と筆をくっつけたままのイメージで流れるように書くから
ロール状の紙のままでもスラスラ書ける >>4
是非がんばって欲しい
複数競い合った方が進歩する >>54
時間短縮のためだな
楷書と草書で写本した場合、草書で書いた方が倍早いっていう記録が江戸時代の史料にもある >>137
なんでも鑑定団とか結構戦国時代の古文書出てくるもんな >>167
研究者や図書館博物館の職員や
ごくまれに弁護士あたりが読まなきゃなんない事があるかも
戸籍謄本は電算化されて手書きの原本も破棄されてるんで通常の業務で解読しなきゃいけないケースはほぼ無くなってるかと
登記に関するものは閉鎖謄本として電算化される前のものがまだ残ってるけど、アレを読むのは弁護士司法書士土地家屋調査士だもんなあ
役人が戦前や戦中の資料を見なきゃいけなくなった場合くらいじゃないかなあ くずし字→翻刻→書き下し→現代語訳までできたら凄い発明になるな
一般人なら翻刻読むのも難易度高いからな
(慶長5年)1600年7月24日付真田信幸宛徳川家康書状
【翻刻】
今度安房守被罷帰候處、日比之儀を不相違、被立候事奇特千万候、
猶本多佐渡守可申候間、不能具候、恐々謹言、
【書き下し】
今度安房守罷り帰り候処、日頃の儀を相違えず、立たれ候事奇特千万に候、
なお本多佐渡守申べく候間(そうろうあいだ)、具(つぶさ)にする能はず候、恐々謹言、
【現代語訳】
この度真田昌幸が(翻意して)領国に戻った際に、あなたは日頃の我等との交流を忘れず、味方したことは非常に殊勝である。
詳しくは本多正信から申し上げるので、ここでは詳しく申しません。 >>118
筆書きの崩字、いわゆる「達筆」を読むアプリだよ
識字率を試せる日が楽しみ 古文書自体が偽物が多かったりするけどそれを精査するのも楽にはなるね 手書きなんてGoogleでもクソ精度なんだから見なくてもわかるダメなやつ 古文書ではないがたまに戸籍でも難読字が出てくる
現役で仕事したいた時に出てくれていたら試せたのになぁ ■ このスレッドは過去ログ倉庫に格納されています