AIでヴォイニッチ手稿の解明に乗り出したコンピューター科学者が登場、アルゴリズムでわかったこととは?

■ このスレッドは過去ログ倉庫に格納されています
0001ばーど ★2018/02/03(土) 03:39:00.18ID:CAP_USER9
未解読の文字が記され多数の奇妙な絵が書かれている「ヴォイニッチ手稿」は多くの言語学者や歴史家が解読を試みていますが、2018年現在でも謎が多く残された本です。コンピューター科学者であり自然言語処理の専門家が、そんなヴォイニッチ手稿をコンピューターアルゴリズムで解読するという試みを行っています。

Decoding Anagrammed Texts Written in an Unknown Language and Script | Hauer | Transactions of the Association for Computational Linguistics
https://transacl.org/ojs/index.php/tacl/article/view/821

AI used to decipher ancient manuscript - Faculty of Science
https://www.ualberta.ca/science/science-news/2018/january/ai-used-to-decipher-ancient-manuscript

Alberta computer scientist claims clues to deciphering mysterious Voynich manuscript - Edmonton - CBC News
http://www.cbc.ca/news/canada/edmonton/computer-scientist-claims-clues-to-deciphering-mysterious-voynich-manuscript-1.4503571

ヴォイニッチ手稿は1912年に古書収集家によって発見されたもの。数多くの専門家が「これまでに見たことがない」と語る謎の言語で記され、著者は複数人であることや、一体何のために書かれたのかがさっぱりわからないことから「世界一ミステリアスな本」と呼ばれています。

アルバータ大学のコンピューター科学者であり、自然言語処理の専門家であるGreg Kondrak教授は、AI(人工知能)を使ってそのヴォイニッチ手稿の解明に乗り出しました。Kondrak教授は大学院生であるBradley Hauer氏とともに人間の言語の曖昧さをコンピューターで解読するという研究を行っており、ヴォイニッチ手稿がケーススタディーの対象として選ばれたのです。

まず研究者らは、世界人権宣言を380の言語に翻訳したサンプルを使用し、コンピューターが97%の正確性で系統的に言語を識別できるようにしました。最初、研究者らは「ヴォイニッチ手稿はアラビアの言語で書かれているのではないか?」という仮説をたてていましたが、アルゴリズムを走らせた結果、最もヴォイニッチ手稿の言語に近いのはヘブライ語であると結論づけています。

「これは驚くべきことです。ただ『ヘブライ語である』と決めるのは第一段階に過ぎません。次はこれをどう解読するかです」とKondrak教授。

次に、Kondrak教授はヴォイニッチ手稿の記載は単語中の文字をアルファベット順に並べるアナグラム「アルファグラム」を用いて書かれたものだと考えました。そして、Kondrak教授らはこのようなテキストを解読するアルゴルズムを開発して解読を試みたところ、80%以上単語はヘブライ語の辞書にのっていることがわかりました。

「しかし、私たちには、単語を組み合わせることでどんな意味が生まれるのかがわかりませんでした」と語るのはKondrak氏。自分たちの発見が正しいのかどうかを確認するにはヘブライ語学者を探す必要がありましたが、ヘブライ語学者は見つからず、最終的に研究者らはGoogle翻訳を利用しました。

その結果、ヴォイニッチ手稿の最初の一文は「She made recommendations to the priest, man of the house and me and people(人々や私、そしてその家の男である聖職者に彼女は勧告した)」という、文章としては奇妙なものの、文法的には成立する形で翻訳ができたそうです。ただし、古代ヘブライ語の学者を見つけ出すことができなかったため、まだヴォイニッチ手稿の文章全体には謎が残っているとのこと。ヘブライ語に通じており、同時に歴史学者である人物を研究者らは求めています。

Kondrak氏は「ヴォイニッチ手稿の専門家らがこのような研究に親しみを持ってくれるとは思いません。彼らはコンピューターが自分に置き換わるものだとして恐怖を感じるかもしれないので」と語っていますが、一方で自分たちの研究が専門家らに受け入れられることを望んでいるとのこと。

なお、研究者らは今後、開発したアルゴリズムを他の古代の言語に適用していく予定となっています。

2018年01月30日 16時00分00秒
GIGAZINE
http://gigazine.net/news/20180130-ai-voynich-manuscript/

0146名無しさん@1周年2018/02/04(日) 09:53:23.54ID:nf8/7Pn80
ものすごく字と絵が下手な人が書いたとか

0147名無しさん@1周年2018/02/04(日) 09:56:57.45ID:m2OOLhy70
トールキン先生か、
アレクサンドル・ミャスコフスキー連れてこい。

0148名無しさん@1周年2018/02/04(日) 09:58:32.40ID:6KRtMAhE0
昔からこういうインチキ臭い研究はあるよな
コンピューターで文章の特徴を解析してシェイクスピアの正体を突き止める
みたいなやつ

0149名無しさん@1周年2018/02/04(日) 09:59:13.42ID:QCbnes6N0
作成者が統失だっただけだろ・・・
http://machiukezoo.biz/wp-content/uploads/2017/01/20170104-23.jpg

0150名無しさん@1周年2018/02/04(日) 10:03:16.84ID:Y1FRSsEN0
>>149
シアーは英語の「sheer」のことで、和訳すると「 ごく薄い、透きとおるような」という意味です。つけていても、あくまで自然な仕上がりである事を強調する際によく使用され、例えば??...

0151名無しさん@1周年2018/02/04(日) 10:11:06.95ID:5bNhMknC0
>>149
統失だと、余白にもビッシリ字を詰める気がする

0152名無しさん@1周年2018/02/04(日) 10:12:38.83ID:FFQ/8rZq0
ヴォッキデータでこんなことができる時代にもなったんだな。

0153名無しさん@1周年2018/02/04(日) 10:28:53.39ID:Y1FRSsEN0
当時は旧約聖書の時代だから
イスラム、ユダヤ、キリストの中央アジアからスペインまで
幅広い交流があって言語や人種のるつぼ

0154名無しさん@1周年2018/02/04(日) 10:30:34.68ID:xtgxHrze0
>>149
何か軍勢に完全包囲されてる城に見えた

0155名無しさん@1周年2018/02/04(日) 10:43:21.92ID:Y1FRSsEN0
>>154
なんらかの設計図みたいなものかもしれない

0156名無しさん@1周年2018/02/04(日) 10:48:07.90ID:seUcjdK60
他国に侵攻支配されても、
旧約聖書を絶やさない為、
旧約聖書を暗号化したのかもしれん

0157名無しさん@1周年2018/02/04(日) 10:50:03.08ID:Y1FRSsEN0

0158名無しさん@1周年2018/02/04(日) 10:54:29.59ID:5uZ3z1gi0
字列変換する意味がわからん
もしそこいらの漫画でも辞典でも字列変換されてたら投げ捨てるわ

0159名無しさん@1周年2018/02/04(日) 10:54:53.22ID:gkS9rznn0
世界の命運を握るという手稿をめぐって米政府とトレジャーハンターが戦う展開で映画化しても良い時期かも。

0160名無しさん@1周年2018/02/04(日) 10:54:57.89ID:0az8yZHo0
今まで未解読だった古文書なんかは今後AIで解読されていくんだろうな。

0161名無しさん@1周年2018/02/04(日) 10:55:15.64ID:Y1FRSsEN0

0162名無しさん@1周年2018/02/04(日) 19:54:40.18ID:pUNjHLS30
仮にアナグラムが使われて文字が入れ替えられていたとしたら
並び替えてからでないと元の言語を特定できなくない?

0163名無しさん@1周年2018/02/04(日) 20:08:19.68ID:+GUyrqGE0
2chで読めるって奴いただろ
彼を招聘しろ

0164名無しさん@1周年2018/02/04(日) 20:15:21.83ID:ndr6Si6L0
こんなことにまでボッキデータが使われる
こんな世の中じゃ・・・

0165名無しさん@1周年2018/02/04(日) 20:22:18.47ID:YrpmL3kw0
長門有希も呆れ顔

0166名無しさん@1周年2018/02/04(日) 20:31:01.96ID:zuS/dmts0
真偽は不明だけど一応文章になるんだな

0167名無しさん@1周年2018/02/04(日) 20:34:56.42ID:eIpALLPb0
ヘブライ語なら神学者なら分かるはずだよね

0168名無しさん@1周年2018/02/04(日) 20:40:58.07ID:eIpALLPb0
日ユ同祖論があるけど
古代ヘブライ語なら日本語とも関連がーとの
無理矢理こじつけからのヴォイニッチ日本語論期待

0169名無しさん@1周年2018/02/04(日) 22:50:24.14ID:tRhWzMIw0
コデックス何とかの類いだろう

0170名無しさん@1周年2018/02/04(日) 22:53:07.85ID:SgK4oA9S0
書いた人も本望やろなあ

0171名無しさん@1周年2018/02/04(日) 22:59:53.98ID:RciyW6pU0
デュフフコポォ

0172名無しさん@1周年2018/02/04(日) 23:19:24.53ID:RqRd/jgB0
ヴェネチアングラスの製造レシピ
それに入れる毒薬のレシピ
を暗号化したものや、建造物のデザインって判明してなかったっけ
当時はこれら持ち出したら処刑だったからとかなんとか

0173名無しさん@1周年2018/02/04(日) 23:42:12.00ID:Mv7UaLNb0
もしロゼッタストーンが発見されなかったら、未だに象形文字は未解読なのか?

0174名無しさん@1周年2018/02/04(日) 23:53:18.15ID:6KRtMAhE0
>>173
ヒエログリフな
あれはロゼッタ・ストーンが無かったら多分無理

0175名無しさん@1周年2018/02/05(月) 00:00:49.85ID:nocTTjva0
六本指で新鮮な食材の好きなあの人がアップを始めました

0176名無しさん@1周年2018/02/05(月) 08:19:44.86ID:Htl/Z+bm0
>>174
ロゼッタストーンという僅かなヒントから解読できたのがすごいと思うわ

0177名無しさん@1周年2018/02/05(月) 11:13:36.11ID:r6OAUTIQ0
>>2
まともなレスが最初に付いてると安心するわ
ソース文みたいに、ヘブライ語が云々とか言い出すと本当に萎えるんだわ ただのオカルトだよ

0178名無しさん@1周年2018/02/05(月) 11:20:31.60ID:UIUcUq220
>>5
> 正解は苺製菓!

・・・どこら辺からツッコんで欲しいの?

0179名無しさん@1周年2018/02/05(月) 12:24:21.26ID:mt8TMdhd0
>>2
それもひとつの説
だが適当に書いたことを証明した奴はいない。

もしかしてこれも適当に書いたように見えるかね?>>89

0180名無しさん@1周年2018/02/05(月) 12:54:52.57ID:3vMqEdif0
ぱっと見大昔に書かれた植物学の本の写本だね
裸体の女性が管の中にいるのは維管束の仕組みを説明しようとしているのだろう

0181名無しさん@1周年2018/02/05(月) 12:56:46.33ID:TzYjOdbi0
>>180
不思議なことに、載ってるのは実在しない植物ばかりなんだよ

0182名無しさん@1周年2018/02/05(月) 12:58:27.03ID:wy8av7uc0
>>3
だからあくまでそれも一説だろ
これが落書きならそれを証明できるはず

それをやってるだけ

0183名無しさん@1周年2018/02/05(月) 12:59:56.36ID:plJf3DHE0
2ちゃん探偵団に依頼してみればいいのに

0184名無しさん@1周年2018/02/05(月) 13:13:24.61ID:wy8av7uc0
>>183
確かにあの迷探偵が調査すると的中率0%だもんな
真相がすぐにわかりそう

0185名無しさん@1周年2018/02/06(火) 00:02:58.17ID:bpuHQAPr0
>>182
上でも出てるけど落書きの可能性は相当低いよ。
統計解析で絵と文章のあいだに相関性があることまで分かってるし、
文字数などのばらつきも自然言語に近いことが判明している。

0186名無しさん@1周年2018/02/06(火) 00:06:27.94ID:RUeN/EU70
語彙が少なすぎ繰り返しが多すぎ
やる気のない埋め草でできたでっちあげってこった

0187名無しさん@1周年2018/02/06(火) 00:12:00.69ID:6+9lfmJY0
>>186
おまいのレスのことか?

0188名無しさん@1周年2018/02/06(火) 07:05:16.26ID:bIHm7cy40
ランダムに書くのはめんどくさいし
それらしく見えないから暗号プラス
適当な置換

作成プロセスを再建したいという気持ちは
よくわかるよ

0189名無しさん@1周年2018/02/06(火) 10:30:05.11ID:K45CLz3q0
ようやく解読出来るのか
でも解読した内容は人間にとっても聞かない方がいい内容らしい

0190名無しさん@1周年2018/02/06(火) 10:32:27.24ID:bIHm7cy40
狂人が書いたものを、別の者が
また置換すると、そこになんらかの知性的な構造が
把握できても、それ以上解読はできないかも

0191名無しさん@1周年2018/02/06(火) 10:36:19.42ID:YFUaAyGx0
【芸能/考古学】石原真理子、ヴォイニッチ手稿を即座に解読
http://egg.5ch.net/test/read.cgi/%72%69%76%65%72/1513205751/l50

0192名無しさん@1周年2018/02/06(火) 10:43:34.44ID:3duNeYhp0
セコイアみたいな杉は氷河期のものだし
ヨーロッパはずっと氷河期みたいな気候だったということに

0193名無しさん@1周年2018/02/06(火) 10:43:45.16ID:K6Re6Rgg0
挿絵がヘタクソすぎる

0194名無しさん@1周年2018/02/06(火) 10:43:45.55ID:s6GZ9zBp0
ヴォイニッチ手稿の文が元の言語で真似てヘブライ語が出来たんよ。
だからヴォイニッチ手稿を書いたのは宇宙人。
この言語を持つ宇宙人は何度も訪れている。

0195名無しさん@1周年2018/02/06(火) 10:45:02.95ID:biiugftu0
現代でもアニメやドラマや映画などの架空のお話に対する設定資料集が出版されたりとかしてるじゃん
またそれらのお話のために架空の言語を作成してみたりとかもしてる
ヴォイニッチ手稿だってそうしたものであっておかしくない
架空の世界の博物誌を架空の言語で書く
簡単には解読できないからこそより価値が上がり、カネを持った好事家により高く売れると

0196名無しさん@1周年2018/02/06(火) 11:20:13.42ID:1Y5qVpd00

■ このスレッドは過去ログ倉庫に格納されています