AIでヴォイニッチ手稿の解明に乗り出したコンピューター科学者が登場、アルゴリズムでわかったこととは?
■ このスレッドは過去ログ倉庫に格納されています
未解読の文字が記され多数の奇妙な絵が書かれている「ヴォイニッチ手稿」は多くの言語学者や歴史家が解読を試みていますが、2018年現在でも謎が多く残された本です。コンピューター科学者であり自然言語処理の専門家が、そんなヴォイニッチ手稿をコンピューターアルゴリズムで解読するという試みを行っています。
Decoding Anagrammed Texts Written in an Unknown Language and Script | Hauer | Transactions of the Association for Computational Linguistics
https://transacl.org/ojs/index.php/tacl/article/view/821
AI used to decipher ancient manuscript - Faculty of Science
https://www.ualberta.ca/science/science-news/2018/january/ai-used-to-decipher-ancient-manuscript
Alberta computer scientist claims clues to deciphering mysterious Voynich manuscript - Edmonton - CBC News
http://www.cbc.ca/news/canada/edmonton/computer-scientist-claims-clues-to-deciphering-mysterious-voynich-manuscript-1.4503571
ヴォイニッチ手稿は1912年に古書収集家によって発見されたもの。数多くの専門家が「これまでに見たことがない」と語る謎の言語で記され、著者は複数人であることや、一体何のために書かれたのかがさっぱりわからないことから「世界一ミステリアスな本」と呼ばれています。
アルバータ大学のコンピューター科学者であり、自然言語処理の専門家であるGreg Kondrak教授は、AI(人工知能)を使ってそのヴォイニッチ手稿の解明に乗り出しました。Kondrak教授は大学院生であるBradley Hauer氏とともに人間の言語の曖昧さをコンピューターで解読するという研究を行っており、ヴォイニッチ手稿がケーススタディーの対象として選ばれたのです。
まず研究者らは、世界人権宣言を380の言語に翻訳したサンプルを使用し、コンピューターが97%の正確性で系統的に言語を識別できるようにしました。最初、研究者らは「ヴォイニッチ手稿はアラビアの言語で書かれているのではないか?」という仮説をたてていましたが、アルゴリズムを走らせた結果、最もヴォイニッチ手稿の言語に近いのはヘブライ語であると結論づけています。
「これは驚くべきことです。ただ『ヘブライ語である』と決めるのは第一段階に過ぎません。次はこれをどう解読するかです」とKondrak教授。
次に、Kondrak教授はヴォイニッチ手稿の記載は単語中の文字をアルファベット順に並べるアナグラム「アルファグラム」を用いて書かれたものだと考えました。そして、Kondrak教授らはこのようなテキストを解読するアルゴルズムを開発して解読を試みたところ、80%以上単語はヘブライ語の辞書にのっていることがわかりました。
「しかし、私たちには、単語を組み合わせることでどんな意味が生まれるのかがわかりませんでした」と語るのはKondrak氏。自分たちの発見が正しいのかどうかを確認するにはヘブライ語学者を探す必要がありましたが、ヘブライ語学者は見つからず、最終的に研究者らはGoogle翻訳を利用しました。
その結果、ヴォイニッチ手稿の最初の一文は「She made recommendations to the priest, man of the house and me and people(人々や私、そしてその家の男である聖職者に彼女は勧告した)」という、文章としては奇妙なものの、文法的には成立する形で翻訳ができたそうです。ただし、古代ヘブライ語の学者を見つけ出すことができなかったため、まだヴォイニッチ手稿の文章全体には謎が残っているとのこと。ヘブライ語に通じており、同時に歴史学者である人物を研究者らは求めています。
Kondrak氏は「ヴォイニッチ手稿の専門家らがこのような研究に親しみを持ってくれるとは思いません。彼らはコンピューターが自分に置き換わるものだとして恐怖を感じるかもしれないので」と語っていますが、一方で自分たちの研究が専門家らに受け入れられることを望んでいるとのこと。
なお、研究者らは今後、開発したアルゴリズムを他の古代の言語に適用していく予定となっています。
2018年01月30日 16時00分00秒
GIGAZINE
http://gigazine.net/news/20180130-ai-voynich-manuscript/ 中2病の書いた創作物でもないなら病んでる奴が書いた意味不明な書物という結論に 文字のパターン解析でも全くのデタラメじゃない文章だってわかってるんだよな
わくわくするぜ ああ、これあかんやつだ
世の中には、知らない方がいいことがある この前どっかの研究者が解読成功って発表してなかったか?ヴォイニッチ手稿。 ヴォイニッチ手稿て植物のことが書かれてるんじゃなかったか (; ゚Д゚)やっぱりネクロノミコンだったんだろ
わかってたよ >>15
解読不能の奇書「ヴォイニッチ手稿」、ついに解読!? 懐疑的な意見も続々
何度解読されれば気が済むのか……。評価は芳しくなかったようです。
http://nlab.itmedia.co.jp/nl/spv/1709/14/news093.html
特にITデータの暗号化を得意とするドイツの科学者フォン・クラウス・シュメー(Von Klaus Schmeh)氏は、反論記事を書くにあたり「ケネディ大統領の暗殺とヴォイニッチ手稿は、マニアと研究者によって幾度となく解決されてきた」と揶揄(やゆ)しています。
こうした数多くの反論には、以下のような内容が見られました。
「自説に沿う2文節を抜き出し、当てはめただけのもの」
「これで5行以上解読できたら大したものだ」
「すでに試みられている解読法だが、今後役立つ可能性のある新たな視点は含まれている」
「解読法のひとつに過ぎない内容にも関わらず、権威あるTLSが大々的に“解読に成功した”と伝えた理由がよく分からない」
結局のところ「権威と実績のあるTLSから“ヴォイニッチ手稿の解読に成功、その内容は健康法を紹介する医学書であった”と大々的に報じられたことで大きな話題を呼んだが、実際には解読説がひとつ提示されたに過ぎない」という程度の話であるようです。 金持ちに高く売りつけるようにいかにも怪しく作った特に意味はない本じゃないの? ヘブライ語ってことは
イスラエルあたりにいるんか?専門家は。 イタズラぼったくり本なのか
ガチで世界の認識がひっくりかえる本なのか ヘブライ語と見せかけて、実は日本語として読めたり
日ユ同祖論的に 書かれている植物も実在しない全くの空想で、文字も意味不明
誰かがいたずらで書いたもので、結論が出ているんでしょこれ >>1
知らない奴も写真数枚見たら興味持つ奴も居るんだから何枚か載せろガラクタ アプローチとしては面白い
ヴォイニッチは自然言語をそのまま筆記したものじゃないだろうって話だったからこれが適用できるとは思えないが、契丹文字都下には使えそうや >>1
これネットで公開されてるよな
挿し絵が面白いから何時間も眺めてたことあるわ
書体も色々あって飽きない 人類史の闇にうごめく邪神の正体や暗黒の歴史について
書かれている、のかと思っていました ケツから逆に読んだら普通に読めたけど。
え、何で誰も気づかねえの?
お彼岸にみんなで山行って山菜採るときの注意点と、終わったらみんなで温泉さ行ぐべっつー話だけど。 >>18
なんか、ネラーが解読しそうなシロモノなんだな(笑) >>1
「ヘブライ語に似ている」
ここまではまあいいとして
「アナグラムに違いない」
「アルファベットを置き換える」
この時点で論理破綻してる気がするぞ 文字自体が意味なのではなく、文字で不明になっている部分が言いたいことかもしれない。
欠けているところを推測してつなぎ合わせると本当の意味が出てくるとかで。 でも、考古学の凄い進歩になるかもな
解読できてない古代語いくつかあるだろ 廚二妄想のワールド・ガイドだろ
TRPGとかによくある
もしかしたら、世界が狭かったころに金持ちを騙して買い取らせようと作ったのかもしれん
とりあえずそれらしい文字を作って置換えようとしたが、めんどくさくなって適当に並べたんだろ >>48
それも説のひとつ
だがそれを証明した奴はいない。 イスラエルの公用語がヘブライ語なんだから大学に行けばすぐ見つかるんじゃね? ヘブライ語のできる歴史学者なんて欧米にはいっぱいいそうだけどなー
協力してくれるかどうかはまた別なんだろうけど イランのスサ地方について書かれてたけどな
その当時は温泉にバザーをひらいて商売をしてたらしいし
そういうことも書かれてあった >>54
それはないよ
書き損じや修正、書き直しらしいものが全然ないという奇妙な特徴がある
つまり、一旦、別に草稿を書いたものを清書したとしか思えないわけ
しかも、「絵>文字」と「文字>絵」の順番で書いたページが混ざってる
ジョークにしては無駄に手がかかってるし、そもそも何ページも失われているのに現在でも240ページもある
コミケにすら、ここまで手がかかった物なんて、めったにない ゾフィーという女性に恋心をいだく男性の日記も書かれてあったし
物思いにふけるゾフィー、欲しいものはなに?お金?家?それとも心?
みたいな当時の男性の思想が その当時からゾフィーやソフィー、ソフィアという名前があった 少し前の民間療法云々の説がかなり正解に近そうな気がするなぁ
オリハルコンが真鍮だったり
この手のモノは解明されるとガッカリ感が凄いから難しいね 書いてある文字は整ってるし 冗談で作るには 相当の気合が必要なのは俺にも判るぜ 本というものの存在を知って憧れのあまり
手書きで自分で作った
むかし自由帳というものがあって
好きなこと書いて作って楽しんでいたことがあった
想像と妄想が楽しくてやめられなくなったっけ
何もない時代だったからとても熱中できたし楽しかったよ
嘘も本当もなくただ思いつくまま書きなぐったっけ
あの時が一番だったな >>2
それすらわからん
アルゴリズム解析で意味がある可能性が高いとでたが当たってるかどうか >>65
戦後の焼け野原は確かに何もなかったんでしょうね 水彩絵の具がふんだんに使われているから15世紀ではなく1900年代のものだね
これは何かというと文盲(文字を読み書きできない人)が何かの理由で図書館へ行き
それを(意味も分からぬまま)書き写しては自宅で彩色した「写本もどき」だ
インテリのふりをする必要があったのか、図書館に意中の人がいたのか知らないが・・ 壮健の同人誌みたいなもんだったとかって話はどうなった >>1
すげえwwwwwwwwwww
とうとう解読されたのかよwwwww ウリの友達にま普通に考えて天才くんがいたんだけど
彼が架空言語の架空文字を書くのが異様にうまかったなw
おそらくはハングルとタイ語なんかに影響を受けていると思ったが
あれはいつ見てもすげえなと思ったよw
で、ヴォイニッチ趣向もそういうアートなんじゃないの?
まあスレでもそういう意見が与論みたいだけど
別に中世の人間が現代人と比べて合理的だとか迷妄に包まれてたってわけでもない。
いつもいうんだけど脳の機能も視覚も聴覚も現代人と変わらないわけでね どうみてもただの図鑑なので
解読しても失望するしかなさそうだな >>69
17世紀中にこの本の所有者がいたことが分かってるからそれはない。
使われている羊皮紙の鑑定によれば15世紀初頭に書かれたものらしい。 古代の秘密っても大したことは何もないよ
今の時代の1年間の発見のほうがずっとすごい 面白いね
ヘブライ語の他には文法が似た言語なかったのか気になる >>65
わかる
地図記号なんて知った時、偉く興奮して自由帳に架空の街を描いたりしてたもんなw
後年、シムシティなんてゲームの概念を聞いたとき、さてこそと思ったもんね
同じこと考えているやつはいたんだなあ、ってさwww あんなもん偽造された魔女裁判の証拠だろ
意味のあることなんて書いてない
しょうもな 未来の人間がこんな風に困るだろうなって想像しながらこれ書いてたんだろうかな作者は
だったら見事に本懐を遂げたな 本物を作れたってことだ 実は意味のない謎の本を作る理由
1単純に楽しい
2魔女裁判の証拠などの目的
3骨董品として好事家に売る
4国会図書館に買い上げさせる←日本 前衛的な挿し絵に謎の文字だからな
引き付けられるわな 古代ヘブライ語も読める人がおらんとか
ひどい文化的大虐殺ですわね >>81
もしくは出版を予定していた本の下書き・・・・とかな
独自のアルファベットで下書きし、万全を期したのかも
ひょっとしたら普通の言語版が出版されてたりしてな
そっちはあまり売れなくて現存しないだけかもしれん 単純ないたずら説は否定されてるだろ?
解読はできないけど、何らかの言語としての規則性が存在するってのは証明されているんだからさ。 ヘブライ語説はけっこう言われてたんだよ。
というのもヨーロッパのよく知られた言語と比べると母音のパターンが少なすぎるから。
だからありうると思うな。 ヴォイニッチf8r
フルコギィ セオシ アルファ カギィ
セオフルア セルファカギィ セオジア
セカア セルファ カジアシ セオシ
ルファ シルファ ア セルフ セカア
ギィ シ セカ
オルフ セカ ジ セギィ ジアシ アギィ >>90
セオジアシ セアシア セオジアシ
セオルフ セクア セオシ ジア
フォルファシ セカシ セオシ セキュア
ジセアギィ セクシクジ セカルフ
セコア ジアギィ
オルファ セコア ジオシ セクキュセア
ジアルファ(フ)ア シセオ セクルフア
セルフォ オアシ セコア ルファシ >>92
ルフォク セルフ セクア ルフォギィ
ルフォギジア セクア セコクルファ
セキュアジア シアギィ
セカルフオ ルフクアシ クオーシorクオオシ
ジアシ オキュオ ジアン
ルフ セコ クルフ セコルフ セクキュア ルフクスア オルフクスア
ジセキュア セコギィ ジアシ セコシ >>93
ジアシ セキュア ルフコギアシ ジア
セ ソorク オルファクア オルフ セクオ
ギオギィ ギアシ グア
セコギィ クセオ ギアシ ギアシ ギオ
アルフ セコギア セコルフ セコルフア オルファジィシ イスラエル10支族の末裔の日本語こそ
このヘブライ語手稿を解ける鍵なンだっ! >>94
フォ セオ ギ アシ セコルフア ルフオギア
セコルフオギィ オルフォ オルフォ(オルフォルフォ) セコギグァ
セルコ セルフクア セコギィ セコルフアギア セコ セコア
ルフクスア ギィオジア セコギィ アギィ
ギセキュア セルフ コギィ セコギィ
セコア ルフコシ セア
クルフォギアシ ギオギィ ジアシコア
セルファクア 指輪物語の作者、トールキンかな?
あの人も自分の物語世界の詳細な設定や文化、言語、文字を編み出して、
現在研究者もたくさんいるんじゃないっけ?
この謎の文書もそういう当時の執筆家が、己の世界を書き起こした可能性もあるよね。
すると規則性があるだろうからいつか解読できるはず。 >>96
クセクア ル フク オルフ クア
セシクア ルフスア シクカシ セルフカキュアシ
クルフクア ギアシ
セカギィ ギスア フォルフアシ クギィorセギィ アシ セカシ
セルフア セアシ セアシ
オルファシ セルフクアシ セアシ シギィ ギアシ セコシ セア
シオキュアギィ セコグァ
シアシ セキュアシ クルフコギィ ギアシ
セコギィ ルファシ ギアルフアグァ
アシ セカルフ スシ クア セクア オルフアギィ
セカギィ シクカギィ シアグァ ちょっと前(去年ぐらい?)に解明されたとか
スレが立ってたような記憶が・・・ 俺が書き残したふっかつのじゅもんも未来生物が解読しようとするとか胸熱 お前らさ、糖質の人が書いた、意味不明なノートとか見たことないの?
ノートにびっしり、文章と図形で、宇宙の真理やら、この世界の成り立ちやら、すさまじい量で書いてるよ。
あの類だって。 ギスア=ギアシ
ギアス
>その由来はケルト神話における神への誓い、及びそれによる義務や制限を表す「ゲッシュ」である。 これ本当にそんな古いものなのかね
紙は古いかもだけど、書いたのは発見当初と変わらん時代じゃないの セ、英語でTheseにあたる
ル ラ レ、英語でtheにあたる >>107
精神医学の本では写真付きでよく紹介されてるわな
しかしこの手稿は、そうした精神病の類いとは思えない、
整った美しさがあるから同列には語れない
おそらくは美術品の類いじゃないかと思ってるけどね
こうした偽書を高値で売買する骨董マーケットがあったとしたら不思議な話でもない 関係ないけど遠藤はゼビ語なんて作るなら
トールキン程度は考えてもよかったのではないか
と思うのは当時と現在の情報格差を知らんゆとり脳 >英語では、関係代名詞 which は「先行詞が物」、who は「先行詞が人」、という使い分けをしますが、フランス語では、qui は「先行詞が(関係詞節内の動詞の意味上の)主語」、que??は同じく「直接目的」のときに使います。 >>115
whoとwhomの使い分けと同じじゃん。 大したこと無い系の予想じゃなくて、最も壮大で夢のある予想はあるのか?
未知の惑星の植物でタイムリープした奴がいたとか >>117
動物の行動と文明が実は植物の集合知性によって支配されていることに気づいた研究者からの警告だろ。 下手くそな女の裸ばっかり描いてあって、未来人に読まれていることを知った作者は死にたくなるくらい恥ずかしいだろうな ル フク=ルフウ(人の名前)またはルフク
ルフウのスペルは「LeFou」
フランス語では、La, Le, Lesが英語のTheの役割を果たしており、Madmanが特定代名詞になっているので、大文字になっています。名前では、そういった例も時々見られます。 セコルフ=セルフ
selfの本来の意味は自分、自身、自我、利己心などのこと。 ルフクアシ
フクアシ=フクシア
フクシア はアカバナ科の低木で、花が美しいので鉢植えなどでよく栽培される。日本では訛ってホクシャなどとも呼ばれる。
フランス語ではフュシャ、フュクスャ (fuchsia [fy. ??ja, fyk.sja])、スペイン語ではフクスャ (fucsia [ fuk.sja])、ドイツ語ではフクスィエ (Fuchsie [ ??f??ksi??])、英語ではフューシャ (fuchsia??... >>41
まじかよ。読めるのかよ。
どのページをどう読むとお彼岸のが見えるかヒント欲しい セコア=セコイア
セコイアは、ヒノキ科セコイア属の常緑針葉樹。セコイア属はセコイアのみの1属1種である。 高さ100m近くにもなる世界有数の大高木。アメリカ合衆国西海岸の海岸山脈に自生する。 セコイアスギ、センペルセコイア、レッドウッド、アメリカスギなどとも呼ばれる。 旧約聖書学者はヘブライ語学者だろ
カナダにもかなりいると思うが セコシ
2015/07/05 ????セコシ→「背越し」 「魚の切り方の一つで、フナ・アユなどを頭・ヒレ・ 腹わたを取り、中骨のあるままぶつ切りにすること」。 >>127
セcosi セコシ コシ=cosi イタリア語
cosiだけだと「このように」という意味。
「そう」など他にも意味があるらしい
?? アナグラムっつーかゲマトリアとかじゃねーのか?
魔術師探してこいよ。 >>44
向こうは伝統的にそういうのよくやるのよ。
数値に変換したりとか。
ヘブライ語に似てるという時点でそういうのを疑わなくちゃいけない。 セア=スィア
スィア=スフィア
球,球形,球体,球面,天体,範囲,領域,分野,社交範囲,階級 シ=si(イタリア語)イエス(英語)
日本語=はい オルフォルフォ=アルファルファ
ムラサキウマゴヤシは、マメ科ウマゴヤシ属の多年草。中央アジア原産。アルファルファ、ルーサンとも呼ばれる。 ヴォイニッチf8r
たぶん人の名前、植物の名前、入江等の環境について 球体の物は種や種子の可能性もあるから
この当時の栽培を書いてる可能性も キリスト教が焚書しまくったから
解読書みたいのはあったのかもしれないなぁ 書かれた年代の頃
イランからヨーロッパにかけてセコイアの木が生えてたという新事実 解読したら、ただのエロ小説だったとか
だと、どーゆー発表されるんだろうなあ ヘブライ語で書かれている旧約聖書を読んでみると
創造主って、明らかに宇宙人としか考えられないじゃん
人類に生贄を要求してるわけだし、
人類に絶対的服従を要求
家畜同様に産め増やせよって人口増加を推奨してるわけだし
勝手に一瞬で民の言語の種類を数百に増やせて
奴隷たちがツルめないようにしてるわけだよ、
なんらかの方法で人の言語中枢をコントロール可能な技術があるわけだしな
つまりは、中東地方でいわゆる創造主といわれるエーリアンの言語だよ トールキン先生か、
アレクサンドル・ミャスコフスキー連れてこい。 昔からこういうインチキ臭い研究はあるよな
コンピューターで文章の特徴を解析してシェイクスピアの正体を突き止める
みたいなやつ >>149
シアーは英語の「sheer」のことで、和訳すると「 ごく薄い、透きとおるような」という意味です。つけていても、あくまで自然な仕上がりである事を強調する際によく使用され、例えば??... >>149
統失だと、余白にもビッシリ字を詰める気がする ヴォッキデータでこんなことができる時代にもなったんだな。 当時は旧約聖書の時代だから
イスラム、ユダヤ、キリストの中央アジアからスペインまで
幅広い交流があって言語や人種のるつぼ >>154
なんらかの設計図みたいなものかもしれない 他国に侵攻支配されても、
旧約聖書を絶やさない為、
旧約聖書を暗号化したのかもしれん 字列変換する意味がわからん
もしそこいらの漫画でも辞典でも字列変換されてたら投げ捨てるわ 世界の命運を握るという手稿をめぐって米政府とトレジャーハンターが戦う展開で映画化しても良い時期かも。 今まで未解読だった古文書なんかは今後AIで解読されていくんだろうな。 仮にアナグラムが使われて文字が入れ替えられていたとしたら
並び替えてからでないと元の言語を特定できなくない? こんなことにまでボッキデータが使われる
こんな世の中じゃ・・・ 日ユ同祖論があるけど
古代ヘブライ語なら日本語とも関連がーとの
無理矢理こじつけからのヴォイニッチ日本語論期待 ヴェネチアングラスの製造レシピ
それに入れる毒薬のレシピ
を暗号化したものや、建造物のデザインって判明してなかったっけ
当時はこれら持ち出したら処刑だったからとかなんとか もしロゼッタストーンが発見されなかったら、未だに象形文字は未解読なのか? >>173
ヒエログリフな
あれはロゼッタ・ストーンが無かったら多分無理 六本指で新鮮な食材の好きなあの人がアップを始めました >>174
ロゼッタストーンという僅かなヒントから解読できたのがすごいと思うわ >>2
まともなレスが最初に付いてると安心するわ
ソース文みたいに、ヘブライ語が云々とか言い出すと本当に萎えるんだわ ただのオカルトだよ >>5
> 正解は苺製菓!
・・・どこら辺からツッコんで欲しいの? >>2
それもひとつの説
だが適当に書いたことを証明した奴はいない。
もしかしてこれも適当に書いたように見えるかね?>>89 ぱっと見大昔に書かれた植物学の本の写本だね
裸体の女性が管の中にいるのは維管束の仕組みを説明しようとしているのだろう >>180
不思議なことに、載ってるのは実在しない植物ばかりなんだよ >>3
だからあくまでそれも一説だろ
これが落書きならそれを証明できるはず
それをやってるだけ >>183
確かにあの迷探偵が調査すると的中率0%だもんな
真相がすぐにわかりそう >>182
上でも出てるけど落書きの可能性は相当低いよ。
統計解析で絵と文章のあいだに相関性があることまで分かってるし、
文字数などのばらつきも自然言語に近いことが判明している。 語彙が少なすぎ繰り返しが多すぎ
やる気のない埋め草でできたでっちあげってこった ランダムに書くのはめんどくさいし
それらしく見えないから暗号プラス
適当な置換
作成プロセスを再建したいという気持ちは
よくわかるよ ようやく解読出来るのか
でも解読した内容は人間にとっても聞かない方がいい内容らしい 狂人が書いたものを、別の者が
また置換すると、そこになんらかの知性的な構造が
把握できても、それ以上解読はできないかも セコイアみたいな杉は氷河期のものだし
ヨーロッパはずっと氷河期みたいな気候だったということに ヴォイニッチ手稿の文が元の言語で真似てヘブライ語が出来たんよ。
だからヴォイニッチ手稿を書いたのは宇宙人。
この言語を持つ宇宙人は何度も訪れている。 現代でもアニメやドラマや映画などの架空のお話に対する設定資料集が出版されたりとかしてるじゃん
またそれらのお話のために架空の言語を作成してみたりとかもしてる
ヴォイニッチ手稿だってそうしたものであっておかしくない
架空の世界の博物誌を架空の言語で書く
簡単には解読できないからこそより価値が上がり、カネを持った好事家により高く売れると ■ このスレッドは過去ログ倉庫に格納されています