【東証システム障害】日本取引所、売買停止の原因は「共有ディスクのメモリ故障」 ★9 [ばーど★]
■ このスレッドは過去ログ倉庫に格納されています
■東証の横山CIO「市場参加者と協議し終日売買停止を決定」
東京証券取引所の宮原幸一郎社長は1日、東証で全銘柄の取引が終日停止となったことに関して記者会見に臨んだ。冒頭で「市場参加者と投資家に迷惑をかけたことをおわび申し上げる」と謝罪した。
東証を傘下に抱える日本取引所グループ(8697)の横山隆介・最高情報責任者(CIO)は問題が起きた経緯について「7時4分に運用系の共有ディスク装置1号機のメモリー故障が発生した」と説明。「本来であれば2号機に切り替わるはずだったが正常にできなかった。その結果として、情報配信ゲートウェイ(相場報道のサーバー)の配信処理に異常が発生した」と述べた。
終日売買停止とした理由について「システム再起動を行った場合、投資家や市場参加者に対し混乱を生じることが想定された。内外の市場参加者と協議したところ十分な顧客対応や円滑な売買の実施が難しいとの要請もあり、終日売買停止とすることとした」と説明した。
明日の市場については「再開に向けて本日中にハード交換とシステム再立ち上げを実施する。万が一の故障発生時にも速やかに切り替えできる体制を確立したい」と述べた。
2020/10/1 17:00
https://www.nikkei.com/article/DGXLASFL01HT5_R01C20A0000000/
--------
■東証システム障害の発端は共有ディスク装置のメモリ故障、東京証券取引所 宮原社長らが会見で経緯を説明
https://live2.nicovideo.jp/watch/lv328335496
・10/1(木)7:04に共有ディスク装置1号機のメモリ故障が発生
・1号機故障時に2号機へ切り替わらず、相場情報配信業務や売買監視業務に異常が発生
【画像】報道配布資料
https://pbs.twimg.com/media/EjOjKvCU0AAzfM0.jpg
午後4:39 ・ 2020年10月1日
https://twitter.com/nico_nico_news/status/1311571524113952768
★1が立った時間 2020/10/01(木) 12:44:02.37
前スレ
https://asahi.5ch.net/test/read.cgi/newsplus/1601549599/
https://twitter.com/5chan_nel (5ch newer account) 東証っていつの間にか上海に取引額負けてるんだな
終わってるな(´・ω・`) ディスク装置↓はこういう機械のことを指し
https://www.fujitsu.com/jp/products/computing/storage/all-flash-arrays/af/
壊れたと思われるのはコントローラ部内のCM#上のメモリ(いわゆる一般的なメモリ)
https://i.imgur.com/4nF70Av.jpg
CM(コントローラ部分)も両方稼働できず、スタンバイである
もう一筐体にもいかず困ったもんだ
こういう認識です 人間が作ってるんだから何度もテストしても
偶然に止まることくらいあるさ
そんなの気にしても仕方ないよ 日本はIT後進国
いまだにFAXやハンコ使ってる化石国家
世界中から馬鹿にされてるよ?
こんなトラブルを起こすのも日本だけ
冗長性設計もロクにできない国がニッポン
恥ずかしくないの?
韓国より遅れてるよ? バックアップが機能しなかった場合を想定してないとか…
これが日本が最高レベルに金かけたシステムなの? 今、注目される富士通のオールフラッシュアレイ ETERNUS AF series
https://www.youtube.com/watch?v=RGXNPmEjcK0&feature=youtu.be >>9
止まってもバックアップ系に切り替わらないし、終日停止とか
時間かかるのが問題
どうせ、バックアップ系の切り替えテストなんかろくにしてない
んだろう。富士通だからな ドイツでは今月19日に病院のITシステムがハッキングされて死亡者出てたんだな
解除キーを知らせてきたけど間に合わなかったらしい
2020年9月19日
ドイツの病院でITシステムがハッキングされ患者が死亡
https://cafe-dc.com/security/patient-dies-after-german-hospital-it-systems-were-hacked/ 稼働前の障害試験の内容気になるな
ストレージ機器だけで障害発生させて切り替わった!OK!とかなのかね 記者にもツッコまれてたけど
時間を置かずに明日むりやり動かしても大丈夫かどうかが問題
細かい原因は究明中だけど明日から動かすというよく分からん展開 バックアップ云々と言われるけど、どれぐらいの量になるんだろ? >>18
まさかのための保険なんて、案外使えないものだよ
バグのないプログラムなんてないんだから
問題ダァ〜って騒ぐなよ 脳味噌の"記憶部分"や"考えている部分"は本番で動いている系統と待機している系統がある。
"本番で動いている記憶部分"が止まってしまっても"待機している記憶部分"に引き継がれるので普通は問題は表面化しないはずだった。
各脳味噌が正常に動作しているかを"監視をする部分"が常に見張っていて、故障時は待機系に切り替えを指示する仕組み。
で、今回は"本番で動いている記憶部分"が致命的な故障が発生していたが、中途半端に壊れた(これが今回はメモリ故障?障害)で
"監視をする部分"は壊れていると判断できないまま、しばらく動作していた。
気づいたときには故障した部分のせいで、故障した時点から気づいた時点までの記憶がぐちゃぐちゃになってしまった。
※記憶がぐちゃぐちゃになっていないかもしれないが、なってしまったかもしれない可能性がある。
また、"待機している記憶部分"に"故障した時点から気づいた時点までの記憶"が引き継がれているか怪しい。
その為、意図的に"本番で動いている記憶部分"を殺そうとすると、故障した時点から気づいた時点の記憶がなかったことになる可能性がある。
なので時間をかけて、故障した時点から気づいた時点までの記憶が正常なのか確認して戻さないといけないって感じかな。
何年か前にあったANAのシステムトラブルでCISCOのスイッチがちゃんと死ななかった為に
予備系に切り替わらなくて次々にシステムが死んでいったのと似たような話 (-_-;)y-~
俺のお顔ブック、ダミー情報入ってるで。
それをな、ダミーと乱数を上手く分離してくれるのが、4Dって設定やねん。
わからんやろ、わからんでええよ。
わかる人にはわかるようになってるから。 今回良くわかったのは、東証閉まってても、
大して世界に影響が無いと言うこと。 冗長構成でもイザ必要な時に使えないなんてよく聞く話 バックアップサイトに切り替わって縮退で稼働とかしないの?
このレベルだとDR環境用意するような 便利だよな
どれだけ他人に迷惑や絶望与えても
「○○の○○障害です」とか
適当なIT関連の言葉を組み合わせれば
免責になる時代って。 >>31
あるけど
今回は使わない選択したと記者会見で説明してた https://i.imgur.com/0ykZm4G.jpg
https://i.imgur.com/H20rZhP.jpg
この回復の鈍い結果となった日銀短観を株価に反映させたくないから、政府と日銀が東証に売買停止を依頼したとかないの?
政府が今日発表予定だった有効求人倍率と完全失業率も、何故か延期されてるし、下半期初日の10/1というのもタイミング良すぎる
2008年、ライブドア事件を発端に全銘柄に売り注文が殺到したという理由で、後場の取引を停止したと時も対応がおかしかった こういうシステムは多重化してるんじゃないの?
一か所壊れただけで止まるって欠陥品だろうが。 基幹システムはちゃんと動いていたんだから、取引開始を遅らせて、8時56分にプチッと切断したりせずに、運用を続けていたら、こんな大きなトラブルにならなかった
トラブル対応の作業ミスだよ 高頻度取引は、規制すべきでは?
海外の業者とか、ミリ秒単位で取引してるんだろ。 三重4重でバックアップするべきだろ
二番目が不具合ならすぐに
3番目がキックインするように
してないのか。。。
イギリスは5重にバックアップしてるらしいぞ
日本の金融インフラが岩盤でないのがバレた >>35
なるほど。高い金払って構築運用してるのに、いつ使うんだろうな
DBのミラーとかも不安になってくるレベル 市場が開く前だったから影響はまだ少ないだろうけど、開いてる最中に停止してたら電車止まりまくってたんじゃねえの 東証のシステムを朝来たやつが起動させようとしても起動できなかったってことかの
俺のパソコンも謎の起動不能で困ったことがあったが、パソコンの大大先生がたの富士通の人とかなら10分もあれば「もしかしてメモリーかも?」って言う可能性に至るだろうに
俺以下だよな 東証のシステムの人たち 東証の会見聞いてたけど、
問題となった危機にハードもソフトも富士通製だそうだね。
東証は賠償金を請求する気無いらしいけど。 中途半端に取引稼働させて野村女陰ベスト証券のように3日後にデタラメな約定させられるよりはズットマシな対応ではある
大阪とか福岡 札幌 私設取引PTSとかあるんだろ 機能してない? ディスクアレイ装置はEMCとNetappと日立と
HPでシェア8割くらいだろ スーパーニートエンジニアが対策を教えてくれると聞いて >>26
あったねえそんなのも
シスコ様なのにヘボいんだなーと思った 日本製品はワザとすぐ壊れるようにしてるからな
安かろう悪かろうの日本製なんか使うな NEC、富士通、NTTデータみたいな
日の丸ガラパゴス企業を使わなくては
いけない悲哀。
民間企業はとっくに愛想を尽かして、
AWSやAzure使ってる。 今回は切り替えに失敗した原因が分からんと怖いな
明日以降も心配なんだな 明日 大丈夫なんか
おとといのコールド ほんとにスタンバイできるのか?
今日のPTS取引差分がちゃんと反映されてるのか?
まあいいやで リストアしてんじゃねえぞ プロマネ プチッと切断したから、接続先との辻褄があわなくなった >>45
夜間にサーバー止めてるとか、どこの中小企業だよw システムの間違いはわかっても
まず前提とする論理の破綻には気づかないのな…
そんなんだから問題が解決できないんだよ… フィルムオーバーの試験はちゃんとやってると
東証のCIOが言ってた
テストで起きなかったレアなタイミング障害で
切り替わらなかったんだろうな
これはテストでは検出が難しいだろうなぁ >>53
そうだな、深刻なサービス障害起きても報道されないし、ネットでも叩かれないサービスは便利だよね >>46
CIOの責任立場をちゃんとわかってるからだな
これオールドエコノミー企業だと言い逃れしかしない >>41
ミサイルを制御してた技術者とかがデイトレシステム作ってるらしいなw
というかクラウド化であかんのかとおもうな
まあAWSも障害おきてるけど
それこそ分散すればいいw 海外の業者とか、ミリ秒単位で取引をやってるんでしょ。
高頻度取引は、規制すべきでは? 富士通社員証は口先だけのコンサルタント屋になってるからな。 >>39
多重化はしてるけど、完全に壊れないと切り替わらないとか… 共有ディスクってRAID10とかのミラーリング構成ですよね。RAID0でなければ1台のディスクのメモリーが死んでもなんとかなるのでは?
ようわからんです。 冗長化ってのは冗長性を発揮するための構成よ
冗長性を発揮しないための構成を冗長化と呼んじゃいかんよ
東証さんよ メモリ壊れた!でも他にもメモリあるから動くわw→メモリを載せたコントローラ死亡
メモリがダメでコントローラもダウンしたが他にもコントローラはあるから!w→もう一台のコントローラ動かず
ストレージ丸っと死んでもスタンバイのストレージあるからw→切り替わらず
ついてないなあ >>55
それをいきなりどうにか明日から動かすという
まだ原因の完全な特定はされてない 東証システム開発してた中国人がバイナンスのCZ
これ豆な >>69
社員証がコンサルやってくれるの
ハイテクだなw >>66
Webサービスじゃないんだからオンプレじゃないと無理 トラブル後の対応も含めて、
今の日本の技術力。
結果的に市場を止めた責任はどこかにあるけど
どうせ誰も責任取らない。 >>25
そんなことないさ
東証クラスのシステムなら、定期的に障害テストと復旧リハーサル
やってて当たり前なんだから
どうせやってないか、テキトーにやってんだろ >>63
ペンタゴンがAzureなったやん
海外では銀行も移行しとるやろ
正直国産のオンプレとか限界ちゃうか? なんで2号機に切り替わらなかったの?
そこ重要でしょ >>67
ミリ単位で売買するって事は、ミリ単位で手数料払ってくれるって事だぞw >>65
やっぱ、サーバは自前で管理しないと。
クラウドは、サーバの位置を特定できない。 >>53
そこにデータがいるのに違和感
データはハード作ってないしむしろそのパブリッククラウドを導入する側なのですが >>65
クラウドだろうが分散処理させようとする部分が動かなくなったら終わりだろうよ >>71
RAIDコントローラが死ぬとどうなるかな?
そういうのも設計段階で視野に入ってないと思うぞ >共有ディスクが壊れちゃったよう、えーん
一番肝の共有ディスクくらいもう少し堅牢に設計しとけw
素人仕事かよ RAIDカードのメモリーが死んだということか〜!
そりゃ予備のサーバーに移行できなかったら致命的かもね メモリーは一個壊れると全部ダウンするからな
富士通のパソコンの大大先生がたの対応力が糞だったってことだな
バックアップが自動でやっているはず!って全面的に信頼してるんで非常時に対応できないんだよ >>39
ディスクアレイ装置はメモリが載っている
コントローラーも冗長化されてるから
普通は片側コントローラーの閉塞で
可動し続けるよ。保守員が引っこ抜いて交換して
終わる案件 ■ このスレッドは過去ログ倉庫に格納されています