X



【arrowhead】東証、システム障害の原因を特定「自動切り替えできない設定値になっていた」 [記憶たどり。★]
■ このスレッドは過去ログ倉庫に格納されています
0001記憶たどり。 ★
垢版 |
2020/10/06(火) 11:19:43.53ID:mHWZLexh9
https://www.itmedia.co.jp/news/articles/2010/06/news063.html

東京証券取引所は10月5日、株式売買システム「arrowhead」(アローヘッド)で1日に発生した障害の原因を特定し、
4日中に修正したと発表した。

障害は、ストレージ内でメモリ故障が起き、サブ機にも切り替わらなかったことが原因。
メモリ故障による障害が起きた際、自動切り替えできない設定値になっていたという。

https://image.itmedia.co.jp/news/articles/2010/06/l_yx_tos.jpg
東証のニュースリリースより

arrowheadのユーザー情報などを格納するストレージ「共有ディスク装置」の1号機に搭載されたメモリが故障したことに起因。
1号機が障害を検知すると、切り替え用設定値に従って自動で2号機に切り替わるはずが、切り替わらなかった。

調査したところ、メモリ故障が原因の障害パターンが発生した際、自動切り替えできない設定値になっていたという。
設定値を変更すれば、自動切り替えできることが判明。4日にシステムに適用し、自動切り替えが動作することを確認したという。

稼働前のテストでは、1号機と2号機相互の死活監視を途絶えさせても、自動切り替えできていたという。

1日の障害では、東証の全取引が終日停止した。
0102不要不急の名無しさん
垢版 |
2020/10/06(火) 11:42:22.86ID:wW+5CD1h0
オペレータが設定間違ったんだろうな
0103不要不急の名無しさん
垢版 |
2020/10/06(火) 11:42:49.30ID:KsbitBZU0
完全故障は切り替わるけど
性能劣化では切り替わらんってことかw
システムの設計ミスだな
0104不要不急の名無しさん
垢版 |
2020/10/06(火) 11:42:54.77ID:+DA9hSH30
作業ログは残ってなかったのかな?
設定値変更もプログラマブルにするのを標準にした方がいいね。ansibleとか?
0105不要不急の名無しさん
垢版 |
2020/10/06(火) 11:42:55.10ID:Jt1R1t7s0
>>28
どっちのせいでもないように
作り話し考えてる最中だと思われ
0107不要不急の名無しさん
垢版 |
2020/10/06(火) 11:43:20.91ID:DNCZX0Eb0
ケアレスミス一個で起きたってことでOK?
0108不要不急の名無しさん
垢版 |
2020/10/06(火) 11:43:28.63ID:3/p9FIos0
要するに形式的に設備は構築したけど
ストレステストはしてないってことだろ
0110不要不急の名無しさん
垢版 |
2020/10/06(火) 11:43:44.11ID:q152AR3i0
東証は賠償請求していいと思うんだけどなぁ。
0111不要不急の名無しさん
垢版 |
2020/10/06(火) 11:43:52.91ID:tH4VRsCN0
アローヘッドのデータセンターて何処にあるのかな、まさか韓国じゃないだろうな
0113不要不急の名無しさん
垢版 |
2020/10/06(火) 11:44:28.29ID:FANUsa3U0
トランプコロナの情報掴んで市場の混乱を回避するため
0114不要不急の名無しさん
垢版 |
2020/10/06(火) 11:44:45.64ID:4C+wXYG/0
>>97
手動での切り替え自体は出来た
しかし不整合が発生しうるほどのダウンタイムを経過してたので、ストップさせた
0117不要不急の名無しさん
垢版 |
2020/10/06(火) 11:44:54.79ID:Jt1R1t7s0
>>107
そういう作り話しにしようとしてるってことでOK
0118不要不急の名無しさん
垢版 |
2020/10/06(火) 11:45:02.55ID:DNCZX0Eb0
>>112
ケアレスミス一個で止まるシステムなら
当然、設計も欠陥品だろうな
0120不要不急の名無しさん
垢版 |
2020/10/06(火) 11:45:27.90ID:yM9y8doH0
>>3
多分納入時の最初から
設定値は作ったけど応答なくなった場合は自動切り替えする仕組みだったんだろうけれども
ここの設定値の方が優位持ってたとかそんな落ちでしょ
0121不要不急の名無しさん
垢版 |
2020/10/06(火) 11:45:35.73ID:DNlPDHao0
>>97
手動切り替えなんてやらないのが正解。
トラブル時に無理に生かそうとすると余計にハマる。

2回目3回目の停止に追い込まれるくらいなら本日店仕舞、の方が賢い。
0122不要不急の名無しさん
垢版 |
2020/10/06(火) 11:46:00.02ID:Jt1R1t7s0
>>110
作り話しで賠償訴訟起こすの?
ムリっ

wwwwwwwww
0123不要不急の名無しさん
垢版 |
2020/10/06(火) 11:46:07.16ID:OAotXGFz0
レベル低い
こんなんだからデジタル庁とか
恥ずかしい仕切りされるんだよ
0125不要不急の名無しさん
垢版 |
2020/10/06(火) 11:46:40.92ID:7YpvCHDd0
メンテ時に一時的に設定変えて戻し忘れたとかかな
0126不要不急の名無しさん
垢版 |
2020/10/06(火) 11:47:21.20ID:MQpdi2uy0
これもう富士通の責任だろ、下請けガーとか言っても仕方ないだろ
0127不要不急の名無しさん
垢版 |
2020/10/06(火) 11:47:42.54ID:3CejVRnP0
設定値()
じゃあログにはディスクのメモリエラーはいたやつ残ってるはずだな
0128不要不急の名無しさん
垢版 |
2020/10/06(火) 11:47:42.92ID:wW+5CD1h0
あまりも仕事が暇だったので
凍傷システムサービスの社員が設定をいじったと言う事なのか
0129不要不急の名無しさん
垢版 |
2020/10/06(火) 11:47:58.50ID:7fJvy90i0
>>124
富士通「引き渡し後に東証側がやると思った」
東証「そう設定されて設置してくれたと思った」
0130不要不急の名無しさん
垢版 |
2020/10/06(火) 11:47:59.74ID:FANUsa3U0
あの日東証がやっていて、トランプコロナと発表されたら、東証はどうなってたかな
0133不要不急の名無しさん
垢版 |
2020/10/06(火) 11:48:14.07ID:JjOCB6yx0
>稼働前のテストでは、1号機と2号機相互の死活監視を途絶えさせても、自動切り替えできていた

テスト後に「切り替え用設定値」を誰かが変更したということか?
そうなると、
1 稼働前のテストはいつ行ったのか?
2 稼働前のテスト以降、システムの更新は行われたのか?
3 テスト環境から本番環境への切り替えはどのように行われたのか? (一部のパラメータがテスト用のままというのは、よくあるミス)
などの疑問が生じる。

そもそも
4 「自動切り替えできない設定値」の場合、共有ディスク装置の制御機構はどのような挙動をするのか、例えば
 a 業務サーバとの連携はどうなるのか?
 b どのようなアラームが出るのか?
などなど、わからぬことだらけの報道発表だな。
0135不要不急の名無しさん
垢版 |
2020/10/06(火) 11:48:22.04ID:2QfsANtx0
ちゃんとやれとかしっかりやれとか確認したのかとか自分で何一つやらずただやれと命令するだけ
そういう連中が現場の手を動かす人間の三倍の数いて妨害に等しい割り込み処理をずっとしてくる
日本は本当におしまい。老人が消え去る15年後ぐらいにやっと持ち直せるかどうか…
0136不要不急の名無しさん
垢版 |
2020/10/06(火) 11:48:28.96ID:KsbitBZU0
PCサーバーなんかで手工業的にシステムを組むから
トータルで高可用性設計のアーキテクチャの製品を使わないとw
0139不要不急の名無しさん
垢版 |
2020/10/06(火) 11:48:39.03ID:nhSOVf8N0
バックアップシステムはあります。一応・・・。
0144不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:00.13ID:U9YF1TU40
>>22
カーネル設定としたら、カーネルリビルドですか。
それは再テストの範囲大きいねぇ。
カーネルですもの。
0145不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:07.23ID:VtJI0HMC0
> 稼働前のテストでは、1号機と2号機相互の死活監視を途絶えさせても、自動切り替えできていたという。

切り替え出来てた事を確認してるのに切り替えしない設定に変わってた
0147不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:14.97ID:3mO21dmu0
>>114
だからつまりテストしてなかったって事でしょ

というか不整合が発生するかもしれないほど落ちるというシステムの設計がそもそもミス
つまりバックアップが機能しなかった設計になってるのは設定値を間違えようが同じ事
0149不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:33.44ID:Jt1R1t7s0
東証ってそのうち「うちのお父さんが危篤なんです!」とか
「寝てないんですよ我々だって!」とか
「こんなに一生懸命やってるのにみんなボクらの気持ちを分かってくれない!」とか言って泣くとか
やり出すと思うw
0151不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:53.20ID:15lGSOTe0
冗長性を確保して、協議多数決システムを採用しないと
0152不要不急の名無しさん
垢版 |
2020/10/06(火) 11:49:53.09ID:iXGvqIM60
日本はどの業界も新設には熱心だけど改修メンテは二流の仕事って意識があるからな
0153不要不急の名無しさん
垢版 |
2020/10/06(火) 11:50:07.74ID:88gZ+lLT0
分からないでもないが
なぜ東証の人間と打ち合わせができてなかったんだろう
0154不要不急の名無しさん
垢版 |
2020/10/06(火) 11:50:11.63ID:3qS7f+7n0
設定を変更したログみたいなのはないのか
稼働前のテストも何か怪しいな
0155不要不急の名無しさん
垢版 |
2020/10/06(火) 11:50:27.91ID:WXo/MRi/0
いやーよかったなバグじゃなくて。
日本の技術力を見せつけたわ。
設定どおりに動いたんだから。
0156不要不急の名無しさん
垢版 |
2020/10/06(火) 11:50:35.17ID:Jt1R1t7s0
>>140
って言う作り話しだよこれ
0157不要不急の名無しさん
垢版 |
2020/10/06(火) 11:50:39.37ID:tKuTk28j0
>>151
上座に忖度する日本人には無理
0159不要不急の名無しさん
垢版 |
2020/10/06(火) 11:51:02.17ID:lPIxO29L0
無能の極み
レベルが低すぎて怒りも湧かない、ただ笑うしかない
0160不要不急の名無しさん
垢版 |
2020/10/06(火) 11:51:16.73ID:SH+Eo5S/0
>>129
あれ思い出したわ
現場猫のオアシス運動w
0163不要不急の名無しさん
垢版 |
2020/10/06(火) 11:51:19.54ID:dK+RAv710
>>144
まあ、ストレージ装置なんで、Linux ではなく独自 OS だろうけど。
Linux なら無停止で変更可
0164不要不急の名無しさん
垢版 |
2020/10/06(火) 11:51:20.42ID:5rYQ2Cp40
本当ゴミみたいな会社だな
今後重要なシステムを富士通に作らせるのは禁止しろよ
0171不要不急の名無しさん
垢版 |
2020/10/06(火) 11:52:47.36ID:MV5kOpRO0
>>146
中国のイベントと思っちゃうよな
0175不要不急の名無しさん
垢版 |
2020/10/06(火) 11:53:17.30ID:Jt1R1t7s0
>>166
なんで富士通に責任は無いって
「原因(?)」が分かる前に言ったの?
わざわざ記者会見開いてwww
0176不要不急の名無しさん
垢版 |
2020/10/06(火) 11:53:32.17ID:5rYQ2Cp40
とりあえず富士通が潰れるくらいの賠償をさせるべき
低品質なシステムを作り出す温床となっている会社は社員ごとシステム開発の仕事から追放したほうが良い
0177不要不急の名無しさん
垢版 |
2020/10/06(火) 11:53:39.90ID:CMJQv4QZ0
再発防止にはデジタルエキスパートのデジタル庁しかないのであります
0178不要不急の名無しさん
垢版 |
2020/10/06(火) 11:53:48.89ID:3CejVRnP0
なら手動で切り替えられたはずだな
作り話だろw
テストでうまくいって設定値戻すとかバカでもありえんわw
0180不要不急の名無しさん
垢版 |
2020/10/06(火) 11:54:29.09ID:KsbitBZU0
こういう金融系はparallel sysplexとかtandemとか
ハードソフト一体で高可用性の製品を使ってるかと思ってたよw
0181不要不急の名無しさん
垢版 |
2020/10/06(火) 11:54:49.36ID:NpoeqE4n0
絶対だれかイジってるやん
ログさぐれ
0182不要不急の名無しさん
垢版 |
2020/10/06(火) 11:54:58.45ID:WXo/MRi/0
>>172
なんでこういう設定にしてあったか知らないけど、
デフォルトが自動切り替えしない設定で、
それを知らずにデフォルトで使ってたんじゃね。
ユーザーはデフォルトが自動切り替えするものだと勘違いとか。
0184不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:06.52ID:Jt1R1t7s0
東証ってそのうち
「うちのお父さんじゃ無くてお母さんが危篤なんです!」とか
「寝てないんですよ我々だって!」とか
「こんなに一生懸命やってるのにみんなボクらの気持ちを分かってくれない!」とか言って泣くとか
やり出すと思うw
0187不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:21.67ID:4xCivF0H0
通信途絶でフェールオーバーなので通信途絶しないためフリーズと。
これ俺の会社でも去年起きてるぜ。ただ、30分で回復してる。

バカすぎるだろ。こんなの銀行のシステム系でもよくある話だ。
その場合はスイッチオーバーで終わりの話。
なんで当たり前のことを当たり前にできないんだ?
東証のオペレーターどもと富士通の常駐SEは病的低能だな。
0188不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:23.29ID:b9axmaOm0
>>145
死活監視の途絶なんて理想的条件
もっとハードよりの泥臭い条件のテストすべきだった
0189不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:28.81ID:Xyh4RHso0
よくジョークで、スイッチ入れ忘れかといじるが、本当だったと、、
0190不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:31.51ID:yCohfCfY0
ヒューマンエラーだな
どんなシステムを作っても
使う人間がバカなら無意味と言う好例
0192不要不急の名無しさん
垢版 |
2020/10/06(火) 11:55:45.32ID:3ZB28yJk0
設定ミスか?
よくある話だな
0193不要不急の名無しさん
垢版 |
2020/10/06(火) 11:56:00.16ID:ltfQnw8E0
東証はともかく
証券会社は富士通に損害賠償請求すべきだろ
この日売上ゼロなんだから
0195不要不急の名無しさん
垢版 |
2020/10/06(火) 11:56:39.13ID:UgXv0cRI0
東証の会見を信じるならって前提だけど
午前中に手動フラグで場は再開できたが証券会社との協議で途中再開するリスクのが高いってことで終日閉鎖にした
むしろ場中に停止してたほうが当日再開できたかもね
寄り付き前の注文があって取り消し再発注で証券会社側でなにか起こったら大変だし
0197不要不急の名無しさん
垢版 |
2020/10/06(火) 11:56:42.37ID:VNFpXl+k0
>>1
原発レベルで絶対止まっちゃいけないシステムなのにあらゆる事態想定出来てなかったって事だよな
別の業者に変えろ
0200不要不急の名無しさん
垢版 |
2020/10/06(火) 11:56:56.17ID:AXQhNsJR0
いろいろ想定してそういうパラメータも用意するんだろうけど
自動切換出来ない設定値ってよほどの時にしか不要な気がするけど
なんでよりによってその設定にしてあったんだろうか
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況