更新情報とか呟きとか。「Twitter」始めてみました

★ お気に入りブログ等の最新情報

元スレ:http:///livejupiter/1601557235/
1 :風吹けば名無し:2020/10/01(木) 22:00:35.97 ID:UF9sPt4/a.net

 
要するにこういうことだろ?

メモリ壊れた!でも他にもメモリあるから動くわw

→メモリを載せたコントローラ死亡

メモリがダメでコントローラもダウンしたが他にもコントローラはあるから!w

→もう一台のコントローラ動かず

ストレージ丸っと死んでもスタンバイのストレージあるからw

→切り替わらず

ついてないなあ

 
10 :風吹けば名無し:2020/10/01(木) 22:02:18.57 ID:g/jcvTz90.net
どいうこと? 
 
 
14 :風吹けば名無し:2020/10/01(木) 22:03:09.78 ID:UF9sPt4/a.net
>>10
今回の故障がメモリに起因するならこれだけの冗長されたとこ突破してる


 
12 :風吹けば名無し:2020/10/01(木) 22:02:22.40 ID:xG7AGgrb0.net
やきうに例えると何があったんや?

 
15 :風吹けば名無し:2020/10/01(木) 22:04:12.05 ID:UF9sPt4/a.net
>>12
抑え投手いたのに怪我
ベンチも全員怪我した
 
 
 
61 :風吹けば名無し:2020/10/01(木) 22:10:19.66 ID:u2g9yI9P0.net
>>15
抑えがいたけど監督の口が潰れて交代かけれなかったのほうが適切やない? 

 
13 :風吹けば名無し:2020/10/01(木) 22:02:51.52 ID:IxLhmW+P0.net
フェイルオーバーのテストしてうまくいっててもいざという時に動かないIT業界あるあるやね

 


16 :風吹けば名無し:2020/10/01(木) 22:04:16.28 ID:J9QnGHpN0.net
ワイ、元オペレーター想像しただけで胃が痛くなる

 
17 :風吹けば名無し:2020/10/01(木) 22:04:20.01 ID:pbNAOXNta.net
いうてダメージあるの東証本体と富士通の社員と証券会社くらいやろ
手数料でシコシコ稼いだ罰やで


20 :風吹けば名無し:2020/10/01(木) 22:05:09.05 ID:QNjMcpSlx.net
ようわからんけどアマゾンに全部任せられんの?


36 :風吹けば名無し:2020/10/01(木) 22:07:07.19 ID:IxLhmW+P0.net
>>20
さすがにここまで高信頼性求められるシステムをAWSはまだ怖い
AWSは東証なんかより頻繁に落ちてるし

 
28 :風吹けば名無し:2020/10/01(木) 22:06:19.19 ID:iRaZd75K0.net
管理が悪いんでね?
普通そんなことなんねーよ 
 
 
38 :風吹けば名無し:2020/10/01(木) 22:07:10.22 ID:UF9sPt4/a.net
>>28
普通はないけど数年に一回はきく


 
30 :風吹けば名無し:2020/10/01(木) 22:06:23.42 ID:utw4EJow0.net
富士通株下がったところ買いたい

 
34 :風吹けば名無し:2020/10/01(木) 22:06:53.83 ID:S2gcuZzd0.net
ベンダーが燃えてるだろうことはわかる
 
 


 
37 :風吹けば名無し:2020/10/01(木) 22:07:08.92 ID:TWODNQ9o0.net
SEは朝から怒号で誠にごめんなさい状態やろなぁ
 
 
40 :風吹けば名無し:2020/10/01(木) 22:07:24.32 ID:1YdSM+e80.net
レオパで博奕の予定だったんだが補償しろや 
 
 
55 :風吹けば名無し:2020/10/01(木) 22:09:24.89 ID:UF9sPt4/a.net
>>40
むしろ助かったかも知らん
 
 
 
66 :風吹けば名無し:2020/10/01(木) 22:11:48.30 ID:Rv+5lgp80.net
誰も売り買いできないのに損するやつおるんか?

 
46 :風吹けば名無し:2020/10/01(木) 22:08:13.41 ID:mqClhIcF0.net
でも夕方くらいには明日再開の宣言したよな
ワイみたいな素人は「エンジニアが徹夜で直すんやろなぁ」とか思ってたが
実際にはすぐ原因分かったんやろ

 
54 :風吹けば名無し:2020/10/01(木) 22:09:09.95 ID:t3evWffs0.net
>>46
宣言は誰にでもできる
できなきゃ文字通り死ねって意味


51 :風吹けば名無し:2020/10/01(木) 22:08:57.61 ID:gEQUOwMu0.net
サブに切り替わらなかったくらいで丸一日復旧できないってのはどうなんや
前回も配信系で同じ障害起こしとるのに 
 
 
65 :風吹けば名無し:2020/10/01(木) 22:11:20.57 ID:UF9sPt4/a.net
>>51
データの整合性保証するためには仕方ない…


 
57 :風吹けば名無し:2020/10/01(木) 22:09:46.28 ID:lIf+jzPT0.net
データベースの冗長って難しいんやなぁ

 
71 :風吹けば名無し:2020/10/01(木) 22:12:30.34 ID:sfSwTtkh0.net
エンジニア「あーやばい(ヘドバン)」
 



【東証・前代未聞の終日取引停止・・・一体、何が起きた】
https://youtu.be/SXUfYApOD8g
東証公式ETF・ETNガイドブック(第7版)
東証公式ETF・ETN
ガイドブック(第7版)
記事ランキング&コメント


週間人気ページランキング

20位以下ページランキング

月間ランキング


コメント
この記事へのコメント
  1. 名前:名無しビジネス #- | 2020/10/02(金) 21:46 | URL | No.:1839248
    いい投手いるのに
    監督が交代の手順間違えて
    投手がそのまま打たれ続けてコールド負け
  2. 名前:名無しビジネス #- | 2020/10/02(金) 21:50 | URL | No.:1839250
    よくわからんが、まぁ動いてるからヨシ!
  3. 名前:名無しビジネス #- | 2020/10/02(金) 21:51 | URL | No.:1839251
    ええんやで?(にっこり
    日経なんか日銀と機関投資家しか買ってない
    1日止まったところでどうってことない
    NYダウさえ死守すればいい
  4. 名前:名無しビジネス #- | 2020/10/02(金) 21:54 | URL | No.:1839252
    天下り、記憶力だけ
    腐敗しすぎ
    岩盤規制が凄まじい国
  5. 名前:名無しビジネス #- | 2020/10/02(金) 21:56 | URL | No.:1839253
    現場のSEが怒られるようなレベルじゃない
    担当営業とか事業部長が現場に張り付いて顧客と会話してる状態
    SEはシステムに何が起きてるのかをひたすら調べて報告を続けるだけ
    名前も知らないような人が現場に集まって来てる
    開発や初期の設計に関わった人が呼び戻されたりしてる
    こいつらは現場のドキュメントに存在しない”仕様”を知ってる人達

    営業や偉い人が差し入れしてくれるので、
    それ食って飲んで意識ある限り作業するのがSE
  6. 名前:名無しビジネス #- | 2020/10/02(金) 22:09 | URL | No.:1839257
    結局その切り替わらなかった、が大問題なのに分かってないよな
    よくあるで済ませようとしてるあたり日本人の技術力低下が顕著に分かる
  7. 名前:名無しビジネス #- | 2020/10/02(金) 22:13 | URL | No.:1839258
    技術やってない奴ほど「日本の技術が」みたいなこと言うよな。
  8. 名前:名無しビジネス #- | 2020/10/02(金) 22:19 | URL | No.:1839260
    ※6
    無知な奴ほどよく喚く(笑
  9. 名前:名無しビジネス #- | 2020/10/02(金) 22:25 | URL | No.:1839262
    運が悪かっただけじゃないの
    どんなに対策取っても問題発生する確率0にはできんし
  10. 名前:名無しビジネス #- | 2020/10/02(金) 22:25 | URL | No.:1839263
    時代に取り残されてる老害が分かった口聞いてて草

    システムに完璧を求めるほど費用が指数関数的に増大するし、どんなに突き詰めても完全な堅牢性を保証することって現実的じゃないよねって話じゃない?今回のを機に別の場所に同一システムを入れるか?っつったら、まあ無いでしょ。そういうこと。
  11. 名前:名無しビジネス #- | 2020/10/02(金) 22:27 | URL | No.:1839265
    アホやろ最初の障害で全力で対処せい
  12. 名前:名無しビジネス #- | 2020/10/02(金) 22:29 | URL | No.:1839266
    こういう時、素人ほど技術力が低いだの云々わめくよな
  13. 名前:名無しビジネス #- | 2020/10/02(金) 22:33 | URL | No.:1839269
    ※12
    玄人様の意見が聞きたいわ!
  14. 名前:  #- | 2020/10/02(金) 22:41 | URL | No.:1839271
    外部から攻撃された訳でもなく大量の注文が入った訳でもないのに落ちるなんて無能にも程がある。
    少なくとも海外の同レベルかそれ以上の取引所で似たような事例は無いわ。
    日本のシステム屋はカスしかおらん。
  15. 名前:名無しビジネス #- | 2020/10/02(金) 22:46 | URL | No.:1839272
    半死に状態だとうまくフェイルオーバーできないってのは、本番でしか発生しないトラブルあるあるの一つ。
    そういう場合は待機系の方から能動的に殺しにいかなきゃならんのだけど、そこがうまく設計できてなかったか、ベンダー依存で設計できない部分だったのかもね。
  16. 名前:名無しビジネス #- | 2020/10/02(金) 22:48 | URL | No.:1839273
    機器のカードがゾンビになって生き死に繰り返して切り替わらないのは10年に一回あるなぁ
  17. 名前:名無しビジネス #- | 2020/10/02(金) 22:49 | URL | No.:1839274
    素人じじい「技術力が!!!」
  18. 名前:名無しビジネス #- | 2020/10/02(金) 22:50 | URL | No.:1839275
    これ結局部品交換だけで終わったんだろ
    普通は切り替わらなかった原因まで突き止め対処する所までセットなんだけどな、どこか他故障したら再発するし
    そもそも緊急時の手動切替すら備えてないのには呆れた
    今の子は自分に関係ないとこは適当で最悪を想定せず壊れたら原因調べずとりあえず交換って奴ばかり
  19. 名前:名無しビジネス #- | 2020/10/02(金) 22:53 | URL | No.:1839276
    そもそもメモリ起因でフェイルオーバーってするの?
    今回ってメモリ壊れましたがディスクは正常だしそれで自動で切り替える措置は無い、ただ故障後にシステムが止まってしまったため本来それを検知してフェイルオーバーするはずだけどそちらがなんで変わらなかったのか判明してません
    メモリは取り替えましたがそれ以降は調査中
    くらいにしか思ってなかったのだが
    まぁ切り替わるなら切り替わるでヘーって感じなだけだけど
  20. 名前:名無しビジネス #- | 2020/10/02(金) 22:55 | URL | No.:1839277
    直すのは突貫工事でも何でもできるけど対策しろって言うのがきついんだよなぁ
    もう1個予備用意しますじゃもう納得しないだろうし
    落ちないシステムなんか作れたらノーベル賞何個もらえるんだよってブチギレたいだろうな
  21. 名前:名無しビジネス #- | 2020/10/02(金) 22:55 | URL | No.:1839278
    いや、とりあえず交換して詳細はラボ送りでない?
    この手のは調査に1日とか時間掛かるから、とにかく復旧させて様子見るしか無い時もあるし
  22. 名前:名無しビジネス #- | 2020/10/02(金) 23:00 | URL | No.:1839280
    ※18
    原因の突き止めは当然やってるぞ。復旧の優先度が高いだけ。まずは動くようにしないとますます傷口が大きくなる。対処は動いてる裏でやればいいんだ。
  23. 名前:名無しビジネス #- | 2020/10/02(金) 23:12 | URL | No.:1839281
    東証の説明で理解できるが、どうも家庭用PCや小規模なサーバーみたいな知識で批難しとるやつがおるよな
  24. 名前:名無しビジネス #- | 2020/10/02(金) 23:20 | URL | No.:1839282
    今回は想定外の出来事が起きたんでしょ。
    想定外を限りなくゼロに近づけて、様々な対処を用意するのがシステム設計の要所なんだけどね。
    想定外が起きると、その場しのぎの対処で2重3重の障害が発生しやすいことはシステム運用において事実。
    あらゆる事態を検討する、完全な対処が思いつかなくても検討だけでもしとくことが大切ね。
  25. 名前:業界人 #- | 2020/10/02(金) 23:26 | URL | No.:1839284
    基本的にメモリエラーを検知したら筐体は再起動するようになってる。
    その再起動を検知して待機系に切り替わるのが普通。

    だが今回は検知できないようなエラーが発生して、半死状態になったんだろう。
    遅延が普段の数倍とかになりつつも処理は続行してたんだろうなと想像。
    レイテンシーの監視を入れていなかった(想像)のは運用者の落ち度かもね。
  26. 名前:  #- | 2020/10/02(金) 23:26 | URL | No.:1839285
    IT業界や研究者の間では「理想の障害対策」と結論づいてるのに、お前らシロウトがグダグダけちつけてんの間抜けすぎないか?
  27. 名前:    #- | 2020/10/02(金) 23:31 | URL | No.:1839286
    駄目自慢 に出ろ NHK 
  28. 名前:名無しビジネス #- | 2020/10/02(金) 23:32 | URL | No.:1839287
    >>25
    メモリーエラーだけでシステムとして待機系に切り替わるってよりかはメモリエラーで再起動がかかって、それで1台再起動中は死んでるからもう一方に切り替わるなりもう一台だけで動くはずだったけど、なんでか再起動がかからなかったから止まっちゃったって感じなんすかね?
  29. 名前:  #- | 2020/10/02(金) 23:32 | URL | No.:1839288
    どうせサクラが賞賛してるんだろ。
    1年持たずに沈んだ新システムw
    そんなんじゃ原発も爆発しますわ
  30. 名前:名無しビジネス #- | 2020/10/02(金) 23:34 | URL | No.:1839289
    機関投資家「詫びろ!詫びろ!詫びろ!詫びろ!詫びろ!詫びろ!詫びろ!詫びろ!」
  31. 名前:名無しビジネス #- | 2020/10/02(金) 23:37 | URL | No.:1839290
    弄ったことあれば普通にアレイコントローラのメモリ(キャッシュ)に異常があったんだと読み取れるんだけどまぁそれすら分からんなら語るだけ無駄だと思うで。
  32. 名前:名無しさん #- | 2020/10/02(金) 23:38 | URL | No.:1839291
    海外の投資家や投資会社から兆レベルの損害賠償請求があるだろうなあ
    で、それを日本政府が肩代わりして、更にそれが低級国民に対する増税としてふりかかると
  33. 名前:名無しビジネス #- | 2020/10/02(金) 23:38 | URL | No.:1839292
    どう擁護しても停止して丸一日機能しませんでした、という結果しかないからな
  34. 名前:業界人 #- | 2020/10/02(金) 23:42 | URL | No.:1839293
    >>28
    メモリエラーだけでも待機系に切り替えるのが普通。
    今回のは稼働系がエラーを起こしているにもかかわらず再起動しなかったんだろう。
  35. 名前:名無しビジネス #- | 2020/10/02(金) 23:47 | URL | No.:1839294
    14時時過ぎにトランプコロナぶん投げで爆損したやつ挙手
  36. 名前:名無しビジネス #- | 2020/10/02(金) 23:49 | URL | No.:1839295
    >>34
    それってクラスタソフトウェアでメモリエラーを検知してそれだけで切り替えできるもんなんすかね?それだとうちそんなテストしてねえなって。ディスクなら当然するけど。
    伝え方が悪かったけど、HWとして再起動するんで、その機器の生死の段階で初めてソフトが検知して切り替わるけど東証は何で再起動しなかったのかはわからんって話なら
    再現不可なんでそこまで担保しなおさなくていいかって話なので…
  37. 名前:名無しビジネス #- | 2020/10/02(金) 23:50 | URL | No.:1839296
    そもそもメモリエラーなんて疑似的に起こせないか
  38. 名前:名無しビジネス #- | 2020/10/03(土) 00:03 | URL | No.:1839297
    「こんな事も有ろうかと」と考える真田さんが居なかったんでしょ
  39. 名前:   #- | 2020/10/03(土) 00:06 | URL | No.:1839298
    待機系「稼働系のエラーは分かりますん...」
  40. 名前:名無しビジネス #- | 2020/10/03(土) 00:06 | URL | No.:1839299
    定期的に待機系に切り替える予行練習しないとだめということだな。
    避難訓練みたいに。
    中小企業ならともかく、東証レベルならそれくらいの費用ぐらい払えるだろう。
    休日市場がしまっている時間があるんだからそれ使って予行練習してももいいだろうし。
  41. 名前:名無しビジネス #- | 2020/10/03(土) 00:07 | URL | No.:1839300
    むしろこれで済んでよかったと思った方がいいレベル
  42. 名前:名無しビジネス #- | 2020/10/03(土) 00:12 | URL | No.:1839302
    富士通 世界へ向けて赤っ恥
  43. 名前:名無しビジネス #- | 2020/10/03(土) 00:16 | URL | No.:1839303
    自宅サーバ程度の知識で語ってるやつが居てワロスw
  44. 名前:  #- | 2020/10/03(土) 00:20 | URL | No.:1839304
    責任者「(役に立たない)フェイルオーバーのテストは実施していた」
  45. 名前:名無しビジネス #- | 2020/10/03(土) 00:21 | URL | No.:1839305
    ハードがいかれた

    なんでこうなったかは不明(これからの調査)だが、何がどうなったかはわかる

    なので立て直しの見通しは立てられるので宣言した

    こう理解している、あの短時間でトラブルに対して対応できて凄いわ
  46. 名前:名無しビジネス #- | 2020/10/03(土) 00:23 | URL | No.:1839307
    ※13
    システムは物理的に壊れる
    それ以上でもそれ以下でもない
    壊れないシステムを作ることなんて不可能
    大切なのは壊れた時に迅速に対応できるよう備えること
    そして東証はきちんとこたえた
  47. 名前:名無しビジネス #- | 2020/10/03(土) 00:24 | URL | No.:1839308
    試合やってたら負け試合だったところを
    試合中止まで持ち込んだから、まあまあセーフやろ。
  48. 名前:  #- | 2020/10/03(土) 00:25 | URL | No.:1839309
    ハインリッヒの法則
    労働災害における経験則の一つである。
    1つの重大事故の背後には29の軽微な事故があり、
    その背景には300の異常が存在するというもの。

    29回もヒントを与えてやったのに何一つ気づかないとは恐れ入る...
  49. 名前:名無しビジネス #- | 2020/10/03(土) 00:29 | URL | No.:1839311
    うちでも同じような切り替わらない障害あったけど、たいてい自分らで作ってないところのバグだからな
  50. 名前:名無し #- | 2020/10/03(土) 00:37 | URL | No.:1839312
    トランプの陽性発表と重ならんかったのは、助かったと見るべきやで!
  51. 名前:名無しビジネス #- | 2020/10/03(土) 00:41 | URL | No.:1839313
    まあどんなに信頼性上げても100%は無理だからなー
    どこだって何かしら障害起こしてるよ
    東証だから影響でかかったけど
    どっちかと言うと東証死んだときのバックアップが無いのがやばい
  52. 名前:名無しビジネス #- | 2020/10/03(土) 00:49 | URL | No.:1839317
    githubですらよく落ちるんだからどんなサービスも落ちるのは不思議じゃない
  53. 名前:名無しビジネス #- | 2020/10/03(土) 00:51 | URL | No.:1839318
    こんな事もあろうかとみたいに事前に対処しとけなんて真田さんでもムリ
    コントローラのしかもメモリの試験とか簡単に言うなレベル
    むしろこの程度の被害で済んで幸運すぎる
  54. 名前:名無しビジネス #- | 2020/10/03(土) 01:05 | URL | No.:1839321
    隣国からのなんちゃらじゃないよね
    すべて隠蔽されているとか
    どこにもそういった事を疑う記事が無いんだけど
    何にせよ、日頃のメンテナンスを怠った事から来ているんじゃないですかね
    SEだかなんだか知らんが、こんな時でも俺らマジ頑張ったとか気持ち悪いんで止めて欲しい
    この程度
  55. 名前:名無しビジネス #- | 2020/10/03(土) 01:05 | URL | No.:1839322
    事前のトイレもストッパも正露丸も最終装備の紙おむつも貫通して
    電車の座席に💩漏らすようなもんや
    しゃーない

    次の日に切り替えて何事もなかったかのように電車通勤してるメンタルを褒めるべきや
  56. 名前:名無しビジネス #- | 2020/10/03(土) 01:11 | URL | No.:1839325
    コメ欄で、多少の技術力がある奴のコメントと微塵もない馬鹿のコメントの差が激しいな

    >>54とかは微塵もないんだろうな
  57. 名前:名無しビジネス #- | 2020/10/03(土) 01:12 | URL | No.:1839326
    可哀想だが、冗長化しといたのにイザというとき動かないのは実力不足としか言いようがない
  58. 名前:名無しビジネス #- | 2020/10/03(土) 01:25 | URL | No.:1839330
    はっきり言って冗長性が足りなすぎる
    馬鹿か
    データセンターが電源喪失したらどうするんだ
    それに全部いっぺんに死ぬ確率は低すぎる
    ちゃんとメンテしてないだけ
    富士通は昔羽田空港も落としてたろが
    空港で何時間待たされたことか。。
    基本的に管理と設計が甘いんだよ
    こんな設計にハンコついた40人くらいは腹を切れ
  59. 名前:名無しビジネス #- | 2020/10/03(土) 01:35 | URL | No.:1839334
    数年前に某グローバル企業のシステム障害に巻き込まれたから笑いごとじゃない
  60. 名前:名無しビジネス #- | 2020/10/03(土) 01:46 | URL | No.:1839335
    これ東証に焦点いってるけど問題は富士通なんだよなぁ
  61. 名前:名無しビジネス #- | 2020/10/03(土) 01:51 | URL | No.:1839337
    翌日無事稼働しただけで上出来やろ
    ベンダーさんお疲れ様
  62. 名前:名無しビジネス #- | 2020/10/03(土) 01:55 | URL | No.:1839338
    まぁでも再開できるんならいいんじゃない
    世の中には復旧できずサ終するソシャゲもあるんだし
  63. 名前:名無しビジネス #- | 2020/10/03(土) 02:44 | URL | No.:1839347
    客層考えたら世の中のトラブったら不味い国内コンピューター上位一桁ぐらいか?
  64. 名前:名無しビジネス #- | 2020/10/03(土) 03:11 | URL | No.:1839356
    下請けのDB屋もどきだけど自分とこ関係なくても
    このニュース聞いただけで胃がキリキリ痛くなったわ、、
  65. 名前:名無しビジネス #- | 2020/10/03(土) 04:15 | URL | No.:1839361
    切り替わらねえのが決定的に駄目だろ
  66. 名前:名無しビジネス #- | 2020/10/03(土) 04:23 | URL | No.:1839363
    情弱が非難し
    知ったかのアホが擁護してる地獄絵図
  67. 名前:名無しビジネス #- | 2020/10/03(土) 05:13 | URL | No.:1839370
    元CEワイ、SEのとばっちりを受ける所までがセット
  68. 名前:名無しビジネス #- | 2020/10/03(土) 06:26 | URL | No.:1839377
    ※13
    新幹線には予備の指令所システムがもうひとつある
  69. 名前:名無しビジネス #- | 2020/10/03(土) 07:03 | URL | No.:1839386
    バックアップの点検が何ヶ月、下手したら何年もスルーされてきた結果だったりする?
  70. 名前:名無しビジネス #- | 2020/10/03(土) 07:18 | URL | No.:1839389
    24時間365日止められないわけじゃなく取引時間外で点検メンテナンス出来ただろうから、運が悪かったでは済まないわな。
  71. 名前:名無しビジネス #- | 2020/10/03(土) 07:24 | URL | No.:1839392
    こんなに故障が重なるものか?
  72. 名前:名無しビジネス #- | 2020/10/03(土) 07:31 | URL | No.:1839396
    原因がわからない病気を生活習慣のせいで終わらせている医者は?
  73. 名前:通りすがりの名無し #- | 2020/10/03(土) 08:04 | URL | No.:1839404
    本当に原因はそれなんだろうかね?
    (現場の皆さん、本当お疲れ様です。
    隠蔽・改ざん大好きなトップ連中でないことを
    心からお祈りいたします。)
  74. 名前:名無しビジネス #- | 2020/10/03(土) 08:22 | URL | No.:1839407
    何年もフェイルオーバーとスイッチオーバーのテストをしてなかったんだろうな
    でも稼働用のコンピュータでメモリエラー起こしてテストするなんて怖い(そもそもどうやる?)し、稼働してないときにテストしたとして稼働中も切り替えられると言えるかというと微妙
    うちの現場でも大災害に備えてスイッチオーバーの仕組みはあるが、手順は毎年変わってるのに一度もテストしてないからまず失敗するだろうな
  75. 名前:名無しビジネス #- | 2020/10/03(土) 08:31 | URL | No.:1839410
    ノンストップという言葉を使うべきじゃなかったな
    言葉の縛りによる弊害出てるよ
  76. 名前:名無しビジネス #- | 2020/10/03(土) 08:39 | URL | No.:1839413
    なんか知らんが事故はダメだろ。
    何が起こったんだ。
    事故は気をつけてないとな。
  77. 名前:名無しビジネス #- | 2020/10/03(土) 08:54 | URL | No.:1839416
    ストレージのコントローラの外からも一応の監視はされてたかも知れんが、
    それには辛うじて応答してる感じだったんかな
    無応答ならフェールオーバするが、半死にだからしないと

    どの分野でもパフォーマンス監視をフェールオーバに組みこむのは
    それなりに難しいし、実際後回しにされがちなんじゃないかね
    フラッピング状態とかになりかねんし
  78. 名前:名無しビジネス #- | 2020/10/03(土) 09:09 | URL | No.:1839417
    東証のBCPでは当日復旧は想定外だからPTSを充実させるとかの方が現実的でしょうね
    各取引所の流動性が下がるっていう致命的なジレンマはあるけど

    結論から言えば(原因不明の状況下では判断できないだろうけど)札幌名古屋福岡は動かそうと思えば動けたんでしょ?
  79. 名前:名無しビジネス #- | 2020/10/03(土) 09:29 | URL | No.:1839423
    東京一極集中が諸悪の根源やろ
    証券取引所なんて2,3箇所にあってしかるべき
  80. 名前:名無しビジネス #- | 2020/10/03(土) 09:32 | URL | No.:1839425
    ※79
    集中と分散はIT/コンピュータの永遠の命題だから

    そもそも証券取引所は日本国内に複数あるだろ
  81. 名前:名無しビジネス #- | 2020/10/03(土) 09:39 | URL | No.:1839429
    ※74
    試験してるに決まってるだろ。
    こんな案件なら富士通側で疑似環境作って問題ない事確認するし、そのあと現地でも定期的に試験する。

    まぁ、ただいくら試験しても試験では出ないタイミング障害が出るからな。
  82. 名前:名無しビジネス #- | 2020/10/03(土) 11:44 | URL | No.:1839456
    色々意見はあるとは思うけど俺が思ったことは
    「トランプのコロナ陽性発表が東証停止してるときじゃなくてよかった」
    ということ

    東証止まってたと言っても日経先物は動いてたから、あのタイミングでは発表されてたら先物だけに余波が集中して大混乱になってたと思うわ
  83. 名前:名無しビジネス #- | 2020/10/03(土) 12:38 | URL | No.:1839462
    *58
    同業他社の金融SEだが一応擁護しておくとデーターセンターのラックは2本電源が入っている。その二本の大元は違う系統の電源になっており片方の系統がしんでも大丈夫な設計になっている。データーセンターのフロア電源がしんでも基本大丈夫だが全体がしんだ際は、他の地域のDRに機能は移動される。それのミラーは各社で違うけど大抵整合性が合ってるものだ。で、基本的に設計はデータセンター全体の電源がしぬことは想定されていない。DRへいくのは大規模な震災とかで継続が困難な時のみ。今回批難するところがあるとすれば、バックアップが主系にならなかった時点で即時に災対に移行しなかった運用の判断ミス。まあ東証が災対持ってるかは知らんけど、俺はある金融機関の災対への移行承認者なので今回のことは他人事ではない。
  84. 名前:  #- | 2020/10/03(土) 13:41 | URL | No.:1839475
    偽ベテラン「性能アップ成功。障害試験はしている。(でも現実には起きる)」
  85. 名前:名無しビジネス #- | 2020/10/03(土) 13:48 | URL | No.:1839476
    勝ちに不思議の勝ちあり、負けに不思議の負け無し
    原因が無きゃこんなトラブル起きないんだよな
    ついてないとかいう甘ったれた言葉が通用するのか?
  86. 名前:名無しビジネス #- | 2020/10/03(土) 13:58 | URL | No.:1839480
    あまりにありえなさすぎて俺はわざとだと思ってる
  87. 名前:名無しビジネス #- | 2020/10/03(土) 15:04 | URL | No.:1839515
    ※83
    さすがにDR環境は大阪とかにあるんでないの
    あっても縮小版だろうけど
    切り替えようにも、オンボックスでの仕掛けでフェールオーバさせるのだけで、
    外部から手動で切り離して継続できる仕組みがまともにないんでないか
    だから復旧に拘ったと
  88. 名前:七誌 #- | 2020/10/03(土) 15:10 | URL | No.:1839519
    絶対嘘。そんな偶然が続く訳ないよ。

    冗長化の設計を根本からミスってて、その言い訳として「超絶運が悪かった」にしてるだけだろ
  89. 名前:名無しビジネス #- | 2020/10/03(土) 15:39 | URL | No.:1839540
    ※88
    世の中に「絶対」とか「偶然が続くわけがない」と言い切れる時点で頭が悪いのがよくわかる。
    具体的にどの設計をどのようにミスがあるのか調べても居ないのになぜそう言い切れるのさ?
    君の頭が悪い説明と一緒によろしく。
  90. 名前:名無しビジネス #- | 2020/10/03(土) 15:42 | URL | No.:1839541
    これってよくあるコスト削減で、壊れてるけどまだ動いてるから切り替え後も放置してて、全部壊れたんやろ

  91. 名前:誰か #- | 2020/10/03(土) 15:49 | URL | No.:1839545
    ネットワーク系でpingは返すのに
    一切の通信ができないとかそんな状態かな?
  92. 名前:名無しビジネス #- | 2020/10/03(土) 16:05 | URL | No.:1839568
    でもさぁ証券所がダウンしたあとにトランプがコロナでしょ?いろいろと勘ぐっちゃうのは俺だけ?ホントに意図的に起こされたものでなく偶発的なの?
  93. 名前:名無しビジネス #- | 2020/10/03(土) 16:25 | URL | No.:1839575
    結局現場のシステム屋、メーカーでしか構成もアーキテクチャもわからないから何も言えないんだろうけど
    メモリ起因で共倒れってメーカーとして致命的じゃない?
    パソコンですら複数メモリの中一つ死んでも動くっつうのに
  94. 名前:名無しビジネス #- | 2020/10/03(土) 16:48 | URL | No.:1839583
    わかってない奴ばかりやな

    動かすことはできるんだよ。
    問題は既に受け付けキューに溜まった注文を拾い上げて整合性を取りつつ維持続行する事なんだよ。だから止めたんだよ。
    システム屋じゃないのにシステムかじったやつは的外れな事で文句言いすぎや
  95. 名前:名無しさん #- | 2020/10/03(土) 16:54 | URL | No.:1839587
    すまンゴすまンゴ(^o^)ノ
    しょうがないンゴねえ
    これで水に流してもらえるやろ
  96. 名前:名無しビジネス #- | 2020/10/03(土) 17:05 | URL | No.:1839590
    SEだが、こんなのは普通によくあるぞ
    どうせEMCのストレージだろ
    既知の問題ならファームアップデート
    そうでないならハードウェアメーカーの
    原因調査と対応待ちだ
    結局迷宮入りになることもよくあるぞ
  97. 名前:名無しビジネス #- | 2020/10/03(土) 17:05 | URL | No.:1839591
    前回止まった時なんか
    東証関連システムっていうだけで
    毎日会議。報道される故障の原因がうちでも発生するか
    連日、検証、報告だった。

  98. 名前:名無しビジネス #- | 2020/10/03(土) 17:14 | URL | No.:1839594
    もうSE辞めたから、うろ覚えだけど、
    金融システムは高速処理を可能にするために、全てオンメモリで展開される。皆のパソコンが32GBで凄いって言ってるのに対し、東証はテラレべルのメモリを積んでるはず。そして株式情報、受注情報の全データを一度メモリ上に載せて、そのメモリ上で注文を処理しながらDB役もこなすことで高速処理を可能としていて、本当のDBには非同期型システムで書き込みに行くことでデータ保存を行っている。

    高速処理を必要とされる金融SE以外はこのオンメモリDBの事をやらないで良い。高速処理を必要としないので書き込みは同期型でDBにデータが存在するので、B系統をDBの情報を読み込みながら立ち上げるだけでバックアップが可能になる

    金融システムの場合は、ここのオンメモリデータの救済とDBに実際に書き込まれてるデータの整合性が問題になる。オンメモリ上は存在するが、DBにはまだ書き込まれてないキュー上にある注文を拾いあげないといけない。

    メモリ=ただのメモリではなく、メモリ=DBとなってるのが金融システムの1つの特徴
  99. 名前:名無しビジネス #- | 2020/10/03(土) 17:20 | URL | No.:1839598
    >そもそもメモリ起因でフェイルオーバーってするの?

    今回のはストレージのメモリってあるから
    ストレージのアレイコントローラのメモリか
    キャッシュ
    異常検知したらディスクではなく
    コントローラが切り替わりディスクへの
    アクセスパスが切り替わる

    切り替わりは完全に製品とドライバに
    依存するから設計とか技術力はあまり
    関係無い
  100. 名前:名無しのかめはめさん #- | 2020/10/03(土) 17:39 | URL | No.:1839608
    このケースを想定したテストは難しい。厳しい事言ってる奴は相当酷な事を要求してる事を理解しよう。
    システムのバグで切り替わらなかった:感知してテスト可能
    PCの故障で落ちた:感知してテスト可能
    メモリ異常(PCは生きてるが動作がおかしい):テストはかなり難しい。PCのメモリを壊すって再現できるか?
    今回の件、恐らくだけどいっそPCがダウンしてくれれば切り替わったんじゃないかと思うよ。
  101. 名前:名無しビジネス #- | 2020/10/03(土) 17:57 | URL | No.:1839624
    本当なら停止した日にもしかしたらストップ高してたのに、次の日動いてストップ高分損をした気分になったとか
  102. 名前:とおりすがり #- | 2020/10/03(土) 17:58 | URL | No.:1839625
    >>100

    メモリのエラーは日々ログとってる
    急激にエラー率が上がりだしたら、そろそろ寿命かなってことで交換する

    まだ判明してないから絶対こうだとは言えないけど
    その切り替わりの部分にエラーがあったんじゃないんか?
    野球の例えで言うと、監督がおかしい、でも監督しか監督交代命令を出せない、みたいな
  103. 名前:名無しビジネス #- | 2020/10/03(土) 18:05 | URL | No.:1839628
    ※98
    俺DB屋じゃないからよく知らんのだけど、新規キューの受付停止させて
    メモリ上の内容を待機系DBにそっくりデュプリケートとかできんの?
    それとも今回そこが手作業になったとか?
  104. 名前:名無しビジネス #- | 2020/10/03(土) 18:19 | URL | No.:1839633
    野球に例えるやつまだいるんだな(笑)おっさんか?気持ち悪い(笑)
  105. 名前:名無しビジネス #- | 2020/10/03(土) 18:35 | URL | No.:1839641
    バックアップ作動しないとか原発だったらやばいはなしよな
  106. 名前:名無しビジネス #- | 2020/10/03(土) 19:50 | URL | No.:1839671
    つーか中華業者がやったシステムの入れ替えしたんじゃね?
    スパイウェアや謎送信機見つけたけど発表できませんとか
  107. 名前:名無しビジネス #- | 2020/10/03(土) 22:20 | URL | No.:1839725
    運じゃねーんだよ無能が
  108. 名前:774@本舗 #- | 2020/10/04(日) 00:59 | URL | No.:1839777
    よくわかんねーけど機械による高速取引を禁止にすれば二度とこんな事起こらないんだろ?世界中で高速取引禁止にしろよ
  109. 名前:名無しビジネス #- | 2020/10/04(日) 01:06 | URL | No.:1839778

    こんなんで 原 発 動かせるんですかwww


    また爆発させんの?
  110. 名前:  #- | 2020/10/04(日) 07:32 | URL | No.:1839882
    >>100
    >このケースを想定したテストは難しい。
    >厳しい事言ってる奴は相当酷な事を要求してる事を理解しよう。

    できないなら、約束するなよwww
    「Never Stop」掲げていた東証
  111. 名前:名無しビジネス #- | 2020/10/04(日) 09:31 | URL | No.:1839919
    >>109
    何の脈絡もなく原発wwww
    頭大丈夫?

    >>110
    100の説明を読んで理解できない無能。
  112. 名前:名無しビジネス #- | 2020/10/04(日) 09:57 | URL | No.:1839928
    金融系に勤めているが同じ状況に遭遇したことがある
    冗長化がうまくいかない上にバックアップもうまく取れていない
    前から災害対策兼ねてテストしたいが本番機でテストは怖いので開発環境でテスト→開発環境は金かけてないから冗長化構成されてない→机上確認、結局リプレイスの時しか実機確認しない
  113. 名前:  #- | 2020/10/04(日) 10:52 | URL | No.:1839955
    >>111
    >100の説明を読んで理解できない無能。

    理解したうえで「Never Stop」と言うやつは基地外
    理解せずに「Never Stop」と言うやつが無能
  114. 名前:名無しビジネス #- | 2020/10/04(日) 16:56 | URL | No.:1840069
    原因はすぐに分かったけど、途中から
    始めると揉めるから、終日停止にしたンゴ(笑)
  115. 名前:  #- | 2020/10/04(日) 19:54 | URL | No.:1840099
    ドジっ子に確実な仕事を要求する設計が悪い。
  116. 名前:   #- | 2020/10/04(日) 21:48 | URL | No.:1840127
    金融セクターは大阪に決定だな
  117. 名前:774@本舗 #- | 2020/10/04(日) 21:52 | URL | No.:1840135
    今までバックアップに掛けてきた金は全部無駄だったって事だな。
  118. 名前:  #- | 2020/10/05(月) 02:48 | URL | No.:1840281
    特定のパーツを全部一緒のメーカーから調達するのはダメなのかもな
    不具合も寿命も同時期に起こりそうだし
  119. 名前:名無しビジネス #- | 2020/10/05(月) 15:40 | URL | No.:1840451
    フェイルオーバーのテストって片方が安全に停止した時に
    切替が正常にできるかくらいだからな
    無理する場合でも、片方を急に電源OFFとかケーブル引っこ抜き程度で
    さすがに本体にダメージ喰らいそうなテストは難しいし
    (テストで壊したらどーすんだってなるわけで)

    ところが実際の故障はメモリが壊れた、マザーボードが壊れたりで
    死にかけるがちゃんと死なかったりするから
    テストで再現しづらい中途半端な状態が起きるからなぁ
  120. 名前:名無しビジネス #- | 2020/10/05(月) 15:46 | URL | No.:1840453
    サポート対象外を明記していないなら
    正直同情できんな
  121. 名前:  #- | 2020/10/05(月) 21:09 | URL | No.:1840552
    難しい話ではなく、設定ミスとな!?

    ロイター 10/5(月) 18:02配信
    本来ならば共有ディスク装置1号機内のメモリに故障が生じた際、自動的に共有ディスク装置2号機に切り替わるが、1日の午前7時04分時点では正常に切り替えができない設定値になっていたという。IT開発部トレーディングシステム部長、田村康彦氏は「どうしてこのような設定になっていたかは、原因を含めて現在確認している最中だ」と説明した。
  122. 名前:  #- | 2020/10/05(月) 21:20 | URL | No.:1840556
    設定を変えたのに、テストしていないwww
  123. 名前:名無しビジネス #- | 2020/10/05(月) 22:05 | URL | No.:1840577
    ここで小難しい理屈をごねてるSEは駄目だと思うわ
    何も解決できない
  124. 名前:名無しビジネス #- | 2020/10/05(月) 22:22 | URL | No.:1840581
    プライムクエストとかいう最強のIAサーバーからただのIAサーバーに変えたらしいからな
  125. 名前:  #- | 2020/10/05(月) 22:27 | URL | No.:1840583
    設定ミスで東証止まるの何回目だろう
  126. 名前:  #- | 2020/10/05(月) 23:37 | URL | No.:1840615
    要件も見ないし、テストもしない。でも金はとる

    毎日新聞 2020/10/05 20:16
    東証のシステム障害は、共有記録装置が故障したため、投資家に情報を提供したり、システムを監視したりできなくなった。本来なら、もう1台ある共有記録装置に自動で切り替えてバックアップする仕組みだったが、今回起きた故障を切り替えの対象にしていなかった。東証はシステムを設計する際、これを対象にするよう開発する富士通に求めていた。富士通も対象に加えたつもりだったが、どこかの段階で抜け落ちた。

     現在のシステムは2019年11月に運用が開始された。開始前に東証と富士通がバックアップをテストしていたが、今回の障害と同じ条件で調べることが難しく、ミスを見つけられなかった。共有記録装置が故障した原因は、富士通が調べている。
  127. 名前:名無しビジネス #- | 2020/10/06(火) 13:01 | URL | No.:1840803
    東証のトラブル、海外はほぼスルーwww
  128. 名前:名無しビジネス #- | 2020/10/07(水) 20:31 | URL | No.:1841262
    設定ミスってんじゃん
    故障じゃないじゃん
  129. 名前:  #- | 2020/10/19(月) 23:02 | URL | No.:1846742
    毎日新聞 10/19(月) 20:43

    バックアップ、5年「OFF」 富士通のマニュアルに誤り 東証システム障害

    2015年9月のシステムの仕様変更前までは「オフ」でも15秒後に予備に切り替わる仕組みだったが、機器を製造した米メーカーが「オフ」時にはバックアップを作動させない方式に変更。これを富士通が把握せず、「オフ」にして東証に納入。マニュアルにも反映させなかったため、東証は気付かないままシステムを運用していたという。
  130. 名前:  #- | 2020/10/20(火) 21:53 | URL | No.:1847084
    必殺のノールックスルーパスで業務改善命令炸裂か

    IT media NEWS 10/20(火) 15:25
    テストを行わなかったのは、これまでのアローヘッドの稼働実績を鑑みた結果だとしている。東証の担当者によると、製品マニュアルから自動切り替えの発動パターンをメモリやCPUの故障、ネットワークの切断と想定していたという。ネットワーク切断については切り替えテストを行ったが、メモリなどの故障については「NASの設定値とマニュアルの整合性については富士通内の製品出荷プロセスで検証されている前提だった」とし、テストを行っていなかった。

    マニュアルに不備があったのは、機器を製造した米国企業の仕様変更が原因だという。2010年1月に稼働を始めた初代アローヘッドでは自動切り替えが「オフ」でも、トラブルを検知すると15秒後に予備に切り替わる仕組みだったが、2015年9月に導入した2代目からは「オフ」時にはバックアップが作動しない方式に変更されていた。

     これを富士通が把握せず、初期設定を「オフ」にして東証に納入。マニュアルにも反映されていなかったため、東証も気付かないままシステムを運用していたという。システム障害を受け、10月5日から設定を変更した。
  131. 名前:  #- | 2020/10/21(水) 23:06 | URL | No.:1847442
    うさみん
    @usamin5885

    NR1000(というかNetApp)中のOSの大幅刷新があって、前と後は割と別物です。具体的なコマンドでこれくらい違う。

    ■7-mode
    options cf.takeover.on_panic on
    options cf.takeover.detection.seconds 15

    ■cDOT
    storage failover modify -onpanic true
    storage failover modify -detection-time 15
    午前10:08 · 2020年10月20日·Twitter for Android

    onpanic の設定ってデフォルトで true(フェイルオーバする)であって、普通は変更しないです。panic時のダンプが完了する前に止まっちゃう(原因究明が困難になる)可能性を考えて、onpanicはあえてfalseにして、ハートビート途絶の15秒でフェイルオーバさせる設計だったのかなと予想。

    で、7-modeだと思惑通り15秒後にフェイルオーバしてくれるんだけど、cDOTだとそうなってくれない仕様に変わっていた。

    のかなと。NetAppちょっとだけしか分からないので、ただの予想です。
  132. 名前:  #- | 2020/10/21(水) 23:12 | URL | No.:1847443
    s://www.jpx.co.jp/corporate/news/news-releases/0060/20201019-01.html
    JPXからのお知らせ
    2020/10/19 JPX東証 10月1日に株式売買システムで発生した障害について
コメントを投稿する

Comment:


★ ランキング、まとめ記事


20位以下ページランキング

月間ランキング
◆ 【月間ランキングまとめ】 - 2009年1月 2009年2月 2009年3月 2009年4月 2009年5月 2009年6月

年間総まとめ

人気記事まとめタグ (シリーズ記事一覧を見る事ができます)

ランダム記事

TB
この記事のトラックバックURL
http://workingnews.blog117.fc2.com/tb.php/14177-335237e5
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック
Template by ブログのアフィリエイトにSEOテンプレート ,CSSplay Icons by Fast Icon