エラーが記録されてない&予期せぬシャットダウンや再起動 このトラブルは沼 Windows11
エラーが記録されてない&予期せぬシャットダウンや再起動 このトラブルは沼 Windows11
今回の内容
PCが原因不明のシャットダウン、電源交換で復旧という話
CORSAIR RM1000x 2024年モデル PC電源ユニット 1000W ATX3.1 PCIe5.1対応
80PLUS Gold認証 フルモジュラー 12VHPWRケーブル付属 CP-9020271-JP
症状について
WindowsPCのメイン機なのですが、そこそこ前にたまに強制再起動や
電源OFFになる状態が発生していた。ただ、数日に1回レベルであり、落ちるパターンも特定されるケースがなく
サクッとイベントログからも特定することが不可能だった。
頻度が低いということから、とりあえず一旦放置していた。
メインPC作成時の記事---------------------------------------
[作業メモ:自作PC 2022\.09 Intel Gen12ハイエンド機]
(https://denseforestreviewcannotsay.blogspot.com/2022/09/pc-202209-intel-gen12.html)
↑の構成からGPUを4090へ変更して運用中でした。
--------------------------------------------------------------------------
そんな中、ここ2週間ほどでこの頻度が徐々にアップしていき
1日に複数回発生する。
パターンもPC起動直後もあれば、ゲーム中、ブラウジング中、など相変わらず様々
イベントログも特に記載なし・・・・・
[イベントログのざっくり様子]
この状況なのですけど、初期状態で放置したのは 理由がわからないというだけではなく
この手のログに残らない、トラブルの発生が特定のパターンが割り出せないトラブルは
本当にめんどくさい・・・・ のです。
どうてもいい話
この手のトラブルは、複数回自作PCを作成していると必ずと言っていいほど
遭遇するトラブルであり、沼になるパターンも多々ある
また、自作スキルが上がっている方ほど、沼ることもあり、これが起因となり、
自作はもうやめておこう・・・ となる方も複数しっている。
パーツ構成や相性問題、ドライバやソフトウェア更新・管理にたけていても
このトラブルは発生しうる。
ただ、大きな問題で、対応が難しいものなのか?というと、実は
そうではなく、根本的な解決方法は至極単純です。
特定できないトラブルの場合は、すべてを今一度、1ステップごとに確認していく
というだけ
つまり、OS関連に問題はないか?ドライバが最新、またはトラブルが発生している
バージョンではないか?PCの環境は問題ないか?
各パーツ、ケーブルの接続に問題はないか?
各パーツ自体に問題はないか?
つまり、特定できないトラブルは、すべての可能性を考慮して、
ひとつ、ひとつ、トラブルの原因となるものをつぶしていく作業となる。
この時、これは大丈夫!や、2つ同時に交換などはタブーで、
1つチェックしては、動作確認、継続してトラブルが発生しているなら、もとにもどして次・・・
やることは単純なのですけど、やることが多い
そして、この対応時の落とし穴というか、自作スキルがある程度ある方がおちいりやすいのが、
ある程度、原因を予想して、特定のパーツを交換したり、原因対応に複数の対応策を同時に実施してしまい
スキルがある故の先入観から無駄な工数が発生するパターンがある。
当然、たまたま原因が当たって、正常動作する場合もある・・・・が、この成功体験が
のちに同じようなトラブル時にいらぬ先入観となり、自体が悪化することも多々ある。
また、あきらめて順序良くトラブル対応をしていっても
最悪、最終段階で正常化(安定化)できたとしても、その間の無駄とも思える時間と
交換パーツの山をみることとなり、これなら新しいPCが1台作れたのでは?
そこまでする必要がないのだけど、後戻りできなくなる。と
悲しい末路をたどることも多い・・・・
つまるところ、このトラブルはマジでだるい
トラブル対応を実施
さて、トラブル対応として、
まずは手ごろな部分(実費用がかからない)として、OSの状態確認です。
ターミナルで下記のコマンドを実施
1.システムスキャン
SFC /scannow
2.DISM コマンド
DISM.EXE /online /cleanup-image /restorehealth
あとはドライバー関連の確認をしたのですけど、これらに怪しい部分はなく
最新へ更新なども実施したものの、変化なし
熱の上昇などはなかった(汗
とりあえず。。。。。
PCケース内も掃除を実施、各ケーブルの抜き差し確認も実施
これらでも変化なし
つまり簡易的なチェックではあるけど
現状の状態(パーツ構成)では復旧する見込みが少ない可能性が出てくる(涙
こうなると、次は各パーツ毎に交換して、どうなるか?となる
ここでとりあえず最初に電源交換をチョイス!
電源をまず優先して交換対象とした理由としては、
原因を考える中で、過去に投稿していた本PCの構成内容に(上記にリンクアリ)
電源とGPUは旧型機から流用したものであり、そののちGPUを交換した
という経緯を思い題した。
電源容量的には 850W であり、現在搭載しているGPUのメーカーサイトに記載されている
PC電源推奨W数を満たしており、かつパーツ構成的に足りていることは間違いないが・・・・
いかんせん、約三世代にわたり(使用期間ではなく、電圧変化が大きく異なる回数)使用しており、
かつ、普段からほぼ一日(平均すると多分20時間前後、放置時間も多いけど)稼働させている
一般的に流通している自作PC用の電源は、多くの場合1日の使用時間は数時間程度を想定しており
その平均時間からの寿命計算であり、長時間連続稼働は想定されていない
(長くても1日8時間想定のものがほとんど、サーバー系は24時間想定がほとんどなので
サーバー用のパーツ類は高品質なものが多く、高かったりする)
このことから交換していくなら、まずは電源だ!となった。
で!今回チョイスしたのが、こちら!
CORSAIR RM1000x 2024年モデル PC電源ユニット 1000W ATX3.1 PCIe5.1対応
80PLUS Gold認証 フルモジュラー 12VHPWRケーブル付属 CP-9020271-JP
チョイス理由としては、W数単価がそこそこ安く、フルモジュラーでケーブルすっきり
4090用の電源ケーブル(12V HPWR)もありだったため、交換作業が楽になる
[開封時のケーブルと接続ポート]
導入して経過監視中ですが、今のところ症状はゼロとなった。
ログ事態も怪しいものはなく、負荷テストなども問題なくクリアできている状態です。
とりあえずは解決でOKかと思います。
マジでよかった。。。これで変化がなければ、パーツもどして、
GPUやストレージ、メモリなども順繰りやらなければならなかったのでね・・・・
ほんと最小限の出費で収まってよかった。
しばらく経過監視して、また何かあれば書く予定
どうでもいい話
過去にサーバーの管理をしていたことがあるのですが、
1フロアに3千台程度のサーバーが稼働している。仮に同一メーカー、同一構成で
このワンフロアを埋めたとした場合、某有名メーカーのサーバーでも
過去の統計と最新機種の確率的にほぼ毎日どれかが破損する計算となる
実際はメーカーバラバラで使用状況もバラバラ、当然!トラブルがない日はほぼなかった
ただ、後半、クラウドシステムを構築したことにより
1ハードに対するサーバー台数が変化(仮想化により)、これにより
サーバー稼働台数に対する実機の台数が激減したことにより
ハード的なトラブルの割合はぐっと減った・・・なんてことを思い出した。が
これはかなりどうでもいい話ではある。
CORSAIR RM1000x 2024年モデル PC電源ユニット 1000W ATX3.1 PCIe5.1対応
80PLUS Gold認証 フルモジュラー 12VHPWRケーブル付属 CP-9020271-JP
コメント
コメントを投稿