Bluescreen - Hardwarefehler vermutet, wie vorgehen?

Richard Wagner

Bekanntes Mitglied
Bevor ich hier mit Fehlermeldungen und Protokollen ins Detail gehe, würde, würde ich gerne noch etwas testen. Dazu bitte ich um Eure Empfehlung.

Der PC stürzt immer wiede mal ab, einmal in drei Tagen bis zu drei Mal an einem Tag, und bisher nie, wenn das System viel zu tun hatte. Windows hat dann aber noch Zeit, eine große DUMP-Datei zu speichern. Ich vermute, es ist ein Hardwaredefekt, weil Windows auch nach einer Reparatur mit sfc scannow und nach einer vollständigen Neuinstallation noch genau so oft abstürzt, einmal auch in einer PE-Umgebung und auch schon mal zu Beginn des Bootvorgangs.

Jetzt möchte ich natürlich nicht den gesamten Rechner austauschen, sondern möglicht sicher das defekte Bauteil identifizieren. Nach einmal fünf und einmal zwölf Stunden Memtest ohne Fehler, gehe ich davon aus, daß der Arbeitsspeicher in Ordnung ist.
Meine Prioritätenliste ist 1. CPU, 2. Mainboard, 3. Netzteil. Aber das ist nur geraten und alles leider weniger leicht zu testen. Ich will mich jetzt mal hiermit befassen:

Ich habe ein frisch installiertes Windows, auf dem ich die Tests machen könnte, und dazu meine Frage:
Sollte ich für die Tests die Mainboardtreiber (AMD X570) installieren. Ich vermute ja. Was meint Ihr?
Oder ist das weniger wichtig? Dann könnte ich auf meinem normalen System die Tests laufen lassen. Das ist ja auch noch sehr frisch, nur halt mit vielen Einstellungen...

Falls jemand einen praxiserprobten Tip oder eine bessere Anleitung hat, um Hardwarefehler einzugrenzen, dann auch gerne her damit.
 

vinyl

♫ ♪ ♫ ♪ ♪
mein windows hatte auch 20 bluescreens letzte woche.

es war vermutlich eins der windows updates von vor 10 tagen.

seit deinstallation ist ruhe.
 

Cosmo

Team (Founder)
Mitarbeiter
Erstmal den RAM testen:

Memtest86

wenn okay, Rechner mit:

Prime95

testen.

Laufwerk auch testen, Bluescreens können auch durch Festplatten-Hänger hervorgerufen werden.

Hard Disk Sentinel (Oberflächenanalyse)

Es gibt so eine russische Tools-CD, da ist das alles drauf.

Erst mal NICHT an den Treibern herumschrauben, der Hardware-Defekt ist das Wahrscheinlichste. Den beseitigt man nicht durch andere Treiber.

Wenn es das alles nicht ist, anderes Netzteil ausprobieren. Ich empfehle ein Enermax Maxpro II, welches man sowieso in der Bastelkiste in Reichweite haben sollte. Auch den Rechner mal aufschrauben und gucken, ob vielleicht ein oder mehrere ballonierte, oder ausgelaufene Kondensatoren zu sehen sind, meistens in der Nähe der RAM-Bänke und des Prozessors.
 
Zuletzt bearbeitet:

Raymond

Der Wahnsinn hat einen Namen......
Schau dir mal die kleinen Kondensatoren rund um die CPU an. Ich meine Cosmo hatte mal ein Bild von defekten Kondensatoren gepostet.
Wenn die eine Wölbung nach oben haben sind diese defekt. Ebenso auch mal auf dem ganzen Mainboard einfach mal schauen. Kondensatoren haben die Eigenschaft auch ihre Kapazität zu verringern bevor diese ganz kaputt gehen. Das kann auch sein. Das würde auch die Abstürze erklären die nicht (oder kaum) reproduzierbar sind.
RAM hast du ja scheinbar bereits ausgeschlossen, Netzteil halte ich zwar nicht für wahrscheinlich, aber auch hier können Kondensatoren hochgedampft sein. Hast du die Möglichkeit das ganze mit einem anderen Netzteil zu testen? Dann könnte man das zumindest auch schon ausschließen.
 

Richard Wagner

Bekanntes Mitglied
Das Netzteil habe ich jetzt ganz vergessen, doch aufgrund der (für mich bisher wenig aufschlußreichen) Einträge in den Windows-Ereignissen hatte ich als erstes ans daran gedacht. Das habe ich dann aber wieder verworfen, weil ein mehrminütiger Streßtest keine Probleme machte.

Gerade läuft Prime 95, davor der Streßtest von CPU-Z. Die CPU kommt kaum auf 70°, obwohl alle Lüfter auf Silent stehen.

Der PC ist ja auch nicht übertaktet. Ich habe alles auf den Standardeinstellungen gelassen, und da frage ich mich, ob ein Streß-Test, der die Hardware an die Grenzen bringt, die passende Diagnose ist, zumal der PC auch abstürzt, wenn er eigentlich nichts zu tun hat.

Was ist mit den Kondensatoren? Klingt irgendwie passend. Kann das denn auch bei neuerer Hardware schon sein? Oder erst nach ein paar Jahren?
Ich muß den Kühler abbauen (den völlig überdimensionierten Noctua Boliden), um sehen zu können, wie es aussieht.
 

Richard Wagner

Bekanntes Mitglied
Noch etwas: Wenn ich den Streßtest mache und dabei die Spannungen überprüfe, was ist denn da wichtig, bzw. welche Toleranzen sind normal?
 

Raymond

Der Wahnsinn hat einen Namen......
Wenn du einen Zahnarzt deines Vertrauens hast könnte der Mundspiegel dir gute Hilfe leisten.
1626455586563.png


Solltest du zu der Fraktion der Älteren gehören, die bereits erste Anzeichen eines Tremors zeigen, würde ich zum Kunststoffgriff raten. Ansonsten sind etwaige Kurzschlüsse vorprogrammiert und die Fehlersuche beschränkt sich dann auf den Austausch des Mainboards.

Wie stark schwanken die Spannungen denn? Also von 11,7 V -12,4 waren bei meinen Rechnern schon alles dabei, und die liefen damit auch ohne Probleme.
Bei den 5V Leitungen bin ich mir jetzt nicht mehr sicher welche Werte da noch tolerierbar waren. Da wird sich bestimmt noch jemand zu melden.

Kondensatoren sollten eigentlich ein paar Jahre aushalten bevor sie den Kapazitätstod sterben. Aber wer weiß was die Kinderhände in Korea da zusammen geklöppelt haben.......
 

RaZorAlien

Bekanntes Mitglied
Das erinnert mich an einen Vorfall, den ich vor einigen Jahren erlebt habe. Ich schreib meine Erkenntnisse mal hier nieder, vielleicht hilft es Dir ja auch.

Hast Du mehrere Riegel RAM zur Verfügung? Ich habe vor ein paar Jahren meinen Rechner aufgestockt und plötzlich Bluescreens bekommen.
Memtest hat nichts gefunden. Dann habe ich die Riegel einzeln eingebaut und den Rechner normal hochgefahren, bis zum Bluescreen, bzw. es keinen Absturz gab. Das habe ich so lange gemacht, bis ich so alle einmal durchgetestet habe.
Das Problem waren die neu gekauften Riegel. Die habe ich zurückgeschickt und gegen eine baugleiche Version getauscht. Seit dem habe ich nie wieder einen Bluescreen gesehen.

Die neuen RAM-Riegel waren also defekt, auch wenn der Defekt nicht durch Memtest und Co nachweisbar war. Das war schon etwas gemein. :)
 

Cosmo

Team (Founder)
Mitarbeiter
Hast Du mehrere Riegel RAM zur Verfügung? Ich habe vor ein paar Jahren meinen Rechner aufgestockt und plötzlich Bluescreens bekommen.
Memtest hat nichts gefunden.
Das riecht nach der "mal Stromdurchgang - mal nicht" -Problematik. Symptom ist, dass die Riegel mit Memtest86 einwandfrei klappen, aber wenn man an den eingebauten Riegeln wackelt, friert der Rechner ein oder bringt Bluescreen. Also: Rechner hochfahren, Prime95 laufen lassen und mit dem ausgestreckten Finger beherzt an den Riegeln wackeln, nachdem man sich vorher an der Stehlampe die Hände entladen hat. Kackt der Rechner ab, liegt das "mal Stromdurchgang - mal nicht" -Problem vor. Ich glaube, bemerkt zu haben, dass dieses Problem viel an Riegeln auftaucht, mit denen viel "rein-raus" herumgebastelt worden ist. Das Problem ist häufig! Wenn ich mit Riegeln zu tun habe, mache ich immer nach Memtest86 auch den Wackeltest.
 

Raymond

Der Wahnsinn hat einen Namen......
An so einen Spiegel sollte doch ran zu kommen sein. Es gibt freundliche Boten-Menschen, die bringen einem so etwas ins Haus. Vielleicht schon morgen. Kann ja nicht schaden...

würde ich zum Kunststoffgriff raten
Geht auch Strom abschalten?
Klar, aber wenn die Elkos noch in Ordnung sind kannst du die mit einem beherzten Kurzschluss immer gut entladen. Und zwar recht schnell...... Und dabei kann dann auch das ein oder andere Bauteil ebenfalls mit kaputt gehen.
Wir hatten damals Abgleichbesteck von Bernstein, da war auch ein Kunststoff gefasster Spiegel dabei, allerdings finde ich den auf die schnelle gerade nicht. Schwupps... doch gefunden.
 
Zuletzt bearbeitet:

Richard Wagner

Bekanntes Mitglied
Weil das Netzteil das Bauteil ist, das man am einfachten testen kann, wollte ich damit anfangen und habe ein neues gekauft.

Als ich den PC runter fahren wollte, um das Netzeil zu tauschen, hatte ich wieder einen Bluescreen, der mir an der Stelle aber erst einmal egal war. Doch mit dem neuen Netzteil wollte der PC nicht wieder angehen. Es tat sich absolut nichts! Also habe ich das alte Netzteil wieder eingebaut, aber auch damit wollte der PC sich jetzt nicht mehr rühren. Absolute Stille und Dunkelheit!

Dann habe ich diesen Netzteiltester aus dem Koffer geholt:

Mit dem alten Netzteil scheint alles in Ordnung zu sein, aber bei dem neuen ertönt ein unendliches Piep, Piep, Piep... Und der PG-Wert blickt, wobei er 80ms anzeigt. Die Spannungswerte sind aber alle gut.


Ich fürchte nun, daß das Mainboard kaputt ist, und zwar jetzt wirklich ganz kaputt. Aber kann das mit dem Netzteil zusammen hängen? Oder war das Board schon vorgeschädigt und vielleicht auch die Ursache für die Bluescreens.

Und was ist vom Piepen des Netzteiltesters zu halten?
 

eumel_1

Der Reisende
Was ist ein PG-Wert?
Wenn das für das Power Good Signal steht, das kommt vom Mainboard zurück, also Mainboard hin.

Allerdings weiß ich nicht, ob diese Aussage vom Tester auch zuverlässig ist.
 
Zuletzt bearbeitet:

Richard Wagner

Bekanntes Mitglied
Ja, PG ist Power Good Signal, aber das kommt nicht vom Mainboard, sondern vom Netzteil und sagt dem Mainboard, daß es jetzt bereit ist, die Spannungen also stabil sind.

Da ich das Netzteil entweder mit dem Tester oder mit dem Mainboard verbinden kann, sagt die Anzeige des Testers nichts über das Mainboard, nur über das Netzteil. Bei zwei anderen Netzteilen ist der Wert bei mehreren Messungen immer zwischen 260 und 320, bei dem neuen immer konstannt bei 80.

Hier vermischen sich also zwei Themen. Das eine ist das Netzteil. Nehmen wir an, der Tester zeigt ungefähr den richtigen Wert, der nach ATX-Spezifikation etwas höher sein sollte, nämlich mindestens 100ms, wenn ich richtig informiert bin. Welche Bedeutung hat das in der Praxis? Ist das tollerierbar oder kann das Probleme machen oder macht das Probleme. Ich meine jetzt allgemein, nicht nur auf meinen PC bezogen, und im Hinblick darauf, ob ich das Netzteil reklamieren kann/soll? Oder ist das bei neuen Netzteilen vielleicht sowieso etwas schneller?

Das andere betrifft meinen PC, der nun gar nichts mehr macht. Wenn aber nur das Netzteil das Power Good Signal zu früh sendet, würde das den PC ja nicht zerstören und mit dem alten Netzteil würde er wieder starten. Da muß also noch etwas anderes passiert sein.
 
Zuletzt bearbeitet:

eumel_1

Der Reisende
Sorry, mein Fehler.
Habe mich irreleiten lassen, weil ich normalerweise nur das PWR_OK Signal gegen Masse lege um ein Netzteil zum starten zu bringen, hatte mal ein ATX-Netzteil jemanden ins Badezimmer gepflastert, weil der unbedingt ein Autoradio im Badezimmer in der Vorwandinstallation haben wollte - der Kunde ist König.

Wieder was gelernt.
 

Rubb

Rover
.... das was mir dazu einfällt .... dieses kleine Batteriechen "CR2032" z.B. .... ist damit alles in Ordnung?
 

Cosmo

Team (Founder)
Mitarbeiter
Als ich den PC runter fahren wollte, um das Netzeil zu tauschen, hatte ich wieder einen Bluescreen, der mir an der Stelle aber erst einmal egal war. Doch mit dem neuen Netzteil wollte der PC nicht wieder angehen. Es tat sich absolut nichts! Also habe ich das alte Netzteil wieder eingebaut, aber auch damit wollte der PC sich jetzt nicht mehr rühren. Absolute Stille und Dunkelheit!
Ah okay, du hast jetzt eine "multiple Scheiße-Aufschaltung" (so nenne ich das immer). Das Wichtigste ist jetzt: Ruhe bewahren und nicht verzweifeln.

Jetzt:

neues Netzteil drinnen lassen, es ist wahrscheinlich, dass das in Ordnung ist. Dein altes vielleicht auch, aber jetzt erst mal mit dem neuen weiter machen

CMOS Reset machen (Board Manual konsultieren)

Batterie rausholen, testen, dann entweder eine neue reinstecken, (wenn die alte weniger als 2,8V anzeigt), oder die alte wieder reinstecken

Null-Methode anwenden: Alle nicht unbedingt erforderlichen Karten rausholen, alle Geräte absteckern, auch DVD-Drive, Cardreader etc. Hast du eine Grafik-Karte? Wenn zusätzlich Onboard-Grafik vorhanden, mal nur die Onboard-Grafik verwenden, und die Grafik-Karte rausholen?
(jedes Gerät kann durch sporadische Ausfälle Bluescreens verursachen, oft WLAN-Karten, aber auch ein DVD-Drive, alles schon gesehen)

Jetzt alle RAM-Riegel herausholen, Bank-Kontakte Sichtprüfung machen, aussaugen.

Bist du sicher, dass hinter dem Mainboard kein Kurzschluß-Objekt eingeklemmt ist (ne Schraube z.B.). So etwas macht genau den Fehler, denn du beobachtest.

Dann: Nur einen Riegel wieder einbauen. Rechner anmachen. Geht? Geht nicht? Den einen Riegel wieder rausholen, und einen anderen Riegel einzeln einstecken. Geht?

Das machen, und dann wieder melden.

[Leider kann dein Fehlerbild auch durch einen defekten Prozessor verursacht werden, daran denken wir jetzt aber erst einmal nur im Hinterkopf]
 

Richard Wagner

Bekanntes Mitglied
@Cosmo

An CMOS Reset habe ich auch schon gedacht. Das Board hat dafür sogar einen eigenen Taster. Ob ASRock das für nötig hielt, weil die eigenen Boards das so oft brauchen? Oder ob die geahnt haben, daß Richard Wagner das Ding kaufen würde? Aber gut, ich will hier keinn Voodoo-Zauber frei setzen, und werde mich später ans Basteln begeben, ganz in Ruhe...

Frage am Rande: Erkennt es denn ein Mainboard, wenn man das Netzteil gewechselt hat?

hatte mal ein ATX-Netzteil jemanden ins Badezimmer gepflastert, weil der unbedingt ein Autoradio im Badezimmer in der Vorwandinstallation haben wollte
Nette Idee. Ich hab' ja jetzt ein Netzteil übrig. Nur das Autoradio fehlt noch... ;)
 

Richard Wagner

Bekanntes Mitglied
[Leider kann dein Fehlerbild auch durch einen defekten Prozessor verursacht werden, daran denken wir jetzt aber erst einmal nur im Hinterkopf]
Müßte dann nicht das Mainboard melden, daß mit dem Prozessor etwas nicht stimmt? Zumal es ein Board ist, bei dem ich über USB sogar ohne Prozessor und ohne RAM das BIOS flashen kann...
 

Cosmo

Team (Founder)
Mitarbeiter
Frage am Rande: Erkennt es denn ein Mainboard, wenn man das Netzteil gewechselt hat?
Nein, das wäre mir neu.

Müßte dann nicht das Mainboard melden, daß mit dem Prozessor etwas nicht stimmt? Zumal es ein Board ist, bei dem ich über USB sogar ohne Prozessor und ohne RAM das BIOS flashen kann...

Nein, es gibt bei Prozessoren auch den Status "geht mal, mal geht es nicht". Bei allen Komponenten gibt es das Problem mit "sporadischen Ausfällen", die nirgendwo in keinem Log auftauchen. Das macht ja das Einkreisen so schwierig.
 

Richard Wagner

Bekanntes Mitglied
Hätte ich den Tip von Cosmo, Ruhe zu bewahren, auch am WE schon beherzigt, hätte ich mir viel Aufregung um eine kleine Ursache sparen können. Also erstmal Asche auf mein Haupt: Das Kabel vom Ein/Aus-Schalter am Gehäuse war nicht direkt mit dem System-Panel auf dem Board verbunden, sondern über ein Verlängerungskabel, das auf dem Board mit einem Stecker alle Pinne gleichzeitig erfaßt. Damit habe ich die Kontakte nach hinten geleitet, was insofern sehr komfortabel ist, weil die Fummelei mit den einzelnen Kabeln auf den schwer zugänglichen Pinnen entfällt. Auf der Rückseite die Kabel miteinander zu verbinden, ist viel leichter. Dumm ist nur, wenn man bei der Kontrolle eine gelöste Verbindung übersieht, weil die hinter einem andern Kabelwust verborgen ist. Und wenn das dann die Verbindung zum Hauptschalter ist, geht natürlich nichts mehr. Passiert ist die Trennung als ich die Kabel vom Netzteil durch das Kabelgewirr herausgezogen habe.

Jetzt läuft der Rechner also wieder, und zwar mit dem neuen Netzteil. Mal sehen, ob die Smilies auf dem blauen Bilschirme damit erledigt sind...

Meine Frage, ob das Mainboard erkennt, wenn man das Netzteil tauscht, bezog sich hierauf:
Ah okay, du hast jetzt eine "multiple Scheiße-Aufschaltung"
Gut, zumindest das wäre dann erledigt!
 

eumel_1

Der Reisende
Sowas kenne ich auch, mal eben schnell auf einem Kundenproduktivsystem den Raidadapter wechseln, dabei unbeabsichtigt das Kabel für den Starttaster abgezogen, einfach wieder aufgesteckt, links zwei Pins frei lassen und obere Reihe benutzen sagte das Handbuch.
Danach ging er nicht mehr an, aber wenn ich danach mit dem Taster auf dem Motherboard gestartet hatte, ging er an, aber die Uhrzeit stimmte nicht und das BIOS war in den Grundeinstellungen. Support konnte mir auch nicht helfen, also abends im Hotel das Mainboard-Manual von vorn bis hinten durchgelesen.
Es war ein letztlich 60cm Problem, über der doppelreihe Pins war eine weitere Reihe mit 4 Pins, und in dieser Reihe waren die beiden rechten Kontakte der CMOS-Reset. Diese Information war aber 13 Seiten weiter hinten im Handbuch, als die Beschreibung der Doppelreihe Pins für Frontpanel.
Ich hatte den Stecker einfach eine Reihe zu hoch aufgesteckt. War ein ASUS X99-A II Mainboard.
 
Zuletzt bearbeitet:

Richard Wagner

Bekanntes Mitglied
Das kann mir nicht passieren, zumindest nicht bei meinem Sorgen-PC: Für CMOS-Reset gibt es nur einen Taster, nichts zum Stecken oder kurzszuchließen. Der Powerknopf auf dem Mainboard war meine Rettung. Ohne groß darüber nachzudenken hatte ich nämlich den gedrückt, als ich das Netzteil wieder angeschlossen hatte (es war ja am Tester), und da kam dann der Geistesblitz: Wieso funktioniert das mit dem Knopf am Gehäuse nicht? Ob ich da sonst so schnell drauf gekommen wäre...
 
Zuletzt bearbeitet:

eumel_1

Der Reisende
Da, wo ich das Kabel angeschlossen hatte, die Pins hießen CLRTC = Clear Real Time Counter.
Und das löscht nicht nur die Uhrzeit, sondern eben auch alle BIOS-Änderungen.
An dem Tag hatte ich bereits lange gearbeitet, war müde und bin dann frustriert ins Hotel.
Am nächsten Morgen dauerte dann die Fehlererkennung nichtmal 5 Minuten.

Nur wer nicht arbeitet, macht keine Fehler! :D
 
Oben Unten