Sie sind nicht angemeldet.

1

01.10.2010, 08:40

Kernelmeldungen nach Kernel- und Nvidia-Upgrade

Hi,

ich habe auf einer RedHat 5.4 ein Kernelupdate gemacht und während der Installation des NVIDIA-Treibers NVIDIA-Linux-x86_64-195.36.15 kam diese Meldung hier:

Kernel module compilation complete.
Kernel messages:
EDAC MC0: CE row 0, channel 0, label "": Corrected error (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, CE Err=0x10000 (Correctable Non-Mirrored Demand Data ECC))
EDAC MC0: CE row 0, channel 0, label "": Corrected error (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, CE Err=0x10000 (Correctable Non-Mirrored Demand Data ECC))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: CE row 0, channel 0, label "": Corrected error (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, CE Err=0x10000 (Correctable Non-Mirrored Demand Data ECC))
EDAC MC0: CE row 0, channel 0, label "": Corrected error (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, CE Err=0x10000 (Correctable Non-Mirrored Demand Data ECC))
EDAC MC0: CE row 0, channel 0, label "": Corrected error (Branch=0 DRAM-Bank=0 RDWR=Read RAS=0 CAS=0, CE Err=0x10000 (Correctable Non-Mirrored Demand Data ECC))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
EDAC MC0: UE row 0, channel-a= 0 channel-b= 1 labels "-": NON-FATAL recoverable (Branch=0 DRAM-Bank=0 Buffer ID = 0 RDWR=Read RAS=0 CAS=0 NON-FATAL recoverable Err=0x2000 (FB-DIMM Configuration
Write error on first attempt))
nvidia: module license "NVIDIA" taints kernel.


Ich vermute, dass das defekte Speicher sind. Der MEMTest hat allerdings nichts gebracht.
Und seit dem kommen beim User und beim Root in der Shell ständig die Fehlermeldungen:

[root@ceplx103 /]#
Message from syslogd@ at Thu Sep 30 15:45:13 2010 ...
ceplx103 last message repeated 34 times
[root@ceplx103 /]# [root@ceplx103 /]#
-bash: [root@ceplx103: command not found
[root@ceplx103 /]# Message from syslogd@ at Thu Sep 30 15:45:13 2010 ...
-bash: Message: command not found
[root@ceplx103 /]# ceplx103 last message repeated 34 times
-bash: ceplx103: command not found
[root@ceplx103 /]#
[root@ceplx103 /]

Meine Fragen sind

- ist das ein Anzeichen für defekte Speicherriegel?
- wie kann ich diese Fehlermeldungen von der Shell der User wegbekommen?

Vielen Dank und Grüße

Nelson

linuxerr

Prof. Dr. Schlaumeier

  • »linuxerr« ist männlich

Beiträge: 8 557

Wohnort: Mecklenburg, zur Entwicklungshilfe in Chemnitz/Sachsen ;-)

  • Nachricht senden

2

02.10.2010, 09:48

RE: Kernelmeldungen nach Kernel- und Nvidia-Upgrade

Zitat

Original von Nelson
Ich vermute, dass das defekte Speicher sind. Der MEMTest hat allerdings nichts gebracht.

das sind irgendwelche schreibtests, die der nvidia-treiber auf der grafikkarte durchfürht. ich nehme mal an, dass er die speicherbelegung der grafikkarte testet. mit deinem systemspeicher hat das nichts zu tun, deshalb ist memtest sinnlos.

Zitat


Und seit dem kommen beim User und beim Root in der Shell ständig die Fehlermeldungen:
[root@ceplx103 /]#
Message from syslogd@ at Thu Sep 30 15:45:13 2010 ...
ceplx103 last message repeated 34 times
[root@ceplx103 /]# [root@ceplx103 /]#
-bash: [root@ceplx103: command not found
[root@ceplx103 /]# Message from syslogd@ at Thu Sep 30 15:45:13 2010 ...
-bash: Message: command not found
[root@ceplx103 /]# ceplx103 last message repeated 34 times
-bash: ceplx103: command not found
[root@ceplx103 /]#
[root@ceplx103 /]

du solltest mal in die systemlogdateien reinschauen, denn syslogd meldet immer wieder dasselbe.
schau also mal in die /var/log/messages oder /var/log/syslog oder /var/log/debug was da gemeldet wird.
Die Rechtschreibfehler in diesem Beitrag sind nicht urheberrechtlich geschützt.
Jeder der einen findet darf ihn behalten und in eigenen Werken weiterverwenden.

3

04.10.2010, 13:55

Vielen Dank

für Deinen Hinweis. Wie bist Du jetzt auf den Gedanken gekommen, dass das der RAM der Grafikkarte sein könnte?

Jetzt wäre es für mich interessant, ein Bencjmark-Tool zu haben, das die Karte extrem beansprucht, um zu sehen, dass exakt derselbe Fehler wieder auftritt.

Grüße

Nelson

Thema bewerten