Sie sind nicht angemeldet.

1

31.01.2006, 11:26

Festplattencheck ohne Tools

Hallo zusammen,
vielleicht kann mir hier ja jemand weiterhelfen-oder zumindestens einen Tipp geben;-)
Problem ist folgendes.
Zur Hardwareüberwachung einiger Rechner gehört die Überwachung der Festplattenfunktion- also ob diese Funktionsfähig ist!
Funftionsfähig ist genau das Problem- bezw. die Defenition dafür.
Wann ist eine Platte funktionsfähig?.
Und wie teste ich diese Funktion.
Weiteres Problem ist, dass keine Fremdsoftware (also diverse tool die genau dies anbieten) benutzt werden darf.
Das heißt ich muß kleine Scripte schreiben um die Funktion der Festplatte zu checken.
Wie würdet ihr diesen Test durchführen?
einfach auf die Platte schreiben auslesen und löschen?
Was machen die Festplattentool genau?.
am besten wären shell comandos unter linux;-)! (RHEL wird genuzt)
SMART ist mir ein Begriff, leider hat nicht jede Festplatte diese Funktion und fällt somit auch raus.
danke im vorraus!.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »nicknick« (31.01.2006, 11:26)


linuxerr

Prof. Dr. Schlaumeier

  • »linuxerr« ist männlich

Beiträge: 8 557

Wohnort: Mecklenburg, zur Entwicklungshilfe in Chemnitz/Sachsen ;-)

  • Nachricht senden

2

31.01.2006, 21:43

RE: Festplattencheck ohne Tools

was willst du denn checken?
sinnvoll ist doch eine fehlererkennung VOR dem totalausfall und nicht danach!
moderne ide-platten unterstützen doch alle smart (ich habe jedenfalls noch keine gefunden die es nicht unterstützt hat). da siehst du mit dem selftest wenigstens schon vorher, das was faul ist. wenn die schreibzugriffe die du benutzen willst nicht mehr funktionieren ist doch eh alles zu spät.
Die Rechtschreibfehler in diesem Beitrag sind nicht urheberrechtlich geschützt.
Jeder der einen findet darf ihn behalten und in eigenen Werken weiterverwenden.

3

01.02.2006, 11:43

RE: Festplattencheck ohne Tools

dachte eher an etwas wie hdparm.
lässt sich ohne anpassung des systemes ausführen.
(wenn mich nicht alles täuscht muß SMART erst aktiviert werden?, und somit müßten alle systeme ersteinmal angepasst werden?.)

linuxerr

Prof. Dr. Schlaumeier

  • »linuxerr« ist männlich

Beiträge: 8 557

Wohnort: Mecklenburg, zur Entwicklungshilfe in Chemnitz/Sachsen ;-)

  • Nachricht senden

4

01.02.2006, 14:56

RE: Festplattencheck ohne Tools

Zitat

Original von nicknick
dachte eher an etwas wie hdparm.
und was willst du damit testen??
da ist ja zumindest badblocks noch sinnvoller.
ansonsten müsstest du das kernellogging auswerten,. manchmal kündigen sich festplattenausfälle dort schon durch dma probleme an und der kernel dann ide-resets an die platte schickt.
Die Rechtschreibfehler in diesem Beitrag sind nicht urheberrechtlich geschützt.
Jeder der einen findet darf ihn behalten und in eigenen Werken weiterverwenden.

5

01.02.2006, 15:22

genaugenommen möchte ich nur eine "oberflächliche" hardwareüberprüfung machen.
(hardware bezieht sich auf speicherriegel, Cpu´s , Netzwerkkarten, Festplatten).
Und bräuchte nur ein shellcomando mit dem ich den Status der Hardware überprüfen kann.
Mit Status ist gemeint (im weitesten sinne) - die funktionalität der Hardware!- kurzum wenn Fehler an der Hardware vorhanden sind sollte der Status faild sein, ansonsten ok.
Aber eine simple Abfrage des Hardwarestatuses habe ich bei RHEL3 leider nicht gefunden.
daher der versuch über hdpamr bei festplatte free bei speicher usw.
etwas über den status der hardware zu erhalten.

linuxerr

Prof. Dr. Schlaumeier

  • »linuxerr« ist männlich

Beiträge: 8 557

Wohnort: Mecklenburg, zur Entwicklungshilfe in Chemnitz/Sachsen ;-)

  • Nachricht senden

6

01.02.2006, 17:44

so richtig habe ich nicht verstanden, was du mit dem tool dann bewirken willst. was willst du am speicher mit free testen???? das er noch da ist? wenn der ram einen defekt hat, wird sich dein system sowieso unkontrolliert verhalten und einfach stehenbleiben, da meldet auch dein tool kein failed mehr. naja und mit schreibzugriffstest auf die festplatten machst du eine anwesenheitskontrolle und bei den netzwerkkarten könntest du einen externen host anpingen.....
Die Rechtschreibfehler in diesem Beitrag sind nicht urheberrechtlich geschützt.
Jeder der einen findet darf ihn behalten und in eigenen Werken weiterverwenden.

7

02.02.2006, 12:12

also ziel ist nicht die Überwachung eines normalen PCs - es geht eher um Server mit mehreren cpus und restlichem.
Dementsprechen fällt das System nicht aus wenn mal ne CPU oder ein Ramspeicher ausfällt.
Problem wäre jedoch herauszufinden das ein Speicher, oder eine CPU ausgefallen ist. Und genau sowas soll z.b. abgefragt werden.
mit free erhalte ich nur die Auslastung aller Riegel zusammen.
Wenn es möglich wäre diese Auslastung von einzelnen Riegeln abzufragen, würde man erkennen können welcher nicht läuft/ bezw. das einer nicht läuft.
Besser wäre eben eine Funktionsabfrage ob alle einen Status von :OK haben.
Das gleiche gilt für Festplatten und CPU´s.
Ein ping abzusetzten reicht bei der Netzwerkkarte eher nicht.
Den wenn der Host nicht erreichbar ist liegt es ja meistens nicht an der Hardware.

naja irgendwie scheint es leider eher nicht möglich zu sein diese Überwachung simpel zu gestallten?:-)

8

02.02.2006, 12:19

Also eine "aktive" Überprüfung erfordert die dazu passenden Tools (smart wurde ja schon erwähnt) ...
Dem laufenden System kritische Aufgaben wie badblocks oder memtest "unterzujubeln" ist auch keine gute Idee (könnte Fehler überhaupt erst auslösen!).

Somit bleibt eigentlich nur eine aktive Auswertung / Analyse von Lognachrichten (Linux meldet ja schliesslich aufgetretene Fehler), also ein "optimistisches Modell" (Solange kein Fehlerzustand bis auch tatsächlich einer aufgetreten ist) ...

Zusätzlich bzw. alternativ könnte man noch schauen, welche nützlichen Informationen man sich im /proc-Dateisystem zusammenklauben könnte ...


Michael
Life is like ice cream: enjoy it before it melts!
"If there is (a God), all evidence indicates that He hates me." - Matt Groening

9

02.02.2006, 12:27

das mit den logs dachte ich mir auch.
Wäre auch eine gute Möglichkeit.
jedoch ist da das Problem, wie sehen die Fehlermeldungen aus??
wo werden diese Reingeschrieben? es gibt zig logfiels und ziemlich viele Arten von möglichen Fehlermeldungen.
Leider finde ich in den dokus von RHEL jedoch keine Auflistung aller Fehlermeldungen.
Somit suche ich ne "Stecknadel im Heuhaufen".
Um logfiles nach betimmten Fehlern untersuchen zu können bräuchte ich den genauen Wortlaut der Fehlermeldung.

10

02.02.2006, 12:54

Hardware-Fehler werden immer im System-Log protokolliert.
(also entweder in /var/log/messages , /var/log/syslog oder /var/log/kernel* , so genau kenne ich RHEL nicht).

Festplatten tauchen immer mit ihren Gerätenamen auf (sd[a-z] oder hd[a-z]), ein einfaches grep auf die Logs mit den Dir bekannten Festplattennamen sollte Dir schon weiterhelfen ;)

Weiterhin könntest Du tach typischen Fehlerworten suchen (z.B. "failed") ...

Quellcode

1
2
3
4
5
6
7
8
Feb  2 10:02:33 boombox sda: asking for cache data failed
Feb  2 10:02:33 boombox sda: assuming drive cache: write through
Feb  2 10:02:33 boombox sda: sda1 sda2 sda3 sda4
Feb  2 10:02:33 boombox sd 1:0:0:0: Attached scsi disk sda
Feb  2 10:02:33 boombox Adding 979924k swap on /dev/sda1.  Priority:-1 extents:1 across:979924k
Feb  2 10:02:33 boombox EXT3 FS on sda4, internal journal
Feb  2 10:02:33 boombox EXT3 FS on sda2, internal journal
Feb  2 10:02:33 boombox EXT3 FS on sda3, internal journal


Michael
Life is like ice cream: enjoy it before it melts!
"If there is (a God), all evidence indicates that He hates me." - Matt Groening

Thema bewerten