**Heartbeat** ist im der Netzwerkwelt ein Programm, welches überwacht ob ein System bzw. Dienst noch verfügbar ist. Sobald ein Heartbeat-Programm feststellt, dass das primäre System/Dienst nicht mehr verfügbar ist, könnte es das BackUp-System anweisen den ausgefallenen Dienst zu übernehmen.
Im nachfolgenden einige Scripte, welche ein simples, rudimentäres Heartbeat bieten.
==== Heartbeat für ein gesamtes System (ICMP-Test): ====
#!/bin/bash
IP=127.0.0.1
ping $IP -c 2 || ping $IP -c 1 || /srv/backupservice start
==== Heartbeat für einen WebServer: ====
nc = netcat
#!/bin/bash
IP=127.0.0.1
PORT=80
nc -z $IP $PORT || /srv/backupWWWstart
Heartbeatfür einen FTP-Server:
#!/bin/bash
IP=localhost
PORT=21
nc -z $IP $PORT || /srv/backupFTPstart
==== Heartbeat für ein Programm: ====
#!/bin/bash
PRGNAME=apache2
ps -a | grep -w $PRGNAME || /usr/sbin/apache2
==== Heartbeat-Scripte verwenden ====
Diese Scripte müssen natürlich sinngemäß angepasst werden (über die Variablen PRGNAME,IP, PORT) und das auszuführende Kommando sollte auch existieren bzw. angepasst werden.
Bis auf das letzte Script (Heartbeat für ein Programm) müssen diese Scripte natürlich auf den Backupsystemen ausgeführt werden. Da diese Scripte ja regelmäßig laufen sollen empfiehlt sich ein Eintrag in die [[http://www.gentoo.de/doc/de/cron-guide.xml|Crontab]] wie im folgenden Beispiel:
* * * * * /srv/bin/heartbeat.sh
Dafür habe ich dass entsprechende Script ausführbar gemacht (chmod 700 ) und nach /srv/bin/heartbeat.sh kopiert. Es wird jetzt jede Minute ausgeführt. (für private Zwecke sollte dies vollkommen ausreichend sein.)
Auch das letzte Script (Heartbeat für ein Programm) sollte in die [[http://wiki.ubuntuusers.de/Cron|Crontab]] eingetragen werden, hier jedoch auf den primären System selbst.
Weitere Informationen zu Cron:
[[http://wiki.ubuntuusers.de/Cron|http://wiki.ubuntuusers.de/Cron]]
==== Häufigere Überprüfung mit Cron ====
Da Cron maximal einmal in der Minute das Heartbeat-Script startet, kann man mit einen das Tool SLEEP helfen. Dieses Tool lässt wartet einfach #-Sekunden. Wenn also die Scripte nach folgenden Beispiel erweitert werden, kann auch eine höhere Überprüfungsfrequenz erreichen:
#!/bin/bash
IP=127.0.0.1
ping $IP -c 2 || ping $IP -c 1 || /srv/backupservice start
sleep 20 # warte ne drittel minute
ping $IP -c 2 || ping $IP -c 1 || /srv/backupservice start
sleep 20 # nochmal warten
ping $IP -c 2 || ping $IP -c 1 || /srv/backupservice start
==== Zur Erläuterung ====
Bei allen Scripten machen wir uns den ODER-Operator ( **||** ) zu nutze. Wenn ein Programm fehlschlägt, dann wird das Programm hinter den ODER-Operator aus geführt:
false || echo "Programm fehlgeschlagen"
true || echo "Dies ist nicht zu lesen"
Bei weiteren Fragen kann Ihnen in der Mailingliste: lug-talk(ät)lists(dot)lug-myk(dot)de geholfen werden.