====== Login- und Compute-Server am Fachbereich Mathematik ====== ===== Login-Server ===== * login1.math.uni-hamburg.de und login2.math.uni-hamburg.de * sind von außerhalb math.uni-hamburg.de per SSH erreichbar (vergleiche [[de:user:server:fingerprints|Fingerabdrücke]]), * haben aber begrenzte Ressourcen, sind deshalb gedacht für * Einwahl in Compute-Server, * Druckjobs starten, * scp oder rsync, * LaTeX-Dokumente übersetzen und Ähnliches, * können ohne Ankündigung neu gestartet werden, zum Beispiel nach Sicherheitsupdates. ===== Compute-Server ===== * compu1.math.uni-hamburg.de mit 24 CPU-Kernen und 40 GB RAM auf Ubuntu 18.04 (sporadische Probleme bekannt) * compu2.math.uni-hamburg.de mit 24 CPU-Kernen und 48 GB RAM auf Ubuntu 18.04 (sporadische Probleme bekannt) * compu3.math.uni-hamburg.de mit 20 CPU-Kernen und 384 GB RAM auf Ubuntu 22.04 * compu4.math.uni-hamburg.de mit 24 CPU-Kernen und 512 GB RAM auf Ubuntu 22.04 * compu5.math.uni-hamburg.de mit 64 CPU-Kernen und 1504 GB RAM auf Ubuntu 22.04 Die Compute-Server * sind nur aus dem IP-Bereich ''math.uni-hamburg.de'' per SSH erreichbar (vergleiche [[de:user:server:fingerprints|Fingerabdrücke]]), zum Beispiel von Login-Servern oder Desktop-Rechnern, * werden möglichst nur nach vorheriger Ankündigung im Blog neu gestartet, * sind für Rechenjobs gedacht. Bitte Compute-Jobs die zwar viele CPUs, aber nur mäßig Arbeitsspeicher benötigen, bevorzugt auf ''compu3'' oder ''compu4'' rechnen lassen und den Compute-Server ''compu5'' bitte nur bei großem Arbeitsspeicherbedarf verwenden. Der "OOM-Killer" (OOM = Out of Memory) schlägt sonst auch auf den großen Compute-Servern gerne zu. ===== Rechnen unabhängig von der SSH-Einwahl ===== Damit Login-Server, Desktop-Rechner etc. nach Updates neu gestartet werden können, sollten längere Rechenjobs immer losgelöst von der SSH-Einwahl in den Compute-Server laufen. Dies ist zum Beispiel mit Terminal-Multiplexern wie //tmux// oder //GNU Screen// möglich. Beispielhaft wird hier die Benutzung von tmux beschrieben: ==== Starten einer tmux-Session ==== Bei der ersten SSH-Einwahl macht man sich zunächst von den Kerberos/AFS-Zugriffsrechten unabhängig, die beim Trennen der SSH-Verbindung gelöscht werden:\\ ''kpagsh'' Nun muss man sich neue Zugriffsrechte holen [[de:user:server:kpagsh|(Hinweise)]]:\\ ''%%kinit -l 2w --renewable -r 3month%%'' Danach kann man 2 Wochen auf AFS-Dateien zugreifen und dieses Recht 3 Monate lang ohne erneute Eingabe des Passworts verlängern. Mit diesen Zugriffsrechten startet man eine tmux-Session, in der man Rechenjobs ausführt:\\ ''tmux'' Man kann sich nun von der tmux-Session ablösen (detach), die im Hintergrund weiterläuft:\\ ''+ '' Dann kann man die kpagsh schließen und die SSH-Verbindung:\\ ''exit''\\ ''exit'' ==== Wiederherstellen einer tmux-Session ==== Bei erneuter SSH-Einwahl verbindet man sich wieder mit der laufenden tmux-Session:\\ ''tmux attach'' ==== Verlängern der Zugriffsrechte ==== Falls man die Zugriffsrechte verlängern muss, während ein Rechenjob läuft, kann man innerhalb von tmux ein weiteres Fenster erstellen (create):\\ ''+ '' Darin kann man die Kerberos/AFS-Zugriffsrechte verlängern (in diesem Beispiel für 2 Wochen):\\ ''kinit -R -l 2w'' Man kann nun zum ursprünglichen Fenster (0) zurück wechseln (und später mit 1 statt 0 wieder zum neuen):\\ ''+ <0>'' Alternativ schließt man das Fenster:\\ ''exit'' ==== Beenden der tmux-Session ==== Bevor man die tmux-Session schließt, sollte man die Kerberos/AFS-Zugriffsrechte vernichten, die in der kpagsh unabhängig von der Einwahl gemacht wurden:\\ ''kdestroy'' Man beendet die tmux-Session, indem man das letzte Fenster schließt:\\ ''exit'' (jan henrik, 2012-02-24)