TinyGPU hat Zuwachs bekommen: tg010
. Die Hardware-Ausstattung und aktuell auch die Software dieses “Fermi-Knotens” sind anders als bei den restlichen acht Knoten:
- Ubuntu 10.04 LTS (statt 8.04 LTS) als Betriebssystem.
Hinweis: Um lokal auf tg010 mit Intel Compilern <= 11.1 übersetzen zu können, muss [derzeit] das gcc/3.3.6 Modul geladen werden, da sonst libstdc++.so.5 nicht gefunden wird, da diese Bibliothek in Ununtu 10.04 nicht mehr enthalten ist. Das gcc/3.3.6-Modul wird nur zum Übersetzen benötigt – fertige Intel-Binaries laufen auch ohne problemlos. - Die Nvidia-Treiberversion ist inzwischen auf allen Knoten identisch; aktuell: 256.40 / seit 8. Sept. 2010 überall 256.53
/home/hpc
und/home/vault
sind (nur) per NFS gemountet (und nativ via GPFS-Cross-Cluster-Mount)- Dual-Socket-System mit Intel Westmere X5650 (2.66 GHz) Prozessoren mit 6 physikalischen Kernen pro Socket (statt Dual-Socket-System mit Intel Nehalem X5550 (2.66 GHz) mit 4 physikalischen Kernen pro Socket)
- 48 GB DDR3 RAM (statt 24 GB DDR3 RAM)
- 1x NVidia Tesla C2050 (“Fermi” mit 3 GB GDDR5 mit ECC)
- 1x NVidia GTX 280 (Consumer-Karte mit 1 GB RAM – war früher im Testcluster)
- 2 weitere PCIe2.0 16x Slots werden in Q4 wohl noch mit NVidia C2070 Karten (“Fermi” mit 6 GB GDDR5 mit ECC) bestückt werden
- statt 2x NVidia Tesla M1060 (“Tesla” mit 4 GB RAM) wie in den restlichen TinyGPU-Knoten
- SuperServer 7046GT-TRF / X8DTG-QF mit Dual Intel 5520 (Tylersburg) Chipset statt SuperServer 6016GT-TF-TM2 / X8DTG-DF mit einem Intel 5520 (Tylersburg) Chipset
Um den “Fermi-Knoten” anzufordern, müssen Jobs :ppn=24
verwenden (statt :ppn=16
) und explizit in die neue TinyGPU-Queue fermi
submittiert werden. Das Laufzeitlimit ist wie üblich 24h. Ob ECC auf der Fermi-Karte aktuell ein- oder ausgeschaltet ist, wird beim Jobstart angezeigt.