KONWIHR

Kompetenznetzwerk für wissenschaftliches Höchstleistungsrechnen in Bayern

Inhalt

Hochparallele Berechnung vieler innerer und eng benachbarter Eigenwerte fermionischer und hochangeregter exzitonischer Systeme [PEigFEx]

Antragssteller

Dr. rer. nat. habil. Georg Hager
HPC Services, RRZE
Regionales Rechenzentrum Erlangen
Martensstr. 1
91058 Erlangen

Projektübersicht

Hochparallele Berechnung vieler innerer und eng benachbarter Eigenwerte fermionischer und hochangeregter exzitonischer Systeme

Dieses Projekt beschäftigt sich mit der optimierten hochparallelen Implementierung der Chebyshev-Filterdiagonalisierung (ChebFD), eines Algorithmus zur Berechnung ganzer Blöcke von Eigenwerten und zugehöriger Eigenvektoren eines gegebenen Hamilton-Operators. Ausgehend von einer vorliegenden ChebFD-Implementierung, die auf der GHOST-Bibliothek aufbauend bereits hohe Effizienz auf Knotenebene erreicht, wird eine neue zweistufige Parallelität eingeführt. Diese erlaubt die variable Verteilung der einzelnen Suchraumvektoren und des ganzen Suchraums auf die jeweiligen Rechenknoten. Dabei muss der durch die zweistufige Parallelität erhöhte Kommunikationsaufwand der Orthogonalisierung nach Anwendung des Polynomfilters gegen den Kommunikationsoverhead der Matrix-Vektor-Multiplikation während der Anwendung des Polynomfilters abgewogen werden. Die Frage, wie die Aufteilung auf die verschiedenen Ebenen der Parallelität am effizientesten zu erfolgen hat, ist Gegenstand des Projekts. Der entwickelte Code wird zunächst anhand typischer, aus der Quantenphysik fermionischer Systeme motivierter Beispielmatrizen getestet und dann auf die Beschreibung hochangeregter exzitonischer Zustande (Rydberg-Exzitonen) angewendet, wie sie z.B. im Kupferoxydul kürzlich experimentell nachgewiesen wurden. Von Interesse sind dabei vorrangig die Abweichungen von einem Wasserstoff-ähnlichen Spektrum, die durch ein mikroskopisches Gittermodell beschrieben werden sollen. Eine Abschätzung des benötigten Hauptspeichers ergibt, dass zur Lösung dieses hochaktuellen Problems mittels ChebFD mehrere zehn bis hundert Knoten eines modernen Multicore-Clusters benötigt werden.