Supercomputer für die KI-Forschung gibt es schon einige, auch in der Schweiz, aber für den kommerziellen Einsatz bisher keinen. Seit dem 17. Juni steht einer in Arlesheim bei uptownBasel.
Im Rechnerraum von uptownBasel liegt violettes Licht über den Racks, das Surren der Kühlung füllt den Raum. Die Stromkabel seien so dick, dass man sie kaum tragen könne, lacht Thomas Taroni, Co-Gründer und CEO von Phoeniqs, und zeigt auf den Supercomputer, den er und sein Team gerade in Betrieb genommen haben. So nebenbei: Das Unternehmen aus Pfäffikon SZ gilt seit einer Finanzierungsrunde mit einer Bewertung von 1,2 Milliarden Franken als jüngstes Schweizer Unicorn.
192 Nvidia H100 GPUs stecken in sechs Racks, dazu 48 Terabyte RAM, 2’304 CPU-Kerne und ein Netzwerk mit 38,4 Terabit pro Sekunde aggregierter Bandbreite. Vier weitere Racks steuern Netzwerk, Storage und Kontrolle. Phoeniqs betreibt das System gemeinsam mit dem Innovationscampus uptownBasel und dem Arealentwickler Fankhauser. Entwickelt wurde es auf Basis von Technologie von Nvidia, IBM und Dell.
Wer einen Agenten bauen will, steht bei Forschungsrechnern vor verschlossenen Türen
Die Zahl 192 klingt respektabel, sie ist allerdings im internationalen Vergleich bescheiden. Am CSCS in Lugano, am Forschungszentrum Jülich, in den Rechenzentren der grossen Hyperscaler rechnen Systeme mit tausenden GPUs. Taroni weiss das: «Die sind zwar grösser als unserer, aber der gewinnbringende Unterschied liegt woanders.» Forschungsrechner seien für Firmen kaum zugänglich, die Wartezeiten lang, der Zugang über Forschungsanträge geregelt. GPU-Instanzen bei Hyperscalern wiederum böten typischerweise einzelne Karten oder kleine Cluster, keinen Supercomputer. Taroni: «Es ist relativ schwierig für eine Firma, die schnell einen Agenten bauen will und am Nachmittag für 300 Franken etwas machen will.»
Was einen Supercomputer von einem GPU-Cluster unterscheidet, ist das Netzwerk. Die 38,4 Terabit pro Sekunde halten alle 192 GPUs parallel, sodass Modelle trainiert und betrieben werden können, die auf Einzelkarten nicht laufen würden. Phoeniqs positioniert das System primär als Inferencing-Plattform: Fertig trainierte Modelle werden hier betrieben, die Antworten gehen an die Kunden. Training ist laut uptownBasel ebenfalls möglich, der Schwerpunkt liegt aber auf dem Betrieb. Das hauseigene Sprachmodell Apertus etwa wurde am CSCS in Lugano trainiert und läuft in Arlesheim.
30 Agenten, elf Minuten, eine komplette Software
Was das konkret heisst, zeigt Taroni rund zwei Dutzend Journalisten aus der Schweiz. Auf dem Supercomputer laufen 30 KI-Agenten gleichzeitig. Sie übernehmen Requirements-Engineering, programmieren in sechs bis sieben Sprachen und liefern nach elf Minuten eine fertige Software inklusive Deployment. Das Agenten-Framework koordiniert die Arbeit, ein Orchestrierungssystem teilt Aufgaben zu, prüft Ergebnisse und setzt sie zusammen.
Dahinter steckt eine Infrastruktur, die Phoeniqs selbst gebaut hat. Das Cloud-Betriebssystem stammt aus eigener Entwicklung, ebenso das Agenten-Framework. Taroni betont, dass zwischen dem Benutzer und dem Sprachmodell hunderte kleine Applikationen liegen, eine Middleware-Schicht, die bestimmt, wie Anfragen verarbeitet, gefiltert und gesteuert werden. Der Kunde definiert die Regeln für seine Agenten selbst. Phoeniqs setzt dabei auch auf Open-Source-Modelle und Apertus, das in Lugano trainiert und in Arlesheim betrieben wird. Die gesamte Wertschöpfungskette, vom Training über die Daten bis zum Betrieb, verbleibt laut Taroni in der Schweiz.
Der Schlüssel liegt nicht im Chip
Phoeniqs kontrolliert den gesamten Technologie-Stack: von der eingekauften Hardware (Chips kommen aus den USA und Taiwan) über das Betriebssystem bis zur Cloud-Plattform und den Agenten. Kein VMware, kein eingekaufter Lizenz-Stack. Taroni: «Wir sind ja keine Chip-Factory. Wir haben das Betriebssystem obendrauf getan.»
Ein konkretes Differenzierungsmerkmal: Confidential Computing mit Bring-Your-Own-Key. Der Kunde hält die Verschlüsselungsschlüssel, der Provider kann die Daten weder einsehen noch herausgeben. Taroni beschreibt das als aktive Entscheidung: «Das ist etwas, das man als Provider fällt, ob man das erlaubt oder eben nicht.» Hyperscaler böten das laut Taroni in der Regel nicht an, weil es ihr Geschäftsmodell tangiere.
Auf die Frage nach den Nachteilen antwortet Taroni offen: Technologisch sehe er keinen Rückstand. Bei der globalen Präsenz schon. «Wenn jemand 5’000 Büros hat, across the globe, da sind wir nicht präsent.» Die Kosten seien kompetitiv, weil kein eingekaufter Lizenz-Stack die Margen aufblase.
Drei Megawatt, 145’000 Volt, und die Abwärme heizt die Nachbarschaft
Die Infrastruktur unter dem Rechner hat Hans-Jörg Fankhauser geplant, der Architekt und Arealentwickler von uptownBasel. Die Stromstrategie stand, bevor der erste Chip bestellt wurde. Das Areal hängt über ein eigenes Unterwerk am 145-kV-Netz von Swissgrid und Primeo Netz. Drei Transformatoren mit je 40 MVA wandeln die Spannung auf 20’000 Volt herunter, rund 30 lokale Transformatoren regeln weiter auf 400 Volt. Für den AI-Betrieb stehen drei Megawatt bereit.
Fankhauser hat nach eigenen Angaben bereits 160 MVA unter Vertrag gesichert. Den dritten Transformator hat er kürzlich gekauft, ein vierter ist in Planung. Die Kühlung läuft als geschlossener Wasserkreislauf, verdunstungsfrei, direkt am Rack. Die Abwärme verlässt die Racks mit rund 50 Grad Celsius, wird in Warmwasser umgewandelt und speist den regionalen Wärmeverbund Birstal von Primeo Wärme. Eine Rohrleitungsbrücke über die Autobahn A18, nachts montiert im Februar 2023, verbindet das Areal mit den Wärmenetzen in Reinach und Münchenstein.
Fankhauser sagt dazu: «Datacenter bekommen kein Geld mehr von Banken, wenn sie die Abwärme nicht nutzen können.» Das Energiekonzept von uptownBasel sei kein Nachhaltigkeitsprojekt gewesen, sondern Finanzierungsvoraussetzung.
Zwei Reihen sind frei, die nächste Generation kommt
Im Rechnerraum stehen zwei Reihen leer. Taroni plant bereits den nächsten Ausbau, ausschliesslich mit wassergekühlten Chips der nächsten Generation. Die Dimensionen verschieben sich: Ein Rack verbraucht heute typischerweise 100 Kilowatt. In Forschungslabors existieren bereits Racks mit 600 Kilowatt bis einem Megawatt. Was heute eine ganze Reihe füllt, passt demnächst in einen Block.
Die eigentlich erstaunliche Zahl betrifft die Software: Innerhalb von anderthalb Jahren habe sich die Effizienz so weit verbessert, dass dasselbe Megawatt 4’000 Mal mehr Anfragen bediene als bei der Inbetriebnahme. Taroni: «Das ist ein technologischer Fortschritt, den darf man nicht unterschätzen.»
Auf dem uptownBasel-Areal, zehn Minuten von Basel, arbeiten heute 18 Firmen. Ein IonQ-Quantencomputer steht bereits auf dem Areal, ein NorthC-Rechenzentrum folgt im Herbst 2026. Geplant sind 2’500 Arbeitsplätze auf 75’000 Quadratmetern, bei einem Investitionsvolumen von über 500 Millionen Franken. Auf dem Areal steht auch ein Quantencomputer von IonQ, betrieben von QuantumBasel. Der Quantenchip braucht laut Angaben der Betreiber fast keinen Strom und erzeugt kaum Abwärme. Die Kombination beider Systeme dürfte langfristig die interessantere Skalierungsstrategie sein als immer mehr GPUs.
Passend zu diesem Artikel
Impressum
Autor: Eugen Albisser
Bildquelle: uptownBasel / Eugen Albisser
Weitere Artikel
Veröffentlicht am: