Machine HPC/IA codes formation

L’objectif est de mettre en place un équipement mutualisé national distribué sur 6 sites pour répondre à 2 besoins : offrir un équipement de recherche de pointe pour le développement d'applications scientifiques et de codes de calcul et ouvrir l’équipement aux formations de l'enseignement supérieur. L’infrastructure matérielle et logicielle choisie hétérogène et comporte 3 partitions : 

  • Une machine dite CPU avec 2 configurations basées sur les 2 principaux constructeurs de processeurs (Intel et AMD), 
  • Une machine dite GPU en 3 tranches dotées de serveurs accélérés par des unités graphiques spécifiques pour répondre à l’ensemble des usages actuels HPC et IA.
  • Une OPENSTACK avec un environnement logiciel de type cloud pour les usages différents et complémentaires, basées sur un environnement de type cluster. 
Il n'y a pas de limitation géographique aux usages. Les utilisateurs peuvent venir de n'importe quelle région  française et sont orientés sur les machines et partitions en fonction de leurs besoins.

A ce jour, les investissements machines sont les suivants:

Nantes

  • Noeuds de calcul Bull Sequana X440    X 30 (+ 2)
    • Intel Sapphire Rapids (48 cœurs, 2.1 GHz)         X  2
    • 256 Go DDR (+ 2 * 2 To DDR) + 960 Go SSD
  • Noeuds de visualisation Bull Sequana X450    X 2
    • Intel Sapphire Rapids (48 cœurs, 2.1 GHz)         X  2
    • 512 Go DDR + 960 Go SSD
    • GPU Nvidia A40 48 Go       X 2
  • Refroidissement DLC
  • Network : IB 100 Gb + 25 Gb eth
  • GPFS : 285 To utiles
  • 1 login
  • 5 ans de maintenance
  • Disponible décembre 2023

Reims - Machine "Juliet"  

  • Serveur Apollo 6500 XL675d Gen10 Plus   X 3
  • AMD EPYC 7663 (56 cœurs, 2.00GHz)    X  2
  • NVIDIA A100, 80 GB                             X  8
  • NVSWITCH
  • 2 To DDR + 90 To SSD
    • 4 cartes IB
    • 7 ans de maintenance
    • NVIDIA-Certified Systems
  • Network : IB 200 Gb + 10 Gb eth
  • BEEGFS (co-financement Grand Reims)
  • Support 5 ans suite compilateur NVIDIA :
  • 2 servers login / admin
  • Profilers I/O
  • Disponible septembre 2023

Lille - Machine "Zen" 

  • 72 Noeuds de calcul 
    • 2 x AMD EPYC Genoa 9534 (64 cœurs, 2.45 GHz)
    • 384 Go DDR5 + 960 Go SSD ( 2 nœuds “FAT” avec 3 To DDR5)
  • Noeud de visualisation
    • 2 x AMD EPYC Genoa 9534 (64 cœurs, 2.45 GHz)
    • 384 Go DDR5 + 960 Go SSD
    • 2 x GPU Nvidia A40 48 Go
  • Network : OmniPath 100 Gb + ethernet 10 Gb
  • BeeGFS : 1 Po utile
  • 1 nœud de login
  • 5 ans de maintenance
  • Disponible fin 2023

Strasbourg 

  • 3 noeuds de calcul GPU
    • HPE Apollo 6500 Gen10 Plus
    • 10 x GPU AMD MI210 64 Go
    • 2 x bridge Infinity pour 4 GPUs
    • 2 x AMD EPYC 7643 48 cœurs 2.3 GHz
    • 2 To RAM DDR4
    • 15 To NVme 
    • 1 port Infiniband
    • 5 ans de maintenance
  • Pile AMD ROCm Open Software Platform
  • Réseau : IB 100 Gb + 25 GbE
  • 2 serveurs de login et stockage
    • HPE DL385 Gen10 Plus
    • 2 x AMD 7313 16 cœurs, 256 Go RAM
    • 212.8 Tio nets SATA
  • Livraison juin 2023, installation en cours, en production après audit de sécurité (12/2023)