Skip to main content

Scikit-learn et rapids

Scikit-learn n'est disponible par défaut que sur cpu. Si vous souhaitez utiliser des librairies de machine learning qui utilisent le GPU, vous pouvez utiliser les librairies fournies par Nvidia comme cuML uniquement. Pour vous permettre les 2 utilisations, nous avons créé un conteneur apptainer en adaptant pour TURPAN le conteneur rapids de Nvidia depuis le NGC. Il contient l'ensemble des programmes et librairies décrit ici : https://catalog.ngc.nvidia.com/orgs/nvidia/teams/rapidsai/containers/notebooks

Utilisation du conteneur rapids

Il y a deux façons d'utiliser ce conteneur :

Vous pouvez utiliser le conteneur dans un script sbatch. Dans l'exemple ci-dessous avec une réservation de 1 cœur CPU et 1 GPU :

#!/bin/bash
#SBATCH -J mon_job
#SBATCH -p shared
#SBATCH --nodes 1
#SBATCH --ntasks 1
#SBATCH --time=0:15:00
#SBATCH --gres=gpu:1

apptainer exec --bind /tmpdir,/work --nv /work/conteneurs/sessions-interactives/rapids-notebooks-24.02-cuda12.0-py3.10-si.sif python mon_script.py
info

Le conteneur n'a accès par défaut qu'à votre espace $HOME. Si vous avez besoin des espaces WORK /work ou SCRATCH /tmpdir vous pouvez les accrocher en utilisant l'option --bind d'Apptainer par exemple :

apptainer exec --bind /tmpdir,/work --nv ...

Pour plus d'information

Pour plus d'information sur l'utilisation des conteneurs Apptainer :

Conteneur rapids et modules python supplémentaires

Utilisez la commande conda env list pour trouver le chemin de votre environnement Conda

$ conda env list 
# conda environments:
myenv3 /users/sysadmin/user_name/.conda/envs/myenv3
base /usr/local/miniconda/25.1.1
python-3.10.9 /usr/local/miniconda/25.1.1/envs/python-3.10.9
python-tools-3.10.9 /usr/local/miniconda/25.1.1/envs/python-tools-3.10.9

Le chemin sera ensuite utilisé pour l’ajouter au conteneur Apptainer, comme montré dans le script suivant.

#!/bin/bash
#SBATCH -J mon_job
#SBATCH -p shared
#SBATCH --nodes 1
#SBATCH --ntasks 1
#SBATCH --time=0:15:00
#SBATCH --gres=gpu:1

ENV_PATH=/tmpdir/user_name/.conda/envs/myenv3

apptainer exec \
--nv \
--bind /tmpdir,/work \
--env PYTHONUSERBASE=$ENV_PATH \
--env LD_LIBRARY_PATH=$ENV_PATH/lib:$LD_LIBRARY_PATH \
/work/conteneurs/sessions-interactives/rapids-notebooks-24.02-cuda12.0-py3.10-si.sif \
python mon_script.py