25 septembre 2025

Claire Hoede, Philippe Bordron, and all the bioinfo-genotoul team

Lettre d'information de la plateforme n°44¶

Info

Cette lettre d'information est destinée aux membres des équipes utilisant la plate-forme Genotoul-Bioinfo. Elle a pour but de répondre aux questions et commentaires que vous nous avez fait remonter via le questionnaire de satisfaction annuel et de vous parler des évolutions de l'équipe, les nouveaux outils, services, conditions d'utilisation, projets et formations mis en place.

Migration vers Bluesky

Comme nous vous l'avons annoncé le 16 juillet dernier, nous avons quitté Twitter pour Bluesky. Vous pouvez dorénavant nous suivre sur le compte bioinfo-genotoul

Évolutions de l’infrastructure¶

Évolution du site web¶

Comme vous pouvez le constater au travers du format de cette lettre info, le site web de la plateforme a évolué. En mai dernier, nous avons déporté la FAQ et ajouté des tutoriaux sur ce site plus performant et permettant d'effectuer des recherches plus efficaces. Ce mois-ci, nous avons déplacé la section « About us » ici, afin qu'elle bénéficie des mêmes améliorations. À terme, nous comptons faire de même pour la quasi totalité du site.

Évolution des noeuds GPU¶

Comme annoncé dans la lettre d'info précédente, nous avons renforcé nos capacités de calcul grâce à l'achat de deux nouveaux serveurs GPU (gpu02 et gpu03). Vous avez dorénavant 8 cartes NVIDIA L40S 48GB à disposition, en plus des 4 cartes NVIDIA A100 80GB déjà présentes sur le cluster (gpu01). Chaque nouveau serveur est équipé de 256 coeurs, 1.5TB de RAM et 4 cartes L40S-48GB. Vous ne pouvez cependant qu'utiliser 2 cartes à la fois. Voici la syntaxe SLURM pour y accéder (exemple) :

srun -p gpuq --gres=gpu:nvidia_l40s:1 nvidia-smi -L

Merci de bien vouloir remonter toutes vos remarques éventuelles à : support.bioinfo.genotoul@inrae.fr

Nous en profitons pour vous rappeler qu'il est nécessaire de demander l'accès aux GPU avant de pouvoir les utiliser. La demande se fait via le formulaire "Resources request". L'utilisation des GPUs est décrite dans notre FAQ. Nous rappelons aussi à ceux qui ont accès aux GPU que le script sq_gpu vous permet de savoir quelles partitions ou cartes sont libres.

Récupération des données des stagiaires¶

La période des stages vient de se terminer. Nous vous rappelons les règles suivantes des comptes cluster à ce propos:

Les données sur le save d'un compte sont conservées pendant 3 mois après la clôture de ce compte. Passé ce délai, elles sont supprimées définitivement.
Comme n'importe quel compte, le compte d'un stagiaire est personnel. Les encadrants ne peuvent pas récupérer eux-mêmes les données que le stagiaire a stocké sur ses espaces personnels (son home, save et work). C'est au stagiaire de leur transmettre.

Vous trouverez plus de détails dans notre charte.

Nous vous conseillons d'anticiper le départ de vos stagiaires en leur demandant de vous transmettre une copie de toutes leurs données de stage avant la fin de celui-ci. Si nécessaire, mettez à jour votre modèle de convention de stage pour définir les modalités du transfert des données.

Vous pourrez également demander un espace projet (soumis à facturation) lors de l'accueil de vos prochains stagiaires, afin de faire en sorte que les données ne soient pas stockées sur l'espace personnel de quelqu'un.

Le coin des débutants¶

Prochains cycles d’apprentissage¶

Les inscriptions pour nos cycles d'apprentissage de fin d'année sont ouvertes. En partenariat avec la plateforme Sigenae, nous vous proposons les sessions suivantes:

Formation	Dates
Linux	18/11/2025
Cluster	19/11/2025
Using sed and AWK to modify large text files	20/11/2025
RNAseq alignment, quantification and transcript discovery with statistics	24/11/2025 – 27/11/2025
How to run a nf-core nextflow workflow on genotoul ?	01/12/2025
Improve your command line skills by learning a few words of Perl	08/12/2025
Short-read alignment and small size variants calling	15/12/2025 – 16/12/2025

Les inscriptions ainsi que le détail des sessions sont disponibles sur la page des cycles d'apprentissage de la plateforme.

Nous attirons également votre attention sur le calendrier des formations et cycles d’apprentissage de l’IFB et de la plateforme GenoToul Biostat.

Manuels simplifiés (tldr)¶

Si le manuel d'une commande linux vous semble complexe, jetez un coup d'oeil aux pages tldr qui est un effort collectif de simplifier les pages de manuels

Journée bioinfo-biostat¶

Comme chaque année, nous co-organisons, avec la plate-forme Genotoul-biostat, la Journée bioinfo-biostat. Elle se tiendra cette année le 6 novembre. Pour nous permettre de vous accueillir tous, nous avons décidé d'utiliser un amphi légèrement plus grand, dans le nouveau bâtiment PAPS-B, toujours sur le campus INRAE d'Auzeville.

Les oratrices invitées sont:

Flora Jay, de Paris Saclay,
Celine Scornavacca, de Montpellier.

Les inscriptions sont gratuites, mais obligatoires.
Toutes les informations se trouvent sur la page de la journée. Attention, il reste peu de places.

N'hésitez pas à proposer des soumissions avant le 3 octobre!

FROGSDays¶

L'équipe de FROGS nous partage ce message :

Nous avons le plaisir de vous annoncer la tenue des premiers FROGSDays, un symposium dédié aux enjeux techniques et méthodologiques du métabarcoding microbien, qui se déroulera du 1^er au 3 décembre 2025 à INRAE Castanet-Tolosan (Toulouse). Cet événement s’adresse à toutes les personnes intéressées par le traitement et l’analyse de données de séquençage haut débit appliquées à la diversité microbienne – utilisateurs de FROGS ou non. Le programme mettra l’accent sur le partage d’expériences, les innovations bioinformatiques, et les perspectives du domaine. Des démonstrations d’outils, deux tables rondes, et des sessions posters rythmeront ces trois jours.

Inscriptions (gratuites mais obligatoires):

Ouverture le 1^er octobre 2025
Clôture le 7 novembre 2025

Toutes les informations (programme, soumissions, inscription) sont disponibles sur le site du symposium

N'hésitez pas à diffuser largement cette annonce !
Au plaisir de vous retrouver en décembre,

L’équipe d’organisation des FROGSDays
frogsdays(at)inrae.fr

Trucs et astuces¶

Banques¶

Sur le cluster, les banques sont disponibles dans /bank. N'hésitez-pas à fouiller dans ce répertoire ou bien consulter le site genobank (nécessite un compte sur la plateforme pour y accéder). Vous y trouverez les index blast (/bank/blastdb/), les index bwa (/bank/bwadb/), bowtie (/bank/bowtiedb/) et beaucoup d'autres formats. Vous trouverez plus d'informations ainsi que des exemples d'utilisation dans notre FAQ.

Créer un alias ssh¶

Si vous trouvez pénible de taper régulièrement ssh <login>@genobioinfo.toulouse.inrae.fr pour vous connecter au cluster, nous vous proposons d'ajouter un alias dans votre configuration ssh pour parvenir au même résultat en tapant ssh genobioinfo. Toute commande liée à ssh, comme la commande scp ou rsync, pourra utiliser cet alias sans configuration supplémentaire.

Cette astuce est valable si vous utilisez le client openssh (client par défaut sous Linux et macOS, aussi disponible sous Windows).

Sur votre poste de travail, vous devez éditer le fichier ~/.ssh/config(1) et ajouter le contenu suivant (cliquez sur (2) pour avoir un commentaire):

Sous Windows, vous devez éditer le fichier %userprofile%\.ssh\config, ce qui correspond au fichier C:\Users\<Mon-Utilisateur>\.ssh\config la plupart du temps.
Un commentaire

~/.ssh/config
Host genobioinfo # (1)!
    Hostname genobioinfo.toulouse.inrae.fr # (2)!
    User <login> # (3)!
    ServerAliveInterval 60 # (4)!
    ServerAliveCountMax 2

Défini l'alias, ici genobioinfo.
Adresse vers laquelle l'alias genobioinfo pointe, ici genobioinfo.toulouse.inrae.fr.
Login à utiliser pour se connecter sur le cluster. Remplacez <login> par votre login sur le cluster.
Les lignes 4 & 5 rendent la connection plus robuste aux coupures réseau (optionnelles)

Une fois le fichier enregistré, il suffit de taper ssh genobioinfo dans votre terminal pour vous connecter. Pour les autres commandes, le principe est le même: il suffit de remplacer le bloc <login>@genobioinfo.toulouse.inrae.fr par genobioinfo. Par exemple:

# Syntaxe sans aliasscp mes-sequences.fa <login>@genobioinfo.toulouse.inrae.fr:work/# Syntaxe avec aliasscp mes-sequences.fa genobioinfo:work/

Si vous souhaitez aller plus loin dans votre configuration ssh, vous pouvez consulter le manuel correspondant en tapant la commande man ssh_config dans un terminal.

IGV dans OOD¶

Afin de visualiser vos séquences, vous pouvez utiliser notre instance d'Open On Demand (OOD) pour lancer IGV dans un système Linux virtualisé sur le cluster. Il suffit de suivre notre tutoriel qui présente comment utiliser un bureau linux sous OOD (aussi accessible en tapant OOD dans la barre de recherche)

Lorsque vous arrivez sur le bureau linux, il suffit d'ouvrir un terminal et de suivre les instructions décrites dans 'How to use on Genobioinfo cluster' concernant IGV:

# On charge la dépendance java d'IGVmodule load devel/java/24.0.2# On rend accessible IGVmodule load bioinfo/IGV/2.16.1# On lance IGVigv.sh

capture run IGV

Environnements reproductibles avec conda¶

Si vous utilisez des environnements conda pour améliorer la reproductibilité de vos analyses, nous vous recommandons d'exporter vos environnements de deux façons. De la façon traditionnelle en utilisant la commande conda env export > environment.yml que nous avons décrit dans notre tutorial conda, mais aussi aussi en utilisant l'export explicite:

# Charge le module condamodule load devel/Miniforge/Miniforge3# Activer l'envsource activate /path/to/myenv# Export expliciteconda list --explicit > environment.txt# Réinstallation à l'identiqueconda create --prefix /path/to/my/newenv --file environment.txt

Cette manière permet de réinstaller un environnement à l'identique et n'échouera pas dans le futur même si paquets ont été supprimés des index conda (contrairement à la commande conda env create -f environment.yml). Elle est aussi plus rapide, car il n'y a pas de vérification de contraintes entre les paquets. Elle présente cependant quelques limites:

l'environnement ne peut-être réinstallé que sur la même architecture processeur (x86-64, arm64, ...) et le même OS (Linux, macOS, ...)
seuls les paquets existants dans les dépots conda seront pris en compte (la commande conda env export exporte aussi la liste des paquets installés avec pip)