communaute:sapi:sapi:sapis2025:r4multidata

Le projet R4multidata a été officiellement ouvert le 28/01/2025.

Objectif : La communauté R4multidata vise à créer un environnement standardisé pour tester et comparer des fonctions de packages R avec des données réelles et simulées. Au départ, les packages RGCCA et mixOmics seront utilisés, avant de s’intéresser à d’autres packages. Quatre méthodes sont envisagées prioritairement : l’analyse canonique des correspondances régularisée généralisée sparse ou classique ((sparse)RGCCA) et la régression PLS sparse ou classique ((sparse)PLS).

Livrables :

  • Un compte rendu des analyses et comparaison (méthodologie appliquée, résultats) avec des recommandations
  • soit un webinaire ouvert à tous les membres de CATIs, soit des interventions dans des Assemblées Générales ou animations scientifiques de CATIs, équipes ou unités des agents ayant participé au projet.
  • une communication via le forum de la DipSO, et lors des séminaires de cohésion CATI/PEPI/Pépinière.
  • les jeux de données, scripts et dockers d’exécution qui auront servi au travail de comparaison, mis à disposition via un entrepôt de données (data.gouv.fr) sous licence, et la forge institutionnelle.

Phases du projet :

  • préparation du travail de comparaison de fonctions de packages R (5 mois ⇒ janv – mai 25) : Théorie des méthodes; établissement des critères de comparaison, et du plan de comparaison pour prendre en compte différentes structures de données qui peuvent impacter les résultats; mise en place des outils collaboratifs de travail; préparation des jeux de données réelles et simulées
  • travail de comparaison lors d’un hackathon (2 jours ⇒ mai 2025): programmation sous R, application aux données, synthèse des résultats obtenus.
  • l’analyse et mise en forme des résultats (3 mois ⇒ juin - aout 25)
  • la diffusion des résultats (3 mois ⇒ sept-nov 25)

Etat d'avancement :

préparation du travail de comparaison de fonctions de packages R

  • outils collaboratifs mis en place: projet sur la forge institutionnelle, espaces collaboratifs de travail, tutoriels pour l'utilisation des outils
  • jeux de données: les données de 3 projets ont été packagées et déposées sur la forge institutionnelle

travail de comparaison lors d’un hackathon

le hackathon s'est déroulé du 20 au 22 mai 2025 à Balma

l’analyse et mise en forme des résultats

les résultats sont accessibles sur le site internet du projet https://r4multidata.pages-forge.inrae.fr/r4manalysis/

la diffusion des résultats

en plus de la communication sur le site internet https://r4multidata.pages-forge.inrae.fr/r4manalysis/ , une présentation du projet et des résultats a eu/aura lieu:

  • lors de l'AG du CATI codex (mars 2025)
  • lors du séminaire interCATI/PEPI 2G (juin 2025)
  • lors des journées du PEPI IBIS (octobre 2025)
  • lors du congrès Chimiométrie (poster, février 2026)
  • lors du séminaire interCATI/PEPI 2G (mai 2026)
  • lors des journées de la SFdS (communication orale, juin 2026)
  • lors du webinaire du PEPI 3G (juin 2026)
  • lors des rencontres R (poster, juin 2026)
  • communaute/sapi/sapi/sapis2025/r4multidata.txt
  • Dernière modification : 2026/05/20 11:27
  • de mbrandolini