03/12/2014

Le CERN rend publiques des données des expériences LHC

Précurseur des problématiques liées au partage d’information de calcul sur de grands volumes de données, le CERN a lancé il y a quelques jour son ortail des données ouvertes. Des données issues de véritables collisions produites par les expériences LHC seront pour la première fois mises librement à la disposition de tous. Outre le grand intérêt qu’elles devraient présenter pour les chercheurs, ces données seront également utilisées à des fins pédagogiques.

C’est un pas de plus pour le CERN (Organisation européenne pour la recherche nucléaire) dans l’ouverture des données au public. Bien que le principe d’ouverture soit inscrit dans convention constitutive de l’organisation, seules les publications du LHC (grand collisionneur de hadrons) étaient mises à disposition pour être lues et réutilisées librement à ce jour. L’ensemble des instituts collaborant à l’expérience a donc décidé d’approuver des politiques d’accès libre aux données, qui leur permettront ces prochaines années de publier des données relatives aux collisions.

Un portail dédié

capture d'écran cms

Cette image d’une collision entre protons enregistrée par le détecteur CMS est accessible via le Portail des données ouvertes (Image: Open Data Portal/CMS )

Les premières données de collision de haut niveau analysables et disponibles en libre accès proviennent de l’expérience CMS. Elles ont été initialement collectées en 2010 durant la première exploitation du LHC. Cet ensemble de données est désormais disponible au public sur le Portail des données ouvertes du CERN (opendata.cern.ch). Des logiciels libres permettant de lire et d’analyser les données sont également disponibles, de même que la documentation correspondante. La collaboration CMS s’engage à publier ses données trois ans après leur collecte, une fois qu'elle les aura étudiées en profondeur.

« Il s'agit d'une toute nouvelle initiative ; nous sommes curieux de voir comment les données seront réutilisées, a commenté la coordinatrice de la préservation des données de CMS, Kati Lassila-Perini. Nous avons préparé des outils et exemples de différents niveaux de complexité, allant de l’analyse simplifiée à des applications en ligne faciles d’emploi. Nous espérons que ces exemples stimuleront la créativité des utilisateurs externes. »

Un objectif pédagogique

En parallèle, le Portail des données ouvertes du CERN donne accès à des ensembles de données complémentaires des collaborations ALICE, ATLAS, CMS et LHCb, qui ont été préparés spécialement à des fins pédagogiques, par exemple pour les master classes internationales en physique des particules, auxquelles participent chaque année plus de dix mille élèves du secondaire. Ces ressources sont assorties d’outils de visualisation.

Le royaume du Pétaoctet de données

Les données extraites de l’expérimentation CMS (Compact Muon Solenoid) sont de loin les plus volumineuses. Quelques jeux de données dépassent ainsi les 2,5 To. L’expérimentation Alice fournit quant à elle des jeux pouvant dépasser les 600 Mo. Les données pour les capteurs Atlas et LHCb sont également publiées. Pour rappel, le LHC génère en effet environ15 pétaoctets de données à traiter chaque année.

source : http://home.web.cern.ch/fr/

Actualités