Stage M2 Informatique : Développement d’une application Web : création du pipe-line global

 

 

(STinfo1) Offre de stage  M2 Informatique : (pdf)

Développement d’une application Web de visualisation des trajectoires de masses d’air : création du pipe-line global

 

Localisation

Centre INRA / PACA / Avignon
 

Unité de Recherche

Biostatistique et Processus Spatiaux (BioSP)

Niveau du stage

Master II Informatique

Durée

6 mois – démarrage au plus tôt à partir de janvier 2019

Gratification de stage

(«3.75€ / h) soit environ 550€  net par mois

Personne à contacter

hervé.richard@inra.fr / 04 32 72 21 79

 

Résumé du projet scientifique

La dispersion de particules biologiques (e.g., bactéries, spores fongiques et pollen) par voie aérienne à longues distances est un processus de premier ordre pour de nombreuses dynamiques démo-génétiques de populations, en particulier dans le cadre de la santé des plantes. Pouvoir estimer les flux troposphériques au sein d’un réseau constitué d’un grand nombre de sites répartis sur une grande zone géographique offrirait la possibilité de comprendre et prédire les processus et patrons liés auxdites dynamiques démo-génétiques, et de concevoir des stratégies pertinentes d’observation et de contrôle.

Le projet Tropolink, a pour objectif de déployer un prototype de plate-forme Web de calcul spécifique, qui permettra à l’utilisateur d'estimer les connectivités induites entre de nombreux sites par les mouvements des masses d’air qui constituent l'un des modes de transport de base des particules biologiques.

 

Objectif de la composante informatique du projet

Il s’agit de mettre en place une plate-forme Web proposant un ensemble d’outils pour calculer et dessiner des cartes géographiques sur lesquelles sont représentées les zones à haut potentiel de contact de différentes masses d’air au cours de leurs différentes (rétro-)trajectoires.  Les plus-values technologiques attendues par cette plate-forme sont :

  • Une simplification de l’enchaînement des étapes jusqu’au calcul des matrices de connectivités et de la visualisation des graphes. 

  • La mise à disposition d’un ensemble d’outils pour explorer et analyser les graphes de connectivité (zoom, sélections, déformations, …). À noter que l’ensemble des fonctionnalités devra être bien identifiées par le pool de testeurs. 

  • Un mécanisme de gestion des études réalisées afin d’offrir la possibilité de les stocker et les rejouer avec de nouveaux paramètres Tropolink sans avoir à relancer la phase de calcul des trajectoires avec Hysplit. 

 

Objectif du stage

On peut décomposer en 6 étapes l’exploration des graphes issus des matrices de connectivités. Le paramétrage des valeurs est réalisé par l’utilisateur via une interface avec des champs de réponse contraints à l’aide de widgets.  

  • Étape 0 : Recueillir les données météo.   

  • Étape 1 :  Paramétrer le logiciel de calcul de trajectoire .   

  • Étape 2 : Générer le script d’exécution des calculs. 

  • Étape 3 : Lancer le script sur un calculateur. 

  • Étape 4 : Lancer le traitement des résultats  en post-analyse pour construire la matrice de connectivité et tracer la carte des trajectoires et des zones de contact. 

  • Étape 5 : Exploration dynamique des graphes. 

 

Chaque étape propose une sauvegarde dans un fichier ré-utilisable. l’utilisateur doit pouvoir sans ambiguïté modifier les valeurs des paramètres directement en éditant le fichier sans avoir à repasser par l’interface. Il peut également recharger dans l’interface les valeurs sauvegardées pour pour les modifier.

Actuellement les différentes étapes du pipe-line (sauf l’exploration graphique qui n’est pas en œuvre) sont réalisées « à la main » par les chercheurs qui souhaitent explorer des matrices de connectivités dans le cadre de leurs travaux. Pour ce faire un certain nombre de programmes et fonctions ont été développés par eux sous R.

L’objectif de ce stage consiste à réaliser un programme informatique cohérent à partir du code existant pour en faire un programme couvrant toutes les différentes étapes du pipe-line jusqu’à la phase d’analyse des graphes et à connecter l’ensemble du code à l’interface graphique.

Le stagiaire devra donc produire tout le code du back-office enchaînant les étapes du pipe-line en Python sous forme de modules complets et documentés.

L’interface constitue un lot spécifique qui devrait être développé par un prestataire informatique avec lequel le stagiaire pourra interagir si besoin. Selon les disponibilités le stagiaire pourra également participer à la réflexion sur la définition des besoins (identification des fonctions, choix des bibliothèques, …) concernant les manipulations des graphes en coordination avec l’ingénieur en charge de cette partie.

 

Environnements, langages

  • La PF sera développée dans l’environnement Jupyter (http://jupyter.org/

  • Distribution et configuration sous Anaconda (https://www.anaconda.com/

  • Sous cet environnement, les langages et bibliothèques  utilisées sont : 

    • Python 3 (IPython),   

    • R (Rpy2), 

    • Bokeh (en cours d’évaluation) 

  • Le formalisme des fichiers reste à déterminer parmi :XML (ou variante comme MatML), CSV, yaml, …