Support de cours pour Python au master TAL de l'INaLCO
Projet à rendre le 13 janvier au plus tard
Projet collectif, par groupe de 2 ou 3 (sauf exception)
Le rendu devra comporter :
Les objectifs du projet
Les données (origine, format, statut juridique) et les traitements opérés sur celles-ci
Les méthodes utilisées (comment vous vous êtes répartis le travail, comment vous avez identifié les pbs et les avez résolus, différentes étapes du projet, …)
L’implémentation ou les implémentations (modélisation le cas échéant, modules et/ou API utilisés, différents langages le cas échéant)
Les résultats (fichiers output, visualisations, …) et une discussion sur ces résultats (ce que vous auriez aimé faire et ce que vous avez pu faire par ex.) C’est de la doc technique, pas une dissertation. La doc pourra prendre la format d’un ou plusieurs fichiers, d’un site web, d’un notebook, à votre convenance
Le code doit être commenté.
Open Data
Vous travaillerez sur au moins 3 données issues de l’open data dont l’une sera accédée via une API. L’idée ici est de croiser ces données, trouver des variables en commun pour créer un nouveau tableau de données.
Exemple : à partir des fichiers d’adresse des établissements d’enseignements supérieurs du premier et second degrés, des taux de chômage par département et de l’API des indicateurs relatifs à l’éducation prioritaire pour les écoles, vous dresserez un tableau des départements français où apparaitront le taux de chômage, le nombre d’écoles, collèges et lycées publics et privés, le nombre d’écoles en éducation prioritaire ainsi que le nombre d’élèves concernés.
Vous utiliserez le module requests pour interroger l’API.
UD et graphes
Vous concevrez un programme ou un module qui prend en entrée un fichier ou des fichiers au format UD. Chacune des phrases contenues dans le ou les fichiers d’entrée devra être représentée en mémoire sous forme de graphe.
votre programme devra être capable de trouver et afficher les chemin de dépendance entre deux mots (ou deux lemmes ou deux POS) donnée par l’utilisateur.
Sur les graphes et leur implémentation vous pouvez consulter Graphs in Python, Python Patterns - Implementing Graphs et également la documentation de l’outil Grew