Support de cours pour Python au master TAL de l'INaLCO
Projet à rendre le 10 janvier 2020 au plus tard
Framapad avec vos questions/réponses : https://bimestriel.framapad.org/p/9dxn-projet-python2019-m1-inalco
Projet individuel ou collectif, par groupe de 2
Le rendu devra comporter :
une documentation du projet traitant les points suivants :
Les objectifs du projet
Les données (origine, format, statut juridique) et les traitements opérés sur celles-ci
Les méthodes utilisées (comment vous vous êtes répartis le travail, comment vous avez identifié les problèmes et les avez résolus, différentes étapes du projet, …)
L’implémentation ou les implémentations (modélisation le cas échéant, modules et/ou API utilisés, différents langages le cas échéant)
Les résultats (fichiers output, visualisations, …) et une discussion sur ces résultats (ce que vous auriez aimé faire et ce que vous avez pu faire par ex.) C’est de la doc technique, pas une dissertation. La doc pourra prendre la forme d’un ou plusieurs fichiers, d’un site web, d’un notebook, à votre convenance
le code Python et les codes annexes (JS par ex.) que vous avez produit.
Le code doit être commenté.
les données en input et en output (ou un échantillon si le volume est important)
Vous choisirez un sujet parmi les deux :
Open Data
Vous travaillerez sur 3 données issues de l’open data.
Vous travaillerez sur ces données, soit avec sqlite3 soit avec pandas de façon à répondre aux questions suivantes:
N’hésitez pas à produire des graphiques.
UD et graphes
Vous concevrez un programme ou un module qui prend en entrée un fichier ou des fichiers au format UD. Chacune des phrases contenues dans le ou les fichiers d’entrée devra être représentée en mémoire sous forme de graphe.
votre programme devra être capable de trouver et afficher les chemins de dépendance entre deux mots (ou deux lemmes ou deux POS) donnés par l’utilisateur.
Sur les graphes et leur implémentation vous pouvez consulter Graphs in Python, Python Patterns - Implementing Graphs et également la documentation de l’outil Grew