Dès vous êtes arrêté sur un sujet, faîtes m’en part pour le valider.
Créer un classifieur de documents.
Il faudra utiliser plusieurs algorithmes, plusieurs jeux de features et les évaluer.
Vous choisissez le jeu de données. Évitez les données en langue anglaise dans la mesure du possible.
Si vous n’avez pas d’idées vous pouvez utiliser Wikinews et chercher à retrouver les catégories
thématiques d’articles.
Reporting sur un channel discord du serveur Plurital.
Avec par exemple le nombre participants, le nombre de posts par participants, le nombre de liens/gifs, le nombre de questions, de réponses, etc…
Vous devrez générer des graphiques pour présenter les résultats, idéalement dans une page web.
Proposez un bot pour le serveur Plurital qui puisse offrir des services intéressants et/ou divertissants pour notre communauté.
Le rendu devra comporter :
Une documentation traitant les points suivants :
On attend de la documentation technique, pas une dissertation. Elle pourra prendre la format d’un ou plusieurs fichiers, d’un site web, d’un notebook de démonstration, à votre convenance
Le code Python et les codes annexes (JS par ex.) que vous avez produit.
Je veux du code structuré, écrivez des fonctions, des modules. Appliquez ce qu’on a vu en cours.
Le code doit être commenté. Des tests ce serait bien. Évitez les
notebooks pour le projet.
Les éventuelles données en input et en output (ou un échantillon si le volume est important)
Écrivez ! Tenez un carnet : vos questions, un compte-rendu de vos discussions, les problèmes rencontrés, tout est bon à prendre et cela vous aidera à rédiger la documentation finale.