Premier Lancement : De A à Z
Maintenant que votre environnement est configuré, nous allons lancer le pipeline complet en utilisant le notebook principal 00_master_pipeline.ipynb. Ce notebook orchestre toutes les étapes, de la sélection des données à la génération d'un rapport de session complet.
Si vous utilisez un Codespace, l'environnement est déjà prêt ! Vous pouvez directement ouvrir le dossier notebooks/ et lancer 00_master_pipeline.ipynb. Un petit jeu de données a même été téléchargé pour vous.
Étape 1 : Acquérir des Données (si nécessaire)
Si c'est votre toute première exécution en local, le dossier data/raw/ est vide.
- Ouvrez le notebook
notebooks/01_download_spectra.ipynb. - Utilisez l'interface interactive pour télécharger un premier lot de spectres (quelques centaines suffisent pour un test).
Étape 2 : Lancer le Pipeline de Production
Une fois que vous avez des données, le processus est entièrement automatisé.
- Ouvrez le notebook principal :
notebooks/00_master_pipeline.ipynb. - Exécutez toutes les cellules de haut en bas.
Le notebook va exécuter séquentiellement le MasterPipeline :
- Étape 2 : Sélection d'un lot de spectres non traités.
- Étape 3 : Génération d'un catalogue local pour ce lot.
- Étape 4 : Traitement & Extraction des Features (plus de 20 features par spectre).
- Étape 5 : Entraînement & Évaluation avec une interface interactive pour choisir entre
RandomForestetXGBoostet configurer le nombre d'estimateurs.
Étape 3 : Examiner les Résultats
À la fin de l'exécution, plusieurs artefacts cruciaux auront été créés :
- Un fichier CSV dans
data/processed/avec vos features prêtes pour l'analyse. - Un modèle
.pklsauvegardé dansdata/models/. - Un rapport de session JSON détaillé dans
data/reports/. - Directement dans le notebook, vous verrez le rapport de classification et la matrice de confusion de votre modèle optimisé.
🎉 Vous avez terminé le Démarrage Rapide !
Félicitations !
Vous avez exécuté le pipeline de bout en bout et obtenu vos premières classifications. Vous êtes maintenant prêt à explorer le projet plus en profondeur !