Aller au contenu principal

Premier Lancement : De A à Z

Maintenant que votre environnement est configuré, nous allons lancer le pipeline complet en utilisant le notebook principal 00_master_pipeline.ipynb. Ce notebook orchestre toutes les étapes, de la sélection des données à la génération d'un rapport de session complet.

Utilisateurs de Codespaces

Si vous utilisez un Codespace, l'environnement est déjà prêt ! Vous pouvez directement ouvrir le dossier notebooks/ et lancer 00_master_pipeline.ipynb. Un petit jeu de données a même été téléchargé pour vous.

Étape 1 : Acquérir des Données (si nécessaire)

Si c'est votre toute première exécution en local, le dossier data/raw/ est vide.

  1. Ouvrez le notebook notebooks/01_download_spectra.ipynb.
  2. Utilisez l'interface interactive pour télécharger un premier lot de spectres (quelques centaines suffisent pour un test).

Étape 2 : Lancer le Pipeline de Production

Une fois que vous avez des données, le processus est entièrement automatisé.

  1. Ouvrez le notebook principal : notebooks/00_master_pipeline.ipynb.
  2. Exécutez toutes les cellules de haut en bas.

Le notebook va exécuter séquentiellement le MasterPipeline :

  • Étape 2 : Sélection d'un lot de spectres non traités.
  • Étape 3 : Génération d'un catalogue local pour ce lot.
  • Étape 4 : Traitement & Extraction des Features (plus de 20 features par spectre).
  • Étape 5 : Entraînement & Évaluation avec une interface interactive pour choisir entre RandomForest et XGBoost et configurer le nombre d'estimateurs.

Étape 3 : Examiner les Résultats

À la fin de l'exécution, plusieurs artefacts cruciaux auront été créés :

  • Un fichier CSV dans data/processed/ avec vos features prêtes pour l'analyse.
  • Un modèle .pkl sauvegardé dans data/models/.
  • Un rapport de session JSON détaillé dans data/reports/.
  • Directement dans le notebook, vous verrez le rapport de classification et la matrice de confusion de votre modèle optimisé.

🎉 Vous avez terminé le Démarrage Rapide !

Félicitations !

Vous avez exécuté le pipeline de bout en bout et obtenu vos premières classifications. Vous êtes maintenant prêt à explorer le projet plus en profondeur !