Premier Lancement : De A à Z
Maintenant que votre environnement est configuré, nous allons lancer le pipeline complet en utilisant le notebook principal 00_master_pipeline.ipynb
. Ce notebook orchestre toutes les étapes, du téléchargement des données à l'entraînement du modèle.
Télécharger un premier lot de données
Si c'est votre toute première exécution, le dossier data/raw/
est probablement vide. Le pipeline a besoin de spectres pour fonctionner.
- Lancez Jupyter Lab ou Jupyter Notebook depuis votre terminal (où l'environnement
venv
est toujours actif). - Ouvrez le notebook
notebooks/01_download_spectra.ipynb
. - Ce notebook utilise le module
SmartDownloader
pour récupérer les spectres. - Exécutez les cellules pour télécharger un premier lot. Un petit lot de 100 à 500 spectres est suffisant pour un premier test.
Le downloader est "intelligent" : il garde en mémoire les plans d'observation déjà téléchargés (downloaded_plans.csv
) pour ne pas les reprendre deux fois.
Lancer le pipeline principal
Une fois que vous avez des données dans data/raw/
, vous pouvez lancer le workflow complet.
- Ouvrez le notebook principal :
notebooks/00_master_pipeline.ipynb
. - Exécutez toutes les cellules. Vous verrez des barres de progression et des messages informatifs à chaque étape.
Ce notebook orchestre les étapes suivantes :
- Sélection d'un lot de spectres non traités.
- Génération d'un catalogue local.
- Prétraitement et extraction de features.
- Entraînement et évaluation du modèle.
Examiner les Résultats
À la fin de l'exécution, plusieurs fichiers auront été créés ou mis à jour. Les plus importants sont :
data/processed/
: Un fichier CSV avec vos features prêtes pour le ML.reports/
: Un rapport de session en JSON résumant les performances du modèle.
Directement dans le notebook, vous verrez également apparaître un rapport de classification et une matrice de confusion pour une première analyse des performances.
🎉 Vous avez terminé le Démarrage Rapide !
Félicitations !
Vous avez exécuté le pipeline de bout en bout et obtenu vos premières classifications. Vous êtes maintenant prêt à explorer le projet plus en profondeur !