Premier Lancement : De A à Z

Maintenant que votre environnement est configuré, nous allons lancer le pipeline complet en utilisant le notebook principal 00_master_pipeline.ipynb. Ce notebook orchestre toutes les étapes, du téléchargement des données à l'entraînement du modèle.

Si c'est votre toute première exécution, le dossier data/raw/ est probablement vide. Le pipeline a besoin de spectres pour fonctionner.

Lancez Jupyter Lab ou Jupyter Notebook depuis votre terminal (où l'environnement venv est toujours actif).
Ouvrez le notebook notebooks/01_download_spectra.ipynb.
Ce notebook utilise le module SmartDownloader pour récupérer les spectres.
Exécutez les cellules pour télécharger un premier lot. Un petit lot de 100 à 500 spectres est suffisant pour un premier test.

Conseil

Le downloader est "intelligent" : il garde en mémoire les plans d'observation déjà téléchargés (downloaded_plans.csv) pour ne pas les reprendre deux fois.

Une fois que vous avez des données dans data/raw/, vous pouvez lancer le workflow complet.

Ouvrez le notebook principal : notebooks/00_master_pipeline.ipynb.
Exécutez toutes les cellules. Vous verrez des barres de progression et des messages informatifs à chaque étape.

Ce notebook orchestre les étapes suivantes :

Sélection d'un lot de spectres non traités.
Génération d'un catalogue local.
Prétraitement et extraction de features.
Entraînement et évaluation du modèle.

À la fin de l'exécution, plusieurs fichiers auront été créés ou mis à jour. Les plus importants sont :

data/processed/: Un fichier CSV avec vos features prêtes pour le ML.
reports/: Un rapport de session en JSON résumant les performances du modèle.

Directement dans le notebook, vous verrez également apparaître un rapport de classification et une matrice de confusion pour une première analyse des performances.

🎉 Vous avez terminé le Démarrage Rapide !

Félicitations !

Vous avez exécuté le pipeline de bout en bout et obtenu vos premières classifications. Vous êtes maintenant prêt à explorer le projet plus en profondeur !

Premier Lancement : De A à Z

Télécharger un premier lot de données

Lancer le pipeline principal

Examiner les Résultats

🎉 Vous avez terminé le Démarrage Rapide !

Félicitations !

Télécharger un premier lot de données

Lancer le pipeline principal

Examiner les Résultats

🎉 Vous avez terminé le Démarrage Rapide !​

Félicitations !

🎉 Vous avez terminé le Démarrage Rapide !