Aller au contenu principal

Les Données : LAMOST DR5

Le pipeline AstroSpectro est optimisé pour l'exploitation scientifique des spectres stellaires issus du LAMOST Data Release 5 (DR5). Ce relevé spectroscopique à grand champ a permis de collecter des millions de spectres stellaires, ce qui en fait une ressource inestimable pour l'astrophysique.

Cette page détaille la nature de ces données et la façon dont elles sont intégrées et traitées dans le projet.


Source et Structure des Données

Les données du projet sont organisées de manière logique pour séparer les données brutes des données traitées et des métadonnées.

Organisation Locale des Données

  • Format Principal : Les spectres sont stockés au format .fits.gz (FITS compressé), un standard en astronomie.

  • Organisation :
    Cliquez pour voir l'arborescence du dossier data/
    • data/raw/: Contient les spectres bruts téléchargés, organisés par plan d'observation.
    • data/catalog/: Stocke les catalogues et les journaux (logs) au format CSV, qui lient les spectres à leurs métadonnées (coordonnées, magnitudes, SNR, etc.).
    • data/processed/: Contient les features extraites, prêtes pour l'entraînement des modèles.
    • data/models/: Emplacement pour les modèles de classification sauvegardés.

Téléchargement et Parsing Automatisés

Le pipeline inclut des outils dédiés pour automatiser l'acquisition et la gestion des données, afin d'assurer la reproductibilité.

  • Interface de Téléchargement : Le notebook notebooks/01_download_spectra.ipynb fournit une interface simple pour lancer le téléchargement de nouveaux lots de spectres.
  • Logique Intelligente : Sous le capot, le module SmartDownloader (dans src/tools/dr5_downloader.py) gère le processus. Il consulte le journal downloaded_plans.csv pour éviter de retélécharger des plans d'observation déjà complets.

Pour aller plus loin

Ressources Utiles