Les Données : LAMOST DR5
Le pipeline AstroSpectro est optimisé pour l'exploitation scientifique des spectres stellaires issus du LAMOST Data Release 5 (DR5). Ce relevé spectroscopique à grand champ a permis de collecter des millions de spectres stellaires, ce qui en fait une ressource inestimable pour l'astrophysique.
Cette page détaille la nature de ces données et la façon dont elles sont intégrées et traitées dans le projet.
Source et Structure des Données
Les données du projet sont organisées de manière logique pour séparer les données brutes des données traitées et des métadonnées.
Organisation Locale des Données
Format Principal : Les spectres sont stockés au format
.fits.gz
(FITS compressé), un standard en astronomie.- Organisation :
Cliquez pour voir l'arborescence du dossier
data/
data/raw/
: Contient les spectres bruts téléchargés, organisés par plan d'observation.data/catalog/
: Stocke les catalogues et les journaux (logs) au format CSV, qui lient les spectres à leurs métadonnées (coordonnées, magnitudes, SNR, etc.).data/processed/
: Contient les features extraites, prêtes pour l'entraînement des modèles.data/models/
: Emplacement pour les modèles de classification sauvegardés.
Téléchargement et Parsing Automatisés
Le pipeline inclut des outils dédiés pour automatiser l'acquisition et la gestion des données, afin d'assurer la reproductibilité.
- Interface de Téléchargement : Le notebook
notebooks/01_download_spectra.ipynb
fournit une interface simple pour lancer le téléchargement de nouveaux lots de spectres. - Logique Intelligente : Sous le capot, le module
SmartDownloader
(danssrc/tools/dr5_downloader.py
) gère le processus. Il consulte le journaldownloaded_plans.csv
pour éviter de retélécharger des plans d'observation déjà complets.
Pour aller plus loin
- Site officiel de LAMOST DR5 : Pour consulter la documentation originale du relevé.
- Guide du Téléchargement : Pour un tutoriel détaillé sur l'utilisation de nos scripts de téléchargement.
- Structure du Projet : Pour une vue d'ensemble de tous les dossiers du projet.