Analyse des Résultats
Résultats complets d'AstroSpectro : réduction de dimension (PCA, UMAP, t-SNE, HDBSCAN), classification supervisée XGBoost (87 % balanced accuracy, ROC-AUC ~0,964) et validation SHAP (97,9 % de features physiques dans le top-30).
Autoencodeur — Réduction de dimension non-linéaire
Résultats complets de l'autoencodeur SpectralAutoencoder appliqué aux 183 descripteurs LAMOST DR5 : architecture MLP symétrique, espace latent z=2, MSE(AE)=0.489 ≈ PCA(k=10), découverte de l'axe gravité sur l'axe 1 latent, détection d'anomalies QSO (107× erreur), interpolation et arithmétique latente.
Catalogue des 183 descripteurs spectraux
Liste complète et annotée des 183 descripteurs spectroscopiques utilisés dans AstroSpectro (PHY-3500 × LAMOST DR5 × Gaia DR3), organisés par famille physique.
Dataset — LAMOST DR5 × Gaia DR3 (PHY-3500)
Description complète du jeu de données utilisé dans le projet PHY-3500 : N = 43 019 spectres LAMOST DR5 croisés avec Gaia DR3, p = 183 descripteurs spectroscopiques après filtrage qualité.
Données LAMOST DR5
Présentation complète des données LAMOST DR5 utilisées par AstroSpectro : caractéristiques du télescope, structure FITS, pipeline de téléchargement SmartDownloader, croisement Gaia DR3 et filtres qualité.
Guide — Prétraitement des Spectres
Guide complet du prétraitement des spectres LAMOST DR5 dans AstroSpectro : reconstruction de la grille λ, normalisation médiane, filtres qualité SNR/RUWE, et préparation du vecteur de 183 descripteurs.
Interprétation physique de la PCA
Analyse détaillée des axes principaux PCA appliquée aux 183 descripteurs de LAMOST DR5 : variance expliquée, eigenspectra sur flux bruts, loadings par famille spectrale, corrélations Gaia DR3 et diagramme HR.
Réduction de dimension — PCA, UMAP, t-SNE
Comparaison complète de trois méthodes de réduction de dimension sur 43 019 spectres stellaires LAMOST DR5 : PCA (linéaire), UMAP (topologique) et t-SNE (probabiliste). Hyperparamètres, résultats, stabilité Procrustes et clusters HDBSCAN.
XGBoost — comparaison sur les mêmes 183 descripteurs
Résultats du classifieur XGBoost entraîné en mode spectro_only=True sur les 183 descripteurs LAMOST DR5. 87 % de précision équilibrée sur 5 classes, confiance médiane 96,3 %, cohérence géographique dans l'espace UMAP.