Aller au contenu principal

Structure du Projet

Le projet est organisé pour faciliter la reproductibilité, l'extension scientifique et l'utilisation pratique. Voici une description des répertoires principaux et de leur rôle.

Vue d'ensemble de l'arborescence

Répertoires Principaux

  • /src - Cœur du pipeline Python.
  • /notebooks - Orchestration et analyse interactive.
  • /data - Données brutes, traitées et catalogues (ignoré par Git).
  • /website - Source de cette documentation.
  • /reports & /logs - Rapports de session et logs.

Fichiers à la Racine

  • README.md - Présentation et liens rapides.
  • requirements.txt - Dépendances Python.
  • ROADMAP.md - Vision et objectifs du projet.
  • .gitignore - Fichiers et dossiers à ignorer par Git.

Détails des Dossiers Clés

/src

Le moteur du pipeline. Contient tout le code Python modulaire pour le traitement des données et le machine learning. Divisé en pipeline/ (logique métier) et tools/ (utilitaires).

/notebooks

L'interface de contrôle. Les notebooks Jupyter permettent d'exécuter et d'orchestrer les différentes étapes du pipeline de manière interactive, du téléchargement à la visualisation.

/data

L'entrepôt de données. Contient les spectres bruts, les catalogues générés, les features extraites et les modèles entraînés. Ce dossier est ignoré par Git.

info

La séparation entre src/ (le code pur) et notebooks/ (l'orchestration) est un choix d'architecture clé pour garantir la modularité et la testabilité du code.