Skip to content
View TSAGUE25's full-sized avatar

Block or report TSAGUE25

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
TSAGUE25/README.md

Bonjour, je suis Emmanuel TSAGUE 👋

Data Scientist · Data Analyst · Énergie & Industrie

LinkedIn GitHub Email


À propos

Data Scientist avec une expérience terrain dans les secteurs énergie et industrie.
Je construis des solutions analytiques end-to-end : de l'exploration des données à la mise en production.

  • Domaines : énergie, maintenance, finance, e-commerce, BI
  • Approche : données simulées / anonymisées — aucune donnée confidentielle publiée
  • Stack principale : Python · SQL · PySpark · scikit-learn · XGBoost · SHAP · Power BI

Portfolio — 16 cas d'usage Data Science

Tous les projets utilisent des données simulées ou anonymisées.
Aucune donnée confidentielle, propriétaire ou personnelle n'est publiée.

Énergie & Industrie

Projet Description Stack Lien
Efficacité Énergétique Segmentation KMeans + prédiction IEP kWh/m² pandas, sklearn, matplotlib → Voir
Réseau de Chaleur VAN/TRI + algorithme greedy d'optimisation pandas, numpy → Voir
Reporting Multi-KPIs Pipeline 15 KPIs + alertes CRITIQUE/ATTENTION pandas, matplotlib → Voir

SQL & Data Engineering

Projet Description Stack Lien
SQL Analytique CTE, Window Functions, cohort analysis SQLite, pandas, sqlalchemy → Voir
Modélisation Étoile Star Schema, ROLLUP, Data Warehouse SQLite, sqlalchemy → Voir
Big Data PySpark Broadcast join, Parquet, Window Functions PySpark, pandas → Voir

Machine Learning Supervisé

Projet Description Stack Lien
Pipeline ML Production Anti-leakage, GridSearchCV, joblib sklearn, pandas → Voir
Interprétabilité ML SHAP, PDP/ICE, analyse erreurs sklearn, shap → Voir
Churn Bancaire XGBoost + seuil optimisé PR-curve xgboost, shap → Voir
Fraude Bancaire SMOTE + Isolation Forest — classe 0,17% sklearn, imbalanced-learn → Voir
Risque Crédit Calibration + KS Statistic + équité sklearn, scipy → Voir
House Price 5 modèles comparés, feature engineering sklearn, xgboost → Voir

Machine Learning Non-Supervisé & RecSys

Projet Description Stack Lien
Segmentation Marketing RFM + KMeans (K=5) + PCA + Power BI sklearn, pandas → Voir
Recommandation SVD + CF user-based + cold start sklearn, scipy → Voir
Reinforcement Learning Q-Learning ε-greedy, gestion énergie numpy → Voir

Analyse & Visualisation

Projet Description Stack Lien
YouTube/Netflix EDA 100k vidéos simulées, storytelling data pandas, seaborn → Voir

Stack technique

Langages      Python · SQL · Bash
ML/DS         scikit-learn · XGBoost · LightGBM · SHAP · imbalanced-learn
Data Eng.     PySpark · SQLAlchemy · pandas · numpy
Viz & BI      matplotlib · seaborn · Power BI
MLOps         joblib · GitHub Actions
Bases de données  SQLite · PostgreSQL (notions)

Métriques portfolio (données simulées)

Cas d'usage Algorithme clé Métrique
Efficacité énergétique KMeans + RandomForest R² = 0,89
Churn bancaire XGBoost AUC = 0,87 · Recall = 0,79
Fraude bancaire SMOTE + XGBoost PR-AUC = 0,81
Risque crédit GradientBoosting calibré KS = 0,52 · Gini = 0,71
House Price GradientBoosting R² = 0,91 · MAE = 18k€
Recommandation SVD factorisation Precision@10 = 0,31

Contact

Tous les projets de ce portfolio utilisent exclusivement des données simulées, synthétiques ou anonymisées. Aucune donnée réelle, confidentielle ou propriétaire n'est publiée.

Popular repositories Loading

  1. fastapi-quiz-api fastapi-quiz-api Public

    API REST FastAPI sécurisée pour générer des quiz par catégorie, avec authentification, tests automatisés et documentation complète.

    Python 1

  2. fastapi_exam_TSAGUE_EMMANUEL fastapi_exam_TSAGUE_EMMANUEL Public

    fastapi_exam_TSAGUE_EMMANUEL

  3. ML_Project_Full_Cycle ML_Project_Full_Cycle Public

    Agent IA pour la gestion autonome du cycle complet d'un projet d'apprentissage automatique

  4. co2-vehicle-emissions-prediction co2-vehicle-emissions-prediction Public

    Projet Data Science complet — Prédiction des émissions CO2 des véhicules. Régression, Classification, Deep Learning, Streamlit. Datascientest 2024.

    Jupyter Notebook

  5. classification-gamme-electrique classification-gamme-electrique Public

    Classification de consommateurs électriques pour l'affectation tarifaire — EDF MAD EDVANCE — Précision : 91%

  6. challenge-rcu-edf-dataiku-2026 challenge-rcu-edf-dataiku-2026 Public

    Challenge EDF×Dataiku 2026 — Optimisation réseau de chaleur urbain par théorie des graphes (PCST) — Score : 579.7M€ ×7.5

    Python