Disponible pour opportunités
Data Science & Intelligence Artificielle

ENDAYE Aimé

Transformer les données brutes en insights actionnables grâce à l'analyse avancée et le machine learning.

29
Projets Data
15+
Technologies
2+
Années XP
scroll

À propos

Mon parcours Data

Je m'appelle Endaye Aimé, passionné par la data et par la manière dont elle permet de structurer, analyser et optimiser des systèmes complexes.

Mon parcours a commencé dans les sciences du vivant, où j'ai développé une approche rigoureuse, analytique et méthodologique de la résolution de problèmes. Progressivement, j'ai orienté cette rigueur scientifique vers la donnée, en débutant par la data analyse à travers plusieurs projets concrets : exploration, nettoyage, visualisation, analyses statistiques et problématiques décisionnelles.

Avec le temps, mon intérêt s'est déplacé vers les fondations techniques des systèmes data. Je me spécialise aujourd'hui en Data Engineering, avec une approche orientée architecture, performance et scalabilité.

Aujourd'hui, mon objectif est d'évoluer vers des rôles d'ingénieur data et architecte IA, en concevant des architectures robustes capables d'alimenter des systèmes d'intelligence artificielle à grande échelle.

Ce sur quoi j'ai travaillé

Modélisation de bases de données (schémas en étoile, logique décisionnelle)
SQL avancé et optimisation de requêtes
Python pour le traitement de données (Pandas, Polars)
Mise en place de pipelines ETL
Réplication et sharding avec MongoDB
Conteneurisation avec Docker
Intégration de données via Airbyte
Machine Learning (régression, feature engineering, tuning)
Applications analytiques avec Streamlit

"Chaque projet que je réalise s'inscrit dans une logique claire : concevoir des solutions data complètes, performantes et prêtes pour la production."

Formation

  • Master Data Engineering
    OpenClassrooms
    09/2025 - 08/2026
    En cours
  • Licence Data Analyst
    DSR School
    01/2025 - 07/2025
  • Formation Data
    Dataquest
    03/2024 - 11/2024
  • Biologie, Niveau Licence 3
    UFR de Reims
    09/2019 - 06/2022

Expertise

Stack technique

Langages & Outils

PythonSQLHTML/CSSJupyterGitBash

Machine Learning & IA

Scikit-LearnPandasNumPyFAISSLangChainRAGMistral AI

Data Engineering

dbtKestraApache SparkRedpandaKafkaDuckDBDocker

Bases de données

PostgreSQLMongoDBSQL ServerMySQLAWS S3

Visualisation

MatplotlibSeabornPlotlyPower BIStreamlit

Cloud & DevOps

AWSDockerETLAPI RESTCI/CD

Qualifications

Diplômes & Certifications

22 certifications obtenues auprès de plateformes reconnues

Mai 2026

Mettez en place un RAG pour un LLM

OpenClassrooms
IA & Machine Learning
Mai 2026

Initiez-vous au Machine Learning

OpenClassrooms
IA & Machine Learning
Mai 2026

Réalisez des calculs distribués avec Spark

OpenClassrooms
Big Data
Avril 2026

Analysez les flux en temps réel avec Redpanda

OpenClassrooms
Big Data
Mai 2026

Orchestrez vos workflows avec Kestra

OpenClassrooms
Data Engineering
Avril 2026

Initiez-vous à dbt Cloud

OpenClassrooms
Data Engineering
Mai 2026

Adoptez les approches modernes des bases de données

OpenClassrooms
Bases de données
Mai 2026

Implémentez vos bases de données relationnelles avec SQL

OpenClassrooms
Bases de données
Avril 2026

Perfectionnez votre maîtrise de SQL

OpenClassrooms
Bases de données
Octobre 2025

Modélisez vos bases de données

OpenClassrooms
Bases de données
Septembre 2025

Requêtez une base de données avec SQL

OpenClassrooms
Bases de données
Octobre 2025

Découvrez les librairies Python pour Data Science

OpenClassrooms
Python & Data
Octobre 2025

Initiez-vous à Python pour l'analyse de données

OpenClassrooms
Python & Data
Octobre 2025

Nettoyez et analysez votre jeu de données

OpenClassrooms
Python & Data
Août 2025

Perfectionnez-vous sur Excel

OpenClassrooms
Outils
Juillet 2025

Maîtrisez les fondamentaux d'Excel

OpenClassrooms
Outils
Septembre 2023

Formation Complète Python 2023 - de 0 à Expert

Udemy
Python & Data
Novembre 2023

SQL pour la Data Science de A à Z

Udemy
Bases de données
Mars 2023

HTML5 et CSS3 : la formation ULTIME

Udemy
Développement Web
Février 2023

Concevoir un scénario pédagogique

Udemy
Soft Skills

Portfolio

Mes 29 Projets

Cliquez sur un projet pour voir les détails, le code et le lien GitHub

Seattle Energy Forecast
Machine Learning

Seattle Energy Forecast

Prédiction énergétique avec ML

PythonScikit-LearnBentoML+3
Analyse Marketing Bancaire
Business Analytics

Analyse Marketing Bancaire

Optimisation campagne téléprospection

PythonPandasSeaborn+2
Base de Données Immobilier France
Data Engineering

Base de Données Immobilier France

Modélisation SQL & Analyse territoriale

SQLSQLitePython+1
European Football Analytics
Data Analysis

European Football Analytics

Analyse SQL des performances

SQLPythonPandas+2
Spotify API Data Extraction
Data Engineering

Spotify API Data Extraction

Extraction & structuration de données musicales

PythonRequestsPandas+2
Évolution Capacité Crânienne
Data Visualization

Évolution Capacité Crânienne

Dashboard Streamlit interactif

StreamlitPythonPlotly+3
Amazon Scraper Selenium
Data Engineering

Amazon Scraper Selenium

Pipeline d'extraction automatisé

PythonSeleniumWebDriver+2
Migration MongoDB Médical
Data Engineering

Migration MongoDB Médical

NoSQL & Cloud AWS

MongoDBDockerAWS+2
Audit Architecture OLAP
Data Engineering

Audit Architecture OLAP

Data Warehouse SuperMarket

SQLOLAPTableau+2
Analyse Films TMDb
Data Visualization

Analyse Films TMDb

Application Streamlit cinéma

StreamlitPandasPlotly+2
Analyse Centrales Électriques Europe
Data Visualization

Analyse Centrales Électriques Europe

Visualisation données énergétiques

PythonMatplotlibSeaborn+2
Hacker News Engagement
Data Analysis

Hacker News Engagement

Analyse des publications

PythonPandasDatetime+1
Profitable App Profiles
Data Analysis

Profitable App Profiles

Analyse App Store & Google Play

PythonCSVData Cleaning+1
Analyse SQL Locations Films
Data Analysis

Analyse SQL Locations Films

Base de données cinéma type Sakila

SQLPythonPandas+2
Analyse Système Éducatif Mondial
Data Analysis

Analyse Système Éducatif Mondial

Données World Bank EdStats

PythonPandasPoetry+2
MongoDB Architecture Distribuée
Data Engineering

MongoDB Architecture Distribuée

NoSQL NosCités

MongoDBNoSQLTableau+2
Projet SCRUM Biodiversité
Data Science

Projet SCRUM Biodiversité

Gestion de projet Data agile

PythonPandasSCRUM+2
Streamlit Data Lab
Data Visualization

Streamlit Data Lab

Développement d'apps Streamlit

StreamlitPythonPandas+2
COVID-19 Dashboard
Data Analysis

COVID-19 Dashboard

Analyse pandémie mondiale

PythonPandasMatplotlib+2
Analyse Capacité Crânienne
Data Science

Analyse Capacité Crânienne

Projet fil rouge Data Science

PythonPandasSeaborn+2
NumPy Data Lab
Fundamentals

NumPy Data Lab

Exercices manipulation tableaux

PythonNumPyJupyter+1
Pandas Data Lab
Fundamentals

Pandas Data Lab

Manipulation et nettoyage données

PythonPandasMatplotlib+1
Python Foundations
Fundamentals

Python Foundations

Fondamentaux et POO

PythonOOPAlgorithms+1
Jupyter Notebook Guide
Fundamentals

Jupyter Notebook Guide

Tutoriel et bonnes pratiques

JupyterPythonMarkdown+1
GreenCoop - Entrepôt Météo dbt
Data Engineering

GreenCoop - Entrepôt Météo dbt

Pipeline dbt & Docker pour données météo

dbtPostgreSQLDocker+2
InduTech - Infrastructure Cloud Hybride
Data Engineering

InduTech - Infrastructure Cloud Hybride

Architecture AWS & Pipeline Streaming

AWSSparkRedpanda+3
Kestra Pipeline - Analyse Vins
Data Engineering

Kestra Pipeline - Analyse Vins

Orchestration data avec Kestra & DuckDB

KestraDuckDBPython+3
RAG - Assistant Événements Culturels
Machine Learning

RAG - Assistant Événements Culturels

Chatbot IA avec Mistral & FAISS

PythonMistral AIFAISS+2
Sport Data Solution
Data Science

Sport Data Solution

Analyse données sportives

PythonPandasSQL+2

Contact

Travaillons ensemble

Vous avez un projet data ? Une opportunité professionnelle ? N'hésitez pas à me contacter.