Vous avez des données mais ne savez pas comment les exploiter ? Vous souhaitez prendre des décisions basées sur des faits concrets ? Ou vous êtes étudiant·e et voulez maîtriser les outils de l'analyse moderne ?
Ce cours est fait pour vous.
👨🏫 À propos du formateur :
Je suis Data Scientist et Ingénieur en Mathématiques Appliquées, diplômé de l’Université Cheikh Anta Diop (UCAD). Mon expertise repose sur une solide base en Mathématiques, Statistiques, Machine Learning et Visualisation de données. J’allie rigueur scientifique et outils modernes pour transformer des données brutes en décisions stratégiques.
🧠 Objectifs du cours :
Comprendre et manipuler les données (exploration, nettoyage, visualisation)
- Identifier les variables importantes et repérer les anomalies
- Appliquer les méthodes statistiques et Machine Learning pour extraire de la valeur
- Construire des tableaux de bord clairs et parlants pour la prise de décision
- Adapter les analyses aux besoins réels d’une entreprise ou d’un projet académique
🧰 Contenu détaillé :
1. Introduction à l’analyse de données
- Qu’est-ce que l’analyse de données ?
- Typologie des données (quantitatives, qualitatives)
- Méthodologie globale
2. Préparation des données
- Nettoyage (valeurs manquantes, doublons, outliers)
- Encodage des variables catégorielles
- Normalisation et transformation
3. Visualisation et exploration
- Graphiques de distribution, de corrélation, de tendance
- Tableaux croisés, heatmaps, boxplots
- Détection de patterns et d’anomalies
4. Statistique descriptive et inférentielle
- Moyenne, Médiane, Ecart-type, Corrélation
- Tests statistiques : Khi2, t de Student, ANOVA
5. Modélisation prédictive (ML supervisé)
- Régression linéaire/logistique
- Arbre de décision, Random forest, KNN, SVM
- Évaluation : accuracy, recall, precision, F1-score, AUC
6. Segmentation et classification non supervisée
- Clustering (K-means, DBSCAN, hiérarchique)
- Réduction de dimension (ACP/PCA)
7. Projets réels (au choix)
- Analyse des ventes / Churn client / Scoring de crédit / Santé publique
- Ou projet personnalisé à vos propres données
💻 Outils utilisés :
- Python (Pandas, Matplotlib, Scikit-learn, Seaborn)
- ou R (selon la préférence)
- Excel, Power BI/Tableau (pour la visualisation avancée)