Skip to content

Statistiques pour débutant


001 - Comprendre la statistique descriptive

Details

PARTIE 1 - Appréhendez les bases de l'analyse statistique

  1. Tirez un maximum de ce cours
  2. Découvrez les statistiques : vocabulaire et tour d’horizon
  3. DĂ©couvrez les 4 types de variables

Quiz : Appréhender les bases de l'analyse statistique

PARTIE 2 - Nettoyez un jeu de données

  1. Repérez les différents types d'erreurs
  2. Gérez les différentes erreurs d'un jeu de données
  3. Nettoyez vos données avec Python

Quiz : Nettoyer un jeu de données

PARTIE 3 - Représentez vos variables

  1. Représentez la distribution empirique d'une variable
  2. Présentez une variable sous forme de tableau
  3. Découvrez les enjeux de l'analyse univariée
  4. DĂ©couvrez les mesures de tendance centrale
  5. Comprenez les mesures de dispersion
  6. Appréhendez les mesures de forme
  7. Familiarisez-vous avec les mesures de concentration

Quiz : Représenter vos variables

PARTIE 4 - Réalisez une analyse bivariée

  1. Comprenez les enjeux de l’analyse bivariée
  2. Recherchez les corrélations
  3. Analysez la corrélation entre deux variables quantitatives
  4. Analysez deux variables quantitatives par régression linéaire
  5. Analysez une variable quantitative et une qualitative par ANOVA
  6. Analysez deux variables qualitatives avec le Chi-2

Quiz : Réaliser une analyse bivariée

002 - Comprendre l'inférence statistique

Details

PARTIE 1 - Découvrez les statistiques inférentielles

  1. Familiarisez-vous avec deux cas pratiques
  2. Adoptez la posture du Data Analyst
  3. Comprenez les enjeux de l’inférence
  4. Déterminez votre modèle probabiliste

PARTIE 2 - RĂ©alisez une estimation ponctuelle

  1. DĂ©couvrez la notion d'estimateur
  2. Estimez une proportion
  3. Estimez une moyenne et une variance
  4. Comprenez ce qui fait la qualité d’un estimateur
  5. Déterminez la qualité de votre estimateur
  6. Allez plus loin : méthodes des moments et du maximum de vraisemblance

Quiz : Testez vos connaissances sur les estimateurs

PARTIE 3 - DĂ©terminez des intervalles de confiance

  1. DĂ©couvrez les intervalles de confiance
  2. DĂ©terminez un intervalle de confiance sur une proportion
  3. DĂ©terminez un intervalle de confiance sur une moyenne
  4. DĂ©terminez un intervalle de confiance sur une variance

Quiz : Testez vos connaissances sur les intervalles de confiance

PARTIE 4 - RĂ©alisez des tests statistiques

  1. DĂ©couvrez les tests statistiques
  2. Formalisez votre problème de test
  3. Testez une proportion
  4. Testez une moyenne ou une variance
  5. Comparez deux Ă©chantillons gaussiens (test de comparaison)
  6. Découvrez les tests d'adéquation : le Khi-deux et Kolmogorov Smirnov
  7. Entraînez-vous à tester l'équiprobabilité des naissances de femmes et d'hommes

Quiz : Savez-vous effectuer un test statistique ?

PARTIE 5 - Conclusion

  1. Conclusion

003 - Réalisez une analyse exploratoire de données

Details

PARTIE 1 - DĂ©couvrez l'analyse exploratoire multidimensionnelle

  1. ĂŠtes-vous prĂŞt Ă  suivre ce cours ?
  2. Découvrez l'intérêt de l’analyse multidimensionnelle
  3. Rencontrez Emeric Nicolas, Data Scientist
  4. Découvrez les méthodes factorielles et la classification non supervisée
  5. Téléchargez les jeux de données analysés dans ce cours
  6. Représentez vos données dans un espace

Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionnelle ?

PARTIE 2 - DĂ©couvrez l'analyse en composantes principales (ACP)

  1. Comprenez l'enjeu de l'analyse en composantes principales
  2. DĂ©couvrez les espaces que nous utiliserons
  3. Interprétez le cercle des corrélations
  4. Représentez les individus sur les plans factoriels
  5. Choisissez le nombre de composantes
  6. TP : RĂ©alisez une ACP
  7. Soyez attentif aux spécificités de l'ACP

Quiz : Pratiquez l'ACP

PARTIE 3 - Partitionnez vos données

  1. Recherchez une bonne partition
  2. Découvrez l’algorithme k-means
  3. Effectuez une classification hiérarchique
  4. Interprétez votre partition
  5. TP : Partitionnez vos données

004 - Qu'est ce que la probabilté ?

Details

PARTIE 1 - Explorez les espaces probabilisés

  1. Découvrez les notions de base des probabilités
  2. Apprenez à calculer une probabilité
  3. Appréhendez les probabilités conditionnelles

Quiz : Partie 1

PARTIE 2 - Apprenez à manipuler les variables aléatoires

  1. Découvrez les variables aléatoires
  2. Déterminez la loi de probabilité d'une Variable Aléatoire Discrète (VAD)
  3. Appréhendez les Variables Aléatoires Continues (VAC)
  4. Apprenez à utiliser quelques lois usuelles discrètes
  5. Familiarisez-vous avec quelques lois usuelles continues

PARTIE 3 - Découvrez les couples de variables aléatoires

  1. Découvrez les notions de couple et d'indépendance
  2. Découvrez les notions de covariance et de corrélation linéaire

Quiz : Partie 3

PARTIE 4 - Appréhendez les notions de convergences

  1. DĂ©couvrez la loi faible des grands nombres
  2. Utilisez le Théorème Central Limite

Quiz : Partie 4

005 - Analyse des données temporelles

Details

PARTIE 1 - Introduction

  1. Découvrez l'univers des données temporelles
  2. Familiarisez-vous avec certaines séries temporelles
  3. TP : représentez des séries temporelles

PARTIE 2 - Corrigez une série temporelle des variations saisonnières

  1. Comprenez les variations saisonnières
  2. TP : Désaisonnalisez à l'aide de la régression linéaire
  3. DĂ©saisonnalisez Ă  l'aide des moyennes mobiles
  4. DĂ©couvrez des algorithmes de traitement des moyennes mobiles

Quiz : Partie 2

PARTIE 3 - Prévoyez une série à l'aide des méthodes de lissage exponentiel

  1. Appréhendez le lissage exponentiel simple
  2. Appréhendez le lissage exponentiel double et la méthode de Holt-Winters
  3. TP : Prévoyez une série à l’aide des méthodes de lissage exponentiel

Quiz : Partie 3

PARTIE 4 - Prévoyez une série à l'aide des modèles ARMA

  1. DĂ©couvrez les processus stationnaires
  2. Les processus AR, MA et ARMA
  3. Les processus non stationnaires : ARIMA et SARIMA
  4. Entraînez des modèles SARIMA
  5. TP : Prévoyez une série temporelle à l’aide des méthodes SARIMA
  6. Familiarisez-vous avec d'autres modèles connus

Quiz : Partie 4

006 - Modélisation statistique

Details

PARTIE 1 - Appréhendez la notion de modélisation

  1. Appréhendez les différents types de modélisation
  2. Découvrez le jeu de données de l'ozone
  3. Découvrez le jeu de données des maladies cardio-vasculaires
  4. Découvrez le jeu de données du blé

PARTIE 2 - Modélisez des données à l'aide de la régression linéaire simple

  1. Appréhendez le fonctionnement de la régression linéaire
  2. Appliquez la méthode des Moindres Carrés Ordinaires
  3. Calculez le coefficient de détermination
  4. Testez le modèle linéaire gaussien simple
  5. TP : Pratiquez la régression linéaire sur le jeu de données de l'ozone
  6. Entraînez-vous : déterminez la hauteur d'un arbre à l'aide d'une régression

PARTIE 3 - Modélisez des données à l'aide de la régression linéaire multiple

  1. Appréhendez le fonctionnement de la régression linéaire multiple
  2. Appliquez la méthode des Moindres Carrés Ordinaires
  3. Calculez le coefficient de détermination
  4. Testez le modèle linéaire gaussien multiple
  5. Analysez les résultats
  6. Sélectionnez automatiquement un modèle
  7. TP : Pratiquez la régression linéaire multiple sur le jeu de données de l'ozone
  8. Entraînez-vous : améliorez les prévisions de hauteur des arbres

PARTIE 4 - Effectuez une classification à l'aide de la régression logistique

  1. Appréhendez le fonctionnement de la régression logistique
  2. Estimez un modèle de régression logistique
  3. Analysez les résultats
  4. TP : Pratiquez la régression logistique sur le jeu de données des maladies cardio-vasculaires

Quiz : Avez-vous compris les enjeux de la régression logistique ?

PARTIE 5 - Effectuez une analyse de la variance (ANOVA)

  1. Appréhendez le fonctionnement de l'analyse de la variance (ANOVA)
  2. RĂ©alisez une analyse de la variance
  3. TP : Pratiquez l'analyse de la variance sur le jeu de données du blé

Quiz : Avez-vous compris les enjeux de l'ANOVA ?

007 - Video : Statistique descriptive de A Ă  Z

Details

Notions de Base en Statistique Descriptive

  1. Statistique descriptive : premier cours (notions de base)
  2. Exercice sur les types de variable (de caractère) - Statistique descriptive
  3. C’est quoi une moyenne arithmétique ?
  4. La médiane - notion et calcul
  5. Les quartiles en statistique - notions et calcul
  6. Caractéristiques de position et caractéristiques de dispersion - Statistique

Caractéristiques et Mesures en Statistique

  1. Information cachée derrière : Moyenne, Médiane, Variance, Écart type
  2. Exercice en statistique : moyenne, médiane, étendue, les quartiles, variance, écart type
  3. Boîte à moustache ou diagramme de quartiles - Statistique descriptive
  4. Apprendre Ă  Ă©tablir la boite Ă  moustaches facilement - cours de statistique descriptive
  5. Des formules de base en statistique - En comprendre le sens facilement

Fréquence et Mode

  1. La fréquence en statistique - en cas de variable quantitative discrète ou continue
  2. C’est quoi le MODE d’une série statistique ? Variable discrète ou continue

Représentations Graphiques en Statistique

  1. Les représentations graphiques les plus utilisées en statistique
  2. Diagramme circulaire ou Ă  bandes
  3. Diagramme en bâtons et Histogramme

008 - Khan Academy : Statistics and probability

Details

Unit 1: Analyzing categorical data

  1. Analyzing one categorical variable: Analyzing categorical data
  2. Two-way tables: Analyzing categorical data
  3. Distributions in two-way tables: Analyzing categorical data

Unit 2: Displaying and comparing quantitative data

  1. Displaying quantitative data with graphs: Displaying and comparing quantitative data
  2. Describing and comparing distributions: Displaying and comparing quantitative data
  3. More on data displays: Displaying and comparing quantitative data

Unit 3: Summarizing quantitative data

  1. Measuring center in quantitative data: Summarizing quantitative data
  2. More on mean and median: Summarizing quantitative data
  3. Interquartile range (IQR): Summarizing quantitative data
  4. Variance and standard deviation of a population: Summarizing quantitative data
  5. Variance and standard deviation of a sample: Summarizing quantitative data
  6. More on standard deviation: Summarizing quantitative data
  7. Box and whisker plots: Summarizing quantitative data
  8. Other measures of spread: Summarizing quantitative data

Unit 4: Modeling data distributions

  1. Percentiles: Modeling data distributions
  2. Z-scores: Modeling data distributions
  3. Effects of linear transformations: Modeling data distributions
  4. Density curves: Modeling data distributions
  5. Normal distributions and the empirical rule: Modeling data distributions
  6. Normal distribution calculations: Modeling data distributions
  7. More on normal distributions: Modeling data distributions

Unit 5: Exploring bivariate numerical data

  1. Introduction to scatterplots: Exploring bivariate numerical data
  2. Correlation coefficients: Exploring bivariate numerical data
  3. Introduction to trend lines: Exploring bivariate numerical data
  4. Least-squares regression equations: Exploring bivariate numerical data
  5. Assessing the fit in least-squares regression: Exploring bivariate numerical data
  6. More on regression: Exploring bivariate numerical data

Unit 6: Study design

  1. Statistical questions: Study design
  2. Sampling and observational studies: Study design
  3. Sampling methods: Study design
  4. Types of studies (experimental vs. observational): Study design
  5. Experiments: Study design

Unit 7: Probability

  1. Basic theoretical probability: Probability
  2. Probability using sample spaces: Probability
  3. Basic set operations: Probability
  4. Experimental probability: Probability
  5. Randomness, probability, and simulation: Probability
  6. Addition rule: Probability
  7. Multiplication rule for independent events: Probability
  8. Multiplication rule for dependent events: Probability
  9. Conditional probability and independence: Probability

Unit 8: Counting, permutations, and combinations

  1. Counting principle and factorial: Counting, permutations, and combinations
  2. Permutations: Counting, permutations, and combinations
  3. Combinations: Counting, permutations, and combinations
  4. Combinatorics and probability: Counting, permutations, and combinations

Unit 9: Random variables

  1. Discrete random variables: Random variables
  2. Continuous random variables: Random variables
  3. Transforming random variables: Random variables
  4. Combining random variables: Random variables
  5. Binomial random variables: Random variables
  6. Binomial mean and standard deviation formulas: Random variables
  7. Geometric random variables: Random variables
  8. More on expected value: Random variables
  9. Poisson distribution: Random variables

Unit 10: Sampling distributions

  1. What is a sampling distribution?: Sampling distributions
  2. Sampling distribution of a sample proportion: Sampling distributions
  3. Sampling distribution of a sample mean: Sampling distributions

Unit 11: Confidence intervals

  1. Introduction to confidence intervals: Confidence intervals
  2. Estimating a population proportion: Confidence intervals
  3. Estimating a population mean: Confidence intervals
  4. More confidence interval videos: Confidence intervals

Unit 12: Significance tests (hypothesis testing)

  1. The idea of significance tests: Significance tests (hypothesis testing)
  2. Error probabilities and power: Significance tests (hypothesis testing)
  3. Tests about a population proportion: Significance tests (hypothesis testing)
  4. Tests about a population mean: Significance tests (hypothesis testing)
  5. More significance testing videos: Significance tests (hypothesis testing)

Unit 13: Two-sample inference for the difference between groups

  1. Comparing two proportions: Two-sample inference for the difference between groups
  2. Comparing two means: Two-sample inference for the difference between groups

Unit 14: Inference for categorical data (chi-square tests)

  1. Chi-square goodness-of-fit tests: Inference for categorical data (chi-square tests)
  2. Chi-square tests for relationships: Inference for categorical data (chi-square tests)

Unit 15: Advanced regression (inference and transforming)

  1. Inference about slope: Advanced regression (inference and transforming)
  2. Nonlinear regression: Advanced regression (inference and transforming)

Unit 16: Analysis of variance (ANOVA)

  1. Analysis of variance (ANOVA): Analysis of variance (ANOVA)

009 - DataCamp : Introduction to Statistics

Details

Chapter 1: Summary Statistics

  1. What is statistics?
  2. Using statistics in the real-world
  3. Identifying data types
  4. Descriptive vs. Inferential statistics
  5. Measures of center
  6. Typical number of robberies per London Borough
  7. Choosing a measure
  8. London Boroughs with most frequent crimes
  9. Measures of spread
  10. Defining measures of spread
  11. Box plots for measuring spread
  12. Which crime has the larger standard deviation

Chapter 2: Probability and Distributions

  1. What are the chances?
  2. What is more likely?
  3. Chances of the next sale being more than the mean
  4. Conditional probability
  5. Dependent vs. Independent events
  6. Orders of more than 10 basket products
  7. Discrete distributions
  8. Identifying distributions
  9. Sample mean vs. Theoretical mean
  10. Continuous distributions
  11. Discrete vs. Continuous distributions
  12. Finding the normal distribution
  13. Calculating probability with a uniform distribution

Chapter 3: More Distributions and the Central Limit Theorem

  1. The binomial distribution
  2. Recognizing a binomial distribution
  3. How probability affects the binomial distribution
  4. Identifying n and p
  5. The normal distribution
  6. Recognizing the normal distribution
  7. What makes the normal distribution special?
  8. Identifying skewness
  9. Describing distributions using kurtosis
  10. The central limit theorem
  11. Visualizing sampling distributions
  12. The CLT vs. The law of large numbers
  13. When to use the central limit theorem
  14. The Poisson distribution
  15. Identifying Poisson processes
  16. Recognizing lambda in the Poisson distribution

Chapter 4: Correlation and Hypothesis Testing

  1. Hypothesis testing
  2. Sunshine and sleep
  3. The hypothesis testing workflow
  4. Independent and dependent variables
  5. Experiments
  6. Recognizing controlled trials
  7. Why use randomization?
  8. Correlation
  9. Identifying correlation between variables
  10. What can correlation tell you?
  11. Confounding variables
  12. Interpreting hypothesis test results
  13. Significance levels vs. p-values
  14. Type I and type II errors
  15. Congratulations!

010 - Stanford University : Introduction to Statistics

Details

Introduction et statistiques descriptives pour l'exploration des données

Production de données et échantillonnage

Probabilité et distributions

  1. Probabilité
  2. Approximation normale et distribution binomiale
  3. Distributions d'échantillonnage et théorème de la limite centrale

Régression et analyse des données

  1. RĂ©gression
  2. Intervalles de confiance
  3. Tests de signification
  4. RĂ©Ă©chantillonnage
  5. Analyse des données catégorielles

Analyse de la variance

  1. Analyse de la variance Ă  une voie (ANOVA)
  2. Comparaisons multiples