Statistiques pour dĂ©butant¶
001 - Comprendre la statistique descriptive¶
Details
PARTIE 1 - Appréhendez les bases de l'analyse statistique
- Tirez un maximum de ce cours
- Découvrez les statistiques : vocabulaire et tour d’horizon
- DĂ©couvrez les 4 types de variables
Quiz : Appréhender les bases de l'analyse statistique
PARTIE 2 - Nettoyez un jeu de données
- Repérez les différents types d'erreurs
- Gérez les différentes erreurs d'un jeu de données
- Nettoyez vos données avec Python
Quiz : Nettoyer un jeu de données
PARTIE 3 - Représentez vos variables
- Représentez la distribution empirique d'une variable
- Présentez une variable sous forme de tableau
- Découvrez les enjeux de l'analyse univariée
- DĂ©couvrez les mesures de tendance centrale
- Comprenez les mesures de dispersion
- Appréhendez les mesures de forme
- Familiarisez-vous avec les mesures de concentration
Quiz : Représenter vos variables
PARTIE 4 - Réalisez une analyse bivariée
- Comprenez les enjeux de l’analyse bivariée
- Recherchez les corrélations
- Analysez la corrélation entre deux variables quantitatives
- Analysez deux variables quantitatives par régression linéaire
- Analysez une variable quantitative et une qualitative par ANOVA
- Analysez deux variables qualitatives avec le Chi-2
Quiz : Réaliser une analyse bivariée
002 - Comprendre l'infĂ©rence statistique¶
Details
PARTIE 1 - Découvrez les statistiques inférentielles
- Familiarisez-vous avec deux cas pratiques
- Adoptez la posture du Data Analyst
- Comprenez les enjeux de l’inférence
- Déterminez votre modèle probabiliste
PARTIE 2 - RĂ©alisez une estimation ponctuelle
- DĂ©couvrez la notion d'estimateur
- Estimez une proportion
- Estimez une moyenne et une variance
- Comprenez ce qui fait la qualité d’un estimateur
- Déterminez la qualité de votre estimateur
- Allez plus loin : méthodes des moments et du maximum de vraisemblance
Quiz : Testez vos connaissances sur les estimateurs
PARTIE 3 - DĂ©terminez des intervalles de confiance
- DĂ©couvrez les intervalles de confiance
- DĂ©terminez un intervalle de confiance sur une proportion
- DĂ©terminez un intervalle de confiance sur une moyenne
- DĂ©terminez un intervalle de confiance sur une variance
Quiz : Testez vos connaissances sur les intervalles de confiance
PARTIE 4 - RĂ©alisez des tests statistiques
- DĂ©couvrez les tests statistiques
- Formalisez votre problème de test
- Testez une proportion
- Testez une moyenne ou une variance
- Comparez deux Ă©chantillons gaussiens (test de comparaison)
- Découvrez les tests d'adéquation : le Khi-deux et Kolmogorov Smirnov
- Entraînez-vous à tester l'équiprobabilité des naissances de femmes et d'hommes
Quiz : Savez-vous effectuer un test statistique ?
PARTIE 5 - Conclusion
- Conclusion
003 - RĂ©alisez une analyse exploratoire de donnĂ©es¶
Details
PARTIE 1 - DĂ©couvrez l'analyse exploratoire multidimensionnelle
- ĂŠtes-vous prĂŞt Ă suivre ce cours ?
- Découvrez l'intérêt de l’analyse multidimensionnelle
- Rencontrez Emeric Nicolas, Data Scientist
- Découvrez les méthodes factorielles et la classification non supervisée
- Téléchargez les jeux de données analysés dans ce cours
- Représentez vos données dans un espace
Quiz : Avez-vous compris l'intérêt de l'analyse exploratoire multidimensionnelle ?
PARTIE 2 - DĂ©couvrez l'analyse en composantes principales (ACP)
- Comprenez l'enjeu de l'analyse en composantes principales
- DĂ©couvrez les espaces que nous utiliserons
- Interprétez le cercle des corrélations
- Représentez les individus sur les plans factoriels
- Choisissez le nombre de composantes
- TP : RĂ©alisez une ACP
- Soyez attentif aux spécificités de l'ACP
Quiz : Pratiquez l'ACP
PARTIE 3 - Partitionnez vos données
- Recherchez une bonne partition
- Découvrez l’algorithme k-means
- Effectuez une classification hiérarchique
- Interprétez votre partition
- TP : Partitionnez vos données
004 - Qu'est ce que la probabiltĂ© ?¶
Details
PARTIE 1 - Explorez les espaces probabilisés
- Découvrez les notions de base des probabilités
- Apprenez à calculer une probabilité
- Appréhendez les probabilités conditionnelles
Quiz : Partie 1
PARTIE 2 - Apprenez à manipuler les variables aléatoires
- Découvrez les variables aléatoires
- Déterminez la loi de probabilité d'une Variable Aléatoire Discrète (VAD)
- Appréhendez les Variables Aléatoires Continues (VAC)
- Apprenez à utiliser quelques lois usuelles discrètes
- Familiarisez-vous avec quelques lois usuelles continues
PARTIE 3 - Découvrez les couples de variables aléatoires
- Découvrez les notions de couple et d'indépendance
- Découvrez les notions de covariance et de corrélation linéaire
Quiz : Partie 3
PARTIE 4 - Appréhendez les notions de convergences
- DĂ©couvrez la loi faible des grands nombres
- Utilisez le Théorème Central Limite
Quiz : Partie 4
005 - Analyse des donnĂ©es temporelles¶
Details
PARTIE 1 - Introduction
- Découvrez l'univers des données temporelles
- Familiarisez-vous avec certaines séries temporelles
- TP : représentez des séries temporelles
PARTIE 2 - Corrigez une série temporelle des variations saisonnières
- Comprenez les variations saisonnières
- TP : Désaisonnalisez à l'aide de la régression linéaire
- DĂ©saisonnalisez Ă l'aide des moyennes mobiles
- DĂ©couvrez des algorithmes de traitement des moyennes mobiles
Quiz : Partie 2
PARTIE 3 - Prévoyez une série à l'aide des méthodes de lissage exponentiel
- Appréhendez le lissage exponentiel simple
- Appréhendez le lissage exponentiel double et la méthode de Holt-Winters
- TP : Prévoyez une série à l’aide des méthodes de lissage exponentiel
Quiz : Partie 3
PARTIE 4 - Prévoyez une série à l'aide des modèles ARMA
- DĂ©couvrez les processus stationnaires
- Les processus AR, MA et ARMA
- Les processus non stationnaires : ARIMA et SARIMA
- Entraînez des modèles SARIMA
- TP : Prévoyez une série temporelle à l’aide des méthodes SARIMA
- Familiarisez-vous avec d'autres modèles connus
Quiz : Partie 4
006 - ModĂ©lisation statistique¶
Details
PARTIE 1 - Appréhendez la notion de modélisation
- Appréhendez les différents types de modélisation
- Découvrez le jeu de données de l'ozone
- Découvrez le jeu de données des maladies cardio-vasculaires
- Découvrez le jeu de données du blé
PARTIE 2 - Modélisez des données à l'aide de la régression linéaire simple
- Appréhendez le fonctionnement de la régression linéaire
- Appliquez la méthode des Moindres Carrés Ordinaires
- Calculez le coefficient de détermination
- Testez le modèle linéaire gaussien simple
- TP : Pratiquez la régression linéaire sur le jeu de données de l'ozone
- Entraînez-vous : déterminez la hauteur d'un arbre à l'aide d'une régression
PARTIE 3 - Modélisez des données à l'aide de la régression linéaire multiple
- Appréhendez le fonctionnement de la régression linéaire multiple
- Appliquez la méthode des Moindres Carrés Ordinaires
- Calculez le coefficient de détermination
- Testez le modèle linéaire gaussien multiple
- Analysez les résultats
- Sélectionnez automatiquement un modèle
- TP : Pratiquez la régression linéaire multiple sur le jeu de données de l'ozone
- Entraînez-vous : améliorez les prévisions de hauteur des arbres
PARTIE 4 - Effectuez une classification à l'aide de la régression logistique
- Appréhendez le fonctionnement de la régression logistique
- Estimez un modèle de régression logistique
- Analysez les résultats
- TP : Pratiquez la régression logistique sur le jeu de données des maladies cardio-vasculaires
Quiz : Avez-vous compris les enjeux de la régression logistique ?
PARTIE 5 - Effectuez une analyse de la variance (ANOVA)
- Appréhendez le fonctionnement de l'analyse de la variance (ANOVA)
- RĂ©alisez une analyse de la variance
- TP : Pratiquez l'analyse de la variance sur le jeu de données du blé
Quiz : Avez-vous compris les enjeux de l'ANOVA ?
007 - Video : Statistique descriptive de A Ă Z¶
Details
Notions de Base en Statistique Descriptive
- Statistique descriptive : premier cours (notions de base)
- Exercice sur les types de variable (de caractère) - Statistique descriptive
- C’est quoi une moyenne arithmétique ?
- La médiane - notion et calcul
- Les quartiles en statistique - notions et calcul
- Caractéristiques de position et caractéristiques de dispersion - Statistique
Caractéristiques et Mesures en Statistique
- Information cachée derrière : Moyenne, Médiane, Variance, Écart type
- Exercice en statistique : moyenne, médiane, étendue, les quartiles, variance, écart type
- Boîte à moustache ou diagramme de quartiles - Statistique descriptive
- Apprendre Ă Ă©tablir la boite Ă moustaches facilement - cours de statistique descriptive
- Des formules de base en statistique - En comprendre le sens facilement
Fréquence et Mode
- La fréquence en statistique - en cas de variable quantitative discrète ou continue
- C’est quoi le MODE d’une série statistique ? Variable discrète ou continue
Représentations Graphiques en Statistique
- Les représentations graphiques les plus utilisées en statistique
- Diagramme circulaire ou Ă bandes
- Diagramme en bâtons et Histogramme
008 - Khan Academy : Statistics and probability¶
Details
Unit 1: Analyzing categorical data
- Analyzing one categorical variable: Analyzing categorical data
- Two-way tables: Analyzing categorical data
- Distributions in two-way tables: Analyzing categorical data
Unit 2: Displaying and comparing quantitative data
- Displaying quantitative data with graphs: Displaying and comparing quantitative data
- Describing and comparing distributions: Displaying and comparing quantitative data
- More on data displays: Displaying and comparing quantitative data
Unit 3: Summarizing quantitative data
- Measuring center in quantitative data: Summarizing quantitative data
- More on mean and median: Summarizing quantitative data
- Interquartile range (IQR): Summarizing quantitative data
- Variance and standard deviation of a population: Summarizing quantitative data
- Variance and standard deviation of a sample: Summarizing quantitative data
- More on standard deviation: Summarizing quantitative data
- Box and whisker plots: Summarizing quantitative data
- Other measures of spread: Summarizing quantitative data
Unit 4: Modeling data distributions
- Percentiles: Modeling data distributions
- Z-scores: Modeling data distributions
- Effects of linear transformations: Modeling data distributions
- Density curves: Modeling data distributions
- Normal distributions and the empirical rule: Modeling data distributions
- Normal distribution calculations: Modeling data distributions
- More on normal distributions: Modeling data distributions
Unit 5: Exploring bivariate numerical data
- Introduction to scatterplots: Exploring bivariate numerical data
- Correlation coefficients: Exploring bivariate numerical data
- Introduction to trend lines: Exploring bivariate numerical data
- Least-squares regression equations: Exploring bivariate numerical data
- Assessing the fit in least-squares regression: Exploring bivariate numerical data
- More on regression: Exploring bivariate numerical data
Unit 6: Study design
- Statistical questions: Study design
- Sampling and observational studies: Study design
- Sampling methods: Study design
- Types of studies (experimental vs. observational): Study design
- Experiments: Study design
Unit 7: Probability
- Basic theoretical probability: Probability
- Probability using sample spaces: Probability
- Basic set operations: Probability
- Experimental probability: Probability
- Randomness, probability, and simulation: Probability
- Addition rule: Probability
- Multiplication rule for independent events: Probability
- Multiplication rule for dependent events: Probability
- Conditional probability and independence: Probability
Unit 8: Counting, permutations, and combinations
- Counting principle and factorial: Counting, permutations, and combinations
- Permutations: Counting, permutations, and combinations
- Combinations: Counting, permutations, and combinations
- Combinatorics and probability: Counting, permutations, and combinations
Unit 9: Random variables
- Discrete random variables: Random variables
- Continuous random variables: Random variables
- Transforming random variables: Random variables
- Combining random variables: Random variables
- Binomial random variables: Random variables
- Binomial mean and standard deviation formulas: Random variables
- Geometric random variables: Random variables
- More on expected value: Random variables
- Poisson distribution: Random variables
Unit 10: Sampling distributions
- What is a sampling distribution?: Sampling distributions
- Sampling distribution of a sample proportion: Sampling distributions
- Sampling distribution of a sample mean: Sampling distributions
Unit 11: Confidence intervals
- Introduction to confidence intervals: Confidence intervals
- Estimating a population proportion: Confidence intervals
- Estimating a population mean: Confidence intervals
- More confidence interval videos: Confidence intervals
Unit 12: Significance tests (hypothesis testing)
- The idea of significance tests: Significance tests (hypothesis testing)
- Error probabilities and power: Significance tests (hypothesis testing)
- Tests about a population proportion: Significance tests (hypothesis testing)
- Tests about a population mean: Significance tests (hypothesis testing)
- More significance testing videos: Significance tests (hypothesis testing)
Unit 13: Two-sample inference for the difference between groups
- Comparing two proportions: Two-sample inference for the difference between groups
- Comparing two means: Two-sample inference for the difference between groups
Unit 14: Inference for categorical data (chi-square tests)
- Chi-square goodness-of-fit tests: Inference for categorical data (chi-square tests)
- Chi-square tests for relationships: Inference for categorical data (chi-square tests)
Unit 15: Advanced regression (inference and transforming)
- Inference about slope: Advanced regression (inference and transforming)
- Nonlinear regression: Advanced regression (inference and transforming)
Unit 16: Analysis of variance (ANOVA)
- Analysis of variance (ANOVA): Analysis of variance (ANOVA)
009 - DataCamp : Introduction to Statistics¶
Details
Chapter 1: Summary Statistics
- What is statistics?
- Using statistics in the real-world
- Identifying data types
- Descriptive vs. Inferential statistics
- Measures of center
- Typical number of robberies per London Borough
- Choosing a measure
- London Boroughs with most frequent crimes
- Measures of spread
- Defining measures of spread
- Box plots for measuring spread
- Which crime has the larger standard deviation
Chapter 2: Probability and Distributions
- What are the chances?
- What is more likely?
- Chances of the next sale being more than the mean
- Conditional probability
- Dependent vs. Independent events
- Orders of more than 10 basket products
- Discrete distributions
- Identifying distributions
- Sample mean vs. Theoretical mean
- Continuous distributions
- Discrete vs. Continuous distributions
- Finding the normal distribution
- Calculating probability with a uniform distribution
Chapter 3: More Distributions and the Central Limit Theorem
- The binomial distribution
- Recognizing a binomial distribution
- How probability affects the binomial distribution
- Identifying n and p
- The normal distribution
- Recognizing the normal distribution
- What makes the normal distribution special?
- Identifying skewness
- Describing distributions using kurtosis
- The central limit theorem
- Visualizing sampling distributions
- The CLT vs. The law of large numbers
- When to use the central limit theorem
- The Poisson distribution
- Identifying Poisson processes
- Recognizing lambda in the Poisson distribution
Chapter 4: Correlation and Hypothesis Testing
- Hypothesis testing
- Sunshine and sleep
- The hypothesis testing workflow
- Independent and dependent variables
- Experiments
- Recognizing controlled trials
- Why use randomization?
- Correlation
- Identifying correlation between variables
- What can correlation tell you?
- Confounding variables
- Interpreting hypothesis test results
- Significance levels vs. p-values
- Type I and type II errors
- Congratulations!
010 - Stanford University : Introduction to Statistics¶
Details
Introduction et statistiques descriptives pour l'exploration des données
Production de données et échantillonnage
Probabilité et distributions
- Probabilité
- Approximation normale et distribution binomiale
- Distributions d'échantillonnage et théorème de la limite centrale
Régression et analyse des données
- RĂ©gression
- Intervalles de confiance
- Tests de signification
- RĂ©Ă©chantillonnage
- Analyse des données catégorielles
Analyse de la variance
- Analyse de la variance Ă une voie (ANOVA)
- Comparaisons multiples