9 Diagramme : QQ-Plot

Ce chapitre est à l’origine une contribution de hao871563506

En cours de progression. Toute amélioration est la bienvenue. Si vous souhaitez participer rendez vous sur contribuer au repo.

9.1 Introduction

En statistiques, un Q-Q (quantile-quantile) plot est une méthode graphique pour comparer deux distributions de probabilité en affachant leur quantiles contre quantiles. Un point (x,y) du graphique représente un quantile de la seconde distribution (axe y) contre le même quantile de la première distribution (axe x). Ainsi la droite est une courbe paramétrique dont le paramètre est le nombre d’intervalle des quantiles.

9.2 Interpretation des qqplots

9.3 Normal ou pas (example avec qqnorm)

9.3.1 qqplot normal

Les points semblent s’aligner le long de la droite. Remarquez que sur l’axe des x il s’agit des quantiles théoriques. Ces quantiles sont ceux de la distribution normale centrée réduite.

9.3.2 qqplot non-normal

Remarquez que les forment une courbe et non pas une droite. Un Q-Q plot normal qui ressemble à ça indique que votre échantillon est biaisé (skewed en anglais)

9.4 Différents genre de qqplots

Le graphique suivant est une compilation des différents types de qqplots. via Stack Exchange

  • Normal qqplot: La distribution normale est symétrique, donc aucun biais (skew) (la moyenne est égale à la médiane).

  • Right skewed qqplot: Right-skew aussi appelé positive skew.

  • Left skewed qqplot: Left-skew aussi appelé negative skew.

  • Light tailed qqplot: Cela veut dire que comparé à la distribution normale il y a un peu plus de données dans les extrémités que dans le centre de la distribution.

  • Heavy tailed qqplot: Cela veut dire que comparé à la distribution normale il y a un beaucoup plus de données dans les extrémités que dans le centre de la distribution.

  • Biomodel qqplot: illustre une distribution bimodale.

9.5 qqplot avec ggplot

Pour faire un qqplot avec ggplot2 on doit utiliser un dataframe, ainsi nous commençons par convertir notre structure de données. On peut voir qu’avec ggplot le qqplot donne un résultat similaire à celui obtenu en utilisant qqnorm.

Néanmoins, si on a besoin d’afficher différents groupes, ggplot est très utile et permet une coloration par facteurs.

9.6 References







with