7 Diagramme : Violin Plot
Ce chapitre est à l’origine une contribution de AshwinJay101
En cours de progression. Toute amélioration est la bienvenue. Si vous souhaitez participer rendez vous sur contribuer au repo.
7.1 Avant-propos
Cette section couvre les violins plots.
7.2 Quelques exemples en R
Utilisons le jeu de données chickwts
issu du package datasets
pour réaliser un violin plot avec ggplot2
.
Voilà le code pour le faire :
# import ggplot and the Datasets Package
library(datasets)
library(ggplot2)
supps <- c("horsebean", "linseed", "soybean", "meatmeal", "sunflower", "casein")
# plot data
ggplot(chickwts, aes(x = factor(feed, levels = supps),
y = weight)) +
# plotting
geom_violin(fill = "lightBlue", color = "#473e2c") +
labs(x = "Feed Supplement", y = "Chick Weight (g)")
7.3 Ajout de quelques statistiques au violin plot
7.3.1 Ajout de la médiane et de l’intervalle inter-quartile
On peut ajouter la médianne et l’intervalle interquartile sur un violin plot.
ggplot(chickwts, aes(x = factor(feed, levels = supps),
y = weight)) +
# plotting
geom_violin(fill = "lightBlue", color = "#473e2c") +
labs(x = "Feed Supplement", y = "Chick Weight (g)") +
geom_boxplot(width=0.1)
Pour obtenir ce résultat on ajoute juste une geom boxplot.
7.4 Description
Les violin plots sont similaires au boxplots. L’avantage de ces derniers par rapport aux boxplots est qu’ils nous permette de visualiser la distribution des données et et leur densité de probabilité. On peut interpreter le violin plot comme la combinaison parfaite des boxplots et des density plots.
Ce type de graphique nous permet de savoir si les données sont unimodale, bimodale ou même multi-modale. Ces détails pourtant simples sont invisible dans un boxplot. Dans un violin plot la distribution peut être vue sur la largeur.
7.5 Quand l’utiliser ?
Les violin plots ne s’utilisent que sur des variables continues.
7.6 Ressources externes
- ggplot2 Violin Plot: Ressource excellente pour créer et personnaliser vos violin plot.
with