32 Ressources générales

Voici une longue liste de resources générales très utiles pour tout ce qui touche à l’exploration de données. Si vous trouvez une bonne ressource que vous ne voyez pas répertoriée ici, pensez à l’ajouter via une pulle request (voir notre page de contribution pour plus d’informations).

32.1 Livres

Beaucoup de ces livres sont disponibles pour les étudiants via Columbia Libraries, en

  • Graphical Data Analysis with R: Ce livre explique de façon systématique les différents types de données, y compris les variables catégorielles, continues et séries temporelles. L’auteur montre plusieurs exemples de techniques pour présenter les données comme ggplot et promeut le modèle “grammar of graphics”. Les parties de code sont inclues et disponibles sur le site du livre.

  • R for Data Science: Le classique. Tout des types de données, programmation, modélisation, communication des résultats et ces raccourcis clavieres qu’on oublie tout le temps. Pour citer le livre, “Ce livre vous apprendra ) appliquer des data sciences avec R”. Tout est dit.

32.2 Cheatsheets

  • Cheatsheet of cheatsheets: Paul van der Laken a répertorié une grande panoplie de ressources R, soit des cheatsheets, guides de style, informations sur des packages, blogs et autres ressources utiles.

  • RStudio Cheatsheet Collection: Un ensemble de cheatsheets qui peuvent être téléchargées de RStudio. Cela inclut celles sur R Markdown, transformation de données (dplyr) et visualisation de données (ggplot2). Ils ont aussi un guide de référence R Markdown, qui est génial pour se rappeler des chunks options qu’on a tendance à oublier.

  • R Base Graphics Cheatsheet: De façon assez suprenante, malgré sa durée d’existence, il est difficile de trouver une cheatsheet pour base graphics. Joyce a créé celle-ci pour aider ceux qui utilise cet outil.

32.3 Articles

  • Ten Simple Rules for Better Figures: Un article utile qui explique comment faire les meilleurs graphiques en suivant des règles très simples comme “éviter le ‘chartjunk’” et “connais ton audience”. Il est bon de garder ces règles en tête.

  • The Simpsons by the Data: Un bon exemple pour raconter une histoire avec des données (histogrammes, scatterplots, etc.). De plus, son sujet est la série télé préférée de toutes les familles (pas tout à fait vrai quand tu es français, mais on respecte la version originale en anglais).

32.4 Meetups

32.5 Twitter

R aime Twitter. Voici quelques personnes très cools qui travaillent avec #rstats:

32.6 Data

(Peut-être que ceci devrait être un nouveau chapitre)

Membres du Congrès aux Etats-Unis (1789-Présent) avec beaucoup d’informations biographiques:







with