Hadley Wickham est un statisticien et informaticien qui est surtout connu pour son travail en science des données, en particulier pour ses contributions au langage de programmation open-source R. Il est l'auteur de plusieurs paquets R populaires, y compris le tidyverse, qui est une collection d'outils pour la manipulation et la visualisation de données.
Hadley Wickham est né en Nouvelle-Zélande en 1979.
Il a obtenu son doctorat en statistiques de l'Iowa State University en 2006.
Il a occupé des postes dans plusieurs universités et entreprises technologiques, notamment Rice University, Google et RStudio.
Il a reçu de nombreux honneurs et prix pour son travail, dont le John Chambers Award for Statistical Computing en 2019.
Il est actuellement professeur de statistiques à l'Université d'Auckland en Nouvelle-Zélande.
Python est un langage de programmation open source populaire utilisé à diverses fins, y compris la science des données.
Julia est un langage de programmation relativement nouveau qui a été conçu spécifiquement pour le calcul numérique et scientifique.
Matlab est un langage de programmation propriétaire et un environnement de développement qui est souvent utilisé dans l'informatique scientifique et l'ingénierie.
ggplot2 est un package de visualisation de données populaire pour R qui permet aux utilisateurs de créer des graphiques et des graphiques personnalisés.
dplyr est un package pour R qui fournit des outils de manipulation et de filtrage des données.
tidyr est un paquet pour R qui fournit des outils pour remodeler et nettoyer les ensembles de données.
Le tidyverse est une collection de paquets R créés par Hadley Wickham et d'autres qui fournit des outils pour la manipulation et la visualisation des données.
ggplot2 est un package R populaire pour créer des visualisations de données personnalisées.
dplyr est un paquet R pour la manipulation et le filtrage des données qui est conçu pour fonctionner correctement avec d'autres paquets populaires comme ggplot2.
Cela dépend de la tâche à accomplir. R est souvent préféré pour la visualisation de données et l'analyse statistique, tandis que Python est préférable pour les tâches qui impliquent l'apprentissage automatique ou le travail avec de grands ensembles de données.
Il existe de nombreuses ressources disponibles pour apprendre R, y compris des cours en ligne, des tutoriels et des manuels. Certaines options populaires incluent DataCamp, les ressources d'apprentissage en ligne gratuites de RStudio et le livre 'R for Data Science' de Hadley Wickham et Garrett Grolemund.