5 projets d'analyse de données pour les débutants

Écrit par Coursera Staff • Mise à jour à

Créez un portfolio prêt à l’emploi avec ces cinq projets d’analyse de données adaptés aux débutants.

[Image en vedette] Une personne portant une al-amira rose est assise sur un canapé gris et travaille sur un ordinateur portable

Read in English (Lire en anglais).

Si vous vous préparez à vous lancer dans une nouvelle carrière de data analyst, il est probable que vous ayez rencontré un dilemme séculaire. Les offres d'emploi demandent de l'expérience, mais comment acquérir de l'expérience si vous recherchez votre premier emploi de data analyst ? C'est là qu'intervient votre portfolio de data analyst.

Les projets d'analyse de données que vous incluez dans votre portfolio démontrent aux recruteurs vos compétences et votre expérience, même si elles ne proviennent pas d'un précédent emploi dans le domaine de l'analyse de données. Enrichir votre portfolio avec de bons projets d’analyse de données peut contribuer grandement à conforter l’idée que vous êtes la personne idéale pour le poste, même sans expérience professionnelle préalable.

Dans cet article, nous allons aborder cinq types de projets que vous devriez inclure dans votre portfolio, surtout si vous débutez. Vous n'en avez pas encore ? Dans le cadre du Certificat Professionnel en Analyse de Données de Google, vous démontrerez vos compétences grâce à des projets d’analyse de données prêts à être intégrés dans votre portfolio et présentés à de futurs employeurs.

Idées de projets d'analyse de données

En tant que data analyst en herbe, vous souhaiterez démontrer quelques compétences clés dans votre portfolio. Ces idées de projets d'analyse de données reflètent les tâches qui correspondent souvent aux fonctions de base de nombreux data analysts. 

1. Web scraping

Bien qu’Internet regorge d’excellents (et gratuits) ensembles de données publiques excellentes, vous voudrez peut-être montrer aux employeurs potentiels que vous êtes également capable de trouver et d'extraire vos propres données. De plus, savoir comment extraire des données du web signifie que vous pouvez trouver et utiliser des ensembles de données qui correspondent à vos intérêts, qu'ils aient déjà été compilés ou non.

Si vous connaissez un peu Python, vous pouvez utiliser des outils comme Beautiful Soup ou Scrapy pour explorer le web à la recherche de données intéressantes. Si vous ne savez pas coder, ne vous inquiétez pas. Vous trouverez également plusieurs outils qui automatisent le processus (beaucoup proposent un essai gratuit), comme Octoparse ou ParseHub.

Si vous ne savez pas par où commencer, voici quelques sites web proposant des choix de données intéressantes pour inspirer votre projet :

  • Reddit

  • Wikipédia

  • Sites d'emploi

Exemple de projet de web scraping : Todd W. Schneider de Wedding Crunchers a récupéré environ 60 000 annonces de mariage du New York Times publiées entre 1981 et 2016 pour mesurer la fréquence d’expressions particulières. 

Conseil : chaque fois que vous récupérez des données sur Internet pour votre projet d’analyse de données, n'oubliez pas de respecter les conditions d'utilisation de chaque site web. Limitez vos activités de récupération afin de ne pas surcharger les serveurs d'une entreprise et citez toujours vos sources lorsque vous présentez vos résultats de données dans votre portfolio.

Emplacement réservé

Vous souhaitez en savoir plus sur la manière dont les employeurs voient les data analysts ? Découvrez-en plus sur la manière dont les data analysts et leurs portfolios sont perçus par les responsables du recrutement dans cette conférence du Certificat Professionnel en Analyse de Données de Google :

2. Nettoyage des données

Une part importante de votre métier de data analyst consiste à nettoyer les données pour les préparer à l'analyse. Le nettoyage des données (également appelé épuration des données) est le processus consistant à supprimer les données incorrectes et en double, à gérer les éventuelles lacunes dans les données et à garantir un formatage cohérent. 

Lorsque vous recherchez un ensemble de données pour vous entraîner au nettoyage, recherchez-en un qui comprend plusieurs fichiers collectés à partir de plusieurs sources sans beaucoup de préparation. Voici quelques sites où vous pouvez trouver des ensembles de données « sales » avec lesquels travailler :

  • CDC Wonder

  • Data.gov

  • World Bank

  • Data.world

  • /r/datasets

  • data.gouv.fr

  • data.sncf.com

  • donneespubliques.meteofrance.fr

Exemple de projet de nettoyage de données : Cet article de Medium décrit comment le data analyst Raahim Khan a nettoyé un ensemble de statistiques mises à jour quotidiennement sur les vidéos YouTube les plus populaires.

Apprenez à collecter, nettoyer, trier, évaluer et visualiser des données avec le Certificat Professionnel de Data Analyst de Meta.

Emplacement réservé

3. Analyse exploratoire des données (AED)

L'analyse des données consiste à répondre à des questions à l'aide de données. L'analyse exploratoire des données, ou AED en abrégé, vous aide à déterminer les questions à poser. Cela peut être effectué séparément ou en conjonction avec le nettoyage des données. Dans tous les cas, vous souhaiterez accomplir les tâches suivantes au cours de ces premières investigations :

  1. Questionner abondamment les données.

  2. Découvrir la structure sous-jacente des données.

  3. Rechercher des tendances, des modèles et des anomalies dans les données.

  4. Tester des hypothèses et valider des conjectures sur les données.

  5. Réfléchir aux problèmes que vous pourriez éventuellement résoudre avec les données.

Exemple de projet d'analyse exploratoire de données : ce data analyst a pris un ensemble de données existantes sur les universités américaines en 2013 publiées par Kaggle et l'a utilisé pour explorer ce qui fait que les étudiants préfèrent une université à une autre.

10 ensembles de données publiques gratuites pour l'AED

Un projet AED est une excellente occasion de tirer parti de la richesse des ensembles de données publiques disponibles en ligne. Voici 10 ensembles de données amusants et gratuits pour vous aider à démarrer vos explorations.

1. Centres nationaux d'information sur l'environnement : découvrez le plus grand fournisseur mondial de données météorologiques et climatiques.

2. Rapport 2024 sur le bonheur dans le monde : Qu'est-ce qui rend si heureux les pays les plus heureux du monde ? 

3. NASA : Si vous vous intéressez aux sciences spatiales et terrestres, voyez ce que vous pouvez trouver parmi les dizaines de milliers de données publiques mises à disposition par la NASA.

4. Recensement des États-Unis : apprenez-en plus sur la population et l’économie des États-Unis avec les dernières données du recensement de 2020.

5. FBI Crime Data Explorer (CDE) : explorez les données de la criminalité collectées par plus de 18 000 organismes chargés de l'application de la loi.

6. Tableau de bord COVID-19 de l'Organisation mondiale de la santé : suivez les derniers chiffres de l’OMS sur le coronavirus, par pays ou région.

7. Dernières données Netflix : cet ensemble de données de Kaggle (mis à jour en avril 2021) comprend des données sur les films réparties en 26 attributs.

8. Google Books Ngram : Téléchargez les données brutes de Google Books Ngram pour explorer les tendances des mots ou expressions dans les livres publiés de 1800 à 2022.

9. NYC Open Data : Découvrez la ville de New York à travers ses nombreux ensembles de données accessibles au public sur des sujets tels que la population d'écureuils de Central Park et les collisions de véhicules à moteur.

10. Ensemble de données ouvertes Yelp : découvrez ce que vous pouvez trouver en explorant cette collection d'avis d'utilisateurs, d'enregistrements et de caractéristiques d’entreprises fournie par Yelp.

Emplacement réservé

4. Analyse de sentiments

L'analyse de sentiments, généralement effectuée sur des données textuelles, est une technique de traitement automatique des langues (TAL) permettant de déterminer si le sentiment qui se dégage d’un énoncé est neutre, positif ou négatif. Elle peut également être utilisée pour détecter une émotion particulière en fonction d'une liste de mots et des émotions correspondantes (appelée lexique). 

Ce type d’analyse fonctionne bien avec les sites d’évaluation publique et les plateformes de réseaux sociaux, où les gens sont susceptibles d’exprimer publiquement leur opinion sur divers sujets.

Pour commencer à explorer ce que les gens pensent d'un certain sujet, vous pouvez commencer par des sites comme :

  • Amazon (avis sur les produits)

  • Allocine (critiques de films)

  • Facebook

  • X (anciennement Twitter)

  • Les sites d'actualités

Exemple de projet d'analyse de sentiments : cet article de blog sur Medium détaille comment un business analyst utilise Python pour effectuer une analyse de sentiments à partir des avis sur les produits à l'aide du TAL.

Découvrez comment utiliser Google Cloud pour l'analyse de sentiments grâce à Google lui-même, dans son court projet interactif Entity and Sentiment Analysis with the Natural Language API.

Emplacement réservé

5. Visualisation des données

Les humains sont des créatures visuelles, ce qui fait de la visualisation des données un outil puissant pour transformer les données en une histoire convaincante qui encourage l'action. Les visualisations de qualité sont non seulement amusantes à créer, mais elles ont également le pouvoir de rendre votre portfolio magnifique.

Exemple de projet de visualisation de données : la data analyst Hannah Yan Han visualise le niveau de compétence requis pour 60 sports différents afin de déterminer lesquels sont les plus difficiles.

Cinq outils de visualisation de données gratuits

Vous n'avez pas non plus besoin de payer pour un logiciel de visualisation avancé pour commencer à créer des visuels exceptionnels. Voici quelques-uns des outils de visualisation gratuits que vous pouvez utiliser pour commencer à raconter une histoire avec des données :

1. Tableau Public : Tableau se classe parmi les outils de visualisation les plus populaires. Utilisez la version gratuite pour transformer des feuilles de calcul ou des fichiers en visualisations interactives (voici quelques exemples d'avril 2021).

2. Google Charts : Cette galerie de graphiques interactifs et d'outils de visualisation de données permet d'intégrer facilement des visualisations dans votre portfolio à l'aide de codes HTML et JavaScript. Une section Guides complète vous guide tout au long du processus de création.

3. Datawrapper : Copiez et collez vos données à partir d'une feuille de calcul ou téléchargez un fichier CSV pour générer des graphiques, des cartes ou des tableaux, sans codage. La version gratuite vous permet de créer un nombre illimité de visualisations à exporter sous forme de fichiers PNG.

4. D3 (Data-Driven Documents) : Avec un peu de savoir-faire technique, vous pouvez faire beaucoup de choses avec cette bibliothèque JavaScript.

5. RAW Graphs : cette application web open source permet de transformer facilement des feuilles de calcul ou des fichiers CSV en une gamme de types de graphiques qui pourraient autrement être difficiles à produire. L'application fournit même des exemples d'ensembles de données avec lesquels vous pouvez acquérir de l’expérience.

Emplacement réservé

Bonus : Projet complet

Il n'y a rien de mal à enrichir votre portfolio avec des mini-projets mettant en valeur vos propres compétences. Mais si vous avez récupéré vos propres données sur le web, vous pouvez également envisager d'utiliser ces mêmes données pour mener à bien un projet de bout en bout. Pour ce faire, prenez les données que vous avez récupérées et appliquez-leur les principales étapes de l'analyse des données : nettoyer, analyser et interpréter. 

Cela peut montrer à un employeur potentiel que vous possédez les compétences essentielles d’un data analyst et que vous savez comment elles s’articulent.

Abonnez-vous à Career Chat sur LinkedIn

Nous avons publié une newsletter sur la façon de devenir data analyst. Abonnez-vous pour être au courant des derniers conseils de carrière avec Career Chat.

Emplacement réservé

Développez vos compétences en analyse de données sur Coursera

Une autre excellente façon de créer des projets prêts à être intégrés dans un portfolio est de suivre une formation en ligne basée sur des projets. Voici quelques-uns des cours les plus recommandés sur Coursera :

Réalisez des projets à ajouter à votre portfolio avec le Certificat Professionnel en Analyse de Données de Google. Une fois le programme terminé, vous aurez également accès à des ressources professionnelles.

Approfondissez et démontrez vos compétences en Python avec la spécialisation Python for Everybody de l'Université du Michigan .

Entraînez-vous à utiliser Power BI, un outil d'analyse de données courant utilisé pour transformer les données en informations avec des rapports et des tableaux de bord personnalisés, grâce au Certificat Professionnel Microsoft Power BI Data Analyst.

Questions fréquemment posées (FAQ)

Continuer de lire

Mise à jour à
Écrit par :

Équipe éditoriale

L’équipe éditoriale de Coursera est composée de rédacteurs, de rédacteurs et de vérificateurs de fai...

Ce contenu a été mis à disposition à des fins d'information uniquement. Il est conseillé aux étudiants d'effectuer des recherches supplémentaires afin de s'assurer que les cours et autres qualifications suivis correspondent à leurs objectifs personnels, professionnels et financiers.