Article original : How to Build an Awesome Data Science Portfolio

Si la section compétences de votre CV mentionne Python, R, SQL, Machine Learning, Deep Learning et que vous vous demandez pourquoi vous êtes rejeté à chaque fois, continuez à lire.

Des millions de personnes cherchent un emploi en Data Science, et les opportunités sont limitées. La question importante est donc de savoir comment vous pouvez vous démarquer.

Ce guide tente de capturer tout ce dont vous avez besoin pour construire un portfolio exceptionnel — si bon qu'ils ne pourront pas vous ignorer !

Pourquoi construire un portfolio ?

Pour quelqu'un qui a obtenu un master ou un doctorat d'une université de premier plan, trouver un emploi peut ne pas être si difficile. L'institut ajoute de la crédibilité à votre profil, ce que les employeurs recherchent.

Pour quelqu'un qui n'a pas de diplôme pertinent ou suffisamment d'expérience, cette crédibilité doit être établie via un portfolio exceptionnel mettant en valeur votre potentiel. Le portfolio sert alors de preuve de vos compétences.

Il existe de nombreux facteurs qui peuvent améliorer vos chances d'être remarqué par un employeur. Avec une stratégie intelligente et des efforts constants, vous pourrez y parvenir.

Construisons un plan infaillible pour travailler à l'obtention d'un emploi !

Étape 1 — Identifiez-vous

Passer d'un portail de carrière à un autre et postuler à n'importe quel emploi mentionnant "Data" n'est pas une bonne idée. Cela ne fera qu'ajouter à votre stress et à votre charge de travail pour apprendre qu'ils vous ont rejeté.

Affinez votre recherche

4212d182-9f2f-4759-950c-7c6fa3f492b6

Par Monica Rogati — https://medium.com/hackernoon/the-ai-hierarchy-of-needs-18f111fcc007

Le spectre de la Data Science est immense. La plupart des gens se situent dans l'une des strates de la pyramide représentée dans le diagramme. Seuls quelques-uns peuvent maîtriser deux ou trois des couches.

Une organisation axée sur les données emploie aujourd'hui pour divers postes, et voici une liste avec le niveau de difficulté des problèmes que ces professionnels résolvent :

  • Analystes de données — Facile à moyen

  • Ingénieurs de données — Moyen à difficile

  • Ingénieurs ML — Moyen

  • Chercheurs/Scientifiques de données — Difficile

  • Ingénieurs IA/Praticiens du Deep Learning — Très difficile

Évidemment, un seul individu ne peut pas accomplir toutes les tâches. La première chose à faire est d'identifier les compétences que vous avez maîtrisées (ou que vous souhaitez maîtriser). Sur la base de ces compétences, vous devriez sélectionner les descriptions de poste que vous viserez.

Étape 2 — Étudier la description de poste

Si vous passez suffisamment de temps à parcourir un ensemble de descriptions de poste pour divers profils de données, vous remarquerez qu'ils demandent de l'expérience même pour quelqu'un fraîchement sorti de l'université.

La deuxième chose à comprendre est qu'il existe des emplois avec des exigences plus généralistes comme l'analyse de données. Et puis il y a des domaines de recherche plus spécialisés et dédiés comme un chercheur scientifique dans un fonds spéculatif, ce qui est très mathématique.

Voici quelques captures d'écran que j'ai prises de grandes (Facebook, Netflix) et moyennes (h20.ai) organisations sur ce qu'elles recherchent chez un candidat :

Image pour l'article

Les étudier nous ramène à la question très importante et souvent posée :

Comment compenser le facteur expérience si je suis fraîchement sorti de l'école ?

La réponse est les projets !

Attendez ! Je le savais déjà…

Voici ce que vous ne saviez probablement pas — ces projets ne peuvent pas être votre analyse du jeu de données MNIST ou la résolution du problème de classification du jeu de données Titanic.

Alors, quel type de projets ? Où trouver ces projets ? Que suis-je censé faire ?

Pour répondre à cela, plongeons dans la construction de votre portfolio.

Étape 3 — Montrer son expertise via des projets

Les projets sont votre seul substitut à l'expérience.

Chris Albon, lorsqu'on lui a demandé ce que les gens devraient avoir dans leur portfolio lorsqu'ils cherchent leur premier emploi dans une interview avec Datacamp, a dit :

...quand quelqu'un postule, certaines des meilleures choses qu'il peut présenter sont des projets qu'il a réalisés ou quelque chose comme un boot camp ou peut-être sa recherche de thèse ou quelque chose de ce genre, où nous pouvons regarder et dire, oh, cool, comme vous avez fait des trucs intéressants, vous avez travaillé avec des données de manière intéressante.

Ce que ces projets doivent refléter :

Il y a quatre facteurs majeurs que vos projets doivent valider, quel que soit le profil pour lequel vous postulez :

  1. Votre maîtrise des compétences requises

  2. La complexité du problème que vous avez résolu ou étudié — il peut s'agir d'un problème nouveau ou d'un problème courant de niveau entreprise.

  3. Expertise du domaine — la quantité de recherche que vous avez effectuée pour trouver les réponses aux questions ou construire une infrastructure de données.

  4. Votre volonté d'aller plus loin et de faire ressortir le projet — Déployer votre projet pour un usage public ou écrire un blog ou publier une vidéo pour expliquer vos résultats.

Types de projets à ajouter à votre portfolio

En gardant à l'esprit les facteurs mentionnés ci-dessus, voici une liste d'idées de projets qui nécessiteront des efforts sincères, mais qui ajouteront du poids à votre portfolio.

  • Travailler avec des données réelles : Si vous pouvez montrer à quelqu'un que vous pouvez travailler avec des données brutes provenant de différentes sources et répondre à des questions intéressantes sur les lois sociales, la finance, les soins de santé ou toute expérience scientifique, cela serait très apprécié.

  • Explorer des jeux de données publics :

Image pour l'article

Utiliser des jeux de données publics, explorer les données pour plusieurs insights, définir des questions qui n'ont jamais été posées auparavant, plonger dans des journaux et des articles de recherche pour chercher du matériel connexe, puis découvrir des motifs cachés en utilisant des modèles statistiques.

Une analyse approfondie d'un jeu de données public est également un bon point de départ.

  • Exploiter votre curiosité : En tant que professionnel des données curieux, il doit y avoir des produits/services/questions que vous trouvez intrigants. Utilisez cette curiosité pour creuser de nouveaux problèmes. Par exemple, un fanatique de sport peut se lancer dans la création d'un tableau de bord ou d'une infrastructure de données qui gère les statistiques et les schémas de performance de tous les joueurs.

  • Contribuer à des packages Open Source : Chaque organisation considère les contributions open-source aux packages de machine learning ou de calcul scientifique comme très importantes. Développer pour des logiciels libres et open-source augmente considérablement vos chances d'être recruté. Vous pouvez essayer de contribuer à des packages comme sklearn, numpy et pandas. Cela montre que vous pouvez travailler avec de grandes et complexes bases de code et que vous maîtrisez votre sujet.

  • Construire des projets de bout en bout : Une excellente façon de prouver que vous êtes vraiment un généraliste est de construire des projets de bout en bout (plus comme des produits). Ne vous arrêtez pas à la recherche de la solution ou à la création d'un prototype pour un système de recommandations ou un chatbot fintech. Allez plus loin, déployez-le, partagez-le avec vos pairs pour qu'ils l'utilisent, collectez des analyses. Cela montre à quel point vous êtes passionné par ce que vous faites et jusqu'où vous pouvez aller pour apprendre de nouvelles technologies et méthodes.

  • Projets spécifiques à une compétence : Il y a des gens qui sont très bons pour nettoyer des données ou créer des graphiques perspicaces ou automatiser des pipelines de données. Vous devriez envisager de développer vos propres packages Python qui pourraient automatiser ces tâches de nettoyage ou, étant donné un dataframe, le package devrait créer des graphiques de paires et toutes les autres possibilités pour accélérer le processus EDA.

Liste de quelques portfolios vraiment cool pour inspiration :

Calendrier pour le projet

Le temps que vous passez sur un projet donne des indices sur la complexité, la niche et le volume de travail qu'il nécessite. Cela devrait vous aider à justifier si le projet est digne d'être dans votre portfolio ou non.

Les efforts que vous mettez dans votre projet pour le faire passer au niveau supérieur dépendent de nombreux facteurs différents.

Juste pour vous donner quelque chose à quantifier, si vous avez choisi une technologie naissante avec laquelle travailler, vous devriez passer au moins un mois à construire quelque chose de concret.

Comment ajouter ces projets à votre portfolio

Une fois que vous avez quelques bons projets que vous pouvez inclure dans votre portfolio, l'étape suivante est de présenter votre travail de la meilleure manière possible.

Apple est connue pour son emballage et son design. Soyez sincère quant à la manière dont vous présentez votre travail avant de l'afficher.

Voici comment vous pouvez ajouter plus de poids à vos projets :

  • URL GitHub : Si vous décidez d'ajouter un lien vers votre dépôt, assurez-vous que ce dépôt ne contient pas seulement un notebook Jupyter, il doit contenir tous les autres fichiers comme requirements.txt, .gitignore, une licence si nécessaire, etc. Ainsi, vous serez embauché en tant que package complet et non seulement en tant qu'expert de notebooks Jupyter.

  • Blogs : Écrire sur ce que vous avez accompli est toujours une bonne pratique, et pour les employeurs, cela renforce la confiance dans votre travail et votre capacité à communiquer efficacement ce que vous avez fait.

  • Applications déployées : Si vous avez déployé votre application alimentée par le ML, fournissez le lien pour que l'employeur puisse l'essayer.

  • Tableaux de bord : Si vous êtes fier de votre analyse, vous pouvez créer un tableau de bord à partir de celle-ci. Vous pouvez utiliser Voila ou Dash si vous travaillez en Python. Si vous êtes un expert en analyse commerciale, vous pouvez ajouter votre tableau de bord Power BI ou Tableau pour montrer vos compétences en analyse.

Étape 4 — Profils sur les réseaux sociaux

Un bon profil sur les réseaux sociaux peut vous aider à décrocher votre prochain emploi de rêve. GitHub, LinkedIn, Twitter, Kaggle, StackOverflow et Medium sont les principales plateformes que les gens utilisent pour partager leur travail/sentiments, réseauter, consommer des informations et faire de la publicité.

Les organisations et les recruteurs utilisent ces plateformes pour contacter leur prochain candidat potentiel.

  • GitHub : Avoir un bon profil GitHub avec beaucoup de contributions ou d'étoiles sur vos dépôts fait de vous un programmeur compétitif.

Image pour l'article

  • Kaggle : Participer à des compétitions Kaggle, créer des notebooks et des jeux de données utiles peut également vous aider à construire un bon profil d'analyste de données.

Image pour l'article

Un extrait du post de Reshama Shaikh To Kaggle or Not dit :

Il est vrai qu'une seule compétition Kaggle ne qualifie pas quelqu'un pour être un scientifique des données. De même, suivre un seul cours ou assister à un seul tutoriel de conférence ou analyser un seul jeu de données ou lire un seul livre en science des données ne suffit pas. Travailler sur des compétitions ajoute à votre expérience et enrichit votre portfolio. C'est un complément à vos autres projets, pas le seul test de litmus des compétences en science des données de quelqu'un.

  • LinkedIn : J'ai personnellement utilisé LinkedIn pour décrocher mon premier emploi, mon premier client et de nombreux collaborateurs. C'est une plateforme tout-en-un pour se connecter avec des personnes qui travaillent dans vos entreprises de rêve, interagir avec elles, trouver des emplois et suivre les avancées intéressantes. Lisez ce guide complet sur le profil LinkedIn pour la science des données pour optimiser votre profil.
    Conseil : Vous devez être prêt à offrir quelque chose avant de demander une faveur.

  • Twitter : Toutes les grandes figures de l'espace de la science des données utilisent Twitter assez fréquemment, et vous avez l'occasion d'interagir avec des personnes de votre domaine. Vous apprenez ce sur quoi ces personnes travaillent et leurs sentiments sur les questions sociales.
    Vous pouvez promouvoir vos blogs, vidéos et autres découvertes avec votre Twitter. Les gens ont obtenu des offres d'emploi, des invitations à des conférences, des travaux freelance et des contrats de marketing d'influence pour leur travail et leur bonne audience sur Twitter.

Principaux scientifiques des données à suivre sur Twitter :

Il y en a beaucoup d'autres, vous pouvez regarder mon profil et les personnes que je suis sur mon profil Twitter.

Étape 5 — Condenser un portfolio en un CV d'une page

L'élément le plus important de votre candidature est votre CV, car il détermine si vous allez être présélectionné pour le poste ou non.

En supposant que vous avez tous les autres éléments en bon état, il est temps de condenser ces informations dans un CV élégant et concis.

Comme vous le savez probablement, les recruteurs ne passent pas plus de quelques minutes à parcourir votre CV, vous devez donc transmettre tout ce que vous avez fait en une seule page.

Les sections les plus importantes après votre nom et vos coordonnées :

  1. Résumé : En 1-2 phrases, expliquez ce que vous avez fait et ce que vous avez l'intention de faire.

  2. Compétences : Ne les remplissez pas avec toutes les compétences aléatoires qui vous viennent à l'esprit. Ne vous évaluez pas sur une échelle. Une seule ligne avec toutes les compétences majeures devrait suffire.

  3. Projets : Cela devrait être la section majeure pour les nouveaux diplômés, car vous n'avez pas beaucoup d'expérience. Soyez concis sur ce que vous avez accompli, ajoutez des hyperliens vers votre travail. Énumérez les projets de fin d'études, les compétitions Kaggle, les recherches indépendantes et les projets. Cette section sera appelée votre portfolio.

  4. Cours suivis : Ajoutez uniquement les cours pertinents. Vous pouvez mentionner votre GPA si applicable.

  5. Expérience (si vous en avez) : Ajoutez un historique d'emploi pertinent avec les points clés qui parlent des tâches majeures que vous avez accomplies dans l'organisation.

  6. Liens vers les réseaux sociaux : N'oubliez pas d'ajouter des liens vers vos profils actifs sur les réseaux sociaux.

Voici un exemple de bon CV qui a été examiné lors de Kaggle CareerCon2018 :

Image pour l'article

Un exemple de bon CV présenté à Kaggle CareerCon

Appel à l'action

Vous avez probablement encore beaucoup de questions. Où trouver des idées de projets ? Comment commencer ? Comment se préparer aux entretiens ? Et bien d'autres.

J'ai travaillé sur la création de projets pour chaque profil en fonction de mon expérience en tant que concepteur pédagogique pour les parcours Web et Data Science.

En fonction de votre réponse à ce post, je créerai un canal Discord pour chaque profil où je partagerai les projets et les instructions pour les compléter avec le calendrier associé à chacun.

Je crois fermement en la pédagogie basée sur les projets et je créerai donc beaucoup de contenu où le développement de projets sera couvert. Je partagerai les ressources que vous pouvez utiliser pour apprendre (certaines que je créerai moi-même) et compléter les projets avec succès.

Vous pouvez regarder l'un de mes exemples ici : COVID-19 Interactive Analysis Dashboard from Jupyter Notebooks.

Voici la version vidéo de cet article de blog sur ma chaîne Data Science with Harshit :

Data Science with Harshit

Avec cette chaîne, je prévois de lancer plusieurs séries couvrant tout l'espace de la science des données. Voici pourquoi vous devriez vous abonner à la chaîne :

Si ce tutoriel vous a été utile, vous devriez consulter mes cours de science des données et de machine learning sur Wiplane Academy. Ils sont complets mais compacts et vous aident à construire une base solide de travail à présenter.