Article original : Why You Should Learn SQL if You Want a Data Science Job
Par Charlie Custer
L'apprentissage automatique et l'IA peuvent dominer les gros titres technologiques, mais la compétence la plus importante dans l'industrie de la science des données est quelque chose de beaucoup plus ancien — presque 50 ans, en fait ! Malgré son âge, SQL reste le langage le plus important pour le travail des données.
Comment un langage vieux de cinq décennies a-t-il réussi à rester si pertinent dans le secteur en constante évolution et en rapide développement de la science des données ? Nous y viendrons, mais d'abord, répondons à une question plus fondamentale :
Qu'est-ce que SQL ?
SQL est ce qu'on appelle un langage de requête — un type spécifique de langage de programmation conçu pour faciliter l'interaction avec les bases de données. Il a été développé pour la première fois dans les années 1970 pour travailler avec des bases de données relationnelles.
Bien qu'il ait été mis à jour assez fréquemment au fil des ans, c'est toujours ce pour quoi SQL est utilisé aujourd'hui : interroger, mettre à jour, modifier, ajouter et supprimer des données dans des bases de données relationnelles.
(À propos, SQL peut se prononcer « sequel » ou S.Q.L. — les deux prononciations sont largement utilisées.)
Dans le contexte du travail en science des données, SQL est souvent utilisé en tandem avec des langages de programmation traditionnels comme Python ou R.
Un scientifique des données pourrait écrire une requête SQL pour extraire des données spécifiques d'une base de données d'entreprise en fonction des conditions décrites dans la requête. Ensuite, il peut utiliser ses compétences en Python ou R pour effectuer une analyse plus approfondie en utilisant l'ensemble de données que sa requête SQL a récupéré.
Aujourd'hui, SQL est utilisé comme base d'une grande variété de systèmes de gestion de bases de données. Le langage lui-même est open-source, mais des entreprises comme Microsoft ont également développé des « dialectes » de SQL pour une utilisation avec leurs produits de bases de données SQL propriétaires, comme Microsoft SQL Server.
Pourquoi devez-vous apprendre SQL ?
1. Les bases de données SQL sont partout.
Presque toutes les entreprises de la planète stockent des données dans une sorte de base de données. Et la plupart de ces bases de données sont construites en utilisant une sorte de technologie basée sur SQL.
Selon Statista, les quatre systèmes de gestion de bases de données les plus populaires sur terre sont Oracle, MySQL, Microsoft SQL Server et PostgreSQL. Ces quatre systèmes sont basés sur SQL, et toute personne travaillant avec eux bénéficierait de compétences en SQL.
En fait, parmi les dix systèmes de gestion de bases de données les plus populaires, seuls deux (MongoDB et Redis) ne sont pas basés sur SQL.
Mais SQL est si populaire que les compétences en SQL sont utiles même pour ces technologies de bases de données, car des solutions ont été créées pour permettre l'utilisation de SQL sur ces deux systèmes également.
En bref ? Votre entreprise (ou future entreprise) possède une base de données. Si vous voulez un emploi dans le domaine des données, vous devrez être capable d'interroger cette base de données.
Statistiquement parlant, il y a une forte probabilité que vous ayez besoin de compétences en SQL pour le faire — et même si votre entreprise est l'une des rares à utiliser un système de gestion de bases de données non basé sur SQL, il y a de bonnes chances que vos compétences en SQL soient encore utiles.
2. Elles passent au cloud, pas en disparition.
SQL est définitivement ancien, et ce n'est certainement pas « sexy ». Les bootcamps ne font pas de publicités glamour promettant de vous enseigner SQL. Mais comme mentionné précédemment, les bases de données basées sur SQL sont utilisées dans presque toutes les entreprises de la terre.
Et loin de disparaître, SQL est en train d'être implémenté dans la prochaine génération de technologies de bases de données. Avec la demande croissante pour les bases de données cloud, par exemple, des solutions de bases de données SQL basées sur le cloud comme Azure SQL Database de Microsoft, Cloud SQL de Google, et plus encore, apparaissent de tous côtés.
Les bases de données relationnelles peuvent être une ancienne technologie, mais cela signifie aussi qu'elles sont éprouvées. La plupart des entreprises dépendent fortement de leurs bases de données SQL et ne sont pas intéressées à réparer un système qui n'est pas cassé. Cela signifie que les compétences en SQL seront demandées pendant de nombreuses années à venir.
3. Les employeurs exigent que vous connaissiez SQL.
Vous n'avez pas à me croire sur les deux premières raisons. Si vous doutez de l'importance des compétences en SQL, commencez à regarder les offres d'emploi pour des rôles comme « analyste de données » ou « ingénieur de données » et voyez combien mentionnent SQL.
Vous constaterez que les compétences en SQL sont demandées pour presque tous les emplois avec « données » dans le titre. Et pour les postes de niveau débutant comme analyste de données, SQL apparaît plus fréquemment que toute autre compétence technique (y compris Python, R, l'apprentissage automatique, etc.).
En fait, il existe de nombreux emplois dans le domaine des données où les compétences en SQL (et une certaine familiarité avec les tableurs) sont la seule compétence technique requise, ou la seule compétence technique testée dans le cadre du processus d'entretien.
Les rôles plus avancés sont également susceptibles de nécessiter SQL. Les emplois en ingénierie des données, par exemple, listent généralement SQL comme une compétence obligatoire. Au moment de la rédaction de cet article, plus de 70 % des offres d'emploi ouvertes pour « ingénieur de données » sur Indeed.com mentionnent SQL.
Comment apprendre SQL
Ainsi, SQL est un langage essentiel à apprendre pour travailler avec des données. Comment pouvez-vous réellement vous y prendre pour l'apprendre ?
Il existe de nombreuses façons d'apprendre SQL. Et bien que les marketeurs vous diront parfois le contraire, aucune approche unique ne conviendra à tout le monde.
Certains préfèrent les ressources gratuites, comme les cours SQL de freeCodeCamp, d'autres veulent apprendre avec des cours interactifs, et d'autres préfèrent apprendre via une université.
Avant de choisir une plateforme, vous devriez considérer des facteurs tels que :
- Votre budget — Cherchez-vous quelque chose de gratuit ? Êtes-vous prêt à dépenser un peu pour la bonne plateforme d'apprentissage ? Cherchez-vous un diplôme universitaire et êtes-vous prêt à dépenser beaucoup ?
- Votre temps — Combien de temps avez-vous pour apprendre ? Quand pourrez-vous étudier ? Différentes plateformes et solutions d'apprentissage ont des exigences de temps différentes, et certaines nécessitent un engagement à temps plein.
- Vos préférences d'apprentissage — Apprenez-vous mieux en pratiquant ? Vous voudrez peut-être chercher une plateforme interactive qui vous permet d'écrire et d'exécuter des requêtes SQL. Apprenez-vous mieux à partir de vidéos ? Vous voudrez peut-être regarder des cours basés sur des conférences vidéo. Apprenez-vous mieux avec des pairs ? Vous voudrez peut-être chercher une solution d'apprentissage en personne ou en ligne basée sur une cohorte.
Si vous n'êtes pas sûr du type de plateforme ou d'approche qui vous convient le mieux, vous pouvez toujours tester plusieurs options ! Même les plateformes payantes ont généralement un essai gratuit, une sorte de niveau gratuit, ou au moins une ou deux conférences d'exemple que vous pouvez parcourir pour voir si l'approche d'apprentissage vous convient.
Bon apprentissage !