Article original : Learn Python for Data Science – Full Course for Beginners
Si vous vous intéressez à la data science mais que vous ne savez pas par où commencer, Python est un excellent point de départ. Il est facile à apprendre et dispose de nombreuses bibliothèques qui facilitent grandement le travail avec les données.
Nous venons de publier un cours sur la chaîne YouTube freeCodeCamp.org qui vous apprend à faire de la data science en utilisant Python. Frank Andrade a développé ce cours.
Il commence par l'installation et la configuration, puis couvre les fondamentaux de Python afin que vous ne soyez pas perdu si vous n'avez jamais codé auparavant. À partir de là, il aborde deux des bibliothèques les plus couramment utilisées en data science : Pandas et NumPy. Pandas vous aide à travailler avec des tableaux de données (pensez aux feuilles de calcul, mais en Python), et NumPy est idéal pour faire des mathématiques sur ces données.
Vous pourrez appliquer ce que vous apprenez immédiatement avec des projets pratiques. Le premier vous montre comment extraire des données de sites web en utilisant Pandas. Ensuite, vous apprendrez à filtrer et nettoyer ces données, à les remodeler et à créer des tableaux croisés dynamiques. Il y a aussi un projet où vous construirez des graphiques et des diagrammes afin de visualiser ce que les données vous disent. Vous utiliserez des ensembles de données réels et construirez des choses comme des graphiques à barres et des nuées de points pour explorer les tendances et les motifs.
Une fois que vous êtes à l'aise avec ces bases, le cours introduit des techniques plus utiles comme l'utilisation de groupby et des fonctions d'agrégation, la combinaison de différents ensembles de données, et l'utilisation d'expressions régulières pour extraire des motifs spécifiques du texte. Ce sont des compétences dont vous aurez besoin pour tout travail réel avec des données, ou même si vous essayez simplement de comprendre une grande feuille de calcul désordonnée.
Plus tard dans le cours, vous commencerez à travailler avec le machine learning. Ce n'est pas super avancé, mais cela vous donne un bon premier aperçu de son fonctionnement. Vous utiliserez scikit-learn pour construire un modèle simple de classification de texte. Basiquement, vous entraînerez un programme à lire un texte et à décider à quelle catégorie il appartient. Pensez spam vs. non-spam, ou avis positifs vs. négatifs.
Si vous êtes nouveau dans la data science et que vous voulez vraiment essayer des choses au lieu de simplement les lire, ce cours est un bon choix. Tout est divisé en petites sections gérables, et les projets aident à ancrer les idées. C'est gratuit, c'est sur YouTube, et vous pouvez suivre à votre propre rythme.
Êtes-vous prêt à apprendre la Data Science avec Python ? Regardez le cours complet sur la chaîne YouTube de freeCodeCamp.org (17 heures de visionnage) :