Article original : Machine Learning Systems Book Recommendations – Learn How to Build and Understand ML Systems
« De bons amis, de bons livres et une conscience endormie : voilà la vie idéale. »
— Mark Twain
J'espère que vous lisez ce blog en pyjama, impatient de passer un week-end régénérant et sain.
J'ai travaillé sur plusieurs projets ces derniers temps, de la création de cours de Machine Learning Engineering et de Machine Learning Operations (MLOps) au développement de systèmes de ML de bout en bout à grande échelle. Et je me suis rendu compte que, bien souvent, soit je replonge dans un livre que j'ai déjà lu, soit je me réfère à un livre que j'avais seulement parcouru sans jamais avoir eu la chance de le lire vraiment.
Cette semaine, je souhaite partager avec vous les livres qui, selon moi, devraient être lus par tout passionné et praticien du ML pour saisir l'étendue des idées et la profondeur de ce domaine.
C'est une liste courte et concise couvrant la majorité des sujets du ML. Elle devrait être utile aussi bien aux débutants qui se lancent qu'aux professionnels de niveau intermédiaire souhaitant comprendre les subtilités de l'ingénierie de systèmes de ML réussis.
Alors, c'est parti...
#1 — Hands-On Machine Learning with Scikit-Learn, Keras and TensorFlow, 2nd Edition
Par Aurélien Géron
Ce livre est tout simplement une œuvre d'art. Je recommande vivement non seulement de lire ce livre, mais aussi de coder en même temps que l'auteur.
Le livre est divisé en deux parties — la première partie est axée sur les fondamentaux du machine learning et couvre tous les principaux algorithmes de ML classiques. Il contient juste ce qu'il faut d'explications mathématiques et de code Python pour commencer réellement à développer des modèles.
La seconde partie se concentre sur les réseaux de neurones et le deep learning.
J'ai lu ce livre en entier et j'ai peut-être relu certains chapitres deux ou trois fois afin de bien assimiler les concepts et de faire les exercices.
Conseil de lecture pour celui-ci : passez 2 à 3 jours (ou plus si nécessaire) sur chaque chapitre si vous consacrez 2 à 3 heures à l'apprentissage actif.
#2 — Machine Learning Engineering
Par Andriy Burkov
Andriy a encore frappé. Ce livre explique chaque phase du cycle de vie des systèmes de ML et constitue une ressource complète et concise pour quiconque a l'intention de construire des applications évolutives alimentées par le ML.
Le livre est une compilation de défis d'ingénierie et de meilleures pratiques pour faire fonctionner le ML en production. Andriy explique comment vous devriez envisager la planification d'un projet, pourquoi les projets peuvent échouer et comment aborder chaque étape. Voici les sections de ce livre :
Son premier livre, The Hundred-Page Machine Learning Book, a été un grand succès et on peut en dire autant de celui-ci.
#3 — Practical Deep Learning for Cloud, Mobile, and Edge
Par Anirudh Koul, Siddha Ganju et Meher Kasam
Le livre suit le conseil pratique selon lequel on apprend en pratiquant. C'est un guide pratique pour créer des applications de Deep Learning pour le cloud, les navigateurs mobiles et les appareils edge. Je suis actuellement en train de lire ce livre et je suis surpris de ne pas être tombé dessus plus tôt.
Chaque chapitre vous aide à construire une application de bout en bout. Chaque application cible un sous-domaine du deep learning, une méthode de service différente ou des techniques pour optimiser l'expérimentation à l'aide de TensorFlow.
C'est une lecture incontournable pour les personnes déjà familières avec le deep learning. Ce livre vous aide à plonger plus profondément et à apprendre en construisant une série de projets sympas.
#4 — Building Machine Learning Pipelines
Par Hannes Hapke et Catherine Nelson
Après avoir lu un certain nombre d'études de cas sur la façon dont des organisations comme Spotify et Airbnb utilisent TF Extended pour améliorer leurs plateformes de ML, j'ai commencé à apprendre TFX. Cela peut vraiment vous aider à optimiser le développement de pipelines de bout en bout.
Le livre explique les techniques pour mettre en place des pipelines de ML, de l'ingestion des données à l'orchestration des pipelines à l'aide d'Airflow ou de Kubeflow. TFX, associé à TF, offre des outils pour chaque étape du processus.
Il s'agit d'une lecture de niveau avancé, et vous ne devriez vous y plonger qu'après avoir fini de lire les deux premières recommandations.
Lecture intéressante de la semaine
C'est une recommandation un peu inhabituelle par rapport à ce sur quoi j'écris d'habitude. Mais je n'ai pas pu m'empêcher de la partager avec vous en raison de la qualité exceptionnelle du travail accompli ici.
Comprenez-vous comment fonctionne un moteur à combustion interne ? Comment toutes ces pièces s'assemblent pour propulser vos véhicules et vos machines ? Eh bien, je suis tombé sur la meilleure explication possible du fonctionnement de toutes les pièces de base d'un moteur.
Lire l'article : Internal Combustion Engine par Bartosz Ciechanowski
Les illustrations à 360 degrés magnifiquement conçues et en action, accompagnées d'explications, vous aident non seulement à comprendre les moteurs à combustion, mais pour ma part, cela m'a définitivement inspiré à travailler plus dur sur mon art.
Cela m'a amené à me demander si notre système éducatif en fait assez pour nous inspirer ou s'il se contente de nous « enseigner ».
Merci de m'avoir lu !
C'est tout pour cette semaine. Je ne veux pas vous accabler avec une pléthore de livres de ML aléatoires. N'hésitez pas à me contacter si vous avez des réflexions, des recommandations ou des questions.
Si ce tutoriel vous a été utile, n'hésitez pas à consulter mes cours de data science et de machine learning sur Wiplane Academy. Ils sont complets mais compacts et vous aident à construire une base solide de travaux à présenter.