Paul Rivière

Paul Rivière
Speaker

Paul Rivière

Data Engineer & Data Scientist @Wavenet

À propos de Paul

Data Engineer et Data Scientist, spécialisé dans les pipelines de données, le stockage et le machine learning appliqué. Mon objectif : construire des solutions robustes qui font parler les données.


Machine Learning comme un rōnin : zéro cloud, 100% contrôle


Entraîner avec les plus gros modèles sur des clouds connus ? Fastoche. Mais tout faire chez soi, sans Internet ? Là, ça se complique. Récemment, nous avons eu l'occasion de travailler sur l'entrainement d'un modèle pour de la détection de fraude dans des transactions. Facile ! Pas vraiment… quand la contrainte du client est d'être 100% OnPremises, aussi bien pour l'entrainement que pour le run. Un challenge qui nous a permis de revenir aux fondamentaux du Machine Learning boostés par les frameworks modernes. Retour donc au bon vieux Python, à Docker, à l’AutoML, au délicat équilibre entre entraînement, surentraînement et validation... Nous vous proposons de revivre avec nous ce challenge au travers des différentes étapes qui nous ont permis de mener à bien ce projet. Et bien entendu, les pièges dans lesquels nous sommes tombés ! Nous irons de la sélection du jeu de données jusqu'à la mise à disposition sous forme d'api locale en passant par les différentes itérations de l'entrainement. Notre objectif : vous montrer que la voie du guerrier armé de sa boite à outils en python est toujours d'actualité et viable ! Du code brut, de l'entraînement sur-mesure, et pas une goutte de cloud pour cette introduction au Machine Learning by yourself.