J'ai des données et un problème commercial - et maintenant ? Apprentissage automatique et explicabilité (AutoMLx) chez Oracle Labs

CS-Can|Info-Can a le plaisir de présenter un webinaire organisé par Oracle Labs, notre nouveau membre corporatif.

J'ai des données et un problème commercial - et maintenant ?
Apprentissage automatique et explicabilité (AutoMLx) chez Oracle Labs

Yasha Pushak
Membre senior du personnel technique, équipe AutoMLx, Oracle Labs

Au cours des dernières décennies, l'apprentissage automatique a fait de nombreux progrès, améliorant ainsi considérablement l'état de l'art dans un large éventail d'applications industrielles. Cependant, pour un ensemble de données donné et un cas d'utilisation professionnel, les utilisateurs non techniques sont confrontés à de nombreuses questions qui limitent l'adoption d'une solution d'apprentissage automatique. Par exemple :

  • Quel modèle d'apprentissage automatique dois-je utiliser ?
  • Comment dois-je définir ses hyperparamètres ?
  • Puis-je me fier à ce que mon modèle a appris ?
  • Mon modèle est-il discriminatoire à l'égard d'un groupe marginalisé ou protégé ?

Même pour les data scientists chevronnés, répondre à ces questions peut s'avérer fastidieux et chronophage. Pour surmonter ces obstacles, l'équipe AutoMLx d'Oracle Labs a développé un pipeline d'apprentissage automatique (AutoML) qui effectue une ingénierie des caractéristiques, un prétraitement et une sélection automatisés, puis sélectionne un modèle d'apprentissage automatique approprié et une configuration d'hyperparamètres. Pour aider les utilisateurs à comprendre et à faire confiance à leurs modèles d'apprentissage automatique "magiques" et opaques, le paquet AutoMLx prend en charge une variété de méthodes qui peuvent aider à expliquer ce que le modèle a appris.

Dans cet exposé, nous donnerons un aperçu de nos méthodes AutoMLx actuelles, nous commenterons les questions ouvertes et nos domaines de recherche actifs, et nous passerons brièvement en revue les projets de nos équipes sœurs au sein des Oracle Labs. Enfin, nous réfléchirons brièvement à certaines des principales différences entre la recherche dans un laboratoire industriel de pointe et la recherche dans un cadre universitaire.

Biographie de l'orateur
Yasha a rejoint Oracle Labs en tant que stagiaire en 2019 au milieu de son doctorat en informatique et de sa titularisation en tant que boursier Vanier à UBC. Il a ensuite repris son doctorat en 2020 tout en continuant à faire des recherches sur l'explicabilité de l'apprentissage automatique à temps partiel chez Oracle Labs.

La recherche doctorale de Yasha a étudié les paysages de fitness des problèmes de configuration d'algorithmes automatisés (une généralisation du problème de configuration d'hyperparamètres qui se pose dans AutoML). Il a montré que les problèmes contiennent des modèles qui peuvent être exploités, permettant ainsi le développement de procédures améliorées de configuration d'algorithmes automatisés. Pendant cette période, Yasha a également été le premier représentant des étudiants au conseil d'administration de CS-Can/Info-Can.

Avant d'obtenir son doctorat, Yasha a obtenu une licence avec mention en informatique et une licence avec mention en mathématiques au campus Okanagan de l'UBC. Au cours de sa dernière année de licence, Yasha a également cofondé la Canadian Undergraduate Computer Science Conference.

Défiler vers le haut
Skip to content