Jiannan Wang
Université Simon Fraser
Jiannan Wang s'est imposé comme un leader intellectuel dans la recherche sur les systèmes de bases de données. Il a notamment apporté d'importantes contributions de recherche à la gestion des données crowdsourcées, au nettoyage des données et à l'analyse des données en boucle humaine, ce qui lui a valu le prestigieux prix IEEE TCDE Rising Star en 2018. Son projet CrowdER est un travail de pionnier dans la résolution d'entités par la foule. Le projet a été très influent dans la communauté des bases de données et les deux articles CrowdER ont reçu plus de 750 citations au total. Son projet SampleClean propose plusieurs idées innovantes qui peuvent réduire de manière significative les coûts de nettoyage des données pour le traitement des requêtes et l'apprentissage automatique. Le projet a été intégré en tant que composant logiciel libre dans le Berkeley Data Analytics Stack, l'une des piles de données les plus populaires au monde à l'époque. Il a mis au point l'algorithme de jointure par similarité le plus rapide, qui est devenu un opérateur essentiel dans les systèmes de préparation des données. Depuis son arrivée à la SFU, M. Wang a fait preuve d'une indépendance remarquable en lançant et en exécutant un programme de recherche ambitieux visant à accélérer la science des données. Il a obtenu une importante subvention MITACS Accelerate de $990K en tant que seul PI pour soutenir ce programme de recherche, et a développé plusieurs outils open-source (par exemple, DataPrep, Deeper, AQP++), qui ont déjà été déployés dans plusieurs entreprises ou utilisés par des dizaines de milliers d'utilisateurs. Il est actuellement directeur du programme de maîtrise professionnelle en Big Data, informatique visuelle et cybersécurité à la SFU. Il a contribué à la conception de deux cours de laboratoire populaires sur les Big Data dans le cadre du programme et a formé plus de 300 étudiants en master Big Data au cours des cinq dernières années. Bon nombre de ces étudiants travaillent aujourd'hui comme scientifiques ou ingénieurs de données au Canada, contribuant ainsi à combler le déficit de talents en matière de Big Data au Canada.