Aux États-Unis principalement, mais aussi en Europe et en France, des instituts de recherche ont bénéficié du soutien de Facebook qui a mis certains de ses algorithmes et données utilisateurs en open source. Suivi épidémiologique, évaluation du confinement, questionnaire diagnostic ou encore traduction automatique, Antoine Bordes, chercheur français, co-directeur général du laboratoire d'intelligence artificielle de Facebook, tire un premier bilan des initiatives qui ont été menées. Ce qui est intéressant même si ce n'est pas fini, c'est de faire de l'apprentissage par transfert. Tous les pays ont des vagues décalées. En Europe, il y a eu l'Italie, puis la France, l'Espagne, le Royaume-Uni et les États-Unis. On a vu cette séquence temporelle. L'enjeu est de se demander si on peut utiliser ce qui s'est passé dans certains pays et le transférer à d'autres contextes. Les États-Unis ont trois semaines de retard, on peut utiliser les prédictions italiennes pour informer le modèle américain. Les conditions sont différentes mais on peut garder la forme de la vague. C'est le modèle de transfert en épidémiologie. C'est nouveau et ça informe les nouveaux champs de recherche mais c'est très rapide. Chez Facebook, on ne fait pas que de l'épidémiologie, ce n'est qu'un de nos projets. Pour nous, il y a un impact assez fort sur la pandémie, sur des sujets sur lesquels on travaillait mais qu'on n'avait peut-être pas mis dans nos priorités. Je vais prendre deux exemples. Là, on se parle en vidéo, c'est de la téléprésence. Toutes les technologies qui permettent de télétravailler, télédiscuter... ça peut aller de la voix, à être capable d'enlever automatiquement le fond sonore pour qu'on entende bien, savoir automatiquement donner la parole à quelqu'un. Derrière moi, ça fait un flou pour qu'on puisse se concentrer sur le locuteur. Il y a beaucoup de choses qui sont basées sur le lien qu'on a remises dans les priorités car le besoin est croissant. Un autre enjeu, c'est la 3D. Facebook a une grosse branche en réalité virtuelle augmentée. On sent de plus en plus que le futur du travail ou de la communication va passer par des espaces virtuels. On pourrait se retrouver, discuter, faire des réunions, etc. On prend moins l'avion, le reprendra-t-on pour une réunion ou la fera-t-on en vidéo ? Beaucoup de questions sont posées de façon plus rapide. On propose des outils qui peuvent aider à faire ça. C'est très important pour nous. Un aspect qui a été rebattu par la pandémie du coronavirus, c'est la traduction et la communication. On travaille beaucoup sur les traductions pour les langues fréquentes, le français, l'anglais, le mandarin... Mais on a un ordre de recherche depuis six mois sur les langues rares qui ont beaucoup de locuteurs mais pour lesquelles il y a peu de traductions. On pense à des dialectes en Inde, ou aux dialectes africains. On a fait des recherches, on avait déjà proposé des corpus donnés qu'on avait créés et mis en accès libre. On a encore remis ça à niveau puisque l'enjeu était de traduire les recommandations de l'OMS dans toutes les langues très rapidement. Les recommandations changent presque quotidiennement, c'est important d'avoir une information de qualité dans une pandémie où l'information part dans tous les sens. Facebook a identifié très tôt ce besoin en créant le Covid-19 Hub. C'est une page dédiée avec des informations sur Facebook. En IA, on voulait pouvoir proposer les informations dans le plus de langues possibles. Ces exemples de la téléprésence et de la traduction ne sont pas directement liés à l'épidémie, mais plutôt aux conséquences. Ça nous a vraiment impactés dans le sens où ça a changé la priorité de certains projets. Il n'y a aucune collusion entre nos travaux liés au Covid et les données Facebook. À part par le biais des "Disease Propagation Maps" qui sont des données agrégées partagées avec des instituts de recherche qui ont été validées par des comités d'éthique et de vie privée en interne et en accord avec le RGPD. Elles sont agrégées à une grande échelle géographique, plus qu'à la ville. Donc à part les données déjà partagées avec des partenaires, on n'a fait aucun mélange de données Facebook avec des données épidémiologiques. L'idée était de travailler sur les données publiques qui permettent de prédire et de voir si nos capacités en IA, en algorithme, en outils permettent de mieux utiliser ces données. Ce n'est pas l'idée d'avoir plus de données pour être pertinents. Il n'y a pas de volonté de mélanger les données médicales avec les données des utilisateurs, ce n'est absolument pas notre intention. Il y a une autre initiative lancée par une autre branche de Facebook, ce sont les "symptom surveys", les sondages de symptômes. C'est un questionnaire de dix questions permettant de savoir si quelqu'un a des symptômes de coronavirus. Ce n'est pas un diagnostic. L'initiative a été lancée aux États-Unis par l'Université Carnegie-Mellon. Elle a fait le questionnaire et recueilli les données. Facebook a été partenaire en faisant des pubs qui permettent aux gens de cliquer et d'aller sur le questionnaire. Mais il n'y a pas de collusion entre les données recueillies sur les questionnaires et Facebook. On a été très vigilants en raison des craintes que vous soulevez. Notre enjeu n'est pas de faire un mélange des genres. Pour gérer la crise, on veut être utiles avec nos outils. Mais pas en faisant un gros changement en disant à Facebook de se mettre à faire du business sur la santé, ce n'est pas l'intention. Ce ne sont pas du tout les projets qu'on a mis en œuvre.