Machine Learning Algorithms for understanding and closing the gender gap

(French version below)

Are you a group of students willing to apply technology for good? Are you excited about exploiting data for understanding social phenomena? Are you interested in understanding the gender gap issues to better develop a more egalitarian society? We are looking for you!

Working language: French and English

Advisors

Genoveva Vargas-SolarCNRS, Database group, LIRIS

genoveva.vargas-solar@cnrs.fr

1.1       Context

This internship will be developed in the context of the projects JOWDISAI and SINFONIA of the Gender Equity Commission of the LIRIS lab. 

As AI and data science become almost ubiquitous in everyday life. The last decade has seen a pervasiveness of AI and data science in everyday life, often incurring a gender gap in involvement that is important to bridge. As these disciplines are evolving particularly fast, both in industry and academia, there is a need for a comprehensive mapping showing how these gaps manifest themselves. The unbalanced sharing of opportunities offered by these disciplines is fundamentally an ethical issue of social and economic justice and a question of value in diversity [62]. Thus, it is crucial to understand the forces at play in the persistence of this discriminatory situation and the distribution of opportunities as a function of unequal access to education, the supply of undergraduate and graduate programs in the disciplines, the economic investment and technological advances promoted by governments, and of course the perspectives that underrepresented communities have regarding elite opportunities.

1.2       Objectives and expected results

The objective is to study and reflect on the gender dynamics of careers in data science and AI by specifying a (1) methodology for collecting and analysing data on the presence and position of women in the labour market opened by these disciplines (2) network of groups and organisations working on F/M equality in AI and data science. The intern will develop two studies:

  • Women and Career Advancement: Graph Path to Success[1] the question to answer is What pathways did successful women leverage to attain career goals, and how can that be replicated or enhanced? The focus will be on women in artificial intelligence and data science.
  • Where are French Scientists in AI and DS: collect data from different public social networks and lab data to observe the roles of women in AI and DS activities both in academia and in industry.

Tasks

  1. Initial getting acquainted with basic concepts and best practices. 
  2. Design and implementation of a general data analytics pipeline of the topics enumerated above: preparation, analytics, and assessment with at least three ML methods.
  3. Develop a dashboard for the pipelines.

Expected results

  1. Reproducible experiments: Github of the pipelines implemented
  2. Dashboards for the performed study(ies)

Algorithmes d’apprentissage automatique pour comprendre et combler l’écart entre les sexes

Êtes-vous un groupe d'étudiants désireux de mettre la technologie au service du bien ? Êtes-vous enthousiastes à l'idée d'exploiter les données pour comprendre les phénomènes sociaux ? Êtes-vous intéressés par la compréhension des problèmes liés à l'écart entre les sexes pour mieux développer une société plus égalitaire. Nous sommes à la recherche de vos compétences !

Langue de travail : Français et Anglais

Encadrante

Genoveva Vargas-Solar, CNRS, Groupe des bases de données, LIRIS

genoveva.vargas-solar@cnrs.fr

Contexte

Ce stage sera développé dans le cadre des projets JOWDISAI et SINFONIA de la commission égalité de genre du laboratoire LIRIS. 

Alors que l’IA et la science des données deviennent presque omniprésentes dans la vie quotidienne. Au cours de la dernière décennie, l’IA et la science des données sont devenues omniprésentes dans la vie de tous les jours, entraînant souvent un écart de participation entre les sexes qu’il est important de combler. Comme ces disciplines évoluent particulièrement vite, tant dans l’industrie que dans le monde universitaire, il est nécessaire d’établir une cartographie complète montrant comment ces écarts se manifestent. Le partage déséquilibré des opportunités offertes par ces disciplines est fondamentalement une question éthique de justice sociale et économique, et une question de valeur dans la diversité. Ainsi, il est crucial de comprendre les forces en jeu dans la persistance de cette situation discriminatoire et la distribution des opportunités en fonction de l’inégalité d’accès à l’éducation, de l’offre de programmes de premier et deuxième cycles dans les disciplines, de l’investissement économique et des avancées technologiques promues par les gouvernements, et bien sûr des perspectives que les communautés sous-représentées ont concernant les opportunités de l’élite.

Objectifs et résultats attendus

L’objectif est d’étudier et de réfléchir à la dynamique de genre des carrières en science des données et en IA en spécifiant (1) une méthodologie de collecte et d’analyse des données sur la présence et la position des femmes sur le marché du travail ouvert par ces disciplines (2) un réseau de groupes et d’organisations travaillant sur l’égalité F/M en IA et en science des données. Le stagiaire développera deux études :

  • Les femmes et l’avancement professionnel : Graph Path to Success[2] la question à laquelle il faut répondre est la suivante : quelles voies les femmes qui ont réussi ont-elles empruntées pour atteindre leurs objectifs de carrière, et comment cela peut-il être reproduit ou amélioré ? L’accent sera mis sur les femmes dans l’intelligence artificielle et la science des données.
  • Où sont les scientifiques françaises dans l’IA et la DS : collecte de données à partir de différents réseaux sociaux publics et de données du laboratoire pour observer quels sont les rôles des femmes dans les activités d’IA et de DS, tant dans le milieu universitaire que dans l’industrie.

Tâches

  1. Se familiariser avec les concepts de base et les meilleures pratiques. 
  2. Conception et mise en œuvre d’un pipeline général d’analyse de données des sujets énumérés ci-dessus : préparation, analyse, évaluation avec au moins trois méthodes ML.
  3. Développer un tableau de bord pour les pipelines.

Résultats attendus

  1. Expériences reproductibles : Github des pipelines mis en œuvre.
  2. Tableaux de bord pour la ou les études réalisées

[1] https://data.world/scuttlemonkey/women-and-career-advancement

[2] [2] https://data.world/scuttlemonkey/women-and-career-advancement