¡Hola! ¿Cómo estás?
Las políticas de “acción afirmativa” buscan beneficiar a cierto grupo (género, raza) para compensar lo que, dicen sus defensores, son las inequidades producto de alguna discriminación pre-existente. Un ejemplo de esto son las cuotas (o cupos): contrato a 100, pero 50 tienen que ser mujeres.
“Que no pida cupo, si es talentosa se destacará igual!”, leí hace poco de una candidata a VP. Los detractores menos críticos (o algunos de ellos) aducen que, si bien esas políticas pueden mejoran la diversidad, lo hacen a costa de perder “calidad”, al admitir gente que no es suficientemente talentosa para pasar sin cupo.
Pero, ¿qué pasaría si ese “trade-off” no fuera tal? Hoy escribí sobre el impacto de las cuotas de género en la productividad de un sector clave: la educación.
Espero que te guste. Gracias por leer.
Las preguntas de hoy
¿Las cuotas de género necesariamente reducen la productividad?
¿Necesariamente existe un trade-off entre diversidad y “calidad”?
¿Qué pasa cuando el filtro que usamos para elegir “a los mejores” falla?
Llegué a Brasil en Agosto de 2019, poco tiempo después de terminar mi doctorado, para empezar como profesor/investigador. En Septiembre empecé a escuchar en cada almuerzo a mis colegas hablando insistentemente de algo llamado “Exame Anpec”, un evento que era, aparentemente, de suma importancia. Resulta que en Brasil hay una asociación de economistas (Anpec) que desde hace años se encarga de desarrollar un examen estandarizado que lo rinde cualquier estudiante del país que quiera ser admitido en una maestría académica en economía. Los alumnos estudian mucho, rinden, y al poco tiempo a las universidades les llega el ranking. “Mejor puntaje: Juancito, segundo mejor: Pedrito”, y así. Históricamente, las universidades tomaban el ranking y empezaban a llamar del primero hacia abajo con el objetivo de convencerlos para que hicieran su maestría ahí.
¿Por qué? Porque cuanto mejor sean los estudiantes, mejor les va a ir cuando postulen a hacer doctorados en el exterior y, cuanto mejor les vaya, mejor reputación van a tener sus alma mater. Este sistema existe desde hace décadas.
Este gráfico se lo robé a Claudio Ferraz. Si en 2017 admitías a los/as 100 mejores aplicantes, hubieras seleccionado 11 mujeres (si pensás que esto es porque, de base, son pocas las mujeres que lo rinden, te equivocás: 40% de los aspirantes son mujeres). Imaginate que le hacés oferta a los 30 mejores en el examen (el tamaño promedio de una cohorte de maestría). ¿Cuántas ofertas a mujeres pensás que van a ir? Te respondo mirando datos de 2021: 1 mujer. Si esa mujer rechaza tu oferta, entonces tu programa posiblemente quede con 0 mujeres.
La realidad es los programas no tienen 0 mujeres. Tienen más. ¿Por qué? Porque las universidades valoran la diversidad y decidieron sumar otros criterios (es decir, no solo la nota en el examen Anpec) para seleccionar aplicantes. Decidieron buscar la forma de que haya más representación femenina.
Si estás a favor de las cuotas (por ejemplo, de género) y lo discutiste con un amigo que está en contra, seguramente en algún momento te dijo algo que tiene estos tres componentes. 1) Le encanta la diversidad, le encanta trabajar/estudiar con mujeres. 2) Pero en la organización (universidad, trabajo) hay que elegir a los que tienen más mérito. 3) Corolario: las cuotas (o cualquier otra medida de affirmative action) hace que priorices diversidad a costa de perder en “calidad”.
Muchos de los que defienden las cuotas aceptan ese argumento. Sí, tal vez hay que resignar “calidad”, pero vale la pena porque queremos un mundo más justo. A mí no me interesa debatir sobre la justicia de las cuotas, sino directamente desafiar la propia existencia de ese trade-off entre “calidad” y diversidad. ¿Es cierto que siempre que ponemos cuotas, necesariamente estamos eligiendo resignar calidad?
Hace un mes presenté un paper en un workshop en Chicago (ya que estamos me hago propaganda: presenté esto sobre discriminación). También presentó Maria Schaede un paper sobre cuotas de género que me pareció espectacular. El paper estudia el impacto de discontinuar una política de cuota de género en la contratación de maestros y maestras en Finlandia en el aprendizaje de los estudiantes. Lo curioso de este setting es que la cuota no era de mujeres (como suele ser), sino de hombres.
En Finlandia, al igual que en casi todo el mundo, la docencia es una profesión en la cual las mujeres están sobre-representadas. Para balancear un poco, durante varias décadas el gobierno implementó un sistema de cuotas de hombres del 40%. Si en 1980 había 100 vacantes para cubrir, 60 iban para las mejores 60 mujeres y 40 para los mejores 40 hombres.1 Este sistema se discontinuó (por considerarlo discriminatorio) en 1989.
El gráfico muestra la proporción de hombres aplicantes a la carrera docente (cuadraditos azules) y la proporción de hombres invitados a entrevista (triángulos celestes). Solía haber un 25% de aplicantes hombres y un 40% (la cuota, precisamente) de entrevistados. Una vez caído el sistema de cuotas, la proporción de aplicantes más o menos se mantuvo, pero los hombres invitados a entrevista cayeron drásticamente a cerca del 20%.
Lo que hacía la cuota era que algunos maestrOs entren POR la cuota (los voy a llamar “maestrOs cuota”) y “reemplacen” a algunas maestrAs que hubieran pasado sin cuota, pero que con cuota quedaron afuera (a estas las voy a llamar “maestrAs marginales”).
Ahora, fijate una cosa del gráfico de arriba. Cuando sacan la cuota, no solo cae la proporción de hombres que entran (lógico), sino que cae incluso por debajo de la proporción de aplicantes hombres: en ausencia de cuotas, aplica un 25% de hombres, pero entran entre el 15% y el 20%. ¿Por qué?
Los círculos (rojo) son los puntajes promedio de las mujeres en el examen de ingreso y los triángulos (azul) de los hombres. Sin cuotas, entra una proporción de hombres más baja que la de aplicantes simplemente porque les va peor en el examen de ingreso. Una conclusión fácil es que las cuotas generaban mayor diversidad a costa de perder “calidad”, porque entraban maestros con peores notas en el ingreso.
Tal vez notaste que siempre que hablé de calidad, puse la palabra entre comillas. Para decir que el sistema de cuotas en Finlandia implicaba “perder calidad” tendríamos que ver outputs: cómo le fue a los alumnos. La pregunta que queremos responder no es si el sistema de cuotas genera que el puntaje en el examen promedio de los profesores sea menor (este efecto es obvio y mecánico). Lo que nos interesa es saber si, dado que impusimos cuotas, generamos un resultado peor en términos de los aprendizajes de los alumnos y, principalmente, su performance una vez que terminan la escuela. Veamos.
Un experimento ideal sería agarrar maestros al azar de diferentes municipalidades y reemplazarlos (también aleatoriamente) por “maestrOs cuota” o bien por “maestrAs marginales”. No can do. El paper intenta aproximarse a eso, pero sin hacer experimentos. Hoy es el primer envío en el que voy a escribir sobre una estrategia de identificación causal muy común en economía: variables instrumentales. Si alguna vez leíste sobre esto, te conviene saltear el texto hasta donde dice Sigamos. Si no, dejame que te explique brevemente de qué se trata.
Me desvío un minuto de las cuotas en Finlandia. Estás en Octubre de 2023 en Argentina. Hay elecciones presidenciales. 15 días antes de la elección se da el último debate televisado. Querés estimar el efecto de haber visto ese debate en la probabilidad de que un ciudadano promedio vote al candidato oficialista (digamos, Wado de Pedro).
Tenés una base de datos increíble que sale de encuestas y que te dice exactamente si cada ciudadano de, por ejemplo, Formosa vio o no vio el debate, y a quién votó. Podrías correlacionar “votó a Wado” con “vio el debate” pero la interpretación no sería causal: la gente que decide mirar el debate es posiblemente bien diferente a la que decide no mirarlo.
Ahora imaginate esto. El día del debate justo hubo una lluvia de rayos en toda Formosa, que hizo que algunas antenas dejen de funcionar exactamente a la hora del debate, dejando sin TV a los hogares que tomaban la señal de ahí. Esas antenas están dispersas por toda la provincia. De manera que, incluso en una misma cuadra, puede pasar que haya hogares que no tuvieron TV esas dos horas y otros que sí. Quién tuvo y quién no parece aleatorio. Pensalo: ahora esa correlación entre “votó a Wado” y “vio el debate” tiene ALGO de causal. Los que no vieron el debate PORQUE aleatoriamente se quedaron sin TV no tomaron la decisión de no verlo. Fueron inducidos por la naturaleza. Claro, simpre es posible irse a un bar o a la casa de otro a verlo, pero digamos que, en un mundo normal, la probabilidad de ver el debate debería ser más baja en los hogares que tuvieron la mala suerte de perder la señal esa hora (al menos si comparamos hogares parecidos). Seguime estos pasos.
Estimamos la probabilidad de que una persona haya visto el debate en función de su vivía en una casa con o sin señal por culpa de los rayos (y de todas las características de esa persona; por ejemplo, su sexo, edad, barrio, etc). A esto lo llamamos Primera Etapa. Para cada hogar, vamos a tener una “probabilidad de haber visto el debate” en función de sus características y de haber tenido o no tenido señal.
Estimamos la probabilidad de que una persona vote a Wado de Pedro en función de la “probabilidad de haber visto el debate” que estimamos en el punto anterior. Fijate una cosa: la correlación acá no es entre “voto a Wado de Pedro” y “vio el debate”. Más bien, es entre “voto a Wado de Pedro” y “la probabilidad de haber visto el debate, dado que vivía en una casa con o sin señal durante la hora del debate”. La diferencia es sutil pero crucial.
A mi me gusta pensarlo así. La probabilidad de que una persona vea el debate depende de dos tipos de factores. Por un lado, de un montón de factores “endógenos”, es decir, de factores que tienen que ver con las propias características de las personas, tal que esos factores explican tanto que alguien quiera o no ver el debate, como sus preferencias electorales. Por ejemplo (no sé), puede ser que los que están más politizados son más peronistas y entonces sean más propensos a ver el debate y a votar a Wado. No porque vieron el debate votaron a Wado, sino que votaron a Wado Y vieron el debate por otro motivo (estar más politizados).
Por otro lado, la probabilidad de ver el debate también depende de factores “exógenos”, es decir, de factores que afectan la probabilidad de que veas el debate, independientemente de tus preferencias políticas (o, en general, de tus características personales). El rayo que le saca señal fortuitamente a algunos pero no a otros afecta “exógenamente” la probabilidad de que una persona vea el debate, no por sus preferencias políticas, sino simplemente porque se le cortó la TV. Si pudiéramos “limpiar” la primera parte (la endógena) y quedarnos solamente con la segunda parte (la exógena), entonces podríamos perfectamente interpretar la correlación entre “ver el debate por factores exógenos” y “votar a Wado” como causal.
Lo que hace el punto (1) es precisamente eso: intentar “limpiar” los factores que afectan simultáneamente la probabilidad de ver el debate y de votar a Wado y quedarse solamente con los factores que inducen a ver o no el debate por motivos fortuitos. Los rayos que afectan la señal en este caso son lo que llamamos “instrumento” (por eso el método es “variables instrumentales”). Si logramos encontrar un instrumento que (a) explique al menos una parte de la decisión de mirar el debate y (b) NO se relacione de manera directa con la probabilidad de votar a Wado, entonces encontramos un buen “instrumento” y podemos interpretar la cosa de manera causal.
¿Qué pasaría, por ejemplo, si (b) no se cumpliera? Imaginate que el rayo que dejó sin TV a algunos también les destruyó la casa, que quedó así hasta el día de las elecciones. Ese evento seguramente incida en tu voto al candidato oficialista, independientemente de si te hizo ver o no el debate. Si ese es el caso, entonces el instrumento es malo y no permite inferir causalidad.
Sigamos.
Queremos saber si cuando en Finlandia sacaron las cuotas de género los alumnos tuvieron algún impacto en su performance futura, por ejemplo, en la probabilidad de ir a la universidad. Necesitamos un instrumento: una variable que (1) afecte la probabilidad de que en una cohorte y en una escuela haya menos hombres (y, particularmente, menos hombres que entraron GRACIAS a la cuota) y que (2) no afecte directamente la probabilidad de que los alumnos en el futuro vayan a la universidad.
Para que quede clara la idea, dejame darte un ejemplo de lo que sería un MAL instrumento. Imaginate que Finlandia sanciona la ley en 1989 eliminado las cuotas, pero resulta que el partido opositor (el partido comunista, PC) dice que no está de acuerdo y entonces decide que en las escuelas de en comunas donde gobiernan ellos no se acata la ley y se siguen usando cuotas. AJÁ, podemos usar como instrumento que una comuna NO esté ese año gobernada por el PC. La variable “comuna SIN gobierno PC” cumple con el requisito (1), porque afecta la probabilidad de que una cohorte de alumnos esté expuesta a menor proporción de maestros hombres. Pero claramente no cumple el (2): evidentemente las comunas con gobiernos PC pueden haber hecho un millón de otras cosas (no sé, contratar docentes comunistas) que afectarían directamente la probabilidad de que los alumnos vayan a la universidad (no porque haya más o menos maestros hombres, sino porque tienen docentes comunistas).
Vamos al instrumento que usa el paper y que sí pareciera cumplir con (1) y (2). En Finlandia los maestros (y maestras) se jubilan a los 60 años. En el momento en que se implementó el fin de la cuota, había municipios en donde casualmente había muchos docentes que habían llegado a esa edad y, por lo tanto, abrieron muchas vacantes nuevas. Y había otros municipios en los que no había tantos docentes por retirarse, por lo que abrieron menos vacantes. Lo mismo pasó en los años subsiguientes.
Si, justo cuando se implementa la ley, la escuela Thor tiene 20% de docentes que tienen 60 años, el director de esa escuela va a tener que salir a reclutar para cubrir el 20% de sus vacantes. Esas vacantes se llenaron con 40% de hombres (cuando había cuota). Ahora ya no hay, o sea que la composición de ese 20% de vacantes va a ser bien diferente en términos de género. Y 20% es bastante: la cohorte que entre ese año va a tener una probabilidad mucho menor de tener maestros hombres que la que hubiera tenido el año previo. Si, justo cuando se implementó la ley, El Colegio Nacional de Helsinki (aka“El Colegio”) tenía un 1% de docentes con 60 años, su directora va a reclutar para reemplazar a ese 1% y la composición de El Colegio va a cambiar, pero mucho menos que la de Thor.
En el paper la cosa es un poco más sofisticada, pero el instrumento es básicamente un indicador de la proporción que cada escuela tiene en cada año de docentes a punto de jubilarse. Que se cumple (1) parece claro: cuanto mayor es esa proporción, menos probable es que una cohorte que empieza ese año tenga maestros hombres (y no solo “maestros hombres”, maestros hombres que entraron GRACIAS a la cuota: los maestrOs cuota). También es razonable pensar que, bajo ciertos supuestos, (2) se cumple: en principio, tener más o menos docentes cerca del límite de 60 años no debería afectar directamente la performance educativa de esa cohorte (siempre que se controle por la edad de los docentes de esa escuela, claro).2
Lo primero que hace el paper es mostrar que el instrumento (la proporción de maestros a punto de retirarse en un año en una escuela) afecta la proporción de maestros hombres de esa escuela (es decir, mayor proporción de docentes por retirarse implica que la proporción de hombres post-1989 - y no antes de 1989-, va a ser menor). Eso es exactamente lo que nos pide la condición (1): el instrumento (proporción de maestros a punto de retirarse en un año y escuela en particular) efectivamente reduce la probabilidad de que la cohorte entrante tenga un maestrO (y, particularmente, un maestrO cuota).
Ahora la pregunta es si esa menor probabilidad de tener un maestrO cuota afecta la performance futura de esos alumnos. En resumen, los alumnos con MENOR exposición a maestrOs cuota (o sea, mayor exposición a maestrAs marginales) tienen:
Menor probabilidad de aplicar a educación superior (y, si aplican, de entrar en sus carreras preferidas; es decir, pierden más frecuentemente con otros alumnos de mayor puntaje en el ingreso).
Menor probabilidad de estudiar carreras más competitivas (y que pagan mejor). También tienen menos años de educación promedio.
Menor probabilidad de ser población económicamente activa (ya sea trabajando o estudiando cuando son adultos).
O sea: pusieron cuotas para que, artificialmente, entren más docentes hombres de los que deberían haber entrado según su puntaje en el ingreso, bajaron la “calidad” de los maestros que entraron y, aún así, la cuota MEJORÓ la performance en los alumnos.¿Qué pasó?
El gráfico muestra la diferencia en puntaje promedio en el examen de ingreso entre mujeres y hombres aspirantes a docentes en las 4 categorías que se miden (tres de lenguaje, una de matemática/ciencias). La que se usa para rankear es la total, que es un promedio de las otras 4. En las de lenguaje a los hombres les va peor que a las mujeres, en la de matemática/ciencia les va mejor. Como todas valen lo mismo (25%), en la total le va peor a los hombres. Una hipótesis es que tal vez para ser un buen docente es más importante matemática/ciencia que las otras (o al menos “tan” importante). Los autores muestran que, efectivamente, el puntaje promedio (es decir, el que incluye 75% de lenguajes y 25% de matemática/ciencias) de un aspirante no tiene mucha correlación con su efectividad dentro del aula.
La explicación es simple: el examen de ingreso es un mal filtro, que termina penalizando excesivamente a un género (en este caso los hombres). De manera que la cuota lo que hace es corregir parcialmente ese problema, haciendo que entre gente que, según el rankeo original no hubiera entrado, pero que posiblemente sean más efectivos que los que SI hubieran entrado.
Nos la pasamos discutiendo, aunque sea implícitamente, sobre el trade-off entre diversidad y calidad de las políticas de acción afirmativa y de cuotas. Pero nunca nos paramos a pensar que si la vara que usamos para medir calidad no es buena, entonces ese tradeoff ni siquiera existe. De este paper no se desprende que las cuotas nunca impliquen un “costo” en términos de calidad. Pero, al menos a mí, me invitó a pensar en que deberíamos invertir mucho más tiempo en entender si las varas que usamos para reclutar reflejan lo que realmente queremos que reflejen.
Te puede interesar
Si querés leer el paper de este envío lo podés bajar acá.
Si querés leer mi paper sobre discriminación (con Bruno Ferman y Pedro Sant’Anna) mirá acá.
Si querés leer más sobre cuotas en educación, recomiendo mirar los papers de mi amiga Fer Estevan. Ursula Mello también tiene cosas muy interesantes. Sobre cuotas en política, por ejemplo, me gustan este y este.
En el próximo envío
“Keeping up with the Kardashians”. Algunos dicen que “hay que bajar la pobreza, qué me importa la distribución del ingreso”. Otros piensan (pensamos) que la distribución también importa, incluso si la pobreza fuera cero. ¿Por qué? Te lo cuento en el próximo envío.
En realidad las cuotas eran para la primera etapa del proceso: el llamado a entrevista presencial. En la 2da etapa se los entrevistaba y luego se les hacía una oferta. Para simplificar, voy a enfocarme en la primera etapa, que es la relevante.
Para los interesados: los autores del paper muestran un montón de tests necesarios para convencernos de que este supuesto es razonable.