Por: Roberto Juárez
Última actualización:
Si has leído sobre inteligencia artificial quizá en algún momento pasaste por la palabra modelo o algoritmo. El modelo suele ser la parte crucial de nuestro algoritmo pues es en donde se concentran las reglas que relacionan las posibles entradas con la salida y es posible que éste modelo tenga algún tipo de sesgo y por consiguiente entorpezca o disminuya el desempeño de tu algoritmo implementado.
¿Cuando una inteligencia artificial comete sesgos?
Por desgracia, practicamente siempre… Pero aquí el motivo: detrás de una inteligencia artificial siempre hay personas, y éstas son las que pueden cometer sesgos de manera involuntaria (o no) y pasarlos por alto, por lo que de algún modo podemos decir que los algoritmos heredan los sesgos de quienes la diseñaron. Quien se haya involucrado al respecto quizá haya oído hablar de los siguientes ejemplos
Detras de una inteligencia artificial hay personas y éstas pueden comerter sesgos [...], por lo que los algoritmos heredan los sesgos de quienes la diseñaron.
Algoritmos sexistas
El ejemplo más popular es el de Amazon, quienes quisieron implementar un método de calificar de 0 a 5 estrellas las postulaciones a trabajos y las mujeres eran las peor calificadas.
Algoritmos clasistas
Nuevamente los algoritmos de contratación tienen problemas aquí al elegir egresados de universidades de paga, a las cuales sólo ciertas clases sociales pueden tener acceso, sin embargo también está el algoritmos de Tiktok, quienes además a sus moderadores en un inicio se les pedía eliminaran gente pobre o fea. Esto posiblemente metió un sesgo al algoritmo al tomar sus datos “semilla” con datos cortados a propósito.
Algoritmos racistas
Por desgracia ejemplos hay muchos para este caso, pero los más fuertes son Google en el 2015 quienes se disculparon por etiquetar como gorilas fotografías de personas negras, Twitter en mayo del 2021 por su tecnología de cortar imágenes para su previsualización con predisposición a seleccionar a los caucásicos y Facebook por preguntar si querían seguir viendo videos de primates después de ver videos protagonizados por gente negra.
Considerando que cada vez son más las decisiones que se toman de manera automática o hay motores de recomendación cuyos resultados son consecuencia de una inteligencia artificial, es importante detectar toda fuente de sesgos en nuestros datos que recopilamos y emprender acciones correctivas lo antes posible antes que pase algo que inconforme a los usuarios o afecte a quien está implementando el algoritmo directamente pensando que podía ser una gran solución.
Ojo aquí que esto no solo pasa a nivel de algoritmos y no quiero dejar de mencionar un fenómeno empresarial que se llama ceguera de perspectiva, les dejo este interesante artículo de porque la CIA no detectó los ataques del 11 de septiembre, y que se debió en parte a procesos de reclutamiento pobres y sesgados. Aunque caso curioso, no hay modo de reclutamiento que no esté sesgado de algún modo.
¿Qué podemos hacer para evitar sesgos?
Estudiar al respecto e identificar cuando personalmente estás cometiendo algún tipo de sesgo, los cuales suelen tener su base en creencias y experiencias personales así como nuestras emociones e influencia social. Puedes apoyarte de wikipedia para aprender más, pero escogí mis 4 tipo de sesgos favoritos para que te des una idea:
Sesgo de confirmación
El favorito de tu tía que encontró un sitio web que explicaba justo lo que quería encontrar (pero que ignoró los otros 1000 que decían lo contrario). Quizá sea difícil de verificar porque justamente estas confirmando los hallazgos que querías encontrar debido a que nuestro razonamiento así funciona, así que si crees que algo dice todo justo lo que buscabas puede que no sea tan bueno.
Sesgo retrospectivo
"Pues claro, era obvio que eso iba a pasar" es la frase más común asociada a este sesgo, pero no se trata más que de otra trampa de nuestro pensamiento que una vez viendo que el resultado final conecta todos los puntos para conducir a ese resultado como el único resultado posible. Por desgracia eso no es así y solo es una apreciación distorsionada en la que se cree que siempre se supo que algo iba a ocurrir.
Sesgo de supervivencia
Quizá hayas visto esta imagen:
Era una evaluación sobre el estudio de daños en aeronaves que regresaron de enfrentamientos bélicos y mostraron que las naves que regresaron sufrían daños en los puntos rojos, por lo que creían que se debían reforzar éstas zonas. Hasta que Wad les contó que todo estaba mal, que debíamos interpretarlo al revés pues justo eso eran las otras zonas sin agujeros por las que los aviones no sobrevivieron. Algo así como hacer encuestas de porque a la gente le gustan las encuestas…
Sesgo del "yo no estoy cometiendo sesgo"
Quizá sea el más complicado de detectar y requiere mucha preparación y pensar desde distintos ángulos las cosas. No todos somos perfectos y nuestra formación, educación y toda nuestra identidad inclinarán nuestra balanza de pensamiento a lugares que a veces ignoramos, pero siempre es bueno cuestionarse a sí mismo sobre lo que estamos pensando. Siempre aprende otras cosas y dedica tiempo a tus hobbies y otros intereses personales, éstos son una nueva ventana para ver el mundo.
¿Y del lado de datos que puedo hacer?
En estos tiempos se recopilan un exceso de datos y se dice que los datos “son el nuevo oro”, su uso a veces es cuestionable, sin embargo a nivel empresarial hay muchas cosas que podemos empezar a realizar y que a veces son todo un reto cultural u organizacional y otros son retos personales, no importa desde donde venga el accionador, siempre es bueno empezar a implementar las siguientes estrategias:
Eliminar o dejar de considerar datos que no son relevantes
El propio usuario es una fuente de datos inmensa sin siquiera darse cuenta y que cada vez más explotamos con el uso de cookies, el cuál se estima que se dejen de compartir entre terceros según comunicó google, sin embargo no todos los datos son importantes para nosotros. Si estamos aceptando a alguien en alguna universidad o empleo ¿es acaso relevante su identidad sexual y cuántos tatuajes tiene? No. Es bueno que cada vez menos dejen de preguntarlo, pero no solo eso, sino que es necesario ignorarlo por completo y dejar de apelar a viejos prejuicios.
Una buena gobernanza de datos
A veces no se puede dejar de recopilar datos, por ejemplo, método de pago, nombre, dirección de facturación y dirección de entrega para el caso de un comercio electrónico, sin embargo, no siempre se requieren éstos para implementar un algoritmo recomendador. Y si crees que sí es probable que estés cometiendo algún sesgo. La persona responsable del gobierno de datos deberá regular el acceso a cada información y preguntar si es estrictamente necesaria para el fin que se le destinará.
Balancea los datos
En el ejemplo de los algoritmos sexistas vimos que se debía a que la mayor cantidad de trabajadores eran hombres, en ocasiones se ha intentado eliminar este problema quitando identidad sexual y nombre, sin embargo en los curriculums sigue pasando lo mismo, es la historia de una mujer la que está plasmando en esas hojas y los algoritmos siguen llegando a resultados similares, teniendo una cantidad de datos balanceada con la misma salida esperada sería lo ideal y si no se cuenta con una cantidad de datos suficientes no cometas el error de creer que será un buen resultado y recopila más datos.
Variedad e integración en el equipo
Si leíste el artículo de por qué la CIA no pudo prevenir los ataques a las torres gemelas, en resumen es que su personal estaba conformado mayormente por personas caucásicas de clases media y alta que ignoraban por completo la cultura islámica… Otra historia pudo ser de tener distintas etnias en el equipo y además escucharlas. No solo con la CIA, sino en todos los equipos debemos evitar la homofilia.
Escucha a tus outliers y opiniones contrarias
Los outliers son los casos poco comunes o excepcionales y generalmente en todo algoritmo de inteligencia artificial buscamos eliminarlos con el fin de generalizar mejor, sin embargo ellos también son parte de quienes utilizarán tu producto así que más vale verificar con ellos que todo se comporta como se debería de comportar.
Conclusiones
Estudiar y detectar sesgos personales y organizacionales es el mejor modo para que no lleguen a tus algoritmos, para ello empezar con diversificar tu forma de pensar y actuar, un excelente tip es cultivar y dedicar tiempo a tus hobbies y descubrir cosas nuevas. Pues cada cosa nueva que descubres también es un modo distinto de ver las cosas. También la diversificación y buena cultura empresarial ayudará, pues cada cabeza distinta (y hasta opuestas a las de más) aportará en la visión holística de los procesos y con una visión más amplia de los que diseñan los productos de inteligencia artificial, ésta también tendrá aprendizaje de cómo tomar decisiones.
Roberto Juárez
Software and Data Engineer
He tomado proyectos end-to-end tanto centrados en datos como de desarrollo web, me gusta siempre estar estudiando de todo que hasta me involucro en cosas de UX y una que otra negociacion con los clientes. En la parte de datos estoy presente en todas las etapas del proceso entre ellos la extracción, procesamiento, limpieza y análisis de datos hasta la presentación y representación de éstos hasta lograr ofrecer una historia o tableros que den insights relevantes a áreas de marketing, catálogo y precios y así facilitar la toma decisiones basadas en datos. En la parte web estoy desde que se gesta la idea hasta que termina (o no) en producción.