Mostrando entradas con la etiqueta Ley de Benford. Mostrar todas las entradas
Mostrando entradas con la etiqueta Ley de Benford. Mostrar todas las entradas

sábado, 3 de junio de 2023

La ley de Benford: el enigma.

Los datos reales tienden a empezar por números pequeños. No así las noticias falsas.

En 2015, la científica de la computación Jennifer Golbeck, de la Universidad de Maryland, descubrió una red de bots rusos que operaba en Twitter, y lo hizo utilizando una enigmática herramienta matemática llamada ley de Benford. La científica de Maryland percibió que los indicadores básicos de las redes sociales, como el número de seguidores que tienen los seguidores de un usuario, obedecían la ley de Benford si se habían generado de manera espontánea, pero no si eran producto de una operación centralizada. Mirados bajo este prisma, los focos rusos de noticias falsas brillaban como una supernova en el oscuro universo virtual. La misma estrategia había desnudado antes manipulaciones y fraudes en la contabilidad de los países europeos, un pucherazo en las elecciones iraníes de 2009 y otros epítomes de la falsificación contemporánea.

¿Qué dice entonces esa ley de Benford que tanto escándalo destapa y tanto entuerto endereza? Tenemos que remontarnos a 1881, cuando murió Billy el Niño, nació Picasso, se fundaron La Vanguardia y el ABC y, entretanto, el astrónomo canadiense Simon Newcomb reparó en una anomalía persistente en las tablas de logaritmos, unos librillos que se usaban para hacer cálculos antes de que hubiese calculadoras. Las páginas iniciales de esos librillos, donde estaban los números que empezaban por uno o por dos, siempre estaban manoseadas y negruzcas, mientras que las páginas que empezaban por ocho o por nueve parecían nuevas como recién salidas de la imprenta.

Newcomb dedujo que los conjuntos de datos obtenidos de la naturaleza solían empezar por uno, algo menos por dos, menos aún por tres y así bajando hasta el nueve. El ingeniero estadounidense Frank Benford generalizó después la observación y acabó estampando su nombre en una ley de Benford que en realidad debería llamarse ley de Newcomb. Como dice el matemático Jack Murtagh, el caso es un ejemplo de la denominada ley de Stigler, que sostiene que los descubrimientos siempre reciben el nombre de cualquiera menos el descubridor, lo que a su vez es otro ejemplo de la ley de Stigler, que en realidad fue formulada por Robert Merton. Humor académico, no hagan caso.

Pero nada de esto penetra en el fondo de la cuestión. ¿A qué demonios se puede deber la ley de Benford? ¿Por qué los datos de un conjunto natural tienden a empezar por un número pequeño? Los matemáticos siguen debatiendo sobre este enigma desconcertante, pero Murtagh nos propone fijarnos en las progresiones exponenciales, que son muy comunes en los procesos naturales: una célula se divide en dos, que se dividen en cuatro, que se dividen en ocho, luego 16, 32, 64… Imaginemos una población de 100 conejos que se duplica una vez al año en promedio. Durante el primer año, mientras la población se va duplicando, tendremos 100 o ciento y pico conejos, luego las cifras que empiezan por uno dominarán todo el año. Durante el segundo año, sin embargo, la población tiene que ir aumentando de 200 a 400 conejos, luego las cifras que empiezan por dos y por tres se tienen que repartir el año, y ninguna de las dos alcanzará a las que empiezan por uno. El tercer año queda como ejercicio para casa.

Mentir bien siempre ha sido un arte y ahora es también una ciencia.