¿Solo una coincidencia?

El cerebro humano parece estar programado para percibir patrones. Esto presumiblemente tiene algunas ventajas evolutivas, pero este atributo puede llevarnos por mal camino en un mundo saturado de datos. Comenzaré con una anécdota personal y luego mostraré las implicaciones para el análisis de datos.
El 18 de junio, mientras viajaba por la zona oeste de Vancouver, vi una calle llamada "Trutch". Recuerdo que me pareció un nombre extraño. Unos días después, Tyler Cowen publicó un enlace a un artículo del periódico de Vancouver , donde comentaba que el nombre de la calle acababa de cambiarse:
Dan Fumano: Muchos residentes de la calle, conocida anteriormente como Trutch, expresaron su apoyo al cambio de nombre. Sin embargo, les preocupan las posibles consecuencias prácticas de una calle cuyo único nombre esté escrito en un idioma distinto del inglés.
Autor del artículo: Dan Fumano . Publicado el 17 de junio de 2025. Última actualización: 18 de junio de 2025.
¡Éste es un nombre aún más extraño!
Fíjense que el cambio de nombre ocurrió justo cuando vi la calle. Parece una coincidencia bastante sorprendente. Pero eso no es todo. El lunes pasado pasamos una noche en un hotel en Calgary, antes de volar a casa. A la mañana siguiente me desperté y revisé Marginal Revolution. Esta es la primera publicación que vi:
Calgary vuelve a usar flúor y dato del día sobre QuebecEso es aún más coincidencia. Es casi como si Tyler supiera de mis planes de viaje y publicara intencionalmente información relacionada con mi ubicación. Claro, eso es una tontería, ni siquiera sabía que estaba de vacaciones. Pero es comprensible que una persona supersticiosa encuentre importantes las coincidencias. ¿Qué probabilidades hay?
Quizás piense que, en un mundo donde ocurren miles de millones de eventos a diario, una coincidencia no tiene tanta importancia. Pero gran parte de nuestra investigación en ciencias naturales y sociales se basa en la premisa de que las coincidencias son muy significativas. Al menos en física, los científicos suelen insistir en coincidencias muy inusuales, "eventos 5 sigma", lo que significa más de 5 desviaciones estándar del valor predicho. Sin embargo, en muchos campos existe una prueba de significancia mucho más débil, de tan solo dos desviaciones estándar de la hipótesis nula. Esto significa que las coincidencias aleatorias con una probabilidad de tan solo 20 a 1 en contra se consideran altamente significativas.
En una publicación reciente de EconLog, Kevin Corcoran dijo lo siguiente:
En 2007, Eliezer Yudkowsky escribió un interesante artículo que abogaba por lo que él llamaba " desafiar los datos". La idea era bastante simple: supongamos que se tiene una teoría que explica cómo funciona el mundo. Se publica un nuevo estudio con datos que no se pueden justificar con el marco teórico. ¿Cómo se debería responder?
Una respuesta es abandonar la teoría a favor de los nuevos datos. Otra respuesta es mantener la teoría intacta y, como dice Yudkowsky, « atacar el experimento : acusar a los investigadores de deshonestidad, diseño defectuoso o conflicto de intereses». Pero existe una tercera posibilidad: simplemente desafiar los datos...
Si una teoría ha sido bien establecida y confirmada por múltiples estudios y experimentos, entonces la aparición realmente sorprendente de datos contrarios no debería ser de gran importancia.
A primera vista, esto podría parecer poco científico. Pero en la práctica, a menudo ocurre que la evidencia que refuta una teoría dada no es más que una simple coincidencia, algo que ocurre a diario.
Incluso los expertos más inteligentes (y yo mismo) a veces nos dejamos engañar por las coincidencias. Uno de los peores ejemplos recientes es el debate sobre el origen de la COVID-19. A lo largo de la historia, las pandemias suelen comenzar en las grandes ciudades del sur de China, donde grandes poblaciones viven cerca de mercados de animales salvajes. Así comenzó la primera epidemia de SARS en noviembre de 2002. La pandemia de COVID-19 (SARS-2) parece haber comenzado de forma casi idéntica, en un mercado de animales salvajes de una de las ciudades más grandes del sur de China.
A pesar de ello, muchos expertos han abrazado la teoría, completamente infundada, de que la COVID-19 se originó en una fuga de laboratorio, ya que, entre la media docena de áreas metropolitanas más grandes del sur de China, apareció por primera vez en una que alberga un importante instituto de investigación de virus. Esta es una de las coincidencias más débiles que he visto, y sin embargo, muchos parecen considerarla un sólido respaldo a la teoría de la fuga de laboratorio. En cambio, la hipótesis del mercado de animales se basa en una coincidencia que es mucho menos probable que ocurra al azar.
Hay millones de calles en el mundo. Que me fijara en una calle de Vancouver justo antes de que Tyler publicara un artículo sobre ella es una coincidencia asombrosa. Y que la publicación de Tyler sobre el flúor ocurriera tan solo 10 días después, justo cuando yo pasaba por Calgary, es una coincidencia aún más asombrosa. En cambio, toda la teoría de la fuga de laboratorio se basa en una simple coincidencia, tan interesante como sacar el mismo número dos veces seguidas al lanzar un dado de seis caras.
econlib