Refugios inventados, rutas peligrosas y algunas ideas útiles: cuando la IA planifica la ruta de senderismo


El plan pinta genial: tres días de senderismo, dos pernoctaciones en el refugio Legler y el refugio Rugghubel. Ambos ofrecen habitaciones dobles. Durante el camino, habrá rebecos y lagos glaciares, y fondue de queso alpino en el destino. Todo esto lo promete el chatbot que planificó la ruta.
NZZ.ch requiere JavaScript para funciones importantes. Su navegador o bloqueador de anuncios lo impide.
Por favor ajuste la configuración.
Si buscáis las cabañas en el mapa, os llevaréis una decepción: no hay las seis horas de viaje prometidas entre ellas, sino 50 kilómetros en línea recta.
La inteligencia artificial puede traducir, redactar correos electrónicos y, a menudo, sabe la respuesta correcta incluso a las preguntas más difíciles . Si las promesas de las empresas tecnológicas son ciertas, pronto asumirá puestos de trabajo altamente cualificados. Pero, ¿cómo se desempeña en tareas realmente útiles, como preguntas cuyas respuestas no se pueden encontrar en línea con solo unos clics? ¿Como planificar una excursión? Lo ponemos a prueba.
Se probaron nueve IA de siete proveedoresEl mensaje, es decir la solicitud a todos los chatbots probados, fue el siguiente:
Quiero hacer una excursión de tres días con dos noches en refugios alpinos en Suiza. Solo quiero alojarme en habitaciones dobles. Por favor, seleccione los refugios y rutas de senderismo adecuados:
- dos cabañas para una caminata de tres días,
- con habitación doble,
- El tiempo máximo de viaje entre las cabañas es de ocho horas,
- A menos de tres horas de Zurich.
Enviamos la solicitud a un total de nueve chatbots de los proveedores Anthropic, Deepseek, Google, Open AI, Manus, Microsoft y Perplexity. Siete de ellos eran gratuitos y dos de pago.
Habilitamos la búsqueda en Internet y, cuando estaban disponibles, funciones de investigación y reflexión para obtener los mejores resultados posibles de la IA.
El chatbot respondió a preguntas breves. Cada uno de los chatbots hizo de una a tres sugerencias, que evaluamos. En la mayoría de los casos, los resultados fueron escalofriantes.
A veces falta la habitación doble, a veces la cabina entera.En primer lugar, todos los chatbots tenían ideas. Con entusiasmo, anunciaban excelentes rutas de senderismo con hermosas vistas y acogedoras habitaciones dobles.
Sin embargo, al revisar las respuestas, rápidamente se hizo evidente: la IA a menudo anunciaba habitaciones dobles donde no existían. La versión gratuita de la IA de Anthropic, Claude, inventó habitaciones dobles para ambas cabañas sugeridas, mientras que la versión de pago lo hizo para tres de las seis cabañas.
Y mientras buscaba la "Oberhornseehütte" sugerida por Deepseek, quedó claro que el chatbot la había inventado por completo. Que también sugiriera una excursión por el valle cerrado de Lötschental parece un desliz perdonable.
¿Cómo surgen estos detalles inventados? La sospecha inicial fue que los chatbots habían accedido a descripciones reales de excursiones de varios días, pero no pudieron determinar si las cabañas junto al sendero contaban con habitaciones dobles. Esta hipótesis resultó ser falsa.
Claude de Anthropic sugiere rutas vertiginosasLa existencia de una ruta de senderismo es más difícil de verificar que la de una habitación doble. En teoría, se pueden recorrer rutas que nadie ha descrito en línea. En la práctica, si no se encuentra una ruta entre dos refugios en línea, es una seria señal de alerta.
La versión gratuita de AI Claude de Anthropic, por ejemplo, proponía hacer una caminata de cinco horas y media desde Grindelwald por el "Scheidegg-Wetterhorn" hasta el refugio del mismo nombre ("2061 m, vista al Eiger, Mönch y Jungfrau").
La IA ignoró que el Scheideggwetterhorn tiene 3360 metros de altitud y solo se puede acceder tras horas de escalada de alta dificultad, así como la ausencia de un refugio en el Scheideggwetterhorn. El chatbot incluso proporcionó el número de teléfono del refugio. Al menos el número de rescate en montaña (1414) indicado es correcto. Cualquiera que confíe en la información de este chatbot podría necesitarla.
Aunque la versión de pago de Claude solo sugería refugios reales, las excursiones de un día entre ellos fueron imposibles en dos de cada tres casos. Tanto el Glecksteinhütte como el Rotstockhütte, así como el Blüemlisalphütte y el Lämmerenhütte, tienen 20 kilómetros en línea recta e incluyen varias montañas y valles. La información de tiempo, distancia y altitud del chatbot era incorrecta .
Según los datos clave, solo la tercera ruta de senderismo propuesta en la región de Appenzell era factible, aunque estaba descrita incorrectamente.
El proveedor chino Deepseek, Copilot de Microsoft y el motor de búsqueda inteligente Perplexity también sugirieron rutas de senderismo que no existen.
Al parecer, todas estas IAs han memorizado los nombres de los refugios y las montañas de Suiza y saben cómo suena la descripción de una ruta. Sin embargo, esta información no se presenta de forma organizada, sino en una mezcla de colores, creando una ruta de senderismo aparentemente plausible que no existe.
Las IA gratuitas tienen las mejores sugerenciasPero no es que los chatbots actuales no estén a la altura. Los mejores ofrecen resultados útiles.
El ganador de nuestra prueba fue el chatbot Gemini de Google. En el modo de búsqueda de la versión gratuita, sugirió tres rutas de senderismo, todas las cuales cumplían con los criterios especificados. No inventó habitaciones dobles ni rutas de senderismo.
Este chatbot también fue el más fácil de controlar, ya que proporcionaba un enlace directo a la fuente para cada frase. Esta es probablemente la razón por la que Gemini logró tan buenos resultados. El bot depende en gran medida de las búsquedas en internet.
Gemini siguió rutas de senderismo que ya habían sido descritas en blogs, asegurándose de que el sendero existiera e incluso hubiera sido recomendado como caminata anteriormente.
Google ha incorporado su capacidad para encontrar información en línea al modo de búsqueda de Gemini, en este caso con resultados alentadores. El proceso de búsqueda debió ser bastante laborioso; la IA tardó más de diez minutos en completarlo.
Buenos resultados también con el chatbot chinoEl segundo puesto es aún más sorprendente: lo ocupa el chatbot Manus, de la empresa china Monica, con sede en Singapur. Manus causó sensación hace tres meses cuando los primeros usuarios lo presentaron con entusiasmo. De hecho, tuvo un rendimiento bastante bueno en nuestra prueba. El chatbot sugirió una ruta viable entre alojamientos con habitaciones dobles.
A diferencia de otros chatbots, Manus malinterpretó inicialmente nuestra solicitud. Interpretó el tiempo de viaje desde Zúrich no como el inicio de la caminata, sino como la llegada al primer refugio. Como resultado, se eliminó el primer día de caminata. Tras una consulta mejorada, los resultados fueron bastante buenos.
Manus sugirió dos rutas viables en el Alpstein, con pernoctaciones en posadas de montaña. Una de ellas era muy adecuada para una excursión de tres días, la segunda no tanto, debido a la gran cantidad de descensos y ascensos entre los dos refugios.
La versión Pro de Chat-GPT también tiene una sugerencia factibleY luego está Chat-GPT, el chatbot que se ha convertido en sinónimo de IA generativa para la mayoría de las personas y sigue siendo, con diferencia, el más utilizado . Esta posición no es del todo inmerecida, al menos según nuestras pruebas. Ambas IA de Open AI sugirieron rutas viables que pasaban por alojamientos con habitaciones dobles.
La versión gratuita de Chat-GPT recibió puntos negativos por proporcionar información ficticia sobre la ruta. Y la versión de pago, al igual que Manus, primero baja a un valle y luego sube por el otro lado.
Una búsqueda en internet muestra que los chatbots probablemente han combinado estas rutas. No se encuentran en ningún otro lugar de esta forma. Para algunas preguntas, este enfoque es ventajoso, ya que puede conducir a soluciones completamente nuevas.
Sin embargo, cuando se trata de rutas de senderismo, es preferible que un chatbot se base en ideas ya descritas en línea. Por lo tanto, Gemini se impone en este caso, aunque Manus le sigue de cerca. La versión de pago de Chat-GPT queda en tercer lugar.
Por cierto, otros ya han ideado la idea de usar IA generativa para rutas de senderismo. La aplicación estadounidense Alltrails sugiere nuevas alternativas generadas por IA para rutas de senderismo, por ejemplo, optimizando la vista o sugiriendo atajos. Esperamos que se esté ejecutando una tecnología más fiable en segundo plano que la que utilizan los chatbots que probamos.
Un artículo del « NZZ am Sonntag »
nzz.ch