Prueba y error. Método de aprendizaje descubierto

Los científicos han descubierto que el cerebro utiliza un mecanismo dual para aprender a través del ensayo y error, lo que explica cómo se forman los hábitos y puede ayudar a sentar las bases para estrategias de tratamiento para afecciones como adicciones o compulsiones.
La investigación, dirigida por neurocientíficos del Centro Sainsbury Wellcome (SWC) del University College de Londres (UCL) y realizada en ratones, también podría ayudar en el desarrollo de terapias para la enfermedad de Parkinson.
El método de aprendizaje por ensayo y error implica probar diferentes opciones hasta encontrar una que funcione y aprender de los propios errores en el camino, informó hoy Efe.
“Encontramos un mecanismo que creemos que es responsable de los hábitos. Una vez que se desarrolla una preferencia por una acción en particular, se puede obviar el sistema basado en valores y simplemente confiar en la política predeterminada de lo que se ha hecho en el pasado”, lo que también libera el cerebro para otras tareas, afirmó Marcus Stephenson-Jones, líder del grupo en SWC y autor principal.
Los investigadores han descubierto una señal de dopamina (un neurotransmisor) en el cerebro que actúa como un tipo de señal de aprendizaje diferente al que se conocía hasta ahora.
Se sabía que las señales de dopamina en el cerebro forman errores de predicción de recompensa (RPE) que informan al individuo si una opción es mejor o peor de lo esperado (este es el circuito que lleva a los individuos a buscar placer).
En este nuevo estudio, los autores descubrieron que, junto con los errores de predicción de recompensa, hay una señal dopaminérgica adicional, llamada error de predicción de acción (APE), que actualiza la frecuencia con la que se realiza una acción.
Estas dos señales de enseñanza proporcionan a los individuos (en este caso, ratas) dos formas distintas de aprender a tomar una decisión: aprender a elegir la opción más valiosa o la opción más común, encontró el estudio.
Imagina ir a tu cafetería local. La primera vez, puede que tardes un poco en elegir un sándwich, y dependiendo de cuál elijas, puede que te guste o no. Pero si vuelves a la cafetería con frecuencia, no perderás tiempo pensando en qué tentempié elegir y, en cambio, empezarás a elegir uno que te guste por defecto. Creemos que es la señal dopaminérgica de la EPA la que permite que se almacene esta política predeterminada —explicó Stephenson-Jones—.
Además, este sistema de aprendizaje recientemente descubierto proporciona una forma mucho más sencilla de almacenar información que tener que comparar directamente el valor de diferentes opciones, liberando el cerebro para realizar múltiples tareas.
Por ejemplo, una vez que aprendas a conducir, también podrás mantener una conversación con alguien mientras viajas. Mientras que el sistema predeterminado realiza todas las tareas repetitivas para conducir el automóvil, el sistema basado en valores puede decidir de qué hablar, explica el estudio.
Los resultados del estudio muestran por qué es tan difícil romper con los malos hábitos y por qué reemplazar una acción por otra puede ser la mejor estrategia : si reemplazas constantemente una acción, como masticar chicle de nicotina en lugar de fumar, el sistema EPA puede tomar el control y formar un nuevo hábito sobre el otro.
Esta investigación también tiene implicaciones potenciales para la enfermedad de Parkinson , que se sabe que es causada por la muerte de las neuronas dopaminérgicas del mesencéfalo, las implicadas en el movimiento, que pueden ser responsables de codificar el EPR, lo que podría explicar por qué estos pacientes tienen dificultad para realizar tareas rutinarias como caminar, pero pueden realizar conductas más flexibles, como patinar sobre hielo.
observador