Tentativi ed errori. Metodo di apprendimento scoperto

Gli scienziati hanno scoperto che il cervello utilizza un duplice meccanismo per apprendere attraverso tentativi ed errori, il che spiega come si formano le abitudini e può aiutare a gettare le basi per strategie di trattamento per condizioni come dipendenze o compulsioni.
La ricerca, condotta dai neuroscienziati del Sainsbury Wellcome Centre (SWC) dell'University College London (UCL) e condotta sui topi, potrebbe anche contribuire allo sviluppo di terapie per il morbo di Parkinson.
Il metodo di apprendimento per tentativi ed errori consiste nel provare diverse opzioni finché non si trova quella che funziona e nell'imparare dai propri errori strada facendo, ha riferito Efe mercoledì.
"Abbiamo scoperto un meccanismo che riteniamo sia responsabile delle abitudini. Una volta sviluppata una preferenza per una particolare azione, è possibile aggirare il sistema basato sui valori e affidarsi semplicemente alla politica predefinita di ciò che si è fatto in passato", il che libera anche il cervello per altri compiti, ha affermato Marcus Stephenson-Jones, responsabile del gruppo presso SWC e autore principale.
I ricercatori hanno scoperto un segnale di dopamina (un neurotrasmettitore) nel cervello che agisce come un tipo di segnale di apprendimento diverso da quelli precedentemente conosciuti.
Era noto che i segnali della dopamina nel cervello formano errori di previsione della ricompensa (RPE) che informano l'individuo se un'opzione è migliore o peggiore del previsto (questo è il circuito che porta gli individui a cercare il piacere).
In questo nuovo studio, gli autori hanno scoperto che, oltre agli errori di previsione della ricompensa, esiste un ulteriore segnale dopaminergico, chiamato errore di previsione dell'azione (APE), che aggiorna la frequenza con cui viene eseguita un'azione.
Secondo lo studio, questi due segnali didattici forniscono agli individui (in questo caso, i ratti) due modi distinti per imparare a fare una scelta: imparare a scegliere l'opzione più valida o quella più comune.
Immagina di andare al bar della tua zona. La prima volta che ci vai, potresti impiegare un po' di tempo per scegliere un panino e, a seconda di quale scegli, potrebbe piacerti o meno. Ma se torni spesso al bar, non perderai tempo a pensare a quale spuntino scegliere e inizierai invece a sceglierne uno che ti piace di default. Crediamo che sia il segnale dopaminergico dell'EPA a consentire a questa politica di default di essere memorizzata", ha spiegato Stephenson-Jones.
Inoltre, questo sistema di apprendimento di recente scoperta fornisce un modo molto più semplice per memorizzare informazioni rispetto al dover confrontare direttamente il valore di diverse opzioni, liberando il cervello per svolgere più attività contemporaneamente.
Ad esempio, una volta imparato a guidare, sarai in grado di conversare con qualcuno anche mentre sei in viaggio. Mentre il tuo sistema predefinito esegue tutte le attività ripetitive per guidare l'auto, il tuo sistema basato sui valori può decidere di cosa parlare, spiega lo studio.
I risultati dello studio mostrano perché è così difficile abbandonare le cattive abitudini e perché sostituire un'azione con un'altra potrebbe essere la strategia migliore : se si sostituisce sistematicamente un'azione, come masticare una gomma alla nicotina invece di fumare, il sistema EPA può prendere il sopravvento e creare una nuova abitudine che si aggiunge alla precedente.
Questa ricerca ha anche potenziali implicazioni per il morbo di Parkinson , che è noto per essere causato dalla morte dei neuroni dopaminergici del mesencefalo, quelli coinvolti nel movimento, che potrebbero essere responsabili della codifica dell'EPR, il che potrebbe spiegare perché questi pazienti hanno difficoltà a svolgere attività di routine come camminare, ma possono assumere comportamenti più flessibili, come pattinare sul ghiaccio.
observador