Învățarea și condiționarea

Învățarea poate fi definită ca o schimbare relativ permanentă în comportament, care apare ca rezultat al experienței. Există două tipuri de învățare: asociativă și non-asociativă. Învățarea non-asociativă implică învățarea unui singur stimul și include habituarea și sensibilizarea.

Habituarea se caracterizează printr-un răspuns comportamental caracteristic unui individ inofensiv. De exemplu, sunetul unui corn vă poate speria prima dată când îl auziți, dar în timp, acesta nu vă mai afectează.

Sensibilizarea presupune amplificarea răspunsului comportamental de la nivelul unui stimul intens. De exemplu, sperietura de la auzul sunetului unui corn este amplificată dacă intrați pe o alee întunecoasă înainte de auzi sunetul puternic.

Pe de altă parte, învățarea asociativă implică învățarea relațiilor dintre evenimente și include condiționarea și învățarea complexă.

Primele cercetări ale învățării au fost realizate de perspectiva behavioristă, pornind de la ideea că un comportament este cel mai bine înțeles prin prisma cauzelor externe, și nu a cauzelor mentale. Una dintre premisele învățării este că asociațiile simple clasice sau instrumentale sunt cărămizile învățării. În plus, aceleași legi fundamentale operează în toate situațiile, indiferent de conținutul învățării sau de persoana care învață.

Condiționarea clasică

Condiționarea clasică este un proces de învățare în care un stimul anterior neutru este asociat cu un alt stimul prin asocierea repetată cu stimulul respectiv.

Exemplul tipic de condiționare clasică este experimentul lui Pavlov. Aceasta a atașat un tub la glanda salivară a unui câine, pentru a măsura debitul salivei. Apoi câinele este pus în fața unui recipient în care poate fi livrată automat carne uscată. Un cercetător aprinde un bec în fața câinelui, sau sună un clopoțel. După câteva secunde, în vas este livrată carnea, și lumina se stinge. exemple

Salivarea este un reflex necondiționat, o reacție înnăscută determinată de sistemul nervos central. Carnea este un stimul necondiționat, care determină un răspuns automat. După câteva prezentări ale stimulului luminos, urmate de livrarea cărnii, câinele va saliva când va vedea lumina. Această salivare anticipatorie este un răspuns condiționat și lumina este un stimul condiționat. Cu alte cuvinte, răspunsul condiționat este un răspuns învățat, determinat de un stimul condiționat, care a devenit predictor pentru apariția unui stimulul necondiționat.

Fiecare prezentare a unei perechi stimul condiționat – stimul necondiționat se numește test. Testele în timpul cărora organismul învață asocierea dintre cei doi stimuli se numește stadiu de achiziție. Dacă după ce apare achiziția, stimulul necondiționat este omis, răspunsul condiționat se va reduce și va apărea extincția. Extincția reprezintă învățarea faptului că stimulul condiționat nu mai este un predictor pentru stimulul necondiționat.

De exemplu, condiționarea clasică joacă un rol în reacțiile emoționale ca frica. Un șobolan dintr-un compartiment închis este supus periodic unor șocuri electrice la picioare. Chiar înainte de apariția șocurilor, se aude un sunet. După repetate asocieri între ton și șocul electric, apariția sunetului este suficientă pentru apariția fricii.

Există și termenul de condiționare de nivelul doi, în care un stimul condiționat ajunge să determine apariția unui răspuns condiționat, în ciuda faptului că nu a fost niciodată asociat cu un stimul necondiționat. De exemplu, să presupunem că un pacient care urmează un tratament cu chimioterapie asociază gustul înghețatei cu greața, ca efect secundar al terapiei. Dacă copilul primește și alte alimente, precum morcovi, după care primește înghețată, poate începe să aibă sentimente neplăcute față de morcovi.

Atunci când un răspuns condiționat a fost asociat cu un anumit stimul, stimuli similari vor trezi aceeași reacție. Cu cât stimulii seamănă mai mult cu stimulul condiționat inițial, cu atât probabilitatea ca ei să trezească un răspuns condiționat este mai mare. Acest principiu poartă numele de generalizare.

Un proces complementar generalizării este discriminarea, o reacție la diferențe între stimuli. De exemplu, se prezintă două tonuri, unul înalt și altul jos. Cel jos, primul stimul condiționat, este mereu urmat de șocuri electrice, în timp ce cel înalt, al doilea stimul condiționat, nu. La început, ambii stimuli vor duce la prezența fricii, dar, în timp, răspunsul la primul stimul condiționat crește, iar pentru al doilea stimul condiționat scade.

Condiționarea poate fi excitatorie sau inhibitorie. Condiționarea excitatorie arată capacitatea unui stimul condiționat de a amplifica probabilitatea de apariție sau magnitudinea unui comportament. Condiționarea inhibitorie se referă la capacitatea unui stimul condiționat de a reduce probabilitatea de apariție sau magnitudinea unui comportament. De exemplu, când un ton care este predictor pentru aplicarea unui șoc electric, este însoțit de lumină atunci când șocul nu va fi prezent, lumina ajunge să fie predictor pentru absența șocului.

S-a încercat identificarea factorului critic, necesar pentru producerea condiționării. Se credea că factorul critic este contiguitatea temporală a stimulului condiționat și necondiționat. O altă teorie este că stimulul condiționat trebuie să fie predictor sigur pentru cel necondiționat. Altfel spus, trebuie să existe o probabilitate mai mare de apariție a stimulului necondiționat atunci când stimulul condiționat a fost prezentat, decât atunci când nu a fost prezentat.

Predictibilitatea este și ea importantă pentru reacțiile emoționale. Dacă un anumit stimul condiționat poate fi un predictor bun pentru apariția durerii, absența acestui stimul condiționat este un predictor pentru faptul că durerea nu va apărea, și organismul se va relaxa. Din acest motiv, stimulul condiționat este un semnal pentru pericol, iar absența sa este un semnal pentru siguranță. Când semnalele de acest tip sunt aleatoare, consumul emoțional poate fi devastator pentru organism. Dacă nu există niciun semnal predictor, subiecții (animale) par să fie mereu anxioși.

Condiționarea clasică are anumite limite biologice. Unele dintre cele mai bune dovezi pentru limitele condiționării vin din cercetările despre învățarea aversiunii față de gust. De exemplu, unui șobolan i se oferă o substanță cu gust de vanilie. Apoi acesta este injectat cu clorură de litiu, pentru a îi determina greața. Acesta învață să evite vanilia. Primii behavioriști credeau că lumina și sunetul au aceleași calități de semnalizare ca gustul. Adică, asociația între lumină și greață ar trebui să nu fie mai grea decât cea între gust și greață. Într-un studiu, șobolanilor li s-a dat o substanță cu un anumit gust, însoțită de o lumină și un clic.

Apoi șobolanilor li se dă o otravă ușoară. Pentru a vedea dacă gustul și ceilalți doi stimuli sunt la fel de puternici, șobolanii fie primesc iar substanța, însă fără lumină sau sunet, fie primesc o substanță fără gust, dar cu lumină și sunet. Șobolanii au evitat substanța asociată cu gust, dar nu și substanța asociată cu lumină și sunet. Însă dacă otrava este înlocuită cu șocuri electrice, lumina și sunetul devin mai buni predictori decât gustul.

Aceste rezultate sunt concordante cu perspectiva etologică asupra comportamentului, care pune accentul pe adaptarea evolutivă a animalului. De exemplu, pentru șobolani există o relație determinată genetic între gust și reacțiile intestinale, care să încurajeze stabilirea unei asociații între gust și greață. Mai mult, în mediul natural, durerea produsă de factori externi, ca frigul sau o rană, este invariabil provocată de stimuli externi. Prin urmare, poate exista o relație înnăscută între stimulii externi și durere.

Condiționarea instrumentală

În condiționarea instrumentală, anumite reacții sunt învățare pentru că afectează sau modifică mediul înconjurător. Individul nu are doar reacții la stimuli, ca în condiționarea clasică, ci inițiază comportamente cu scopul de a determina anumite schimbări în mediu. După ce organismul realizează un anumit comportament, probabilitatea ca acțiunea respectivă să se repete depinde de consecințele sale.

De exemplu, atunci când o pisică este într-o cușcă și în afara acesteia se află o bucată de pește, pisica va încerca o varietate de comportamente, până când lovește cârligul încuietor și ușa se deschide. După mai multe repetări, pisica învață să deschidă direct ușa. Inițial, aceasta se angajează într-un proces de încercare-eroare, iar când un comportament a fost recompensat, învățarea este întărită. Această întărire poartă numele de legea efectului, arătând că dintr-un eșantion de comportamente se selectează cele care sunt urmate de consecințe pozitive.

Experimentele consacrate de condiționare instrumentală sunt cele ale lui Skinner. Un animal înfometat este pus într-o cutie numită cutie skinneriană. Interiorul acesteia este gol, cu excepția unei manete sub care se află o farfurie cu mâncare. Animalul examinează cușca și apasă ocazional pe manetă. Frecvența de apăsare se numește nivel minim. După ce acest nivel este stabilit, experimentatorul activează eliberarea mâncării la fiecare apăsare. Hrana întărește acest comportament, și frecvența de apăsare a manetei se mărește.

Astfel, întărirea se referă la procesul care duce la creșterea probabilității apariției comportamentului. Întărirea pozitivă descrie creșterea unui comportament prin prezentarea unui stimul apetitiv. Întărirea negativă apare atunci când comportamentul împiedică apariția unui stimul aversiv. Comportamentul poate fi controlat și prin aplicarea de pedepse, proces prin care asocierea cu un stimul aversiv sau înlăturarea unui stimul apetitiv reduce probabilitatea de apariție a unui comportament.

Aplicarea de întăriri imediate este mai eficientă decât întărirea întârziată. Cu cât trece mai mult timp între un răspuns condiționat instrumental și factorul său de întărire, cu atât comportamentul este mai slab. Acest principiu este important în educarea copiilor mici. De exemplu, dacă un copil se poartă frumos cu un cățel, lauda imediată este mai eficientă decât lauda după câteva ore.

O tehnică pentru a învăța pe cineva comportamente noi este formarea. Conform acesteia, se întăresc numai anumite variații de comportament, care merg în direcția dorită. De exemplu, prin formare, câinii pot fi învățați să aducă scrisori sau delfinii să găsească echipamente sub apă. Nu toate comportamentele pot fi formate, fiind supuse unor reguli biologice. De exemplu, cercetătorii au dorit să învețe ratonii să pună bani într-o pușculiță. Însă aceștia tratau monedele ca pe mâncare.

Se poate distinge între factori de întărire primari și factori de întărire secundari. Factorii de întărire primari satisfac nevoile primare ale persoanelor, precum foamea. Însă orice stimul poate deveni factor de întărire secundar, dacă a fost asociat constant cu un factor primar de întărire. De exemplu, dacă un șobolan apasă pe o manetă, acesta primește mâncare, însoțită de un sunet. Apoi animalul nu mai primește nici mâncare, nici sunet, ducând la extincția comportamentului. Apoi, după o perioadă, dacă șobolanul apasă maneta, se aude doar sunetul. Chiar și în absența mâncării, comportamentul este întărit. Cei mai întâlniți agenți de întărire secundari pentru oameni sunt banii și aprecierea.

Generalizarea și discriminarea discutate pentru condiționarea clasică sunt valabile și pentru condiționarea instrumentală. Organismele generalizează ceea ce au învățat, iar generalizarea poate fi controlată prin exersarea discriminării. De exemplu, fiind întărit comportamentul de mângâiere a câinelui familiei, o fetiță va generaliza comportamentul pentru toți câinii. Părinții, îngrijorați că ar putea fi mușcată, vor exersa discriminarea prin întărirea mângâierii câinelui familiei, dar nu și a celorlalți câini.

Există patru programe fundamentale de întărire. Unele programe sunt procentuale, iar altele de interval. Cele procentuale presupun aplicarea recompensei după un anumit număr de răspunsuri corecte. Procentul poate fi fix, ceea ce presupune atribuirea recompensei după un anumit număr fix de răspunsuri.

Spre exemplu, recompensa apare după 5 răspunsuri. Cu cât proporția este mai mare, cu atât este mai mare frecvența cu care organismul răspunde, mai ales atunci când acesta este condiționat inițial cu un procent relativ redus. Un astfel de exemplu este norma pe care trebuie să o îndeplinească un muncitor pentru a obține 50 de lei.

Într-un program cu procent variabil, organismul primește întărirea numai după ce aduce un număr de răspunsuri, dar acest număr variază impredictibil. Uneori, poate fi după o apăsare, alteori după cinci sau zece. Un exemplu este câștigul la jocurile de noroc.

Alte programe de întărire sunt cele cu intervale de timp. Acestea presupun oferire a recompensei doar după o perioadă de timp. La rândul ei, această perioadă poate fi fixă sau variabilă.

Într-un program cu interval fix, organismul primește întărirea pentru primul răspuns condiționat ce apare după un anumit interval de timp de la ultima întărire. Deseori apare o pauză imediat după ce a fost primită întărirea și crește frecvența răspunsurilor pe măsură ce se apropie sfârșitul intervalului. Un astfel de exemplu este livrarea corespondenței, care se face o dată pe zi. Imediat după ce se aduce corespondența, nu este controlată cutia poștală, dar când se apropie momentul livrării, începem să verificăm din nou cutia poștală.

Într-un program cu interval variabil întărirea depinde de trecerea unui anumit interval de timp, dar durata intervalului variază impredictibil. De exemplu, formarea unui număr de telefon pentru a doua oară, după ce prima dată a fost ocupat.

Întărirea nu este întotdeauna pozitivă. Evenimentele negative, aversive, precum șocurile electrice sunt deseori folosite în condiționarea instrumentală.

Pedeapsa

Pedeapsa este o altă parte importantă a condiționării. În învățarea acestora, un răspuns este urmat de un stimul sau un eveniment aversiv, care duce la slăbirea sau suprimarea ulterioară a răspunsului. De exemplu, un copil care desenează pe perete va învăța să nu o mai facă dacă este lovit peste mână.

Aceasta are anumite dezavantaje. În primul rând, efectele sale nu sunt la fel de informative ca rezultatele unei recompense. Pedeapsa indică oprirea unui comportament, dar nu oferă o alternativă. Prin urmare, se poate adopta un alt răspuns, chiar mai indezirabil. În al doilea rând, pedeapsa poate duce la respingere sau frică față de persoana care aplică și față de situația în care a apărut. În al treilea rând, o pedeapsă poate duce la un comportament agresiv mai grav decât comportamentul inițial.

Pedeapsa poate fi eficientă dacă este constantă și aplicată imediat după comportamentul indezirabil, alături de întărirea unor răspunsuri alternative.

Evenimentele aversive pot fi folosite și în învățarea de noi moduri de reacție. Organismele pot învăța reacții care pun capăt unor evenimente aversive în plină desfășurare. Această reacție se numește învățarea fugii. Organismele pot învăța și să reacționeze pentru a împiedica declanșarea unui eveniment aversiv. Ca atunci când învățăm să ne oprim când stopul arată culoarea roșie pentru a nu primi amenzi. Acest comportament se numește învățare prin evitare.

Există două procese în învățarea evitării. În prima etapă are loc condiționarea clasică, prin asocieri repetate ale semnalului de avertizare cu evenimentul pedeapsă animalul învățând să asocieze o reacție de frică cu avertismentul. A doua etapă implică condiționarea instrumentală. Animalul învață că o anumită reacție îndepărtează un anumit eveniment aversiv. Teoria cognitivă a evitării sugerează că factorii cognitivi ar putea juca un rol important în condiționarea instrumentală. Organismul fixează noi cunoștințe despre relațiile dintre reacții și factorii de întărire.

Se dorește identificarea factorului critic pentru apariția condiționării operante. Una dintre opțiuni este contiguitatea temporală. Un răspuns operant este condiționat ori de câte ori este urmat imediat de un factor de întărire. O altă opțiune este problema controlului. Un răspuns operant este condiționat numai când organismul interpretează întărirea ca fiind controlată de reacția sa.

Importanța controlului este evidențiată prin experimentul lui Mayer și Seligman. În prima etapă, unii șobolani învață că, dacă primesc sau nu un șoc depinde de comportamentul lor, în timp ce alții învață că nu au niciun control. În a doua etapă experimentatorul a pus ambii șobolani într-un aparat. Pentru a evita șocul, șobolanul trebuie să învețe să sară peste o barieră când aude un ton de avertizare. Cei care au deținut controlul învață acest comportament foarte repede, dar ceilalți nu fac nicio mișcare de a trece peste barieră și devin din ce în ce mai pasivi.

Biologia impune limite comportamentelor care pot fi învățate prin condiționarea instrumentală. Aceste limite implică existența unei relații între răspunsul comportamental și factorul de întărire. De exemplu, porumbeii învață mult mai repede să execute lovituri cu ciocul pentru a obține mâncare decât să dea din aripi. De asemenea, învață mult mai repede să oprească un șoc electric dând din aripi, decât lovind cu ciocul. Aceste rezultate sunt explicate de faptul că există o legătură determinată genetic între hrănire și lovirea cu ciocul sau între fuga și bătaia din aripi.

Învățarea complexă

Problema centrală a învățării și a inteligenței, în general, constă în capacitatea organismului de a își reprezenta mental aspecte ale lumii și de a opera cu aceste reprezentări mentale. În condiționare, reprezentarea mentală este o asociere între stimuli și evenimente.

Un exemplu de învățare complexă este realizarea de hărți mentale, reprezentări mentale ale situației, precum a unui labirint. În ceea ce privește studiile asupra șobolanilor, labirintul este o platformă centrală cu opt brațe identice, care radiază spre exterior. La fiecare test, cercetătorul pune o bucățică de mâncare la capătul unui braț, iar șobolanul trebuie să aibă o hartă mentală a labirintului, pentru a nu omite un braț sau a nu vizita de mai multe ori unul.

De asemenea, la nivelul primatelor, studiile arată că cimpanzeii își pot însuși concepte abstracte despre care se credea că sunt specifice omului, precum utilizarea simbolurilor de plastic de diferite forme și culori ca pe niște cuvinte, chiar dacă nu există o asemănare fizică între simbol și obiect. Pot învăța și concepte precum „la fel”, „diferit” și „cauză”.

Studii asupra cimpanzeilor arată că sunt capabili de raționamente. Animalul era într-o cușcă, alături de un fruct dezirabil, la care nu putea să ajungă fiind nevoit să folosească un obiect din jur. De exemplu, un cimpanzeu trage un băț lung cu un băț mai scurt, pe care urmează să îl utilizeze pentru a obține fructul. Aceste comportamente apar în urma unei observări atente a mediului din jur.

Diferența între acești cimpanzei și animalele care învață prin condiționare este că soluția a fost bruscă, și nu rezultatul unui proces gradual de încercare-eroare. În plus, după rezolvarea problemei, cimpanzeul va repeta soluția cu foarte puține mișcări irelevante. De asemenea, pot transfera foarte ușor ce au învățat într-o situație nouă.

Soluțiile găsite de cimpanzei au trei aspecte critice – bruschețea, disponibilitatea și transferabilitatea. Acestea reflectă un proces mental, de încercare-eroare, prin formarea unei reprezentări mentale a problemei și manipularea componentelor reprezentării până când descoperă o soluție pe care o aplică în lumea reală. Soluția pare bruscă, deoarece cercetătorii nu au acces la procesele mentale ale cimpanzeului. Soluția este disponibilă din acel moment, deoarece o reprezentare mentală persistă în timp. Soluția este transferabilă pentru că reprezentarea este fie suficient de abstractă pentru a acoperi mai mult decât situația inițială, sau suficient de maleabilă pentru a fi extinsă la o situație nouă.

Învățarea complexă implică două faze. În faza inițială este folosită rezolvarea de probleme pentru a ajunge la o soluție, iar în a doua fază soluția este stocată în memorie și recuperată de câte ori apare o situație similară.

La om, credințele anterioare pot stabili ceea ce se învață, ceea ce indică faptul că învățarea implică procese suplimentare, față de cele care formează asociațiile dintre informațiile care intră în sistem. Într-un experiment, participanții s-au concentrat pe posibila relație dintre desenele făcute de niște bolnavi mental și simptomele pacienților. Sarcina era să determine dacă exista un aspect al desenului care era asociat cu unul dintre simptome. În realitate, cele șase simptome fuseseră asociate aleator cu desenele. Participanții au declarat, totuși, că există astfel de legături. De exemplu, desenele cu ochii mari erau asociate cu suspiciunea, credințe pe care persoanele le aveau, probabil, dinainte de experiment. Credințele anterioare despre stimuli au determinat ceea ce a fost învățat.

În situații în care credințele anterioare ale individului nu sunt în acord cu asociația obiectivă care trebuie învățată, oamenii dau prioritate credințelor anterioare. Totuși, pe măsură ce datele sunt din ce în ce mai izbitoare, credințele personale sunt învinse.

Radu Fritea

Radu este psiholog, doctor în psihologie, consultant organizațional, antreprenor și editorul fondator al Psihoteca.

Psihoteca

Învățarea și condiționarea

Condiționarea clasică

Condiționarea instrumentală

Pedeapsa

Învățarea complexă

Faci un comentariu sau dai un răspuns? Anulează răspunsul

Linkuri utile

Condiționarea clasică

Condiționarea instrumentală

Pedeapsa

Învățarea complexă

Faci un comentariu sau dai un răspuns? Anulează răspunsul

Related Posts

De ce visăm? O altă perspectivă asupra somnului REM

Puterea organizațională. Cum o obținem, menținem și pierdem?

Dezvoltarea la vârsta mijlocie

Creierul din perspectiva lui Ramon y Cajal