Prelucrarea informației vizuale

Conspect al capitolului 2 din ”Psihologie cognitivă” de Mircea Miclea.

Neurobiologia procesării informației vizuale

Semnalele luminoase receptate și procesate de sistemul vizual uman sunt unele electromagnetice cu lungimi de undă între 440 și 810 nanometri. Un fenomen fizic este vizibil dacă provoacă o activitate fotochimică la nivelul receptorilor care determină formarea unor potențiale de acțiune.

Razele luminoase traversează corneea, camera anterioară, pupila, cristalinul și umoarea apoasă înainte de a ajunge să formeze o imagine pe retină. Cea mai sensibilă parte a retinei se numește fovee.

Retina conține două tipuri de receptori – conuri și bastonașe. Conurile sunt amplasate în centrul retinei, în special în zona foveală, având un nivel înalt de sensibilitate pentru culori și detalii. Bastonașele se află în zona periferică a retinei, fiind specializate în detectarea luminii de slabă intensitate.

Ambele tipuri de receptori conțin pigmenți sensibili la lumină. Fotonii stimulilor luminoși rezultă în descompunerea pigmenților, dând naștere unor potențiale electrice în celulele nervoase și generâmd variații ale frecvenței de descărcare a acestora. Acestea reprezintă codul neurobiologic care realizează transmiterea informației prin sistemul nervos.

Receptorii sunt conectați pe verticală de celule bipolare, ganglionare și nervi optici. Între celule există și conexiuni orizontale, formate de celulele amacrine și celulele orizontale. Aceste conexiuni oferă retinei o structură laticeală, cu funcții excitative pe verticală și inhibitive pe orizontală.

Câmp receptor, celule on-off și off-on

Fiecărei celule ganglionare îi revine un număr mare de receptori, astfel încât celulele nu reacționează la stimularea unui singur punct pe retină. Suprafața de pe retină care modifică funcționarea celulei nervoase se numește câmp receptor al celulei respective. Mărimea câmpului receptor se stabilește înregistrând activitatea celulei nervoase în condițiile stimulării retinei. Se înregistrează măsura în care activitatea celulei crește fie la apariția luminii, fie la dispariția sa sau măsura în care nu apar modificări.

Utilizând această metodă, au fost descoperite două tipuri de celule – on-off și off-on. În cazul celulelor on-off, stimularea luminoasă intensifică rata descărcărilor electrice dacă lumina cade în centrul câmpului receptor și reduce activitatea celulei dacă spotul se află la periferie. Zona în care efectul luminii se anulează circumscrie câmpul receptor. Astfel, celulele on-off, având un câmp receptor cu o polaritate pozitivă în centru și negativă spre periferie, se activează pentru spoturi luminoase.

Reactivitatea maximă a acestor celule apare când lipsește lumina în zona periferică. În cazul în care câmpul vizual ar fi iluminat uniform, activitatea electrică a neuronilor ar rămâne nemodificată datorită procesului de inhibiție laterală.

În cazul celulelor off-on, activitatea lor e maximă dacă în zona centrală a câmpului receptor e expus un punct negru, mărginit sau circumscris de fasciscule luminoase. În cazul în care câmpul vizual ar fi iluminat uniform, activitatea electrică a neuronilor ar rămâne nemodificată datorită procesului de inhibiție laterală.

Existența celor două tipuri de celule poate fi probată nu numai prin înregistrări neurofizologice, ci și prin metode psihofiziologice. Un astfel de exemplu este grilajul Hermann-Hering, o configurație de careuri negre. La intersecția dintre grilajul negru cu cel alb apar puncte gri, care de fapt nu există. Însă ele reprezintă funcționarea celulelor on-off. Această metodă permite și estimarea mărimii câmpului receptor. Mărind distanțele dintre careurile negre, se poate estima diametrul câmpului receptor în funcție de dispariția petelor gri.

Celulele on-off și off-on sunt caracteristice ganglionilor vizuali și celulelor nervoase din corpii geniculați laterali.

Detectorii de trăsături

În cadrul unor studii pe animale, un electrod era introdus în apropierea sau în corpul unui neuron din cortexul vizual. Apoi, acestora li se arătau stimuli foarte simpli, care reprezentau o singură caracteristică a unui stimul mai complex. Neuronii care își modificau activitatea în cazul prezentării stimulilor au fost numiți detectori de trăsătură.

În funcție de complexitatea caracteristicilor fizice la care reacționau, au fost identificate trei tipuri de celule – simple, complexe și hipercomplexe. Celulele simple detectează contururi, fante luminoase sau linii. Specializarea acestor celule este atât de pregnantă încât ele reacționează numai la o anumită orientare și localizare a caracteristicii.

Frecvența potențialelor de acțiune este maximă dacă stimulul corespunde exact trăsăturii la care reacționează detectorul. Cu cât abaterea este mai mare, cu atât detecția este mai dificilă sau este complet anihilată.

Câmpul receptor al celulelor simple nu mai este circular, ca în cazul celulelor on-off, ci elongat. O celulă simplă însumează activitatea mai multor celule on-off și/sau off-on din nucleii geniculați laterali. Nu este suficientă activarea unei singure celule pentru a activa o celulă simplă. Acestea reacționează doar la combinații sau dispuneri ale celulelor din nucleii geniculați.

Unele cercetări recente au evidențiat organizarea somatotopică a cortexului vizual. Aceasta înseamnă că o anumită regiune din cortexul vizual prelucrează informația dintr-o anumită zonă a câmpului vizual, rămânând insensibilă la stimulii cu altă locație. În interiorul unei astfel de regiuni, se constată o organizare pe bază de similaritate a celulelor simple. Dacă un neuron codează o linie orizontală, celulele din imediata apropiere își sporesc frecvența descărcărilor la linii cu o abatere de 20 de grade față de orizontală.

Tipurile de stimuli trăsături la care reacționează celulele complexe sunt aceeași ca în cazul celulelor simple. Spre deosebire de celulele simple, acestea răspund la stimuli indiferent de locația lor în câmpul vizual. Însă orientarea stimulilor rămâne importantă. În plus, celulele complexe reacționează și la stimuli aflați în mișcare. Astfel, la aceste celule, câmpul receptor este mai amplu.

Există mai multe modalități de a diferenția între celule simple și celule complexe. De exemplu, se alege un stimul și se deplasează în câmpul vizual. Dacă celula respectivă își intensifică rata descărcărilor doar pentru o anumită locație, atunci este o celulă simplă.

La nivelul celulelor hipercomplexe, s-au identificat două tipuri de celule. Primul timp este identic cu celulele complexe, dar reacționează la orice stimul, cu condiția de a avea o anumită dimensiune. Stimuli de dimensiuni diferite activează celule diferite. Al doilea tip de celule detectează unghiuri.

Studii asupra mai maimuțelor indică cât de complecși sunt stimulii detectați de aceste celule, sugerând că există neuroni care par să detecteze triunghiuri, pătrate, palma sau chiar expresia facială.

S-a sugerat o organizare ierarhică a celulelor. Astfel, se pornește de la cele simple, care primesc semnale generate de celulele on-off și off-on, mergând spre cele complexe, care sintetizează mesajele celulelor simple, spre cele hipercomplexe.

Procesarea primară a informației vizuale

O teorie computațională a procesării informației vizuale vizează construirea unor modele logico-matematice capabile să producă un anumit output. Procesarea informației vizuale poate fie împărțită în două stadii – procesarea primară și procesarea secundară.

Procesarea primară cuprinde prelucrările pre-atenționale, cu o durată de aproximativ 200 de milisecunde, care au ca rezultat reprezentarea în sistemul cognitiv a caracteristicilor fizice ale stimulului. Aici sunt incluse mecanismele de detectare a contururilor, a texturii, a mișcării, a culorii sau a dispunerii spațiale.

Procesarea secundară vizează mecanismele implicate în recunoașterea figurilor și a obiectelor. Ele au ca input rezultatele procesării primare și ca output imaginea tridimensională a unui obiect din mediu.

În urma procesării primare, în care procesele de detectare a contururilor, a texturii, a mișcării sau a culorii în paralel, rezultă o reprezentare intermediară a obiectului, notată doi ½ D. Aceasta este input-ul pentru alte procesări, din care rezultă reprezentarea tridimensională a obiectului.

Toate prelucrările posedă o serie de caracteristici care le individualizează față de procesările secundare. În primul rând, procesările primare sunt organizate în moduli, care funcționează simultan, în paralel. În al doilea rând, toate aceste procese sunt independente de natura stimulului, realizându-se indiferent dacă obiectul perceput este un scaun sau o față umană.

În al treilea rând, aceste procese implică o serie de asumpții despre realitatea obiectuală. De exemplu, rigiditatea obiectelor ne permite să percepem adâncimea și deplasarea în spațiu. Astfel, într-un studiu, participanții au văzut baloane care se umflau. Însă ei percepeau această modificare ca apropierea obiectului. Această asumpție este prezentă de la vârsta de cinci luni.

Schița primară – extragerea contururilor

Extragerea contururilor din pattern-urile de luminozitate pe care obiectele le transmit retinei este modalitatea principală implicată în construirea schiței primare.

Valoarea informațională a contururilor rezultă din două caracteristici ale acestora. În primul rând, contururile primare surprind multe dintre caracteristicile invariate ale stimulului, precum dispunerea relativă. În al doilea rând, contururile permit o procesare economică a informației, deoarece reduc diversitatea detaliilor la esențial.

Pentru a extrage un contur, plecăm de la conceptul variației semnificative a intensității stimulilor luminoși. Variațiile cele mai ample ale luminozității emise de obiectele din mediu au loc la marginea acestor obiecte.

Pentru a susține această idee, un cercetător a înregistrat activitatea electrică a celulelor ganglionare la un crab de mare în condițiile expunerii receptorilor la o variație semnificativă a intensității stimulilor luminoși la marginea dintre o fantă luminoasă și o bandă neagră, adică un contur. Cea mai mare variație a descărcărilor a apărut la neuronii din zona de variație bruscă a luminozității.

Mai mult decât atât, sistemul nervos tinde să exagereze contururile, să îngroașe variațiile de luminozitate la limita dintre două suprafețe sau dintre un obiect și mediul său. Acest aspect a fost evidențiat prin intermediul benzilor lor Mach.

Modele matematice ale extragerii conturului

Filtrajul

Cel mai cunoscut model matematic al detectării conturului se bazează pe filtrarea matematică a variațiilor de intensitate a luminii, folosindu-se calculul diferențial. Contururile unei figuri pot fi stabilite fie în punctele de valoare maximă a diferențialei de ordinul I a intensității stimulilor luminoși, fie în punctele de valoare zero a diferențialei de ordinul II a acelorași intensități.

Examinând o reprezentare grafică, acesta este similară cu graficul frecvenței potențialelor de acțiune la prezentarea unui contur. Rata descărcărilor atinge maximum pozitiv în partea luminoasă și maximum negativ în partea întunecoasă. Astfel, conturul propriu-zis este codat la intersecția cu rata spontană a descărcărilor zero.

Însă această abordare nu ia în considerare aspecte precum lipsa unei iluminări uniforme. La rândul său, obiectul însuși poate emite semnale luminoase. Dacă sistemul cognitiv al funcționa pe baza calculului diferențial, conturul s-ar modifica la orice schimbare de intensitate luminoasă.

Astfel, se consideră că micile variații de luminozitate se aglutinează, fiind luate în considerare doar cele suficient de ample, pe baza unei medii a intensităților.

Pe baza filtrării stimulilor vizuali de pe retină se pot stabili contururi mai puține sau mai numeroase ale aceleiași imagini în funcție de mărimea acestor filtre. Numărul de contururi extrase se micșorează odată cu mărimea dimensiunilor filtrului, adică o dată cu mărimea mulțimii de pixeli care sunt aglutinați prin valoarea medie a intensității lor.

Pentru a extrage caracteristicile invariate, se analizează scale diferite, cu filtre diferite, aceeași imagine. Acele contururi care persistă și în cazul unui filtru înalt sunt considerate definitorii.

Analiza Fourier

O teorie alternativă, utilizată pentru modelarea mecanismului de extragere a contururilor, are la bază analiza de frecvență de tip fourier.

În cazul acestei analize, se pornește de la ideea periodicității stimulării luminoase. De exemplu, o lumină se poate aprinde sau stinge, durata în care ea este aprinsă fiind aproximativ egală cu cea în care este stinsă. Acest aspect se numește periodicitate temporală. Există și o periodicitate spațială, zonele cu intensitate mai ridicată alternând aproximativ regulat cu zonele cu intensitate mai redusă.

Aceste funcții periodice pot fi descompuse în funcții periodice trigonometrice sau în serii Fourier. Descompunerea se face inițial într-o funcție sinusoidală de aceeași frecvență ca și stimulul ce trebuie reprezentat. Ulterior, această descompunere se face în funcții de frecvență tot mai mare și amplitudine tot mai mică. Stabilirea acestor frecvențe se face pe baza unor coeficienți Fourier, care reprezintă un multiplu întreg al descompunerii inițiale sau armoniei fundamentale. Semnalul inițial se obține prin recompunerea armoincelor sale.

Cu ajutorul aparatului matematic elaborat de Fourier, putem descompune un stimul periodic în armonicile sale, apoi le putem recombina în vederea reprezentării sale în funcții trigonometrice periodice.

Calculul adâncimii prin disparitatea retinală

Unul din mecanismele cele mai importante de detecție a distanțelor și a adâncimii are la bază fenomenul numit streopsis. Acesta se referă la faptul că cei doi ochi au unghiuri diferite de recepție a stimulilor vizuali. Aceste diferențe unghiulare fac ca distanțele dintre proiecțiile pe retină a două puncte la cei doi ochi să fie diferite, apărând dispariatea retinală.

Pe baza disparității retinale se poate calcula distanța unui obiect față de observatori, deci și adâncimea în spațiu. Au fost dezvoltați și o serie de algoritmi care permit și unor sisteme vizuale artificiale să perceapă adâncimea.

În condiții naturale, pe baza acestor calcule, se poate percepe chiar o diferență de 1mm între două obiecte aflate la o distanță de un metru. Pentru două obiecte aflate la 10 m, adâncimea minimă ce poate fi percepută pe baza calculului este de 90 de mm.

Alte surse de detectare a distanței și a adâncimii sunt deplasarea noastră față de obiecte sau deplasarea obiectelor. Simpla deplasare a privirii poate oferi informații similare – mărimea unghiului acestei deplasări e cu atât mai mare cu cât obiectele sunt mai depărate.

J.Gibson a afirmat că aceste informații pot fi conținute de gradientul unei texturi. Gradientul constă în micșorarea sistematică a dimensiunilor elementelor texturii și distanței dintre acestea. Dacă această variație se face de la baza suprafeței pe care o prezintă textura spre vârf, apare senzația de adâncime în spațiu. În acest caz, asumpția rigidității are un rol important.

Procesarea mișcării

Procesarea deplasării unui obiect pare a fi mult mai rapidă decât cele care sunt implicate în recunoașterea formei și a semnificației. De exemplu, există tendința de a ne feri de obiecte în mișcare chiar dacă sunt periculoase sau nu, tendință existență din primele săptămâni de viață.

Celulele nervoase implicate în detectarea mișcării sunt specifice în funcție de direcția acesteia. Acest lucru poate fi dedus prin observarea pentru mai mult a căderii apei dintr-o cascadă. Atunci când ne mutăm privirea asupra unui obiect fix, vom avea sens că acestea se mișcă în direcția opusă mișcării apei. Acest fenomen se explică din oboseala celulelor nervoase responsabile de detectarea mișcării în jos.

S-a sugerat chiar existența unei rețele neuronale care este sensibilă la mișcări de la stânga la dreapta în câmpul vizual. Un anumit stimul vizual simplu se poate afla succesiv în diferite locații – A, B, C, D. Locația lui este codată de celule care transmit mesajul unor celule intermediare – a, b, c, d. Când obiectul se află în poziția B, el excită celule b și inihbă, prin inhibiție laterală, celula a. Aceste celule transmit mesaje la ganglionii de detectare a mișcării, care au o rată constantă a descărcărilor. Rețeaua nu poate funcționa și în sens invers, deoarece inhibiția și excitația s-ar anula reciproc, iar celula care detectează mișcarea n-ar mai emite potențiale de acțiune.

Extragerea formei din prelucrarea umbrelor

Zonele de umbră dezvoltate în jurul unui obiect pot oferi informații importante despre forma și poziția obiectului într-un anumit context. Până în prezent nu există modelări formal – matematice explicite ale modului de prelucrare a umbrelor în vederea reconstruirii formei sau poziției obiectului. Probabil cunoștințele tacite au un rol important

Procesarea texturii

Textura sau compoziția unui material conține o combinație de texturi sau motive. Elementele nedecompozabile, sau primitive, care specifică caractersticile locale ale unei trăsături au fost numite textoni. Una dintre funcţiile lor este de a segrega figura de fond sau obiectul din mediu atunci când diferenţele de luminozitate nu sunt suficiente.

Detectarea culorii

Detectarea culorii poate ajuta segregarea mai rapidă a figurii de fondul său, în vederea declanșării unor procese capabile să o identifice și să o categorizeze.

Recunoașterea obiectelor

Recunoașterea constă în punerea în corespondență a imaginii perceptive a obiectului cu reprezentarea sa în memorie.

Punerea în corespondență a reprezentării doi ½ D cu reprezentarea stocată, centrată pe obiect, este facilitată de existența unor detalii spațiale constante sau proprietăți neaccidentale. De exemplu, o linie dreaptă va rămâne o linie dreaptă în condițiile aproape oricărei alinieri ochi – obiect. Alte proprietăți neaccidentale se referă la paralelism și simetrie. Două contururi paralele rămân paralele în majoritatea alinierilor ochi – obiect. Un contur simetric, de asemenea, rămâne simetric în majoritatea circumstanțelor.

Principiile gestaltiste

Procesul de recunoaștere este unul flexibil și rapid. Flexibilitatea rezultă deoarece obiectele proprietăți nonaccidentale, iar sistemul vizual neglijează sistematic abaterile de acestea. Rapiditatea presupune prezența unor mecanisme de organizare a stimulilor complecși în unități mai simple.

Diversitatea stimulilor e redusă pe baza unor mecanisme de grupare a elementelor unei figuri, cunoscute drept principii gestaltiste. Pentru obiectele sau figurile statice, cele mai cunoscute sunt principiul proximității, principiul similarității, principiul bunei-continuări și principiul închiderii.

În ceea ce privește principiul proximității, elementele aflate în proximitate spațială sunt grupate într-o singură unitate perceptivă. În principiul similarității, elementele similare sunt grupate în aceeași unitate perceptivă, care e contrapusă altora. Principiul bunei-continuări se referă la faptul că la intersecția a două contururi, ele sunt percepute după continuarea cea ma simplă. În principiul închiderii, conturul ocluzat al unei figuri este închid după configurația sa vizibilă.

Versiunea generalizată a acestor principii este cuprinsă în legea lui Pragranz – stimulii vizuali sunt grupați astfel încât să rezulte configurația cea mai simplă.

Mecanismele de organizare a elementelor din câmpul vizual după principiile gestaltiste sunt responsabile și de inducerea contururilor subiective sau virtuale. Acestea nu rezultă din procesarea variației de luminozitate, deoarece nu este prezentă, ci dintr-o construcție cognitivă, pe baza principiilor menționate.

Într-o cercetare orientată spre recunoașterea contururilor, participanților le erau prezentate anumite configurații. Apoi li se cerea să raporteze măsura în care alte patru forme erau parte a primei figuri. O parte din aceste forme erau secțiuni care respectau principiile gestaltiste, în timp ce o altă parte încălcau aceste principii. Rezultatele arată o recunoaștere mult mai rapidă a figurilor segmentate după principiile gestaltiste.

Unul din principiile centrale ale gestaltiştilor este că percepţia configuraţiei se realziează mai rapid decât percepţia părţilor componente. Într-un studiu, participanții apăsau o tastă atunci când apăreau două paranteze împreună și o altă tastă când apărea doar o paranteză. Pentru stimulii compleți, adică setul de paranteze, timpul de răspuns era mai mic.

Într-un alt studiu, s-au utilizat configurații compozite în care un stimul complex este compus din organizarea unor stimuli cu semnificații total diferite. De exemplu, pe ecran apărea un H mare, format din mai multe E-uri mici. În mod constant, participanții recunoșteau întâi configurația globală.

Prezența principiilor gestaltiste poate fi constatată din primele luni de viață. Chiar dacă nu sunt integral determinante genetic, se consideră că există o predispoziție a sistemului nervos pentru organizarea stimulilor din spațiul vizual.

RBC – un model computațional de recunoaștere

Conform modelului RBC – Recognition by components, oamenii au tendința naturală de a segmenta obiectele complexe în părțile lor componente. Părțile în care sunt descompuse obiectele pot fi văzute ca niște volume primitive, numite geoni, un obiect complex poate fi specificat prin geonii componenți și modul de dispunere a lor.

Conform acestei teorii, diversitatea obiectelor din jur ar putea și redusă la 24 de geoni și la combinațiile dintre aceștia. Segmentarea obiectelor, pentru a fi împărțite în geoni, se face în zonele de concavitate. Conform principiului transversabilității, întretăierea a două suprafețe este aproape mereu marcată de o concavitate. Segmentarea obiectelor în această zonă oferă maximum de informație asupra structurii și părților sale.

Toți geonii pot fi descriși matematic printr-o teorie a conurilor generalizate. Un con generalizat este un volum generat prin mișcarea unei secțiuni transversale în jurul unei axe. Orice geon are patru atribute: curbura, mărimea, simetria și axa. Prin variația acestor atribute și specificarea relațiilor nonaccidentale dintre ele se pot genera și descrie geonii.

Prelucrarea informației din această perspectivă prezintă mai multe etape. În primul rând, are loc extragerea contururilor. După această etapă, sunt inițiate două module paralele, de detectare a proprietăților nonaccidental și de segmentare a obiectelor în zonele de concavitate. Rezultatul acestora constă în reducerea oricărui obiect la un set de geoni. Această reprezentare activează diverse modele ale obiectelor, existente în memorie. Pe baza corespondenței se identifică obiectul. Se consideră că este suficientă identificarea a trei geoni dintr-un obiect pentru a-l recunoaște.

Modelele computaționale se validează, în primul rând, sub aspectul consistenței lor interne prin implementarea pe calculator. Orice model cognitiv generează o serie de predicții despre comportamentul subiectului. Acestea pot fi validate prin observații sau experimente în situații cât mai naturale. Măsura în care predicțiile se dovedesc valabile în mediul natural al persoanei reprezintă validitatea sa ecologică.

Pentru a testa ideea segmentării în zonele de concavitate, participanților li s-au prezentat contururi incomplete ale unor obiecte, fie șterse în zonele de concavitate, fie aleator. Dacă segmentarea are loc la nivelul zonelor de concavitate, recunoașterea este îngreunată.

Un alt argument în favoarea RBC este oferit de studiile asupra recunoașterii obiectelor în condițiile rotirii în plan sau în spațiu. Timpul necesar recunoașterii este semnificativ mai mare dacă obiectele se rotesc în plan decât dacă se rotesc în spațiu, deoarece afectează în mai mare măsură geonii.

Un aspect interesant este faptul că recunoașterea unor scene din realitate nu este mai dificil de realizat decât recunoașterea unor obiecte. Deoarece într-o scenă există mai multe obiecte, ar trebui ca latența să fie semnificativ mai mare. O explicație este faptul că numărul de geoni rămâne relativ constant.

Una din problemele cu care se confruntă RBC este modul în care se realizează punerea în corespondență a imaginii cu reprezentarea sa din memorie. O altă problemă vizează identificarea obiectelor ce același tip de geoni, descompunerea în geoni nu este suficientă pentru a recunoaște obiectele, deoarece geonii componenți sunt aceeași. În acest caz, procesarea descendentă are un rol important. În final, modelul RBC nu ia în considerare mecanismele de organizare gestaltistă a stimulilor vizuali.

Alte modele ale recunoașterii

Modelul analizei de trăsături fizice

Supoziția fundamentală a modelului analizei de trăsături fizice este aceea că recunoașterea obiectelor se bazează pe detectarea unor caracteristici sau trăsături fizice distincte ale acestora. O trăsătură distinctă este orice caracteristică fizică vizibilă a unui obiect pe baza căreia acesta poate fi identificat.

S-a făcut un studiu asupra instinctelor la o specie de peștișori, în care masculii tind să-și marcheze un anumit teritoriu. Dacă un alt mascul de la aceeași specie intră pe acel teritoriu este atac, în timp ce alte specii nu. Masculii din această specie au o trăsătură distinctă – o dungă roșie pe partea ventrală. Cercetătorii au eliminat chirurgical această trăsătură și au atașat-o la alte specii. În acest caz, masculii din aceeași specie nu mai erau atacați, dar ceilalți da.

Astfel, pentru a avea loc recunoașterea, este necesară doar o trăsătură semnificativă. Prelucrarea informației se face după un principiu al economiei cognitive.

La speciile mai evoluate, crește numărul detectorilor de trăsături. De exemplu, la broaște există patru tipuri de detectori – detectori de contururi, de variații continue ale luminozității, de forme simple în mișcare și de puncte negre care se deplasează.

Astfel, reprezentarea realității este circumscrisă de numărul și caracteristicile detectorilor de trăsături de care dispune sistemul cognitiv al unui organism. Dacă unul dintre aceste pattern-uri este deteriorat, recunoașterea unei anumite configurații este grav afectată. De exemplu, în agnozia alexică reprezintă incapacitatea de a recunoaște literele tipărite.

Cu toate că există un nivel înalt de specificitate la nivelul detectorilor de trăsături, există o serie de trăsături comune. Acești detectori sunt organizați modular, sunt în cea mai mare parte determinați genetic, cu perioade de imprinting și au o funcționare abstractă.

S-au elaborat o serie de modele ale recunoașterii bazate pe analiza trăsăturilor obiectelor. Un astfel de model poartă numele de Pandemonium, recunoașterea fiind rezultatul colaborării unei mulțimi de demoni organizați ierarhic. La bază se află demonii imagistici, care recepționează imaginea uni obiect sau a unei figuri. Această imagine este descompusă în trăsături de o suită de demoni de trăsături. Fiecare trăsătură este prelucrată de un demon anume. Mesajele lor sunt sintetizate în unități comprehensive de către demonii cognitivi. Întrucât aceștia propuneau mai multe interpretări posibile, un demon-decident stabilește care dintre candidații la recunoaștere este cel mai potrivit pentru a identifica obiectul inițial.

Un alt model înlocuiește demonii cu microprocesoare ce prelucrează în paralel o anumită trăsătură. Rezultatele acestor prelucrări fac obiectul unor combinații pe baza logicii – și, sau, non. Datorită relațiilor excitative pe verticală și inhibitive pe orizontală eu putut și eliminate nivelurile de procesare corespunzătoare demonilor cognitivi și decidenți.

Una dintre criticile majore ale aduse acestui model vizează posibilitatea descompunerii obiectelor în trăsături separabile, distincte. Mai mult, apare problema modului de combinare a trăsăturilor. Un obiect se deosebește de oricare altul prin modul de combinare a trăsăturilor fizice.

Modelul calchierii tiparelor

Dacă memorarea presupune tipărire, atunci recunoașterea constă în punerea în corespondență a imaginii vizuale a unui obiect cu întipărirea sau urma sa din memorie.

Însă această perspectivă nu este funcțională. Dacă recunoașterea ar consta în punerea în corespondență a imaginilor cu tiparele din memorie, atunci pentru recunoaștere ar fi nevoie de un număr mare de tipare, din diferite unghiuri sau orientări.

Procesări descendente în recunoaștere

O serie de cercetări au testat efectul catalizator al contextului în recunoașterea stimulilor verbali. De exemplu, recunoașterea mai rapidă a unei litere dacă ea este prezentată în contextul unui cuvânt a fost demonstrată de mai multe studii. Într-un studiu se prezenta la tahistoscop un caracter țintă, litera K, în trei condiții – in cadrul unui cuvânt cu sens, în cadrul unui cuvânt fără sens sau doar litera. Pentru fiecare condiție, participanții trebuiau să decidă dacă au văzut litera D sau litera K. Recunoașterea este cea mai eficacitate în situația integrării literei într-un cuvânt cu sens. Acest efect este numit efectul superiorității cuvântului. În mod similar s-a pus în evidență superioritatea recunoașterii cuvântului într-o propoziție.

Ca explicație pentru acest fenomen, pentru a discrimina între D și K trebuie realiată o analiză de trăsături completă dacă sunt prezentate independent. Dar dacă sunt prezentate în cadrul unui cuvânt, e suficientă procesarea unei singure trăsături deoarece, prin analiza descendentă, activarea sensului circumscrie semnificația literei.

Alți cercetători atrag atenția asupra caracterului redundant al majorității stimulilor complecși. Astfel, prelucrarea ascendentă este dublată de analiza descendentă. Acest lucru nu are loc în cazul procesării primare, deoarece este efectuală de moduli impenetrabili cognitiv.

Procesări descendente în cazul recunoașterii obiectelor

Într-un studiu, participanților li s-a cerut să identifice prezența unor trăsături – segmente de dreaptă orientate oblic, poziționate diferit față de un punct fix. Aceste trăsături erau prezentate în trei ipostaze – părți componente ale unui obiect posibil, părți componente ale unui obiect imposibil și independent. Rezultatele arată că recunoașterea este mai rapidă și cu mai puține erori în integrarea caracteristicii într-un obiect plauzibil, apărând conceptul de superioritate a obiectului.

Cunoștințele de care dispunem sunt responsabile și de recunoașterea mai rapidă a elementelor unor fețe umane. Într-un studiu, s-au prezentat părți ale unei fețe umane, asociate cu prezentarea integrală a feței. Recunoașterea lor a avut loc rapid. Însă atunci când organele au fost prezentate independent, a fost nevoie de o perioadă mai lungă de timp.

În cadrul scenelor, regularitățile care guvernează semnificația formează semantica scenei. Ele sunt dobândite în cursul ontogenezei, pe baza unei învățări implicite, neintenționate.

Una dintre regularități se referă la existența unui suport fizic al obiectelor, majoritatea obiectelor fiind așezate pe ceva. O altă regularitate este interpoziția, sau ocluzarea reciprocă. Majoritatea obiectelor sunt opace, astfel încât un obiect ocluzează parțial sau total toate obiectele situate în spatele său. O a treia regularitate se referă la probabilitatea ocurenței – unele obiectele apar cu o probabilitate mai mare într-un context. Astfel, recunoaștem mai rapid obiectele aflate în contextul specific.

Poziția obiectelor reprezintă o altă regularitate. Chiar dacă apar într-un context, obiectele au o anumită poziție obișnuită. În final, ultima regularitate este reprezentată de mărimea relativă a obiectelor. Orice obiect are o mărime cu care suntem obișnuiți sau familiari.

Modelarea neoconexionistă a recunoașteri

Recunoașterea în rețele binivelare

O rețea binivelară, cu unități input și unități output, utilizând regula de învățare delta, poate modela recunoașterea pattern-urilor vizuale. Singura condiție este respectarea celor două constrângeri de funcționare – pattern-urile de intput-uri să fie liniar independente și perechile input-output să fie liniar separabile.

A fi liniar independent înseamnă să nu poată fi derivate unele din altele printr-o combinație liniară. A fi liniar separabil înseamnă să existe cel puțin o mulțime de valori ale ponderii conexiunilor pe baza cărora să se poată produce output-ul dezirabil din orice input.

În faza de învățare, rețeaua primește în bloc input-urile și output-urile dezirabile. La fiecare prezentare a input-urilor, rețeaua va produce un anumit output. Acesta va fi comparat cu cel dezirabil și, pe baza regulii delta, va modifica ponderea conexiunilor pentru a micșora diferența. În acest fel de va încheia o epocă. Prin aplicări repetate ale regulii delta se reduce eroarea.

Prima fază se consideră finalizată fie dacă rețeaua ajunge la un minim local, adică eroarea nu se mai reduce semnificativ odată cu sporirea epocilor, fie la decizia experimentatorului. Pentru a verifica învățarea, reducerea erorii până la o valoare minimă nu este suficientă. E necesară testarea ei cu alte input-uri din aceeași clasă sau categorie.

Recunoașterea în rețele multinivelare

În rețelele multinivelare, între unități de niveluri diferite se stabilesc relații excitative, iar între cele de la același nivel, inhibitive. Un astfel de model poate simula efectul superiorității cuvântului.

Radu Fritea

Radu este psiholog, doctor în psihologie, consultant organizațional, antreprenor și editorul fondator al Psihoteca.

Psihoteca

Prelucrarea informației vizuale

Neurobiologia procesării informației vizuale

Procesarea primară a informației vizuale

Recunoașterea obiectelor

Faci un comentariu sau dai un răspuns? Anulează răspunsul

Linkuri utile

Neurobiologia procesării informației vizuale

Procesarea primară a informației vizuale

Recunoașterea obiectelor

Faci un comentariu sau dai un răspuns? Anulează răspunsul

Related Posts

De ce visăm? O altă perspectivă asupra somnului REM

Puterea organizațională. Cum o obținem, menținem și pierdem?

Dezvoltarea la vârsta mijlocie

Creierul din perspectiva lui Ramon y Cajal