5.1.2 - Igenkänning av objekt och mönster

Det finns många teorier om hur vi ser mönster, objekt och system i vardagen. Ofta kan vi hitta på mönster som inte finns i verkligheten (mer om detta i 5.5). Principiellt kan man tala om två huvudidéer för hur mönsterigenkänning går till, datadrivna processer (eller bottom-up) och konceptuellt drivna processer (top-down). En typisk datadriven teori är Biedermans (1987) modell för objektsigenkänning. Han kallar den för 'recognition' by components model' (RBC). Han menar att tredimensionella objekt består av enkla komponenter, som han kallar för geoner (geometrisk jon). När man känner igen ett objekt så bryter man ner ('parsing') det i dess beståndsdelar. Man påbörjar igenkänningsprocessen genom att undersöka två aspekter av objektet; kanterna och regioner där linjer korsas. Det finns bara 36 grundläggande geoner, och genom att kombinera dessa kan vi få fram massor av objekt. Se figur 2.


Figur 2.


Här kan man tydligt se att vanliga vardagsobjekt lätt kan brytas ner i en begränsad mängd geoner. Biederman (1987) kunde presentera empiriska (se kapitel 4) data som indikerade på att geonerna är viktiga i objektsigenkänning.

Konceptuellt drivna processer är det omvända i förhållande till det datadrivna. En klassisk studie av Neisser (1964) indikerade att vi kan styra vår perception konceptuellt. Se tabell 1.



Tabell 1. Förminskad version av Neisser (1964)

A. Leta efter Z. B. Leta efter Z.

ODUGQR IVMXEW

QCDUGO EWVMIX

CQOGRD EXWMVI

QUGCDR IWEMWV

URDGQO VXWEMI

GRUQDO WVZMXE

DUZGRO XEMIWV

UCGROD WXIMEV

Varför är tabellen ovan ett bra exempel på konceptuellt drivna processer? Om du försökte hitta Z, så insåg du säkert att det gick fortare att söka igenom A än B. Betänk hur man söker igenom lista A. Man inser att listan mest består av kurviga bokstäver och då kan man 'stänga av detektorn' för cirkulära egenskaper. Varifrån kom dessa instruktioner? Inte ifrån detektorerna själva. Instruktionerna måste ha kommit någonstans "högre upp" i systemet, någon mer kognitiv process som var känslig till kontexten (sammanhanget) som de andra bokstäverna bar med sig. Något mer djupare kognitivt påverkade den låga egenskapsdetektionsprocessen, och skapade egenskapsdetektionen driven av den kognitiva konceptuella processen.

Kopplingen till MDI är mycket tydlig. Eftersom vi kan se mönster på ett effektivt sätt, så kan man utnyttja detta genom att skapa gränssnitt som signalerar saker med att bryta mönstret. Låt oss säga att en operatör ska kontrollera 400 små processer i en maskin. Då kan man låta de fungerande processerna ha ett visst mönster. Säg att de har en liten lampa som lyser när allt fungerar. Så fort en lampa släcka så betyder det att processen har slutat. Operatören kan då svepande titta över lamporna och lätt se var mönstret bryts. Titta på följande serie symboler i figur 3.


1111111111111011111111111110011111111111
Figur 3.


Var finns avvikelserna? Se till att inte ha för många ikoner som har liknande geoner i gränssnittet eller kombinera dem så att de kontrasterar mot varandra!