Ciência Cognitiva 
 Alma Humana     
 Cérebro              
 Consciente e Inc.
 Hipnose             
 Filosofia             
 I.A. e a Filosofia 
 Percepção         
 Imagem Mental    
 Racionalidade      
 PC e Cognição    


A Percepção do Mundo

Por Antônio Rogério da Silva

A importância cognitiva da percepção pode ser medida pelo tratamento dado ao assunto pelos filósofos. Platão considerava a visão correta das coisas fundamental para o conhecimento verdadeiro e não apenas de um modo figurado, mas absolutamente concreto. A diferença entre o filósofo e o tirano estava justamente na visão completa das idéias. Segundo o mito da "parelha alada", encontrado no Fedro, o filósofo seria aquele que num mundo ulterior tivesse contemplado as essências com maior atenção(1). A nossa palavra "idéia" -que em Platão tinha o sentido de modelo, padrão ou forma pré-existente e completa- tem sua origem grego idea, que tal como eidos, possui o radical do verbo "ver" -eido. Descartes, por sua vez, descartava todo e qualquer conhecimento adquirido pela percepção através dos cinco sentidos. Apenas o sentido da "propriocepção" -o sentido interno do próprio corpo-, desconhecido em sua época, ele intuitivamente mantinha como fundamental para a concepção de um "eu" pensante. Berkeley, em oposição a Descartes, dizia que o espírito era aquilo que percebe. A existência de tudo mais dependia desse ser percipiente.

Para a ciência cognitiva, a percepção tem sido fonte de intensas e sofisticadas pesquisas, num esforço de compreensão sem precedentes. Trata-se, afinal, de saber como a mente humana transforma as informações dos sentidos em percepção consciente. Em especial, a percepção visual passou a ser o foco das atenções dos pesquisadores, pois todas as demais percepções sensoriais, podem de alguma forma ser subsumidas a imagens sugestivas. Muitas experiências parecem corroborar a tese de que a representação pictórica faz parte do pensamento e que este não seria meramente uma descrição verbal.

Quadros em Exposição

Em 1973, os psicólogos Lynn Cooper e Roger Shepard realizaram estudos em que puderam constatar as evidências de uma rotação mental de imagens, por parte das pessoas examinadas. Eles mostraram a vários estudantes letras do alfabeto latino em posições diferentes e cronometraram quanto tempo as pessoas levavam para decidir se o caractere era ou não uma imagem espelhada do original. Foi observado que quanto mais a letra estivesse fora da sua posição normal, mais tempo seria necessário para uma resposta correta. Assim, concluiu-se que essa demora era devida ao tempo despendido pelas pessoas para realizarem a rotação do objeto observado.

A partir de 1980, o psicólogo Stephen Kosslyn fez testes para averiguar como a figura é formada pela mente. Ele notou que perguntas sobre a localização de cidades, num mapa imaginário, demoravam mais a ser respondidas à medida que a distância entre a primeira cidade e as demais aumentava. Um brasileiro, por exemplo, levaria mais tempo para achar Belém, do que Brasília, se a primeira localidade encontrada tivesse sido Porto Alegre. Para comprovar que a mente utiliza imagens na formulação de pensamentos, Kosslyn realizou outro experimento em laboratório, dessa vez empregando um tomógrafo por emissão de pósitrons (PET), em 1993. Ele pediu a seus pacientes, que de olhos fechados respondessem a perguntas sobre letras maiúsculas e minúsculas. O tomógrafo detectou a ativação do córtex visual quando a letra era maiúscula, enquanto outras áreas da superfície cortical entravam em operação, de acordo com o tamanho da letra. Pacientes com dano cerebral nas regiões responsáveis pelas habilidades perceptivas, apresentavam dificuldades correlacionadas com essas funções. Uma lesão nas células V1 e V4, por exemplo, pode provocar o esquecimento completo das sensações de cores, resultando num daltonismo total. Áreas do cérebro mais próximas à retina possuem uma estrutura de organização espacial, segundo as coordenadas topo-base, esquerda-direta que lhe são correspondentes. A ativação dessas regiões, pela percepção visual, indica a elaboração de representações mentais como se elas fossem quadro e não descrições da linguagem.

Para comprovar a primazia da percepção visual sobre a narrativa, Steven Pinker, Ronald Finke e Martha Farah -ex-alunos e colegas de Kosslyn- criaram descrições verbais que se transformavam em imagens na mente das pessoas. Eles propunham, entre outras instruções, que fosse imaginada uma letra, eventualmente, o "D" maiúsculo. Depois pediam que as pessoas a girassem em 90°, no sentido anti-horário, para em seguida acrescentar a letra "J" maiúscula no meio do traço do "D", formando, no final, a figura estilizada de um guarda-chuva. Essas séries de instruções mostram que, de fato, as pessoas operam com representações visuais que podem surgir até de narrativas lingüísticas.

Mas mesmo com essas evidências, ainda há céticos quanto a conclusões das experiências da imaginação. Eles afirmam, com base no trabalho de David Marr (1945-1980), que todas percepções pictóricas podem ser simuladas por processos computacionais não imagéticos de uma lista de instruções algorítmicas(2).

A Visão 3D do Computador

As pessoas com a visão em bom estado conseguem realizar proezas que só a muito custo os computadores tentam imitar. Entre essas proezas está o fato de transformar uma percepção do mundo em duas dimensões numa visão tridimensional. O truque acontece graças à posição paralela dos olhos na face. Outro embaraço para as máquinas é a identificação de um objeto em suas múltiplas facetas. A complexidade das aparências, que a mente humana capta automaticamente e com relativa facilidade, é um verdadeiro "quebra-cabeça", cheio de ambigüidades, para os organismos artificiais.

Até a década de 80, a teoria computacional da percepção visual apresentava muitas limitações. O máximo que os programas permitiam às máquinas executar era a interpretação de desenhos geométricos em um ambiente artificial e restrito, em nada semelhantes aos objetos ou fotos de cenas reais. Nos últimos anos, o processo computacional das imagens obteve avanços consistentes, sobretudo, devido ao trabalho do jovem neurofisiologista inglês David Marr, morto pela leucemia aos 35 anos.

Cedo Marr percebeu que, sozinha, a pesquisa neurológica não conseguiria explicar a compreensão completa da visão. Para tanto, uma teoria deveria considerar os problemas factuais da percepção e como computadores e cérebros superariam tais obstáculos, a despeito das diferenças do aparato físico. O cérebro não processa apenas uma única imagem, pois os olhos fornecem dois pontos de vista aproximados, cuja defasagem é chama de paralaxe -desvio aparente da posição de um objeto visualizado contra um plano de fundo, quando a posição do observador se altera. Essa diferença permite ao córtex visual realizar a passagem da informação bidimensional em um registro coerente em três dimensões que reúne dados sobre os lados, a perspectiva, as cores, a luz e a sombra recebidos em paralelo. O processamento dessas informações visuais, em estéreo, produz uma imagem única em três dimensões espaciais que pode ser armazenada na memória e recuperada depois. Tais visões representam descrições úteis para o observador que ignora as informações desnecessárias, de modo que as representações visuais não passam de um esboço simbólico da realidade.

Marr pensava que uma tarefa tão complexa não poderia ser explicada apenas por um modelo de interpretação. Propôs, então, três níveis de compreensão: o computacional, o algorítmico e o prático. A teoria computacional trataria de descrever o modo como um mecanismo binocular, em geral, relaciona uma informação de duas dimensões, na entrada, com uma inferência tridimensional, na saída, acrescentando uma profundidade de campo à imagem. O funcionamento desse processo dependeria de uma segunda etapa de avaliação realizada por um conjunto de regras formais de manipulação de dados brutos, resultando numa representação aplicável.

O nível algorítmico estabelece os passos necessários para computação da visão estereoscópica. Marr sugeriu que a combinação dessas imagens duplas seguia uma orientação de correspondência entre os pontos de uma com a outra. A terceira imagem formada na mente seria o resultado das relações existentes entre os diversos pontos encontrados paralelos às duas primeiras imagens. Foi proposto, por fim, a construção de uma rede de conexões paralelas para resolução desse processo. A última etapa da análise de Marr visava a implementação desse sistema em diversos mecanismos, como máquinas elétricas, mecânicas ou neurais.

A teoria da visão de Marr, apresentada no livro póstumo Vision (Visão), em 1982, soluciona os problemas de percepção computacionais, através da formulação precisa de um algoritmo que proporcionaria a aplicação de um programa de compreensão visual em qualquer aparato físico. Assim, o correto entendimento do sistema visual levaria, mais uma vez, ao emprego de princípios matemáticos. O programa desenvolvido por Marr e sua equipe, no laboratório de inteligência artificial do MIT, descrevia, portanto, outros três estágios de representações que passavam do esboço mais grosseiro da análise visual, para o patamar mais refinado de uma disposição espacial completa de um cenário com relevo e profundidade.

O esboço primário faz um relatório inicial, em duas dimensões, da geometria de uma cena, incluindo informações sobre textura e intensidade de luz, associada com as arestas físicas e com seus pontos de determinação. Nessa descrição, são também obtidas dados numéricos sobre o comprimento, a curvatura e orientação das arestas que se apresentam como um relato e não uma imagem propriamente dita. Na etapa seguinte, a mente do observador realiza um esboço em duas e meia dimensões sobre o esboço primário. Aqui a visão estéreo é mobilizada para incluir a profundidade -considerada uma meia dimensão-, a orientação e as descontinuidades superficiais. O esboço em duas e meia dimensões, como o primário, dependem apenas da perspectiva de quem vê. Até essa fase, a percepção visual é trabalhada somente para fornecer as propriedades da superfície de uma imagem, sua direção e distância do observador. Um diagrama de agulhas, em duas e meia dimensões é formado por vetores perpendiculares às superfícies dos objetos representados.

No esboço final em três dimensões, também chamado modelo do mundo, os objetos são divididos sucessivamente em componentes mais detalhados, que permitem cada uma de suas partes com um cilindro generalizado -forma bidimensional movida ao longo de uma linha chamada eixo. Cada componente da imagem torna-se uma descrição individual, independente do ângulo de visão subjetivo. Essa representação visa explicar como os objetos ocupam o espaço. Assim o modelo do mundo descreve um sólido geométrico pelo movimento de uma figura plana que desliza de maneira perpendicular ao eixo que atravessa o seu centro, delineando uma imagem tridimensional. No esboço em três dimensões, o deslocamento de uma forma bidimensional, cujo tamanho pode variar ao longo de sua passagem por uma linha maleável, permite a construção de qualquer objeto tridimensional. Representações diferentes podem, então, ser comparadas, preservando suas peculiaridades. Esse reconhecimento, agora, passa a não mais depender exclusivamente do observador, mas sim de uma descrição estabelecida das formas, que estão vinculadas a características geométricas e propriedades abstratas da imagem(3).

Géons

A lembrança da forma de um objeto, portanto, está centrada no próprio objeto por um sistema de coordenadas retinianas. O reconhecimento da figura é feito ao se ajustar o referencial a eixos que fornecem a extensão, a simetria e medem as posições e os ângulos do objeto. Desse modo, ocorre a correlação entre o que é visto e a memória visual da imagem armazenada. Essa representação da forma não é um molde exato de cada aspecto da visão. Um conjunto de formas geométricas básicas é constituído a fim de identificar as diversas configurações possíveis.

Em 1995, o psicólogo Irv Bierdman apresentou o conceito de géons, elementos geométricos simples que podem ser unidos e montados para compor um objeto mais complexo. Esses géons guardariam a forma de cones, cilindros, tubos em arco, cubos etc, bastando apenas 24 para construção de qualquer tipo de imagem, usando relações espaciais, tais como "acima de", "lateral", "ponta-ponta", "paralelo", "centro", entre outras. Como numa gramática visual, os géons são combinados sobre um sistema de coordenadas, cuja principal referência é a posição do olho, para montagem dos objetos, em função de uma linguagem pictórica interna: o dialeto em pictogramas do "mentalês".

Pinker e o psicólogo Michael Tarr comprovaram empiricamente que, dependendo do grau de dificuldade da percepção, as pessoas utilizam as três estratégias apontadas pelas pesquisas recentes. Primeiro, o ser humano com visão normal cria arquivos na memória com esboço tridimensional para cada orientação na qual o objeto aparece, como na teoria da Marr. Depois, aprenderiam as formas sólidas geométricas que podem ser agrupadas num sistema de coordenadas traçado sobre a retina. Por fim, quando os objetos aparecem fora de sua posição padrão, as pessoas fazem o giro mental que permite o reconhecimento do objeto após um lapso de tempo proporcional ao grau de rotação da imagem(4).

Os críticos da representação visual argumentam que muitas imagens podem ser descritas por palavras e o próprio programa de Marr exigiriam uma etapa algorítmica que só pode ser concebida verbalmente. Porém, as pesquisas mais atuais mostram que o pensamento visual é o mais prático na solução de problemas relacionados com a aparência visual e sua organização espacial. As representações pictóricas substituem com vantagens tarefas de inspeção de área, a busca de um objeto, a aproximação de detalhes, girar e transformar narrações em quadros coerentes. "Uma imagem vale por mil palavras" parece ser a conclusão mais óbvia sobre a importância econômica da percepção visual, aliada à imaginação. Além do mais, as imagens podem ser associadas a outras formas de percepções, a princípio, não visuais. Os livros de culinária estão repletos de fotografias cuidadosamente produzidas para despertar sensações olfativas e gustativas das receitas descritas em seu interior. A maciez e suavidade do toque da seda pode ser comparada visualmente com a do linho, pela recordação da imagem tátil da pele em contato com ambos tecidos. No filme mudo, preto e branco, Um Cão Andaluz (França, 1929), dos diretores surrealistas espanhóis Luís Buñel e Salvador Dali, a seqüência da navalha cortando um olho, ainda hoje, na era da imagem digital, arrepia qualquer um que a veja. Outro clássico do cinema mudo, A Queda da Casa de Usher (França, 1928), do diretor francês Jean Epstein, provoca lembranças sonoras ao apresentar, em primeiro plano, as cordas de um violão sendo dedilhadas e rompidas com o esforço do personagem principal em tocá-las. Muitas paixões e decepções são despertadas à "primeira-vista", numa prova de que até mesmo as emoções podem ser revividas por alusão de um objeto visual(5).

Não obstante essas trivialidades, James J. Gibson, um psicólogo especialista em percepção, afirmou que o acesso a informações imagéticas ocorre tão somente por causa da relação entre padrões na retina -que ele chama de campo visual- que são alinhados com o mundo visual, sem necessidade de todo aquele processamento computacional bolado por Marr. Por conseguinte, ele deixou de lado grande parte do aparato interno representacional defendido pela maioria dos teóricos da cognição. Para obtenção de uma informação sensorial, bastaria ao indivíduo ser inserido no mundo e movimentar-se em seu meio ambiente que as informações que ele precisa sejam obtidas. Todos os padrões estabelecidos pela organização ótica do mundo seria descoberto pelo contato direto e pela investigação empírica e não construído mentalmente. Segundo essa teoria ambientalista da visão, as pesquisa sobre percepção deveriam orientar-se para descobertas das leis naturais que regem a relação entre o organismo e seu meio, sem se preocupar com regras programáticas das representações mentais.

Desse modo, duas posições, aparentemente opostas, passaram a tratar a percepção ora da perspectiva do processamento mental da visão, ora pela concepção naturalista de coleta de informações em um mundo apto a fornecê-las. Todavia, Ulric Neisser ponderou que a percepção deve ser encarada como um processo desenvolvido quando um organismo está interagindo com o mundo, reconhecendo e classificando objetos complexos da realidade, através da memorização de histórias e experiências que o indivíduo tece enquanto vive(6).

_A Percepção do Mundo;

_Texto: GARDNER, H. A Nova Ciência da Mente; III, capítulo 1 pp. 311-329.

 

Referência Bibliográfica

GARDNER, H. A Nova Ciência da Mente; trad. Cláudia M. Caon. - São Paulo: Edusp, 1995.

PINKER, S. Como a Mente Funciona; trad. Laura T. Motta. - São Paulo: Companhia das Letras, 1998.

PLATÃO. "Fedro", in Diálogos, vol. V; trad. Carlos A. Nunes. - Belém: Universidade Federal do Pará, 1975.

SACKS, O. O Homem que Confundiu sua Mulher com um Chapéu; trad. Talita M. Rodrigues. - Rio de Janeiro: Imago, 1988.

______, _. Um Antropólogo em Marte; trad. Bernardo Carvalho. - São Paulo: Companhia das Letras, 1995.

THAGARD, P. Mente; trad. Mª Rita Hofmeister. - Porto Alegre, 1998.

WINSTON, P. H. Inteligência Artificial; trad. Carlos O. Pavel. - Rio de Janeiro: LTC, 1988.

Notas

1. Veja PLATÃO. Fedro, 248a-e.

2. Veja THAGARD, P. Mente, part. I, cap. 6, pp. 103-105 e PINKER, S. Como a Mente Funciona, cap. 4, pp. 308 e 312.

3. Veja GARDNER, H. A Nova Ciência da Mente, part. III, cap. 1, pp. 314-322 e WINSTON, P.H. Inteligência Artificial, cap. 10, pp. 326-329.

4. Veja PINKER, S. Op. Cit., idem, pp. 287-299.

5. Veja THAGARD, P. Op. Cit., idem, idem, pp. 96 e ss.

  1. Veja GARDNER, H. Op. Cit., idem,, pp. 328-335.

Fonte: http://www.geocities.com/discursus/

Voltar