FYI.

This story is over 5 years old.

Tecnologia

Por que as Redes Neurais do Google Parecem Estar Chapadas de Ácido

Os experimentos com redes neurais podem explicar muito sobre nossos cérebros.

Não faz muito tempo, uma misteriosa imagem de um mutante monstruoso apareceu no Reddit: era uma criatura iridescente, de diversas cabeças, semelhante a uma lesma coberta com rostos derretidos de animais.

Logo a origem da figura surgiu na forma de um post de blog em um grupo de pesquisa do Google. A mensagem dizia que o desenho era, de fato, inumano. Tratava-se do produto de uma rede neural artificial — um cérebro computadorizado — criado para reconhecer imagens. E, bem, ele parecia estar chapadaço.

Publicidade

Muitos comentaristas do Reddit e Hacker News ressaltaram que as imagens geradas pela rede neural eram muito parecidas com as que as pessoas veem sob o efeito de substâncias psicodélicas como cogumelos ou LSD. "O nível de semelhança com uma viagem psicotrópica é simplesmente fascinante", escreveu o comentarista do Hacker News, joeyspn. Outro usuário, henryl, concordou: "Serei o primeiro a dizer… Parece uma viagem de ácido/cogumelos."

Logo a mídia comentou o mesmo. Tech Times: "Google Leva Redes Neurais Em Incrível Viagem de Ácido". Tech Gen: "O Novo Software de 'Inceptionism' do Google Sonha com Arte Psicodélica". PBS: "Por Conta Própria, Computadores Criam Arte Viajandona e Surrealista".

A pegada psicodélica das imagens seria só uma coincidência ou existe alguma espécie de relação entre como a rede neural do Google criou os desenhos e como nossos cérebros atuam sob o efeito de drogas psicodélicas?

Redes neurais artificiais (ANNs, na sigla em inglês) são computadores criados para simular o cérebro humano. Eles existem desde o começo dos anos 50 e, nos últimos anos, fizeram avanços incríveis em reconhecimento de imagens.

As redes são compostas por "neurônios" baseados em softwares. Eles se comunicam e alteram a força de suas conexões de forma que os resultados de seus cálculos refletem como neurônios são de verdade. Essa adaptabilidade que faz das ANNs algo especial: elas têm capacidade de aprender.

Publicidade

Ao passar essas imagens pelos níveis mais altos das redes por várias vezes, vemos árvores se transformarem em cachorros mutantes flutuantes e cordilheiras se transformarem em templos indianos

Assim como as crianças humanas, as redes neurais aprendem ao absorverem informações sobre o mundo ao seu redor. Esses dados costumam ser inseridos no sistema por outras pessoas. Se uma rede neural criada para identificar imagens ver 100 retratos de cães, ela começará a reconhecer cachorros por conta própria. Quanto mais fotos de dogs ver, melhor os reconhecerá.

Se a rede observar a foto de algo com formato de cão, um neurônio específico nas camadas superiores da rede se ativará, e a rede dirá o resultado: cão. Tais habilidades tornam as ANNs essenciais para o reconhecimento de características e rostos em imagens, o tipo de coisa que o novo serviço de fotos do Google usa para criar vídeos e álbuns automáticos.

Uma rede neural convolucional, do tipo usado pelo Google para criar as estranhas imagens, consiste de camadas de neurônios que enviam mensagens para uma cadeia de comando e interpretam informações com mais detalhes e abstrações ao passo em que seguem para os níveis superiores. Cada camada se concentra em uma pequena tarefa. Como a rede ensina a si mesma, o que acontece em cada camada permanece um mistério. O Google não sabe que caminho as informações tomam ou mesmo como "a divisão de trabalho" se dá entre as camadas.

Publicidade

O experimento da companhia americana tinha como objetivo revelar mais dessas camadas e ver o que acontecia por dentro. Em vez de pedir para que a rede identificasse imagens, os pesquisadores "a viraram de ponta-cabeça" usando um algoritmo de escalada, que começa com ruído aleatório e aos poucos altera uma imagem para encontrar algo que ative os neurônios ligados a uma forma específica — uma banana, uma xícara medidora ou haltere.

Ao observarem tais resultados, os pesquisadores poderiam determinar o quão preciso era o conhecimento da máquina. Os resultados nem sempre acertavam — cada imagem gerada no caso de "haltere" não era só um peso de metal; incluía também o braço ligado a ele. Isso forneceu informação valiosa: o computador só havia visto um haltere acompanhado de braço.

As imagens mais interessantes foram produzidas quando os pesquisadores deixaram a máquina interpretar paisagens, a exemplo de um campo com uma única árvore ou fundo, ou ruído visual, como uma tevê com chuvisco. Quando observaram que os neurônios foram ativados por uma paisagem ou ruído, os autores então enviaram a imagem gerada de volta para a rede, criando versões e ajustando a figura até que se tornasse uma versão melhorada e ampliada daquilo que o computador viu. A árvore na paisagem se tornava uma matilha de cães flutuantes, cercada por torres e figuras esquisitas com rodas.

Ao extrair as imagens dos níveis inferiores da rede, que detectam coisas como linhas e cores, as imagens resultantes pareciam ter sido pintadas com pinceladas grossas e curvas, ao estilo de Van Gogh. Ao passar essas imagens pelos níveis mais altos várias vezes, vemos árvores se transformarem em cachorros mutantes flutuantes e cordilheiras se transformarem em templos indianos.

Publicidade

A mais incrível imagem publicada pelo projeto Inceptionism, do Google. Crédito: Google

Estas imagens eram bizarras e fascinantes. Por que parecem tanto com o que vemos quando sob efeito de psicodélicos?

Para responder isso, primeiro verifiquei como nossos cérebros reconhecem imagens. É um processo semelhante a como as ANNs detectam imagens. Nos seres humanos, a informação visual passa pelos olhos e vai ao nervo ótico e então rumo à base do córtex visual. Lá, nosso cérebro faz alguns testes simples: busca por extremidades ao determinar quais linhas são verticais ou horizontais e pesquisa por cores e tons. Assim que a imagem é processada, ela é levada acima na cadeia de comandos para unidades de processamento mais sofisticadas, onde nossos cérebros determinam se observamos uma maçã ou um carro.

A principal diferença entre o nosso processamento visual e o de uma rede neural é a quantidade de feedback recebido das diferentes áreas do cérebro, afirma Melanie Mitchell, professora de ciências da computação da Universidade Estadual de Portland, nos Estados Unidos, e autora de um livro sobre redes neurais.

A rede neural do Google é do tipo "feed forward" — uma via de mão única em que os dados viajam apenas para cima. Em contraste, nossos cérebros sempre se comunicam em milhões de direções ao mesmo tempo. Mesmo quando só vimos linhas e extremidades básicas, a porção superior do cérebros pode começar a nos dizer que "aquilo pode ser um guarda-sol", baseado em nosso conhecimento prévio de que guarda-sóis costumar estar próximos de areia e ondas, por exemplo. A informação final repassada para a nossa consciência — o que vemos – é uma composição de dados visuais e a melhor interpretação possível de nosso cérebro para aqueles dados. Isso funciona de modo perfeito até nos depararmos com algo que engana nossos cérebros, como uma ilusão de ótica.

Publicidade

Ingerir alucinógenos altera dramaticamente este processo. "As formas como os áreas do cérebro se ligam e comunicam se rompe", afirma Frederick Barrett, neurocientista cognitivo que estuda drogas psicodélicos no Departamento de Farmacologia Comportamental da Johns Hopkins. Ao passo em que o cérebro experimenta mais conexões, o córtex frontal e outras áreas de controle do cérebro, que normalmente mediam o sem-fim de informações sensoriais externas, enfraquecem e deixam para as outras partes do cérebro a tarefa de interpretar a enxurrada de informações que recebemos de nossos olhos. Sobrecarregadas com tantos dados, as camadas menos avançadas de nossos cérebros são obrigadas a se esforçar para darem seus melhores palpites sobre tal imagem.

Qualquer um que já tomou ácido sabe que existe uma série de elementos visuais prototípicos comuns à maior parte dessas viagens: pense na obra de Alex Grey ou na popular estampa cashmere dos anos 70. Barrett diz existir uma explicação plausível para isso: tem a ver com os receptores 2A de serotonina, que se acredita serem os principais receptores em que atuam as drogas psicodélicas. Temos muitos receptores 2A no córtex visual. Já que os receptores estão localizados na parte inferior da cadeia de processamento, a informação que eles nos dão consiste em linhas, formas e cores. Depende do resto do cérebro interpretar esta informação.

Sob efeito de drogas, as áreas superiores não funcionam em seu melhor. Vemos imagens fractais e caleidoscópicas na forma de uma sobreposição de superfícies. Essas imagens vêm direto da base do cérebro. De certa forma, é como espiar a caixa preta de nossas mentes, vendo se juntarem as peças que compõem nossa percepção.

Publicidade

Cashmere. Crédito: Abdollah Salami/Wikipedia

"As imagens do Google são muito próximas de algo que você esperaria obter ao usar drogas psicodélicas ou em alucinações", afirma Karl Friston, professor de neurociência do University College de Londres, que ajudou a inventar um protocolo de criação de imagens cerebral. "E isso é perfeitamente lógico. Durante uma experiência psicodélica você está livre para explorar todos os tipos de hipóteses ou previsões de alto-nível sobre o que teria causado o input sensorial."

Friston comenta ainda que "o paralelo existe porque os objetivos do cérebro e dos pesquisadores do Google é o mesmo – reconhecer coisas e então agir da forma mais eficaz."

"O que o Google está fazendo com redes neurais se aproxima do que acontece com o cérebro e o que sabemos do sistema visual", concorda Barrett. Mas ele crê que ainda estamos longe de criar uma rede neural que modele de forma precisa o cérebro. "A complexidade do cérebro é tamanha que se não sei se é possível modelá-lo com rede neurais artificiais. Não sei se já chegamos a esse ponto ou se estamos perto dele", disse.

"Use-as com cuidado e com respeito às transformações que são capazes de realizar e terá uma ferramenta de pesquisa extraordinária", escreveu Alexander Shulgin, o "Pai do Ecstasy", em seu livro, Pihkal. Ele falava de drogas e da mente humana, possivelmente a mais perigosa ferramenta que já existiu. Por milênios as pessoas têm virado suas mentes de cabeça para baixo com essas substâncias tentando compreender o processo de aprendizado. Os cérebros artificiais do Google nos lembram que há muita pesquisa para ser feita ainda.

Tradução: Thiago "Índio" Silva