Visão Computacional é uma área da ciência que estuda como reconstruir e compreender uma cena 3D a partir de imagens 2D (fotos, por exemplo) dessa cena. Ou seja, dar aos computadores o poder de visão que os seres vivos possuem.
Quando tiramos uma foto, perdemos a informação de profundidade da cena. Todos os objetos tridimensionais se tornam pixels num mesmo plano.
Mesmo que possa parecer algo trágico :(, por conta dessa perda de informação, podemos tirar fotos divertidas que brincam com o conceito de perspectiva, como a da Figura 1.
Na foto, temos uma flor que parece a saia de uma moça. Esse efeito acontece pois a flor se encontra mais próxima da câmera que a menina, dando a impressão de que a flor tem proporções parecidas com o tamanho de saia que ela usaria. Veja uma ilustração da cena na Figura 2.
Fig 2. Ilustração da cena da foto
Apesar da foto registrar somente a cor e o formato dos objetos, a profundidade deles influencia no tamanho que eles assumem na imagem.
No entanto, esse tipo de informação só é óbvia para um ser humano por ele conhecer as proporções de uma flor e de uma pessoa. Um robô não tem, a princípio, essa informação. Para ele, a menina pode ter 1,76 m de altura e estar longe, ou ter 30 cm e estar utilizando uma saia feita de flor.
Bucky, o pinguim invernal
Nas seções de Visão Computacional do site, você pode conhecer o modelo matemático que usamos para descrever uma câmera, ou para relacionar múltiplas câmeras.
Ah, claro! Caso ainda não tenha calibrado sua câmera, dê uma olhada aqui! Lá também tem um link para um gerador automático de padrões de calibração!
Venha conhecer a nossa Visão sobre o assunto!