Skip to content

Tecnologia

Um olhar digital sobre a realidade: como funciona a visão computacional

Por Redação   | 

Se você usa reconhecimento facial para desbloquear o seu celular, saiba que é graças à visão computacional que este recurso está disponível. 

Faz anos que essa tecnologia saiu dos filmes de ficção científica para fazer parte do nosso dia a dia. Aqui você vai encontrar um resumo sobre como ela funciona e quais são as suas principais aplicações. 

Acompanhe: 

O que é visão computacional 
Diferença entre visão computacional e processamento de imagem 
5 aplicações da visão computacional 
Aprenda sobre IA com quem é referência

Inscreva-se na pós-graduação em Arquitetura de Software da Pós PUCPR Digital

O que é visão computacional 

A visão computacional é um processo de modelagem e replicação da visão humana por meio de software e hardware, cujo principal objetivo é reconhecer e descrever imagens com precisão. Essas imagens podem ser estáticas ou móveis.

As pesquisas sobre visão computacional se iniciaram na década de 1960, tendo como marco a tese do cientista da computação Lawrence Roberts (1937-2018), intitulada "Machine Perception of Three-Dimensional Solids" (1963). O pesquisador descreveu como computadores fazem a derivação de sólidos tridimensionais a partir de imagens 2D.

Hoje, o termo é considerado um subcampo da inteligência artificial (IA), que recorre a modelos de deep learning para treinar redes neurais convolucionais (CNNs, sigla em inglês para “convolutional neural networks”) e redes neurais recorrentes (RNNs, sigla em inglês para “recurrent neural network”).

Deep learning é um tipo de aprendizado de máquina que simula como os seres humanos adquirem certas formas de conhecimento. Ele funciona a partir de redes neurais, um conjunto de unidades básicas de uma estrutura de dados (chamados de “nós”) conectadas entre si que simula o funcionamento de um cérebro humano

Essas redes neurais, no caso da visão computacional, podem ser convolucionais ou recorrentes. As CNNs se baseiam em um sistema de rotulagem para classificar e compreender as imagens, por meio da análise pixel a pixel. Cada pixel recebe um valor, que é usado em uma operação matemática que faz previsões sobre a imagem, processo chamado de convolução. 

As CNNs são utilizadas no processamento de uma única imagem, enquanto as RNNs processam uma série de imagens para estabelecer relações entre elas. 

Na visão computacional, as redes neurais são treinadas para segmentar, classificar e detectar fotos, ilustrações e vídeos:

  • Segmentação: delimita objetos por meio da classificação de pixels em categorias específicas. 
  • Classificação: determina o que uma imagem contém. 
  • Detecção: localiza objetos no ambiente. 

Vamos usar como exemplo um carro autônomo, que depende da visão computacional para garantir a segurança do passageiro e dos pedestres. Ele usa a segmentação para identificar a estrada, os carros e as pessoas. A classificação dá mais precisão à identificação, ao rotular os elementos da imagem. A detecção, por fim, aponta onde os carros e as pessoas estão no ambiente, geralmente com contornos retangulares. 

 

Diferença entre visão computacional e processamento de imagem 

Enquanto a visão computacional visa a detectar e dar sentido a imagens, o processamento de imagem as altera por meio de algoritmos, dando-lhes mais nitidez e suavização. 

É comum usar o processamento de imagem para modificar fotos e vídeos e, assim, facilitar a compreensão desse material por um sistema de visão computacional. 

>>> Leia também: Desvendando a IA generativa

5 aplicações da visão computacional 

Não é apenas nos carros autônomos que a visão computacional está presente. Outros setores da economia são beneficiados com o uso dessa tecnologia: 

Saúde 

Com a visão computacional, a análise de exames de imagem ganha mais precisão, o que ajuda profissionais de saúde a fazerem diagnósticos mais rápidos e precisos. 

A tecnologia é usada principalmente na detecção de tumores, auxiliando no diagnóstico e tratamento de câncer de mama, câncer de pulmão, câncer de próstata e melanomas. 

 

Agricultura 

Sistemas de visão computacional podem ser usados na detecção de doenças e pragas, nas estimativas de safras e na avaliação de atributos como qualidade, aparência e volume. 

Eles também permitem o monitoramento de culturas e de animais, pulverização automática de defensivos agrícolas e rastreamento de produtividade, tudo isso com o apoio de drones. 

Financeiro 

Na área das finanças, a principal funcionalidade da visão computacional utilizada é o reconhecimento facial.  

Existem aplicativos de banco, por exemplo, que exigem que o usuário posicione o rosto diante da câmera do celular para autorizar transações. 

Aplicativos de instituições públicas também usam dessa tecnologia, como o do sistema gov.br, a CNH Digital e o INSS. 

Videogames 

A indústria de games usa a visão computacional para rastrear poses dos jogadores e imitá-las nos avatares. 

Um exemplo clássico é o Kinect da Microsoft, acessório do Xbox 360 e Xbox One descontinuado em 2023. Por meio de câmeras RGB, projetores infravermelhos e detectores de movimento, o dispositivo permitia que os usuários interagissem com os jogos sem a necessidade de um joystick. 

Indústria 

A gestão de qualidade nas fábricas usa a visão computacional em sistemas de inspeção, que detectam falhas em maquinário e produtos por meio da varredura do ambiente. 

>>> Leia também: O que você vai aprender em uma pós-graduação em inteligência artificial

Aprenda sobre IA com quem é referência 

Quer se aprofundar mais em visão computacional e inteligência artificial? 

Seja especialista nessa área em alta da tecnologia com a Pós PUCPR Digital! Nós desenvolvemos especializações e cursos rápidos voltados para quem quer trabalhar com IA de forma ética, responsável e humanizada. 

As aulas são 100% online e ministradas por quem é referência na área como: 

  • Marcelo Leite, especialista em estratégia de dados e inteligência artificial na Microsoft USA.
  • Roberto Celestino, líder de vendas de Inteligência Artificial (Watson) na IBM Brasil.  
  • Pierre Lévy, filósofo, professor da Universidade de Montreal e CEO da Intlekt Metadata Inc.
  • Patrícia Peck Pinheiro, referência nacional em LGPD e Direito Digital, CEO da Peck Advogados e presidente do Instituto iStart de Ética Digital.

Confira o que você vai aprender: 

Pós-graduação 

>>> Arquitetura de Software, Ciência de Dados e Cybersecurity

>>> Governança de TI, Segurança Digital e Gestão de Dados 

>>> Liderança e Transformação Digital na Era da IA

>>> Segurança da Informação

>>> Tecnologia e Dados em Saúde 

Cursos rápidos 

>>> Aplicativos e Algoritmos de Inteligência Artificial em Prol de Estratégias em Serviço de Saúde Mental, com Ives Passos

>>> Arquitetura Datalake: Extraindo Valor dos Dados, com Sergio Nauffal

>>> Ciência de Dados: Agile Data Science Escalável, com Renato Barbosa 

>>> Fundamentos de Ciência de Dados e Big Data, com Marcelo Leite 

>>> Governança em Inteligência Artificial, com Claudio Lucena

>>> Inteligência Artificial, com Fabricio Lira 

>>> Machine Learning e IA Aplicados à Saúde, com Pieter Abbeel

Acelere sua carreira com os cursos da Pós PUCPR Digital!

Sobre o autor

Redação

Redação

Conteúdo para você se preparar para o pós. Vamos criar o futuro juntos?

Assine nossa newsletter e fique por dentro do nosso conteúdo.