Inscreva-se
imagem
PUCPR Logo

Um olhar digital sobre a realidade: como funciona a visão computacional

Redação Pós PUCPR Digital • 4 de outubro de 2023

Lorem ipsum dolor sit amet, consectetur adipiscing elit

Acompanhe

    Se você usa reconhecimento facial para desbloquear o seu celular, saiba que é graças à visão computacional que este recurso está disponível. 

    Faz anos que essa tecnologia saiu dos filmes de ficção científica para fazer parte do nosso dia a dia. Aqui você vai encontrar um resumo sobre como ela funciona e quais são as suas principais aplicações. 

    O que é visão computacional?

    A visão computacional é um processo de modelagem e replicação da visão humana por meio de software e hardware, cujo principal objetivo é reconhecer e descrever imagens com precisão. Essas imagens podem ser estáticas ou móveis.

    As pesquisas sobre visão computacional se iniciaram na década de 1960, tendo como marco a tese do cientista da computação Lawrence Roberts (1937-2018), intitulada " Machine Perception of Three-Dimensional Solids " (1963). O pesquisador descreveu como computadores fazem a derivação de sólidos tridimensionais a partir de imagens 2D.

    Hoje, o termo é considerado um subcampo da inteligência artificial (IA) , que recorre a modelos de deep learning para treinar redes neurais convolucionais (CNNs, sigla em inglês para “convolutional neural networks”) e redes neurais recorrentes (RNNs, sigla em inglês para “recurrent neural network”).

    Deep learning é um tipo de aprendizado de máquina que simula como os seres humanos adquirem certas formas de conhecimento. Ele funciona a partir de redes neurais, um conjunto de unidades básicas de uma estrutura de dados (chamados de “nós”) conectadas entre si que simula o funcionamento de um cérebro humano

    Essas redes neurais, no caso da visão computacional, podem ser convolucionais ou recorrentes. As CNNs se baseiam em um sistema de rotulagem para classificar e compreender as imagens, por meio da análise pixel a pixel. Cada pixel recebe um valor, que é usado em uma operação matemática que faz previsões sobre a imagem, processo chamado de convolução. 

    As CNNs são utilizadas no processamento de uma única imagem, enquanto as RNNs processam uma série de imagens para estabelecer relações entre elas. 

    Na visão computacional , as redes neurais são treinadas para segmentar, classificar e detectar fotos, ilustrações e vídeos:

    • Segmentação: delimita objetos por meio da classificação de pixels em categorias específicas. 
    • Classificação: determina o que uma imagem contém. 
    • Detecção: localiza objetos no ambiente. 

    Vamos usar como exemplo um carro autônomo, que depende da visão computacional para garantir a segurança do passageiro e dos pedestres. Ele usa a segmentação para identificar a estrada, os carros e as pessoas. A classificação dá mais precisão à identificação, ao rotular os elementos da imagem. A detecção, por fim, aponta onde os carros e as pessoas estão no ambiente, geralmente com contornos retangulares. 

     

    Diferença entre visão computacional e processamento de imagem 

    Enquanto a visão computacional visa a detectar e dar sentido a imagens, o processamento de imagem as altera por meio de algoritmos, dando-lhes mais nitidez e suavização. 

    É comum usar o processamento de imagem para modificar fotos e vídeos e, assim, facilitar a compreensão desse material por um sistema de visão computacional. 

     

     >>> Leia também: Desvendando a IA generativa

     

    5 aplicações da visão computacional 

    Não é apenas nos carros autônomos que a visão computacional está presente. Outros setores da economia são beneficiados com o uso dessa tecnologia: 

    Saúde 

    Com a visão computacional, a análise de exames de imagem ganha mais precisão, o que ajuda profissionais de saúde a fazerem diagnósticos mais rápidos e precisos. 

    A tecnologia é usada principalmente na detecção de tumores, auxiliando no diagnóstico e tratamento de câncer de mama, câncer de pulmão, câncer de próstata e melanomas. 

     

    Agricultura 

    Sistemas de visão computacional podem ser usados na detecção de doenças e pragas, nas estimativas de safras e na avaliação de atributos como qualidade, aparência e volume. 

    Eles também permitem o monitoramento de culturas e de animais, pulverização automática de defensivos agrícolas e rastreamento de produtividade, tudo isso com o apoio de drones. 

    Financeiro 

    Na área das finanças, a principal funcionalidade da visão computacional utilizada é o reconhecimento facial.  

    Existem aplicativos de banco, por exemplo, que exigem que o usuário posicione o rosto diante da câmera do celular para autorizar transações. 

    Aplicativos de instituições públicas também usam dessa tecnologia, como o do sistema gov.br, a CNH Digital e o INSS. 

    Videogames 

    A indústria de games usa a visão computacional para rastrear poses dos jogadores e imitá-las nos avatares. 

    Um exemplo clássico é o Kinect da Microsoft, acessório do Xbox 360 e Xbox One descontinuado em 2023. Por meio de câmeras RGB, projetores infravermelhos e detectores de movimento, o dispositivo permitia que os usuários interagissem com os jogos sem a necessidade de um joystick. 

    Indústria 

    A gestão de qualidade nas fábricas usa a visão computacional em sistemas de inspeção, que detectam falhas em maquinário e produtos por meio da varredura do ambiente. 

    Aprenda sobre IA com quem é referência 

    Quer se aprofundar mais em visão computacional e inteligência artificial? 

    Seja especialista nessa área em alta da tecnologia com a Pós PUCPR Digital ! Nós desenvolvemos especializações e cursos rápidos voltados para quem quer trabalhar com IA de forma ética, responsável e humanizada. 

    As aulas são 100% online e ministradas por quem é referência na área como: 

    • Marcelo Leite , especialista em estratégia de dados e inteligência artificial na Microsoft USA.
    • Roberto Celestino , líder de vendas de Inteligência Artificial (Watson) na IBM Brasil.  
    • Pierre Lévy , filósofo, professor da Universidade de Montreal e CEO da Intlekt Metadata Inc.
    • Patrícia Peck Pinheiro , referência nacional em LGPD e Direito Digital, CEO da Peck Advogados e presidente do Instituto iStart de Ética Digital.

    Confira o que você vai aprender: 

    Pós-graduação 

    Cursos rápidos 

    >>> Inteligência Artificial , com Fabricio Lira 

    >>> Machine Learning e IA Aplicados à Saúde , com Pieter Abbeel


    Não sabe qual dos cursos combina mais com você? Faça o teste abaixo e descubra:

    Por Redação Pós PUCPR Digital

    Gostou deste conteúdo? Deixe seu comentário abaixo ou compartilhe com seus amigos!

     

    Assine a News da Pós para ficar por dentro das novidades


    Receba conteúdos sobre:


    • tendências de mercado
    • formas de escalar sua carreira
    • cursos para se manter competitivo.


    Quero receber

    Conteúdo Relacionado

    Share by: