Acompanhe
Se você usa reconhecimento facial para desbloquear o seu celular, saiba que é graças à visão computacional que este recurso está disponível.
Faz anos que essa tecnologia saiu dos filmes de ficção científica para fazer parte do nosso dia a dia. Aqui você vai encontrar um resumo sobre como ela funciona e quais são as suas principais aplicações.
A visão computacional é um processo de modelagem e replicação da visão humana por meio de software e hardware, cujo principal objetivo é reconhecer e descrever imagens com precisão. Essas imagens podem ser estáticas ou móveis.
As pesquisas sobre visão computacional se iniciaram na década de 1960, tendo como marco a tese do cientista da computação Lawrence Roberts (1937-2018), intitulada " Machine Perception of Three-Dimensional Solids " (1963). O pesquisador descreveu como computadores fazem a derivação de sólidos tridimensionais a partir de imagens 2D.
Hoje, o termo é considerado um subcampo da inteligência artificial (IA) , que recorre a modelos de deep learning para treinar redes neurais convolucionais (CNNs, sigla em inglês para “convolutional neural networks”) e redes neurais recorrentes (RNNs, sigla em inglês para “recurrent neural network”).
Deep learning é um tipo de aprendizado de máquina que simula como os seres humanos adquirem certas formas de conhecimento. Ele funciona a partir de redes neurais, um conjunto de unidades básicas de uma estrutura de dados (chamados de “nós”) conectadas entre si que simula o funcionamento de um cérebro humano.
Essas redes neurais, no caso da visão computacional, podem ser convolucionais ou recorrentes. As CNNs se baseiam em um sistema de rotulagem para classificar e compreender as imagens, por meio da análise pixel a pixel. Cada pixel recebe um valor, que é usado em uma operação matemática que faz previsões sobre a imagem, processo chamado de convolução.
As CNNs são utilizadas no processamento de uma única imagem, enquanto as RNNs processam uma série de imagens para estabelecer relações entre elas.
Na visão computacional , as redes neurais são treinadas para segmentar, classificar e detectar fotos, ilustrações e vídeos:
Vamos usar como exemplo um carro autônomo, que depende da visão computacional para garantir a segurança do passageiro e dos pedestres. Ele usa a segmentação para identificar a estrada, os carros e as pessoas. A classificação dá mais precisão à identificação, ao rotular os elementos da imagem. A detecção, por fim, aponta onde os carros e as pessoas estão no ambiente, geralmente com contornos retangulares.
Enquanto a visão computacional visa a detectar e dar sentido a imagens, o processamento de imagem as altera por meio de algoritmos, dando-lhes mais nitidez e suavização.
É comum usar o processamento de imagem para modificar fotos e vídeos e, assim, facilitar a compreensão desse material por um sistema de visão computacional.
Não é apenas nos carros autônomos que a visão computacional está presente. Outros setores da economia são beneficiados com o uso dessa tecnologia:
Com a visão computacional, a análise de exames de imagem ganha mais precisão, o que ajuda profissionais de saúde a fazerem diagnósticos mais rápidos e precisos.
A tecnologia é usada principalmente na detecção de tumores, auxiliando no diagnóstico e tratamento de câncer de mama, câncer de pulmão, câncer de próstata e melanomas.
Sistemas de visão computacional podem ser usados na detecção de doenças e pragas, nas estimativas de safras e na avaliação de atributos como qualidade, aparência e volume.
Eles também permitem o monitoramento de culturas e de animais, pulverização automática de defensivos agrícolas e rastreamento de produtividade, tudo isso com o apoio de drones.
Na área das finanças, a principal funcionalidade da visão computacional utilizada é o reconhecimento facial.
Existem aplicativos de banco, por exemplo, que exigem que o usuário posicione o rosto diante da câmera do celular para autorizar transações.
Aplicativos de instituições públicas também usam dessa tecnologia, como o do sistema gov.br, a CNH Digital e o INSS.
A indústria de games usa a visão computacional para rastrear poses dos jogadores e imitá-las nos avatares.
Um exemplo clássico é o Kinect da Microsoft, acessório do Xbox 360 e Xbox One descontinuado em 2023. Por meio de câmeras RGB, projetores infravermelhos e detectores de movimento, o dispositivo permitia que os usuários interagissem com os jogos sem a necessidade de um joystick.
A gestão de qualidade nas fábricas usa a visão computacional em sistemas de inspeção, que detectam falhas em maquinário e produtos por meio da varredura do ambiente.
Quer se aprofundar mais em visão computacional e inteligência artificial?
Seja especialista nessa área em alta da tecnologia com a Pós PUCPR Digital ! Nós desenvolvemos especializações e cursos rápidos voltados para quem quer trabalhar com IA de forma ética, responsável e humanizada.
As aulas são 100% online e ministradas por quem é referência na área como:
Confira o que você vai aprender:
>>> Aplicativos e Algoritmos de Inteligência Artificial em Prol de Estratégias em Serviço de Saúde Mental , com Ives Passos
>>> Arquitetura Datalake: Extraindo Valor dos Dados , com Sergio Nauffal
>>> Ciência de Dados: Agile Data Science Escalável , com Renato Barbosa
>>> Fundamentos de Ciência de Dados e Big Data , com Marcelo Leite
>>> Governança em Inteligência Artificial , com Claudio Lucena
>>> Inteligência Artificial , com Fabricio Lira
>>> Machine Learning e IA Aplicados à Saúde , com Pieter Abbeel
Não sabe qual dos cursos combina mais com você? Faça o teste abaixo e descubra:
Por Redação Pós PUCPR Digital
Gostou deste conteúdo? Deixe seu comentário abaixo ou compartilhe com seus amigos!
Assine a News da Pós para ficar por dentro das novidades
Receba conteúdos sobre:
Formulário enviado com sucesso!