Ementa


Fundamentos de Visão Computacional. Percepção e Inteligência. Áreas de Aplicação. Segmentação e reconhecimento de características de baixo nível. Detecção de Objetos. Tracking. Visão Estéreo. Estudo de aplicações avançadas.

Carga Horária: 45h

Agenda


Quinta

Lab de Ensino 3

Manhã, 07:30 à 10:00


Organização e Avaliação


Aulas teóricas com exposição de práticas para exemplificar o conteúdo

Participação dos alunos através de discussão de artigos selecionados, de seminários com foco em suas dissertações de mestrado e produção de trabalhos

Agenda do Curso


Data Conteúdo
23/08 Introdução a Visão Computacional: problemas e desafios
30/08 Conceitos Básicos PI
06/09 Conceitos Básicos de AM
13/09 Aprendizagem Profunda - CNN
20/09 Prática CNN
04/10 Discussão 1
11/10 Discussão 2
18/10 1 Avaliação
25/10 Detecção
01/11 Detecção
08/11 Seminários
15/11 Espaço trabalho
22/11 Tópicos Extras
29/11 Tópicos Extras
06/12 Sessão de Pôster - Trabalho Final

Notas de Aula


Num. Conteúdo Nota de Aula Leitura Recomendada
1 Introdução a visão computacional e algumas aplicações Introducao à Visão -
2 Revisão sobre Conceitos Importantes de Processamento de Imagens Básico de PI -
3 Revisão sobre Conceitos Importantes de Aprendizado de Máquina Básico de AM
SVM
-
4 Redes Neurais Introdução
CNN
-
5 CNN - Prática (by Lucas) Introdução a CNN com Keras
Material adicional
6 Discussão 1: Arquitetura de CNN Karen Simonyan, Andrew Zisserman. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556. 2015
S. Xie, R. Girshick, P. Dollar, Z. Tu and K. He. Aggregated Residual Transformations for Deep Neural Networks. arXiv preprint arXiv:1611.05431v1,2016.
G. Huang, Z. Liu, K. Q. Weinberger and L. Maaten. Densely Connected Convolutional Networks. arXiv:1608.06993v3,2016.
Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Alex Alemi. Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning. arXiv:1602.07261. 2016
7 Discussão 2: Novas arquiteturas e otimização Hieu Pham, Melody Y. Guan, Barret Zoph, Quoc V. Le, Jeff Dean. Efficient Neural Architecture Search via Parameter Sharing. arXiv:1802.03268
Hanxiao Liu, Karen Simonyan, Yiming Yang. DARTS: Differentiable Architecture Search. arXiv:1806.09055
Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio. Generative Adversarial Nets. arXiv:1406.2661
Sara Sabour, Nicholas Frosst e Geoffrey E. Hinton. Dynamic Routing Between Capsules
Mais sobre busca de arquiteturas: LITERATURE ON NEURAL ARCHITECTURE SEARCH
8 Segmentação e Detecção Detecção: quais os caminhos?
Segmentação usando Grafos
Selective Search
9 Segmentação Semântica e Detecção de Objetos U-Net
Faster R-CNN
10 Discussão 3: Técnicas de Detecção Vladimir Iglovikov, Alexey Shvets. TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation
Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi. You Only Look Once: Unified, Real-Time Object Detection
Kaiming He, Georgia Gkioxari, Piotr Dollár, Ross Girshick. Mask R-CNN

Trabalhos (Temas)

Defina com seu orientador ou com o professor um trabalho que seja sub-parte do seu trabalho de dissertação e que contenha conteúdos de visão computacional.

Principais Interesses:

  • Segmentação/Reconhecimento de Objetos
  • Reconhecimento de Faces em Video
  • Reconhecimento de emoções
  • Reconhecimento/Interpretação de movimentos/interação humana
  • Tracking de objetos
  • Deep Learnig
  • Estimação de pose de objetos/face/mãos
  • Visão na Área Médica
  • Visão Computacional para Realidade Virtual/Aumentada
  • Jogos com Visão Computacional
  • Aplicações de visão para portadores de deficiência

Temas Definidos

Responsável Tema Proposta
Joaquim Uma comparação entre o desempenho da ResNext e da DenseNet no reconhecimento de semáforos O objetivo do trabalho é hyperopt para estabelecer os melhores parâmetros das redes ResNext e DenseNet, ambas atacando o mesma base com fim de comparar o desempenho delas durante a classificação.
Gleidson Detecção de cancer de mama em imagens infravermelhas Utilizar a base de dados http://visual.ic.uff.br/en/proeng/thiagoelias/ (está indisponível para download, mas vou tentar entrar em contato para conseguir) junto a uma Inception V3 para a classificação de anormalidaes nas regiões de interesse.
Ricardo Redes Neurais Adversárias para Diagnóstico de Glaucoma Para resolver o problema, pretende-se utilizar técnicas de visão computacional, mais especificamente na área de redes neurais convolucionais profundas (deep learning). Para tanto, será feito o reconhecimento entre indivíduos com e sem glaucoma, através de imagens de fundo de olho da base de dados rim-one-v2.
Polyana Detecção da região dos olhos em faces para tracking de olhos em vídeos A fim de determinar a posição da pupila, primeiramente é necessário extrair a região dos olhos numa imagem que contém a face inteira. Para isso, pretendo usar a rede neural convolucional YOLO (You Only Look Once), uma rede projetada para detecção de objetos em tempo real. A detecção de olhos vai ser usada em vídeos, por isso a necessidade de funcionar em tempo real. A fim de estabilizar a posição dos olhos ao longo dos frames, visa-se detectar também a região da face.
Igor Otimização de Hiperparâmetros com HyperOpt para reconhecimento de Pneumonia utilizando arquitetura DENSENET Encontrar uma combinação de hyper parâmetros mais adequada a um conjunto de imagens específico e comparar a Arquitetura obtida para DENSE com a Arquitetura original da DENSE usando hyperopt.


Referências

Baggio, D.: Mastering OpenCV with Practical Computer Vision Projects, PACKT, 2012

Laganière, R: OpenCV 2 Computer Vision Application Programming Cookbook, PACKT, 2011

Howe, K.:A Practical Introduction to Computer Vision with OpenCV, Wiley, 2014

Bradski and Kaehler: Learning OpenCV, O'Reilly, 2008

J.R.Parke: Algorithms for Image Processing and_Computer Vision, Wiley 2010

Szeliski, Richard: Computer Vision: Algorithms and Applications, Microsoft Research, 2010

Simon J. D. Prince. Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2014.

M. Nixon. Feature Extraction and Image Processing for Computer Vision, Elsevier, Ed. 3, 2012

R. Hartley, e A. Zisserman. Multiple View Geometry in Computer Vision, Cambridge University Press, Ed. 2, 2004.

Li Deng and Dong Yu. Deep Learning Methods and Applications, Foundations and Trends in Signal Processing, 2014