Ementa


Fundamentos de Visão Computacional. Percepção e Inteligência. Áreas de Aplicação. Segmentação e reconhecimento de características de baixo nível. Detecção de Objetos. Tracking. Visão Estéreo. Estudo de aplicações avançadas.

Carga Horária: 45h

Agenda


Quinta

Lab de Ensino 3

Manhã, 07:30 à 10:00


Organização e Avaliação


Aulas teóricas com exposição de práticas para exemplificar o conteúdo

Participação dos alunos através de discussão de artigos selecionados, de seminários com foco em suas dissertações de mestrado e produção de trabalhos

Agenda do Curso


Data Conteúdo
23/08 Introdução a Visão Computacional: problemas e desafios
30/08 Conceitos Básicos PI
06/09 Conceitos Básicos de AM
13/09 Aprendizagem Profunda - CNN
20/09 Prática CNN
04/10 Discussão 1
11/10 Discussão 2
18/10 1 Avaliação
25/10 Detecção
01/11 Detecção
08/11 Seminários
15/11 Espaço trabalho
22/11 Tópicos Extras
29/11 Tópicos Extras
06/12 Sessão de Pôster - Trabalho Final

Notas de Aula


Num. Conteúdo Nota de Aula Leitura Recomendada
1 Introdução a visão computacional e algumas aplicações Introducao à Visão CH 1: Computer Vision Algorithms and Applications: Szeliski
2 Revisão sobre Conceitos Importantes de Processamento de Imagens Básico de PI Ch 2,3,4, Computer Vision: Algorithms and Applications, Richard Szeliski
Ch 2, Digital Image Processing, Gonzales
Ch 3, Digital Image Processing, Gonzales
Ch 4, Fundamentals of Digital Image Processing, Solomon
Ch 4, Computer Vision Application Cookbook, Robert Laganiere
Ch 7, Advanced Topics Principles of Digital Image, Burger
3 Revisão sobre Conceitos Importantes de Aprendizado de Máquina Básico de AM
SVM
Ch 1-3, Machine Learning - An algorithmic perspective, Marsland
Ch 6, Machine Learning - An algorithmic perspective, Marsland
Ch 9, Machine Learning - An algorithmic perspective, Marsland
Ch 14, Machine Learning - An algorithmic perspective, Marsland
4 Redes Neurais Introdução
CNN
Ch 5 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
Ch 6 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
Ch 7 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
Ch 8 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
Ch 9 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
Ch 12 - Deep Learning (Ian Goodfellow and Yoshua Bengio and Aaron Courville)
5 CNN - Prática (by Lucas) Introdução a CNN com Keras
Material adicional
6 Discussão 1: Arquitetura de CNN Karen Simonyan, Andrew Zisserman. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556. 2015
S. Xie, R. Girshick, P. Dollar, Z. Tu and K. He. Aggregated Residual Transformations for Deep Neural Networks. arXiv preprint arXiv:1611.05431v1,2016.
G. Huang, Z. Liu, K. Q. Weinberger and L. Maaten. Densely Connected Convolutional Networks. arXiv:1608.06993v3,2016.
Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Alex Alemi. Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning. arXiv:1602.07261. 2016
7 Discussão 2: Novas arquiteturas e otimização Hieu Pham, Melody Y. Guan, Barret Zoph, Quoc V. Le, Jeff Dean. Efficient Neural Architecture Search via Parameter Sharing. arXiv:1802.03268
Hanxiao Liu, Karen Simonyan, Yiming Yang. DARTS: Differentiable Architecture Search. arXiv:1806.09055
Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio. Generative Adversarial Nets. arXiv:1406.2661
Sara Sabour, Nicholas Frosst e Geoffrey E. Hinton. Dynamic Routing Between Capsules
Mais sobre busca de arquiteturas: LITERATURE ON NEURAL ARCHITECTURE SEARCH
8 Segmentação e Detecção Detecção: quais os caminhos?
Segmentação usando Grafos
Selective Search
9 Segmentação Semântica e Detecção de Objetos U-Net
Faster R-CNN
10 Discussão 3: Técnicas de Detecção Vladimir Iglovikov, Alexey Shvets. TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation
Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi. You Only Look Once: Unified, Real-Time Object Detection
Kaiming He, Georgia Gkioxari, Piotr Dollár, Ross Girshick. Mask R-CNN

Trabalhos (Temas)

Defina com seu orientador ou com o professor um trabalho que seja sub-parte do seu trabalho de dissertação e que contenha conteúdos de visão computacional.

Principais Interesses:

  • Segmentação/Reconhecimento de Objetos
  • Reconhecimento de Faces em Video
  • Reconhecimento de emoções
  • Reconhecimento/Interpretação de movimentos/interação humana
  • Tracking de objetos
  • Deep Learnig
  • Estimação de pose de objetos/face/mãos
  • Visão na Área Médica
  • Visão Computacional para Realidade Virtual/Aumentada
  • Jogos com Visão Computacional
  • Aplicações de visão para portadores de deficiência

Temas Definidos

Responsável Tema Proposta
Joaquim Uma comparação entre o desempenho da ResNext e da DenseNet no reconhecimento de semáforos O objetivo do trabalho é hyperopt para estabelecer os melhores parâmetros das redes ResNext e DenseNet, ambas atacando o mesma base com fim de comparar o desempenho delas durante a classificação.
Gleidson Detecção de cancer de mama em imagens infravermelhas Utilizar a base de dados http://visual.ic.uff.br/en/proeng/thiagoelias/ (está indisponível para download, mas vou tentar entrar em contato para conseguir) junto a uma Inception V3 para a classificação de anormalidaes nas regiões de interesse.
Ricardo Redes Neurais Adversárias para Diagnóstico de Glaucoma Para resolver o problema, pretende-se utilizar técnicas de visão computacional, mais especificamente na área de redes neurais convolucionais profundas (deep learning). Para tanto, será feito o reconhecimento entre indivíduos com e sem glaucoma, através de imagens de fundo de olho da base de dados rim-one-v2.
Polyana Detecção da região dos olhos em faces para tracking de olhos em vídeos A fim de determinar a posição da pupila, primeiramente é necessário extrair a região dos olhos numa imagem que contém a face inteira. Para isso, pretendo usar a rede neural convolucional YOLO (You Only Look Once), uma rede projetada para detecção de objetos em tempo real. A detecção de olhos vai ser usada em vídeos, por isso a necessidade de funcionar em tempo real. A fim de estabilizar a posição dos olhos ao longo dos frames, visa-se detectar também a região da face.
Igor Otimização de Hiperparâmetros com HyperOpt para reconhecimento de Pneumonia utilizando arquitetura DENSENET Encontrar uma combinação de hyper parâmetros mais adequada a um conjunto de imagens específico e comparar a Arquitetura obtida para DENSE com a Arquitetura original da DENSE usando hyperopt.


Referências

Baggio, D.: Mastering OpenCV with Practical Computer Vision Projects, PACKT, 2012

Laganière, R: OpenCV 2 Computer Vision Application Programming Cookbook, PACKT, 2011

Howe, K.:A Practical Introduction to Computer Vision with OpenCV, Wiley, 2014

Bradski and Kaehler: Learning OpenCV, O'Reilly, 2008

J.R.Parke: Algorithms for Image Processing and_Computer Vision, Wiley 2010

Szeliski, Richard: Computer Vision: Algorithms and Applications, Microsoft Research, 2010

Simon J. D. Prince. Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2014.

M. Nixon. Feature Extraction and Image Processing for Computer Vision, Elsevier, Ed. 3, 2012

R. Hartley, e A. Zisserman. Multiple View Geometry in Computer Vision, Cambridge University Press, Ed. 2, 2004.

Li Deng and Dong Yu. Deep Learning Methods and Applications, Foundations and Trends in Signal Processing, 2014