Ementa

Fundamentos de Visão Computacional. Percepção e Inteligência. Áreas de Aplicação. Segmentação e reconhecimento de características de baixo nível. Detecção de Objetos. Tracking. Visão Estéreo. Estudo de aplicações avançadas.

Carga Horária: 45h

Agenda

Quinta

Lab de Ensino 3

Manhã, 07:30 à 10:00

Organização e Avaliação

Aulas teóricas com exposição de práticas para exemplificar o conteúdo

Participação dos alunos através de discussão de artigos selecionados, de seminários com foco em suas dissertações de mestrado e produção de trabalhos

Agenda do Curso

Data	Conteúdo
23/08	Introdução a Visão Computacional: problemas e desafios
30/08	Conceitos Básicos PI
06/09	Conceitos Básicos de AM
13/09	Aprendizagem Profunda - CNN
20/09	Prática CNN
04/10	Discussão 1
11/10	Discussão 2
18/10	1 Avaliação
25/10	Detecção
01/11	Detecção
08/11	Seminários
15/11	Espaço trabalho
22/11	Tópicos Extras
29/11	Tópicos Extras
06/12	Sessão de Pôster - Trabalho Final

Notas de Aula

Num.	Conteúdo	Nota de Aula	Leitura Recomendada
1	Introdução a visão computacional e algumas aplicações	Introducao à Visão	-
2	Revisão sobre Conceitos Importantes de Processamento de Imagens	Básico de PI	-
3	Revisão sobre Conceitos Importantes de Aprendizado de Máquina	Básico de AM SVM	-
4	Redes Neurais	Introdução CNN	-
5	CNN - Prática (by Lucas)	Introdução a CNN com Keras Material adicional
6	Discussão 1: Arquitetura de CNN		Karen Simonyan, Andrew Zisserman. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556. 2015 S. Xie, R. Girshick, P. Dollar, Z. Tu and K. He. Aggregated Residual Transformations for Deep Neural Networks. arXiv preprint arXiv:1611.05431v1,2016. G. Huang, Z. Liu, K. Q. Weinberger and L. Maaten. Densely Connected Convolutional Networks. arXiv:1608.06993v3,2016. Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Alex Alemi. Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning. arXiv:1602.07261. 2016
7	Discussão 2: Novas arquiteturas e otimização		Hieu Pham, Melody Y. Guan, Barret Zoph, Quoc V. Le, Jeff Dean. Efficient Neural Architecture Search via Parameter Sharing. arXiv:1802.03268 Hanxiao Liu, Karen Simonyan, Yiming Yang. DARTS: Differentiable Architecture Search. arXiv:1806.09055 Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio. Generative Adversarial Nets. arXiv:1406.2661 Sara Sabour, Nicholas Frosst e Geoffrey E. Hinton. Dynamic Routing Between Capsules Mais sobre busca de arquiteturas: LITERATURE ON NEURAL ARCHITECTURE SEARCH
8	Segmentação e Detecção	Detecção: quais os caminhos? Segmentação usando Grafos Selective Search
9	Segmentação Semântica e Detecção de Objetos	U-Net Faster R-CNN
10	Discussão 3: Técnicas de Detecção		Vladimir Iglovikov, Alexey Shvets. TernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi. You Only Look Once: Unified, Real-Time Object Detection Kaiming He, Georgia Gkioxari, Piotr Dollár, Ross Girshick. Mask R-CNN

Trabalhos (Temas)

Defina com seu orientador ou com o professor um trabalho que seja sub-parte do seu trabalho de dissertação e que contenha conteúdos de visão computacional.

Principais Interesses:

Segmentação/Reconhecimento de Objetos
Reconhecimento de Faces em Video
Reconhecimento de emoções
Reconhecimento/Interpretação de movimentos/interação humana
Tracking de objetos
Deep Learnig
Estimação de pose de objetos/face/mãos
Visão na Área Médica
Visão Computacional para Realidade Virtual/Aumentada
Jogos com Visão Computacional
Aplicações de visão para portadores de deficiência

Temas Definidos

Responsável	Tema	Proposta
Joaquim	Uma comparação entre o desempenho da ResNext e da DenseNet no reconhecimento de semáforos	O objetivo do trabalho é hyperopt para estabelecer os melhores parâmetros das redes ResNext e DenseNet, ambas atacando o mesma base com fim de comparar o desempenho delas durante a classificação.
Gleidson	Detecção de cancer de mama em imagens infravermelhas	Utilizar a base de dados http://visual.ic.uff.br/en/proeng/thiagoelias/ (está indisponível para download, mas vou tentar entrar em contato para conseguir) junto a uma Inception V3 para a classificação de anormalidaes nas regiões de interesse.
Ricardo	Redes Neurais Adversárias para Diagnóstico de Glaucoma	Para resolver o problema, pretende-se utilizar técnicas de visão computacional, mais especificamente na área de redes neurais convolucionais profundas (deep learning). Para tanto, será feito o reconhecimento entre indivíduos com e sem glaucoma, através de imagens de fundo de olho da base de dados rim-one-v2.
Polyana	Detecção da região dos olhos em faces para tracking de olhos em vídeos	A fim de determinar a posição da pupila, primeiramente é necessário extrair a região dos olhos numa imagem que contém a face inteira. Para isso, pretendo usar a rede neural convolucional YOLO (You Only Look Once), uma rede projetada para detecção de objetos em tempo real. A detecção de olhos vai ser usada em vídeos, por isso a necessidade de funcionar em tempo real. A fim de estabilizar a posição dos olhos ao longo dos frames, visa-se detectar também a região da face.
Igor	Otimização de Hiperparâmetros com HyperOpt para reconhecimento de Pneumonia utilizando arquitetura DENSENET	Encontrar uma combinação de hyper parâmetros mais adequada a um conjunto de imagens específico e comparar a Arquitetura obtida para DENSE com a Arquitetura original da DENSE usando hyperopt.

Referências

Baggio, D.: Mastering OpenCV with Practical Computer Vision Projects, PACKT, 2012

Laganière, R: OpenCV 2 Computer Vision Application Programming Cookbook, PACKT, 2011

Howe, K.:A Practical Introduction to Computer Vision with OpenCV, Wiley, 2014

Bradski and Kaehler: Learning OpenCV, O'Reilly, 2008

J.R.Parke: Algorithms for Image Processing and_Computer Vision, Wiley 2010

Szeliski, Richard: Computer Vision: Algorithms and Applications, Microsoft Research, 2010

Simon J. D. Prince. Computer Vision: Models, Learning, and Inference, Cambridge University Press, 2014.

M. Nixon. Feature Extraction and Image Processing for Computer Vision, Elsevier, Ed. 3, 2012

R. Hartley, e A. Zisserman. Multiple View Geometry in Computer Vision, Cambridge University Press, Ed. 2, 2004.

Li Deng and Dong Yu. Deep Learning Methods and Applications, Foundations and Trends in Signal Processing, 2014