Aprendizado de Máquina – 2020

  • Especialização: Ciência de Dados e Big Data PUC Minas – Unidade Barreiro
  • DisciplinaAprendizado de máquina

Datas e atividades:

  • 08/02
  • 15/02
    • Agrupamento:
      • Estratégias por partição
      • O algoritmo k-médias
      • Estratégias baseadas em densidade
      • Algoritmo DBSCAN
      • Estratégias hierárquicas
      • Os métodos AGNES e DIANA
      • Descoberta de tópicos em texto
        • LDA – Latent Dirichlet Allocation
      • Avaliação de modelos para análise de agrupamento
    • Predição
      • Classificação
        • k-nearest neighbors algorithm
    • Projeto prático: Entrega 1
  • 29/02
    • Predição
      • Classificação
        • Árvore de decisão
        • KNN
        • Redes Neurais
        • SVN
        • Introdução a técnicas de regressão
  • 07/03
    • Introdução a técnicas de regressão não linear
    • Metodologia de construção e avaliação de modelos
    • Análise de Associação e Padrões Frequentes – Parte 1 e 2
    • Apresentação dos projetos práticos
    • Projeto prático: Entrega 2 
      • Pode ser entregue até Sábado, dia 14/03/20 até as 23:59


  • Projeto prático:
    • Equipe
      • 3 alunos
    • Objetivos:
      • Experimentar um projeto completo em aprendizado de máquina
    • Descrição:
      • Escolher um problema real que faça uso de, pelo menos, duas técnicas de aprendizado de máquina. Propor um conjunto de perguntas e hipóteses minimamente complexas. Modelar o problema utilizando o software knime e realizar todo tratamento necessário nos dados. Ao modelar o problema procure aplicar os diferentes algoritmos apresentados no curso. O importante é que seja uma análise além do trivial.
    • Algumas fontes de dados:
    • Entrega 1 – Proposta de projeto – 20% da nota
      • 1 – Resumo da proposta de projeto prático (introdução, motivação, perguntas, hipóteses e técnicas candidatas).
        • Máximo de duas laudas
      • Data: Sábado, dia 15/02/20 até as 23:59
        • sergiomariano [at] gmail.com
        • Assunto: “[pos-pucminas-AM] Proposta – Aluno1, Aluno2 e Aluno3”
        • Entregar: proposta
    • Entrega 2 – Projeto final – 80% da nota
      • 1 – Relatório técnico: introdução, motivação, hipóteses, metodologia (domínio do problema, coleta, pré-processamento, extração de conhecimento), experimentos e conclusões.
      • 2 – Apresentação: 10 minutos
        • Oportunidade de conhecer diferentes técnicas de aprendizado de máquina aplicada em diferentes problemas.
      • Data: Sábado, dia 07/03/20 até as 23:59 
      • Pode ser entregue até Sábado, dia 14/03/20 até as 23:59
        • sergiomariano [at] gmail.com
        • Assunto: “[pos-pucminas-AM] Projeto final – Aluno1, Aluno2 e Aluno3”
        • Entregar: Relatório, apresentação, workflow no knime e dados
        • Versionar no https://github.com/
    • Atenção: Para cada dia de atraso o trabalho será penalizado em 2 pontos.


  • Bibliografia
    • Marsland, Stephen. Machine learning: an algorithmic perspective. CRC press, 2015.
    • Zaki, Mohammed J., and Wagner Meira Jr. Data mining and analysis: fundamental concepts and algorithms. Cambridge University Press, 2014.
  • Bibliografia complementar
    • Han, Jiawei, Jian Pei, and Micheline Kamber. Data mining: concepts and techniques. Elsevier, 2011.
    • da Silva, Leandro Augusto, Sarajane Marques Peres, and Clodis Boscarioli. Introdução à mineração de dados: com aplicações em R. Elsevier Brasil, 2017.
    • Braga, Luis Paulo Vieira. Introdução à Mineração de Dados – 2a edição: Edição ampliada e revisada. Editora Epapers, 2005.
    • Amaral, Fernando. Introdução à Ciência de Dados: mineração de dados e big data. Alta Books Editora, 2016.
    • Barber, David. Bayesian reasoning and machine learning. Cambridge University Press, 2012.
    • O curso também será baseado em artigos das principais conferências e periódicos da área.