- Especialização: Ciência de Dados e Big Data PUC Minas – Unidade Barreiro
- Disciplina: Aprendizado de máquina
Datas e atividades:
- 08/02
- Apresentação
- Introdução
- Ferramentas para Aprendizado de Máquina
- Explorando a plataforma Knime
- Conceitos gerais e processo KDD
- Artigo: A survey of open source tools for machine learning with big data in the Hadoop ecosystem
- Artigo: Big data analytics: a survey
- 15/02
- Agrupamento:
- Estratégias por partição
- O algoritmo k-médias
- Estratégias baseadas em densidade
- Algoritmo DBSCAN
- Estratégias hierárquicas
- Os métodos AGNES e DIANA
- Descoberta de tópicos em texto
- LDA – Latent Dirichlet Allocation
- Avaliação de modelos para análise de agrupamento
- Predição
- Classificação
- k-nearest neighbors algorithm
- Classificação
- Projeto prático: Entrega 1
- Agrupamento:
- 29/02
- Predição
- Classificação
- Árvore de decisão
- KNN
- Redes Neurais
- SVN
- Introdução a técnicas de regressão
- Classificação
- Predição
- 07/03
- Introdução a técnicas de regressão não linear
- Metodologia de construção e avaliação de modelos
- Análise de Associação e Padrões Frequentes – Parte 1 e 2
- Apresentação dos projetos práticos
- Projeto prático: Entrega 2
- Pode ser entregue até Sábado, dia 14/03/20 até as 23:59
- Slides exercícios e artigos apresentados em sala de aula:
- aula01
- aula02
- aula03
- aula04
- Solicitar senha por e-mail (sergiomariano@gmail.com) ou acessar o conteúdo na pasta compartilhada da disciplina na rede do laboratório
- Projeto prático:
- Equipe
- 3 alunos
- Objetivos:
- Experimentar um projeto completo em aprendizado de máquina
- Descrição:
- Escolher um problema real que faça uso de, pelo menos, duas técnicas de aprendizado de máquina. Propor um conjunto de perguntas e hipóteses minimamente complexas. Modelar o problema utilizando o software knime e realizar todo tratamento necessário nos dados. Ao modelar o problema procure aplicar os diferentes algoritmos apresentados no curso. O importante é que seja uma análise além do trivial.
- Algumas fontes de dados:
- Entrega 1 – Proposta de projeto – 20% da nota
- 1 – Resumo da proposta de projeto prático (introdução, motivação, perguntas, hipóteses e técnicas candidatas).
- Máximo de duas laudas
- Data: Sábado, dia 15/02/20 até as 23:59
- sergiomariano [at] gmail.com
- Assunto: “[pos-pucminas-AM] Proposta – Aluno1, Aluno2 e Aluno3”
- Entregar: proposta
- 1 – Resumo da proposta de projeto prático (introdução, motivação, perguntas, hipóteses e técnicas candidatas).
- Entrega 2 – Projeto final – 80% da nota
- 1 – Relatório técnico: introdução, motivação, hipóteses, metodologia (domínio do problema, coleta, pré-processamento, extração de conhecimento), experimentos e conclusões.
- 2 – Apresentação: 10 minutos
- Oportunidade de conhecer diferentes técnicas de aprendizado de máquina aplicada em diferentes problemas.
Data: Sábado, dia 07/03/20 até as 23:59- Pode ser entregue até Sábado, dia 14/03/20 até as 23:59
- sergiomariano [at] gmail.com
- Assunto: “[pos-pucminas-AM] Projeto final – Aluno1, Aluno2 e Aluno3”
- Entregar: Relatório, apresentação, workflow no knime e dados
- Versionar no https://github.com/
- Atenção: Para cada dia de atraso o trabalho será penalizado em 2 pontos.
- Equipe
- Recursos na web
- Toy example dataset: https://github.com/sergiomdias/datasets
- The R Project for Statistical Computing: https://www.r-project.org/
- Rstudio: https://www.rstudio.com/
- Knime: https://www.knime.com/
- Machine Learning, Data Science, Big Data, Analytics, AI: https://www.kdnuggets.com/
- The Home of Data Science & Machine Learning: https://www.kaggle.com/
- The Machine Learning Canvas: https://www.louisdorard.com/machine-learning-canvas
- Para descontrair:
- Bibliografia
- Marsland, Stephen. Machine learning: an algorithmic perspective. CRC press, 2015.
- Zaki, Mohammed J., and Wagner Meira Jr. Data mining and analysis: fundamental concepts and algorithms. Cambridge University Press, 2014.
- Bibliografia complementar
- Han, Jiawei, Jian Pei, and Micheline Kamber. Data mining: concepts and techniques. Elsevier, 2011.
- da Silva, Leandro Augusto, Sarajane Marques Peres, and Clodis Boscarioli. Introdução à mineração de dados: com aplicações em R. Elsevier Brasil, 2017.
- Braga, Luis Paulo Vieira. Introdução à Mineração de Dados – 2a edição: Edição ampliada e revisada. Editora Epapers, 2005.
- Amaral, Fernando. Introdução à Ciência de Dados: mineração de dados e big data. Alta Books Editora, 2016.
- Barber, David. Bayesian reasoning and machine learning. Cambridge University Press, 2012.
- O curso também será baseado em artigos das principais conferências e periódicos da área.