Introdução a Ciência de Dados com ênfase em Aprendizado de Máquina utilizando a Plataforma Knime.
Inscrição em: https://www.udemy.com/course/draft/1917954/?referralCode=B349FE9E3F21E2D2F5D4
Objetivos: Apresentamos uma introdução a ciência de dados com ênfase em aprendizado de máquina utilizando a plataforma Kinme. Todos os tópicos são abordados de forma teórica e prática.
Dúvidas durante o curso: você conta com a ajuda de instrutores altamente qualificados: doutores pela UFMG, pesquisadores e analistas em ciência de dados.
Professor (instrutor): Sérgio M. Dias
Resultados esperados: ao final do curso o aluno será capaz de identificar cenários de big data, compreender as principais atividades do cientista de dados, conhecerá os tipos de aprendizado de máquina (supervisionado e não supervisionado), a relação entre o produto e o algoritmo, conhecerá ferramentas para aprendizado de máquina e ciência de dados e será capaz de instalar e utilizar a ferramenta knime para preparação de dados e trarefas iniciais de agrupamento e classificação.
O que aprenderei?:
- Aprenda a importância da ciência de dados e suas principais aplicações de forma teórica e prática
- Conheça as principais ferramentas para ciência de dados
- Conheça a plataforma knime, reconhecida pelo Gartner como uma das plataformas lideres em ciência de dados e aprendizado de máquina
- Aprenda na prática diferentes técnicas e etapas do processo de ciência de dados na plataforma knime
- Conheça os conceitos e faça práticas na plataforma knime para os seguintes assuntos:
- Aprendizado de Máquina
- Preparação dos dados
- Técnicas de Agrupamento
- Análise Preditiva
- Tarefa de classificação
Requisitos: Familiaridade com Informática
Quem é o público-alvo?:
- Interessados em entrar para o mundo da Ciência de Dados e aprender uma moderna plataforma para ciência de dados e aprendizado de máquina, a plataforma de ciência de dados kinme.
Ementa:
- 0- Apresentação do curso
- 1- Introdução a Ciência de Dados
- Os dados estão em toda parte!
- Em grande quantidade!
- Big Data
- Valor do big data
- Como lidar com este “dilúvio” de dados?
- Cientista de Dados
- O que os cientistas de dados fazem?
- Como os cientistas de dados trabalham?
-
- Vídeo-aulas
- Introdução a Ciência de Dados – parte 1
- Introdução a Ciência de Dados – parte 2
- Introdução a Ciência de Dados – parte 3
- Introdução a Ciência de Dados – parte 4
- Introdução a Ciência de Dados – parte 5
- Vídeo-aulas
- 2– Aprendizado de Máquina
- O que é aprendizado?
- Motivação
- Tipos de Aprendizado de Máquina
- Supervisionado
- Não-Supervisionado
- Por Reforço
- Paradigmas do aprendizado
- Simbólico
- Instance-Based
- Conexionista
- Genético
- Estatístico
- Estrutura básica do processo de AM
- Extração de Características
- Qual a relação entre aprendizado de máquina e ciência de dados?
- Qual é a relação com a mineração de dados?
- Qual o caminho entre o produto e o algoritmo de AM?
- Algoritmos e o futuro
- 3– Ferramentas para Ciências de Dados e Aprendizado de Máquina
- O que são ferramentas para aprendizado de máquina?
- Usuários X Ferramentas
- Uso das ferramentas de aprendizado de máquina
- Linguagens de programação (Ambiente R e Ambiente Python)
- Plataformas (KNIME, RapidMiner, SPSS, SAS, Ecossistema Apache e Cluster – nuvem)
- 4– Plataforma Knime – uma visão geral
- Prática – Instalando a plataforma knime
- Prática – Conhecendo o ambiente
- Prática – Meu primeiro fluxo (Hello World)
- Prática – Instalando novas funcionalidades
- Prática – Explorando workflows de exemplo
- Portabilidade de modelos
- 5– Preparação dos dados
- Um pouco antes! Dados para aprendizado não supervisionado e supervisionado
- knowledge-discovery in databases KDD
- Seleção dos dados
- Prática – Seleção de uma base de dados e inferências de tipos
- Pré-processamento, limpeza dos dados e dados ausentes (missing values)
- Prática – Tratamento de dados ausentes
- Dados discrepantes (outliers)
- Prática – Selecionar atributos e Remover outliers
- Transformação dos dados
- Prática – Matriz de correlação
- Normalização
- Prática – Normalizar dados
- Discretização
- Prática – Discretização de dados
- Aprendizado de máquina, Interpretação e avaliação, e Conhecimento
- 6– Técnicas de Agrupamento
- Análise de agrupamento
- Estratégias por partição: O algoritmo k-means – Aula 1
- Estratégias por partição: O algoritmo k-means – Aula 2
- Prática – algoritmo k-means
- Agrupamento por densidade: Algoritmo DBSCAN
- Prática – algoritmo DBSCAN
- Estratégias hierárquicas: Os métodos AGNES e DIANA
- Prática – agrupamento hierarquico
- 7– Análise Preditiva
- Análise Preditiva: classificação vs regressão
- Espaço de busca de modelos
- Armadilhas da análise preditiva
- Dados para construção do modelo
- Prática: dados para construção do modelo
- 8– Tarefa de classificação
- Matriz de confusão, métricas e curva ROC
- Prática – Matriz de confusão, métricas e curva ROC
- K-vizinhos mais próximos (KNN)
- Prática – KNN – parte 1
- Prática – KNN – parte 2
- Árvore de decisão
- Prática – Árvore de decisão
- Classificador Bayesiano
- Prática – Classificador Bayesiano
- Support Vector Machine – SVM
- Prática – SVM