Ciência de Dados na Plataforma Knime

Introdução a Ciência de Dados com ênfase em Aprendizado de Máquina utilizando a Plataforma Knime.

Logo_aulas2.png

Inscrição em: https://www.udemy.com/course/draft/1917954/?referralCode=B349FE9E3F21E2D2F5D4

Objetivos: Apresentamos uma introdução a ciência de dados com ênfase em aprendizado de máquina utilizando a plataforma Kinme. Todos os tópicos são abordados de forma teórica e prática.  

Dúvidas durante o curso: você conta com a ajuda de instrutores altamente qualificados: doutores pela UFMG, pesquisadores e analistas em ciência de dados.  

Professor (instrutor): Sérgio M. Dias 

Resultados esperados: ao final do curso o aluno será capaz de identificar cenários de big data, compreender as principais atividades do cientista de dados, conhecerá os tipos de aprendizado de máquina (supervisionado e não supervisionado), a relação entre o produto e o algoritmo, conhecerá ferramentas para aprendizado de máquina e ciência de dados e será capaz de instalar e utilizar a ferramenta knime para preparação de dados e trarefas iniciais de agrupamento e classificação. 

O que aprenderei?:

  • Aprenda a importância da ciência de dados e suas principais aplicações  de forma teórica e prática
  • Conheça as principais ferramentas para ciência de dados
  • Conheça a plataforma knime, reconhecida pelo Gartner como uma das plataformas lideres em ciência de dados e aprendizado de máquina
  • Aprenda na prática diferentes técnicas e etapas do processo de ciência de dados na plataforma knime 
  • Conheça os conceitos e faça práticas na plataforma knime para os seguintes assuntos:
    • Aprendizado de Máquina 
    • Preparação dos dados
    • Técnicas de Agrupamento  
    • Análise Preditiva
    • Tarefa de classificação

Requisitos: Familiaridade com Informática 

Quem é o público-alvo?:

  • Interessados em entrar para o mundo da Ciência de Dados e aprender uma moderna plataforma para ciência de dados e aprendizado de máquina, a plataforma de ciência de dados kinme.

Ementa:

  • 0- Apresentação do curso
  • 1- Introdução a Ciência de Dados
    • Os dados estão em toda parte!
    • Em grande quantidade!
    • Big Data 
    • Valor do big data
    • Como lidar com este “dilúvio” de dados?
    • Cientista de Dados
    • O que os cientistas de dados fazem?
    • Como os cientistas de dados trabalham?
    • Vídeo-aulas
      • Introdução a Ciência de Dados – parte 1
      • Introdução a Ciência de Dados – parte 2
      • Introdução a Ciência de Dados – parte 3
      • Introdução a Ciência de Dados – parte 4
      • Introdução a Ciência de Dados – parte 5
  • 2 Aprendizado de Máquina 
    • O que é aprendizado?
    • Motivação 
    • Tipos de Aprendizado de Máquina 
      • Supervisionado
      • Não-Supervisionado
      • Por Reforço
    • Paradigmas do aprendizado
      • Simbólico
      • Instance-Based
      • Conexionista
      • Genético
      • Estatístico
    • Estrutura básica do processo de AM
    • Extração de Características 
    • Qual a relação entre aprendizado de máquina e ciência de dados?
    • Qual é a relação com a mineração de dados? 
    • Qual o caminho entre o produto e o algoritmo de AM? 
      • Algoritmos e o futuro
  • 3 Ferramentas para Ciências de Dados e Aprendizado de Máquina
    • O que são ferramentas para aprendizado de máquina?
    • Usuários X Ferramentas
    • Uso das ferramentas de aprendizado de máquina
    • Linguagens de programação (Ambiente R e Ambiente Python)
    • Plataformas (KNIME, RapidMiner, SPSS, SAS, Ecossistema Apache e Cluster – nuvem) 
  • 4 Plataforma Knime – uma visão geral
    • Prática – Instalando a plataforma knime
    • Prática – Conhecendo o ambiente
    • Prática – Meu primeiro fluxo (Hello World)
    • Prática – Instalando novas funcionalidades
    • Prática – Explorando workflows de exemplo
    • Portabilidade de modelos
  • 5 Preparação dos dados
    • Um pouco antes! Dados para aprendizado não supervisionado e supervisionado 
    • knowledge-discovery in databases KDD
    • Seleção dos dados
    • Prática – Seleção de uma base de dados e inferências de tipos 
    • Pré-processamento, limpeza dos dados e dados ausentes (missing values)
    • Prática – Tratamento de dados ausentes
    • Dados discrepantes (outliers)
    • Prática – Selecionar atributos e Remover outliers
    • Transformação dos dados
    • Prática – Matriz de correlação
    • Normalização
    • Prática – Normalizar dados
    • Discretização
    • Prática – Discretização de dados
    • Aprendizado de máquina, Interpretação e avaliação, e Conhecimento
  • 6 Técnicas de Agrupamento  
    • Análise de agrupamento
    • Estratégias por partição: O algoritmo k-means – Aula 1
    • Estratégias por partição: O algoritmo k-means – Aula 2
    • Prática – algoritmo k-means
    • Agrupamento por densidade: Algoritmo DBSCAN
    • Prática – algoritmo DBSCAN
    • Estratégias hierárquicas: Os métodos AGNES e DIANA  
    • Prática – agrupamento hierarquico 
  • 7 Análise Preditiva
    • Análise Preditiva: classificação vs regressão
    • Espaço de busca de modelos  
    • Armadilhas da análise preditiva 
    • Dados para construção do modelo
    • Prática: dados para construção do modelo
  • 8 Tarefa de classificação
    • Matriz de confusão, métricas e curva ROC
    • Prática – Matriz de confusão, métricas e curva ROC
    • K-vizinhos mais próximos (KNN)
    • Prática – KNN – parte 1 
    • Prática – KNN – parte 2
    • Árvore de decisão  
    • Prática – Árvore de decisão
    • Classificador Bayesiano
    • Prática – Classificador Bayesiano
    • Support Vector Machine – SVM 
    • Prática – SVM