GESTÃO DA INFORMAÇÃO: Fundamentos: finalidades, níveis de abstração, modelagem de dados, modelagem funcional. Administração de dados: fundamentos, dado, informação, conhecimento e inteligência;
Bancos de dados; modelos de dados; níveis de abstração de modelos de dados; metadados;
Modelagem, integridade e consultas.
SQL. Linguagens de definição e de manipulação de dados. (Parte 1)
SQL. Linguagens de definição e de manipulação de dados. (Parte 2)
Administração de banco de dados: fundamentos, sistemas de gerenciamento de banco de dados, organização de arquivos, técnicas de armazenamento, métodos de acesso, tipos de bancos de dados, projeto de bancos de dados.
Soluções de suporte à decisão: data warehouse, business intelligence (BI). ETL/ELT e pipelines de dados.
CIÊNCIA DE DADOS: Aprendizado de Máquina. Aprendizado supervisionado: regressão e classificação. Overfitting e underfitting de modelos. Regularização. Seleção de modelos: erro de generalização. Validação cruzada. Conjuntos de treino, validação e teste. Trade off entre variância e viés. Conceitos de otimização de hiperparâmetros.
Algoritmos: regressão linear e regressão logística. Árvores de decisão e random forests. Máquina de suporte de vetores. Naive Bayes. K-NN. Ensembles.
Aprendizado não supervisionado. Redução de dimensionalidade: PCA. Agrupamento K-means. Mistura de gaussianas. Agrupamento hierárquico. Regras de associação.
Redes neurais artificiais. Noções de redes neurais artificiais: definições e arquitetura. Funções de ativação. Otimização de redes neurais artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, vanishing gradients. Métodos de regularização: penalização com normas L1 e L2, dropout e early stopping. Noções de redes neurais convolucionais. Noções de redes neurais recorrentes.
Manipulação, tratamento e visualização de dados. Técnicas de visualização de dados. Lidando com valores faltantes. Lidando com dados categóricos. Normalização numérica. Detecção e tratamento de outliers.
Aprendizado supervisionado com Python scikit-learn. Aprendizado não supervisionado com Python scikit-learn. Redes neurais com Python: treino de modelos com Keras e Pytorch. Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes.