Banco de Dados; Tipos de dados e fontes (estruturados, semiestruturados e não estruturados).
Modelagem de dados; Normalização vs. desnormalização.
Data Warehouse (armazém de dados) vs. Data Lake (lago de dados) vs. Lakehouse (arquitetura lakehouse). Etapas do ciclo de vida dos dados: coleta, limpeza, análise, modelagem e comunicação.
Big Data: arquiteturas distribuídas, processamento em lote vs. fluxo contínuo (streaming), compensações de consistência e disponibilidade, teorema CAP. (Parte 1)
Big Data: arquiteturas distribuídas, processamento em lote vs. fluxo contínuo (streaming), compensações de consistência e disponibilidade, teorema CAP. (Parte 2)
Modelagem de dados: NoSQL.
IA Explicável (XAI). Métodos de interpretabilidade global e local. SHAP, LIME. Ética e governança em dados: viés algorítmico, transparência, explicabilidade, equidade (fairness).
Fundamentos de Aprendizado de Máquina (Machine Learning): aprendizado supervisionado e não supervisionado.
Machine Learning. Classificação, regressão e clustering. Validação cruzada e seleção de modelos. Ajuste de hiperparâmetros e regularização. Compensações viés-variância (bias-variance), sobreajuste (overfitting) e subajuste (underfitting), técnicas de regularização.
Algoritmos de Aprendizado Supervisionado
Algoritmos de Aprendizado Não Supervisionado
Deep Learning. Redes neurais artificiais, CNNs e RNNs. Aplicações em processamento de imagem e texto. Transfer learning e fine-tuning.
Tratamento e Qualidade de Dados. Imputação, remoção de outliers e normalização. Balanceamento de classes e aumento de dados (data augmentation). Métricas de qualidade de dados.
Avaliação de modelos: métricas para classificação e regressão, validação cruzada, interpretação de resultados, análise de erros.
Séries Temporais e Previsão. Modelos ARIMA e LSTM. Decomposição em tendência e sazonalidade. Detecção de anomalias temporais.
Visualização e Comunicação. Dashboards e storytelling com dados. Métricas e indicadores de desempenho.
Pipelines de Machine Learning: arquitetura ponta a ponta (end-to-end), engenharia de características (feature engineering), estratégias de implantação (deployment), monitoramento de modelos em produção, data drift e concept drift (deriva de dados e deriva de conceito
Conformidade com a LGPD e princípios éticos no uso de dados e IA.