Bancos de dados relacionais. (Parte 1)
Bancos de dados relacionais. (Parte 2)
SQL (Structured Query Language).
Sistemas gerenciadores de banco de dados: MS SQL Server. Conceitos básicos. Noções de Administração.
Sistemas gerenciadores de banco de dados: PostgreSQL. Conceitos básicos. Noções de Administração.
Técnicas para detecção de problemas e otimização de desempenho do SGBD e de consultas SQL.
Arquitetura e aplicações de data warehousing, ETL. Business Intelligence - processo de coleta, organização, análise e compartilhamento de informações. Conceito de data lake. ETL X ELT. Data Mesh: arquitetura descentralizada para democratização de dados, conceitos de domínios de dados, produtos de dados e governança federada.
Dashboards: painéis e visualização de dados. Self-Service Analytics e BI em Cloud.
Olap. Técnicas de modelagem e otimização de bases de dados multidimensionais.
Banco de dados NoSQL (Key/Value, Orientados a Documentos e Grafos). Redis.
Governança de dados. Conceito e noção básica. Arquitetura de Dados. Qualidade de Dados. Metadados. Data Stewardship. Qualidade de dados. Conceitos e definições. Dimensões da qualidade de dados (visão DMBOK). Principais técnicas em qualidade de dados. Profiling. Matching. Deduplicação. Data cleansing. Enriquecimento. Boas práticas para adoção da qualidade de dados. Processos de qualidade para modelos de dados.
Big Data. Fundamentos. Tipos de dados: estruturados, semiestruturados e não estruturados. Conceito dos cinco Vs. Fluxo de big data: ingestão, processamento e disponibilização. Armazenamento de big data. Pipeline de dados. Processamento distribuído. Soluções de big data.
Arquiteturas de big data. Data Streaming em tempo real: Apache Kafka, processamento de eventos em tempo real. Processamento MapReduce. Spark
Explainable AI (XAI): transparência e interpretabilidade de modelos, técnicas como LIME, SHAP, análise de importância de features e explicabilidade em deep learning. Data Ethics: ética e responsabilidade no uso de dados e IA, viés algorítmico, fairness, privacidade diferencial e governança ética de algoritmos.
Técnicas de classificação. Técnicas de regressão.
Técnicas de agrupamento. Técnicas de redução de dimensionalidade. Técnicas de associação. Sistemas de recomendação.
Deep learning. IA Generativa: conceitos fundamentais, arquiteturas de modelos generativos, aplicações em geração de texto, imagem e código, modelos de difusão, técnicas de treinamento e ajuste fino, riscos e limitações dos sistemas generativos.
Processamento de linguagem natural (PLN). Large Language Models (LLMs), engenharia de prompts
MLOps: práticas para operacionalização de modelos de machine learning, incluindo versionamento de modelos, CI/CD para ML, monitoramento de performance e drift de modelos.
Tratamento de dados. Normalização numérica. Discretização. Tratamento de dados ausentes. Tratamento de outliers e agregações.
Ingestão de dados. Conceito de ingestão de dados. Ingestão de dados estruturados, semiestruturados e não estruturados. Ingestão de dados em lote (batch). Ingestão de dados em streaming. Ingestão de dados full × incremental. Ingestão de dados CDC (change data capture).
Processamento de dados. Conceitos de processamento massivo e paralelo. Processamento em lote (batch). Processamento em tempo real(real time).
Edge Computing: processamento distribuído na borda da rede. Federated Learning: aprendizado de máquina descentralizado.
DataOps: práticas e ferramentas para automação e governança de pipelines de dados, incluindo versionamento de dados, testes automatizados e monitoramento contínuo.
Bancos de Dados em Nuvem: serviços gerenciados como AWS RDS, Azure SQL Database, Google Cloud Spanner, conceitos de escalabilidade automática e alta disponibilidade.
Data Fabric: abordagem para integração e gerenciamento de dados em ambientes híbridos e multi-cloud, incluindo virtualização de dados e catálogos unificados.