4 Dado, informação, conhecimento e inteligência. Dados estruturados e não estruturados. Dados abertos. Coleta, tratamento, armazenamento, integração e recuperação de dados
MODELAGEM DE DADOS: 2 Linguagem de implementação banco de dados: banco físico, lógico e conceitual.
1 Modelo entidade‐relacionamento. 3 Modelagem conceitual de dados. 3.1 Entidades. 3.2 Atributos. 3.3 Relacionamentos. 3.3.1 Grau dos relacionamentos. 3.3.2 Cardinalidade. 3.3.3 Tipos de relacionamentos. 3.4 Mecanismos avançados de abstração em um modelo conceitual de dados. 3.4.1 Repetição. 3.4.2 Autorrelacionamento. 3.4.3 Generalização e especialização. 3.4.4 Agregação.
4 Modelagem lógica de dados. 4.1 Conceitos em modelagem lógica de dados. 4.2 Normalização. 6 Modelagem de dados. 6.1 Modelo relacional. 5 Banco de dados relacionais. 5.1 Conceitos básicos e características. Metadados. Tabelas, visões (views) e índices. Chaves e relacionamentos.
6 Construção e otimização de consultas em SQL
5 Gestão e operação de bancos de dados. 6 Sistemas de gerenciamento de banco de dados. 7 Oracle 21C
Microsoft SQL Server 2019,
PostgreSQL 13, Enterprise DB (EDB) 13.
5 Data warehouse. 5.1 Modelagem dimensional. 5.3 Conceito e aplicações. 5.4 Fatos e dimensões. 5.5 Operações OLAP. 5.6 Conceitos de data warehouse. 5.7 Técnica de modelagem dimensional e otimização de bases de dados para BI.
BIG DATA: 1 Fundamentos. 2 Tipos de dados: estruturados, semiestruturados e não estruturados. 3 Conceitos dos três Vs. 4 Fluxo de big data: ingestão, processamento e disponibilização. 5 Armazenamento de big data. 6 Pipeline de dados. 7 Processamento distribuído. 8 Conceitos de data lake. 9 ETL X ELT. 10 Soluções de big data. 10.1 Arquitetura do ecossistema Apache Hadoop. 10.2 Componentes Hadoop: HBase, Kudu, Sqoop, Nifi, Hive, Impala, Spark, Spark Streaming, SOLR, Oozie, Yarn, Kafka. 11 Arquiteturas de big data. 11.1 Arquitetura Lambda. 11.2 Arquitetura Kappa. ARMAZENAMENTO DE DADOS: 1 Sistemas de arquivos distribuídos: HDFS. 3 Banco de dados NoSQL orientado a colunas: HBase. 4 Banco de dados NoSQL orientado a grafos: Neo4J.
5 Banco de dados NoSQL orientado a documentos: MongoDB. 6 Sistemas de indexação: ElasticSearch.
PROCESSAMENTO DE DADOS: 1 Conceitos de processamento massivo e paralelo. 2 Processamento em lote (batch). 3 Processamento em tempo real (real time).
INGESTÃO DE DADOS: 1 Conceito de ingestão de dados. 2 Ingestão de dados estruturados, semiestruturados e não estruturados. 3 Ingestão de dados em lote (batch). 4 Ingestão de dados em streaming. 5 Ingestão de dados full × incremental. 6 Ingestão de dados CDC (change data capture).
QUALIDADE DE DADOS: 1 Conceitos e definições sobre qualidade de dados. 2 Dimensões da qualidade de dados (visão DMBOK). 3 Principais técnicas em qualidade de dados. 3.1 Profiling. 3.2 Matching. 3.3 Deduplicação. 3.4 Data cleansing. 3.5 Enriquecimento. 4 Boas Práticas para adoção da qualidade de dados. 5 Processos de qualidade para modelos de dados. 6 Noções básicas de visualização de dados. GOVERNANÇA DE DADOS: 1 Princípios e conceitos da governança de dados. 2 Componentes da governança de dados. 3 Visão geral do guia DAMA‐DMBOK. 3.1 Áreas de conhecimento. 3.2 Elementos ambientais. 3.3 Principais atividades da gestão de dados. 4 Documentos da governança de dados. (Parte 1)
QUALIDADE DE DADOS: 1 Conceitos e definições sobre qualidade de dados. 2 Dimensões da qualidade de dados (visão DMBOK). 3 Principais técnicas em qualidade de dados. 3.1 Profiling. 3.2 Matching. 3.3 Deduplicação. 3.4 Data cleansing. 3.5 Enriquecimento. 4 Boas Práticas para adoção da qualidade de dados. 5 Processos de qualidade para modelos de dados. 6 Noções básicas de visualização de dados. GOVERNANÇA DE DADOS: 1 Princípios e conceitos da governança de dados. 2 Componentes da governança de dados. 3 Visão geral do guia DAMA‐DMBOK. 3.1 Áreas de conhecimento. 3.2 Elementos ambientais. 3.3 Principais atividades da gestão de dados. 4 Documentos da governança de dados. (Parte 2)