Ciência de Dados: Conceitos fundamentais de ciência de dados. Tipos de dados: estruturados, não estruturados, semiestruturados. O ciclo de vida da informação e do processo de Ciência de Dados.
Governança de Dados: conceito, tipos (centralizada, compartilhada e colegiada), papéis e responsabilidades. Engenharia de Dados.
Banco de dados (Conceitos Básicos)
Bancos de Dados Relacionais.
Linguagem SQL: DQL, (Funções de Agregação, Agrupamento, Junção, Ordenação, Restrições e Operações Lógicas.
Arquitetura de Dados: Data Warehouse, Data Mart, Data Lake, Data Lakehouse.
Modelagem Dimensional [Opcional: O tópico não veio explícito no edital, mas pode ser cobrado indiretamente pela banca]
Análise de dados: Agrupamentos, Tendências e Projeções. Data Mining. Pré-processamento de Dados: Técnicas para preparação, limpeza e transformação de dados. Metodologia CRISP. (Parte 1)
Análise de dados: Agrupamentos, Tendências e Projeções. Data Mining. Pré-processamento de Dados: Técnicas para preparação, limpeza e transformação de dados. Metodologia CRISP. (Parte 2)
Bancos de Dados Não Relacionais (NoSQL).
Inteligência Artificial (IA) e Governança e Ética na IA: Transparência, Responsabilidade, Explicabilidade, Privacidade, Segurança, Alucinação, Viés.
Noções de Aprendizado de Máquina (Machine Learning), Aprendizado Profundo (Deep Learning), Modelagem estatística e aprendizado de máquina: aprendizado supervisionado e não supervisionado; processos de treinamento, validação e teste; modelos supervisionados (regressão linear, regressão logística, árvores de decisão, Random Forest, k-vizinhos mais próximos (k-NN), máquinas de vetor de suporte (SVM); modelos não supervisionados (k-means, agrupamento hierárquico, análise de componentes principais (PCA), componentes independentes (ICA), regras de associação); overfitting, underfitting, regularização (Ridge, Lasso), seleção de variáveis e redução de dimensionalidade; identificação de padrões, tendências e anomalias.
Processamento de Linguagem Natural (NLP).
Anonimização, mascaramento e políticas de retenção de dados. Conformidade legal e regulatória (LGPD).
Segurança da Informação e Proteção de Dados: princípios de confidencialidade, integridade, disponibilidade e rastreabilidade. Classificação e controle de acesso a dados.
Visualização e comunicação de resultados;