Banco de dados. Modelo entidade-relacionamento. Mapeamento lógico relacional. Normalização. (Parte 1)
Banco de dados. Modelo entidade-relacionamento. Mapeamento lógico relacional. Normalização. (Parte 2)
Linguagem de definição e manipulação de dados (SQL).
Conceitos de data warehousing.
Modelagem multidimensional (esquema estrela).
Big Data; Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. (Parte 1)
Big Data; Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. (Parte 2)
Conceitos de Bancos NoSQL
Armazenamento orientado a objeto (object store).
Noções e formas de aprendizado de máquinas (supervisionado e não supervisionado), inferência por indução e transdução, classificação e regressão, variáveis qualitativas e quantitativas, conceitos de aprendizado supervisionado, parâmetros e hiperparâmetros, avaliação e validação de modelos (hold-out, validação cruzada, bootstrap), afinamento de hiperparâmetros (busca em grade, aleatória e otimização bayesiana), amostragem de dados, trade-off entre viés e variância e modelos paramétricos e não paramétricos
Algoritmos de aprendizado supervisionado (K-Nearest Neighbors, Árvore de Decisão, Máquinas de Vetores de Suporte, Naive Bayes, Regressão Linear e Regressão Logística), algoritmos de aprendizado não supervisionado (agrupamento, incluindo métodos particionais, hierárquicos e probabilísticos), algoritmos de regras de associação (Apriori, ECLAT e FP-Growth) e algoritmos de redução de dimensionalidade.
Redes neurais artificiais, deep learning, perceptron, aprendizado de redes neurais, tipos de redes neurais (como FFNN, convolucionais, recorrentes e LSTM), redes neurais para aprendizado não supervisionado, e inteligência artificial generativa.
Avaliação de desempenho de modelos supervisionados (regressão e classificação), incluindo métricas como erro quadrático médio, erro absoluto médio, coeficiente de determinação, acurácia, precisão, recall, F1-score, especificidade, curva ROC e AUC; avaliação de modelos não supervisionados, com métricas como coeficiente de silhueta, índice de Dunn e índice de Davies–Bouldin; seleção de modelos; e pré-processamento de dados, abrangendo qualidade, limpeza, tratamento de valores ausentes, análise de outliers, integração, transformação, discretização, codificação, compressão, amostragem e enriquecimento de dados.
Pré-processamento de texto, representações de texto, técnicas de processamento de linguagem natural, modelos de linguagem, métricas de similaridade textual, engenharia de prompts, visão computacional, formação e processamento de imagens, detecção de características, operadores morfológicos, transformadas e segmentação de imagens.
Conceitos de Séries temporais e Técnicas de Visualização de Dados
Técnicas de Visualização de Dados
Lógica de Programação [não explícito no edital]
Algoritmos e estrutura de dados. Complexidade de algoritmos e notação assintótica (Big O). (Parte 1)
Algoritmos e estrutura de dados. Complexidade de algoritmos e notação assintótica (Big O). (Parte 2)
Python (Conceitos Básicos)
Aprendizado supervisionado com Python scikit-learn. Aprendizado não supervisionado com Python scikit-learn. Redes neurais com Python: treino de modelos com Keras e Pytorch. Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes.
Conceitos modernos de sistemas de informação. Conceitos Nuvem: IaaS, PaaS e SaaS.
Versionamento com git, pipeline e CI/CD.
Conceitos básicos de DevOps
Conceitos de Containers: construção, registro, execução e orquestração.