Artigo

Prova da Semana – Comentário da prova da TCE-PE – Auditor de Contas/Obras Públicas – Análise de Informações

Concurso TCE PE

Vamos comentar a prova de Análise de Informações do Tribunal de Contas do Estado de Pernambuco para os cargos de Auditor de Obras Públicas e Auditor de Contas Públicas. Qualquer dúvida estou as ordens! Antes de lerem os comentário, lembre-se de curtir minha página do Facebook® e me seguir no Instagram®. ?

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor de Obras Públicas Questão: 116

Acerca de aspectos diversos referentes a bancos de dados relacionais julgue o item a seguir.

[116] A chave estrangeira (foreign key) é o campo que estabelece o relacionamento entre duas tabelas de bancos distintos, sendo necessariamente chave primária na tabela de um dos bancos.

Comentário: Essa questão tem uma pegadinha que pode ter levado muita gente a marcar a questão como correta. Ela fala que a chave estrangeira relaciona tabelas de banco distintos. Se você lembrar um banco de dados é descrito por um esquema que possui uma coleção de tabelas. A chave estrangeira é utilizada para relacionar tabelas dentro do próprio banco ou esquema. Sendo assim, acredito que a alternativa esteja incorreta.

Gabarito Preliminar: E. Gabarito Oficial: E.

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor de Obras Públicas Questão: 117

A respeito da modelagem dimensional, julgue os próximos itens.

[117]. Todas as tabelas de um modelo apresentam um elemento de tempo como parte da estrutura da chave.

Comentário: Essa questão nós falamos sobre ela em vários momentos do nosso curso. É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos. Contudo, é importante perceber que a dimensão tempo é apenas uma das tabelas dimensões do seu modelo. A chave primária da dimensão tempo é referenciada por uma chave estrangeira na tabela fato. Sendo assim, a alternativa está incorreta, pois, apenas a tabela de dimensão tempo e a tabela fato possuem elementos de tempo como parte da sua estrutura.

Gabarito Preliminar: E. Gabarito Oficial: C. (Acho que cabe recurso)

Fontes/referências para o recurso:

O Kimball definiu algumas regras de ouro para construção de um DW. A regra 3 trata especificamente da dimensão tempo.

No site, http://www.ambientelivre.com.br/tutoriais-pentaho-bi/kimball-university-as-10-regras-essenciais-para-a-modelagem-de-dados-dimensional.html, que detalha as regras e as traduz temos que:

“Regra #3: Tenha certeza de que cada tabela fato tenha uma dimensão de data associada.

Os eventos mensuráveis descritos na Regra #2 sempre tem uma data de algum tipo associada a eles, sejam eles um balancete mensal ou uma transferência de dinheiro registrada em seu centésimo de segundo. Cada tabela fato deve ter ao menos uma chave estrangeira associada a uma tabela de dimensão data, cuja granularidade é cada único dia, com os atributos de calendário e suas características não padronizadas relacionadas a data do evento, como o período fiscal ou um indicador corporativo de feriado. Às vezes múltiplas chaves estrangeiras de data estão ligadas em uma única tabela fato.”

Observem que a tabela fato está associada a dimensão tempo ou data. E essa dimensão, se estivermos tratando de um modelo estrela, é apenas uma das tabelas do esquema.

Vejamos outro site: https://litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/. Nele, mais uma vez, temos a Regra  3 que afirma que Todo Fato ou toda tabela fato deve ter uma Dimensão de Tempo associada.

A medição dos eventos, descritos na regra anterior, sempre tem uma data ‘carimbada’ ou alguma variedade a eles associados, podendo ser o balance mensal, ou os valores capturados por minute, etc. Todo Fato deve ter, pelo menos, uma chave estrangeira de associação a uma Dimensão de Tempo (datas), cuja granularidade seja um único dia com os atributos do calendário  e características não padronizadas sobre a data da medida do evento, como, por exemplo, ano fiscal, feriados, etc. É comum termos várias datas associadas a um fato.”

Percebam que a o tempo aparece apenas na tabela fato e na sua respectiva dimensão. Isso já foi assunto, inclusive, de provas anteriores do próprio CESPE, vejamos:

Ano: 2012 Banca: CESPE Órgão: TCE-ES Prova: Auditor de Controle Externo

Acerca de data warehousing e OLAP, julgue os itens seguintes.

[1] Na modelagem multidimensional da tabela fato, a chave da dimensão tempo deve ser sempre representada como parte da chave primária.

A questão acima está correta. Veja a presença da dimensão tempo e a sua chave primária na composição da chave da tabela fato.

Outro exemplo aparece na prova deste ano, vejamos:

Ano: 2017 Banca: CESPE Órgão: SEDF Prova: Analista de Gestão Educacional – Tecnologia da Informação

Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue o seguinte item.

[1] Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.

Mais uma vez, a alternativa está correta, mas o texto afirma explicitamente que a dimensão tempo fará parte da tabela fato.

Sendo assim podemos confirmar que a alternativa está incorreta. Faltou explicitar a Tabela fato! Sugiro que você organize os recursos baseados nestas referências. Se você procurar qualquer outro texto na internet vai encontrar o mesmo contexto. Você pode usar o google.book (livros) ou google.schollar (artigos) para encontrar outras fontes que podem deixar seu recurso mais robusto! Qualquer dúvida estou às ordens!

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor de Obras Públicas Questão: 118

A respeito da modelagem dimensional, julgue os próximos itens.

[118]. No modelo floco de neve (snow flake) todas a tabelas estão relacionadas diretamente com a tabela de fatos, e as tabelas dimensionais devem conter todas as descrições necessárias para definir uma classe neles mesmas.

Comentário: Essa alternativa nós falamos sobre ela na revisão de ontem. O modelo floco de neve possui pelo menos uma dimensão normalizada, ou seja, ao menos uma tabela não está ligada diretamente a tabela fato. Sendo assim, temos mais uma alternativa incorreta.

Gabarito Preliminar: E. Gabarito Oficial: E.

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor de Obras Públicas Questão: 119

Julgue o item que se refere a CRISP-DM (Cross Industry Standard Process for Data Mining).

[119] Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.

Comentário: Essa para mim foi a questão mais difícil da prova. Primeiramente você teria que se lembrar das fases do CRISP, a primeira fase é o entendimento do negócio e a segunda entendimento dos dados. Vejamos o que cada uma tem como objetivo:

Entendimento do negócio: deve determinar os objetivos de negócio, fazer uma análise da situação atual e estabelecer os objetivos da mineração de dados. Finalizando com um plano de projeto.

Entendimento dos dados: Nesta etapa vamos entender os dados baseados nos requisitos. Nesta etapa podemos incluir uma coleta de dados, descrição, exploração e verificação da qualidade dos mesmos. Nesta etapa temos uma característica peculiar: identificar se as variáveis do modelo são independente umas das outras. Quando as variáveis são independentes podemos concluir que elas não possuem informações sobrepostas. Em econometria ou analise matemática podemos pensar em variáveis que são linearmente independentes. Uma escolha cuidadosa de variáveis independentes pode fazer com que a execução dos algoritmos seja feita de forma mais eficiente.

Enfim, depois desta longa explicação teórica, podemos perceber que o examinador associou eventos de etapas diferentes dos CRISP a fase de entendimento do negócio. Logo, a alternativa está incorreta.

Gabarito Preliminar: E. Gabarito Oficial: E.

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor de Obras Públicas Questão: 120

Com relação a Big Data, julgue o item subsequente.

[120] Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, velocidade e a variedade dos dados estruturados – dos quais se conhece a estrutura de armazenamento – bem como dos não estruturado, como imagens, vídeos, áudios e documentos.

Comentário: Big Data é o termo que descreve o imenso volume de dados – estruturados e não estruturados – que impactam os negócios no dia a dia. A definição da questão está perfeitamente de acordo com o conceito, citando inclusive os 3Vs da definição inicial de Doug Laney. Sendo assim, a resposta para esta alternativa está correta.

Gabarito Preliminar: C. Gabarito Oficial: C.

Até aqui resolvemos as questões da prova de Auditor de Obras Públicas. Para o cargo de Auditor de Contas Públicas tivemos mais uma questão além destas.

  1. Ano: 2017 Banca: CESPE Órgão: TCE-PE Cargo: Auditor Questão:

Acerca de aspectos diversos referentes a bancos de dados relacionais julgue o item a seguir.

[116] Em uma relação, os nomes das colunas são únicos, as linhas são distintas entre si, e a ordem da disposição das linhas e colunas é irrelevante para o banco de dados.

Comentário:

A questão apresenta o conceito de relação. Para o modelo relacional não é relevante a ordem na qual as linhas estão armazenadas, contudo existe uma certa relevância na forma como  define as colunas de uma tabela. Pense da seguinte forma, você tem uma tabela do Excel impressa. Num primeiro momento você faz um corte vertical das colunas das tabela. Perceba que, se você remontar a tabela mudando a ordem das colunas você manterá as informações consistentes. De forma análoga, se você fizer cortes horizontais na tabela, você também consegue manter as mesmas informações. Esse é o arcabouço teórico do modelo relacional. Contudo existem alguns pontos que precisam ser considerados.

  1. Quando você define uma relação, você vai estabelecer um conjunto de atributos, esses atributos são ordenados dentro em uma n-tupla. Algo mais ou menos assim: Aluno (Nome, Endereço, Telefone, Formação, Cpf). Aluno seria a relação e os termos entre parênteses referem-se aos atributos. Nesta situação, quando olhamos para um instância da relação aluno, os valores associados a cada registro ou linha devem estar alinhados com os respectivos atributos. Desta forma, podemos observar que a ordem dos atributos começa a ganhar relevância.
  2. Agora vamos para o próximo passo e pensar em um Sistema de Gerenciamento de Banco de Dados. Do ponto de vista prático, pode existir a necessidade de definir fisicamente, tanto a ordem das linhas quanto a ordem das colunas. Neste ponto temos uma diferença entre o modelo relacional. Quando tratamos das tuplas de uma relação, no modelo lógico, estamos nos referindo a um conjunto de dados. E os conjunto não são, em geral, ordenados. Quando partimos para o armazenamento do arquivo no disco, podemos utilizar diversos tipos de organização de arquivos. Essa organização vai determinar se as linhas ou tuplas estão organizadas de forma ordenadas no disco. Vejam que para as linhas a ordem não importa no modelo relacional, mas é relevante para a organização física dos registros.
  3. Falta falarmos das colunas, tanto no modelo relacional (lógico), quanto no modelo físico temos que levar em consideração a ordem da definição das colunas. Um exemplo interessante sobre isso é que, quando surge a necessidade de inserirmos uma nova coluna em uma tabela, fisicamente ela é “encaixada” ao final. Se você pensar no Excel é como se você colocasse a coluna após a última coluna da tabela. Para inserir uma coluna no meio de uma tabela, muitas vezes é necessário apagar a tabela e recriar a mesma. Isso pode exigir um certo trabalho por parte do DBA, em especial, se a tabela tiver dados armazenados.
  4. Finalizando, essa explicação toda foi para justificar a mudança de gabarito, após a interposição de recursos de C para E.

Gabarito Preliminar: C. Gabarito Oficial pós-Recurso: E.

Agora temos o gabarito preliminar, o oficial e uma possibilidade de recurso.

Forte abraço e bons estudos,

Thiago Cavalcanti

Deixe seu comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja os comentários
  • Exatamente! DW é a sigla para data warehouse ou armazém de dados.
    Thiago Rodrigues Cavalcanti em 20/09/17 às 11:37
  • Professor, o que significa a sigla "DW" que você colocou no início de sua explicação da questão 117, na qual cabe recurso? Seria Data Wharehouse? Pode confirmar? comentário postado: "Essa questão nós falamos sobre ela em vários momentos do nosso curso. É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos." Obrigado
    GUSTAVO MIRANDA DE FREITAS em 20/09/17 às 11:26
  • Que loucura! Deixa eu verificar aqui!
    Thiago Rodrigues Cavalcanti em 19/09/17 às 22:13
  • Professor boa noite, o seu comentário para recurso saiu como a questão 118, mas na verdade seria a 117, será que o senhor poderia nos ajudar com essa fundamentação? Obrigada
    Raquel em 19/09/17 às 22:01
  • Estou trabalhando nisto agora!
    Thiago Rodrigues Cavalcanti em 19/09/17 às 20:58
  • Claro que cabe! Estou trabalhando nisso agora. Já já faço comentários com orientações sobre o recurso.
    Thiago Rodrigues Cavalcanti em 19/09/17 às 20:58
  • Boa noite professor Saiu o gabarito preliminar do CESPE, e na questão 117 eles estão dando como certa, ao contrário da sua análise extra oficial. Cabe recurso?
    Wil em 19/09/17 às 20:13
  • Na questao 117 o gabarito preliminar consta como CERTO no site do CESPE, nao Errado como colocou o professor acima.
    Felipe em 19/09/17 às 19:27
  • Fala Thiago, [116] A chave estrangeira (foreign key) é o campo que estabelece o relacionamento entre duas tabelas de bancos distintos, sendo necessariamente chave primária na tabela de um dos bancos. Essa questão de bancos distintos me deixou com frio na barriga na hora que li, porque na hora da prova, vai saber o que o camarada quiz dizer com isso. No final das contas, tive certeza que a questão estava errada porque ela fala que necessariamente deve ser uma chave primária, quando na verdade uma chave alternativa também pode ser utilizada. Grande abraço
    Leonardo Ribeiro em 19/09/17 às 02:55
  • Pelo que estou vendo, o conteúdo programático do TCE-PE foi bastante relevante
    Dimas em 17/09/17 às 23:52