rodrigo8025@hotmail.com, Autor em Pequenos Projetos

out 13

Particionamento de dados

Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da Informação e Comunicação (TIC), lidar com quantidades enormes de dados tem se tornado algo comum em empresas e instituições públicas. Sobre o conceito de big data, qual é a alternativa correta? R: Trata-se dA descoberta de informação baseada em dados da instituição ou da empresa.

out 13

Frameworks de armazenamento semiestruturados

Os bancos de dados não relacionais abrangem inúmeras soluções de armazenamento que não utilizam apenas SQL, sendo representados principalmente por quatro tipos. Quanto a esses tipos, é correto afirmar que: R: o modelo de grafos é utilizado principalmente quando há a necessidade de identificar uma conectividade entre os dados.

out 04

Tipos de dados não estruturados e principais usos

Os dados podem ser classificados em estruturados, semiestruturados e não estruturados de acordo com a sua estrutura. Com relação a essas classificações, assinale a alternativa correta. R: Dados estruturados são organizados em blocos semânticos e apresentam atributos fixos.

out 04

Frameworks de visualização de dados de big data

Existem diferentes frameworks para o desenvolvimento de visualizações de grandes quantidades de dados, alguns são similares, e outros apresentam características bastante específicas. Qual das seguintes afirmativas apresenta características relacionadas a visualização de big data? R: O Hadoop serve como base para inúmeras aplicações de big data, que podem ser usadas em conjunto com o Zepelin e o Spark Notebook.

set 30

Visualização de dados em big data

Algumas vantagens com a adoção da visualização de dados no processo de descoberta do conhecimento em big data podem ser elencadas. Tomando como base o resultado da pesquisa apresentado por Wang et al. (2015), qual seria o principal benefício do uso da visualização de dados? R: Melhoria no processo de tomada de decisão.

set 30

Overview de frameworks de stream de big data

O Spark Streaming fornece uma abstração de alto nível para representar um fluxo contínuo de dados. Marque a opção que representa a abstração de alto nível fornecida pelo Spark Streaming R: DStream.

set 30

Frameworks de Big Data: uma visão geral

Os sistemas distribuídos têm dois desafios principais, o primeiro deles é a possibilidade de falha de um dos equipamentos de hardware que armazena os dados e o segundo tem relação com a análise combinando dados lidos de discos distintos. Marque a opção que representa os dois principais recursos do Hadoop para lidar com esses desafios: R: HDFS e MapReduce

set 30

Big Data

Quando grandes volumes de dados são armazenados, eles são replicados em outros servidores, pois cada um deles tem diversos elementos com probabilidade de falha. Tais falhas precisam ser detectadas rapidamente e resolvidas eficientemente, de forma que seja evitada a parada do sistema de arquivos como um todo. Marque a opção que representa os dois processos principais da arquitetura do HDFS, Leia mais >>>>

set 28

Big Data – Particionamento de dados

O particionamento horizontal é amplamente utilizado por sistemas que suportam big data, como alguns bancos de dados NoSQL. Qual seria o método de particionamento mais adequado para uma aplicação que precisa de um desempenho excelente em consultas por intervalo a conjuntos de dados , que devem ser consultados a partir de uma ordem global? R: Range

set 26

Big Data – Introdução a ciência de dados

O machine learning pode ser usado como uma tecnologia para identificar transações que podem ser fraudulentas. Uma instituição que faz operações de crédito precisa analisar se um novo cliente tem potencial de tornar-se inadimplente; assim, utiliza-se de uma base que contém dados de transações bancárias de 5 mil clientes dos últimos cinco anos, em que há a informação completa de Leia mais >>>>