Particionamento de dados

Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da Informação e Comunicação (TIC), lidar com quantidades enormes de dados tem se tornado algo comum em empresas e instituições públicas. Sobre o conceito de big data, qual é a alternativa correta? R: Trata-se dA descoberta de informação baseada em dados da instituição ou da empresa.

Frameworks de armazenamento semiestruturados

Os bancos de dados não relacionais abrangem inúmeras soluções de armazenamento que não utilizam apenas SQL, sendo representados principalmente por quatro tipos. Quanto a esses tipos, é correto afirmar que:​​​​​​​ R: o modelo de grafos é utilizado principalmente quando há a necessidade de identificar uma conectividade entre os dados.

Frameworks de visualização de dados de big data

Existem diferentes frameworks para o desenvolvimento de visualizações de grandes quantidades de dados, alguns são similares, e outros apresentam características bastante específicas. Qual das seguintes afirmativas apresenta características relacionadas a visualização de big data? R: O Hadoop serve como base para inúmeras aplicações de big data, que podem ser usadas em conjunto com o Zepelin e o Spark Notebook.

Visualização de dados em big data

Algumas vantagens com a adoção da visualização de dados no processo de descoberta do conhecimento em big data podem ser elencadas. Tomando como base o resultado da pesquisa apresentado por Wang et al. (2015), qual seria o principal benefício do uso da visualização de dados? R: Melhoria no processo de tomada de decisão.

Frameworks de Big Data: uma visão geral

Os sistemas distribuídos têm dois desafios principais, o primeiro deles é a possibilidade de falha de um dos equipamentos de hardware que armazena os dados e o segundo tem relação com a análise combinando dados lidos de discos distintos. Marque a opção que representa os dois principais recursos do Hadoop para lidar com esses desafios: R: HDFS e MapReduce

Big Data

Quando grandes volumes de dados são armazenados, eles são replicados em outros servidores, pois cada um deles tem diversos elementos com probabilidade de falha. Tais falhas precisam ser detectadas rapidamente e resolvidas eficientemente, de forma que seja evitada a parada do sistema de arquivos como um todo. Marque a opção que representa os dois processos principais da arquitetura do HDFS, Leia mais >>>>

Big Data – Particionamento de dados

O particionamento horizontal é amplamente utilizado por sistemas que suportam big data, como alguns bancos de dados NoSQL. Qual seria o método de particionamento mais adequado para uma aplicação que precisa de um desempenho excelente em consultas por intervalo a conjuntos de dados , que devem ser consultados a partir de uma ordem global? R: Range

Big Data – Introdução a ciência de dados

O machine learning pode ser usado como uma tecnologia para identificar transações que podem ser fraudulentas. Uma instituição que faz operações de crédito precisa analisar se um novo cliente tem potencial de tornar-se inadimplente; assim, utiliza-se de uma base que contém dados de transações bancárias de 5 mil clientes dos últimos cinco anos, em que há a informação completa de Leia mais >>>>