Big Data & Analytics

Os três V's do Big Data

Volume, Variedade & Velocidade: O que diferencia uma solução Big Data

Volume
Grandes quantidades de dados são geradas a cada segundo, de modo que uma infraestrutura reformulada, distribuída e escalável possa sustentar a solução de armazenamento e acesso adequada.
Velocidade
Dados que são gerados numa dinâmica onde a computação tradicional demanda uma arquitetura distribuída para atingir a velocidade necessária de processamento e uso destas informações.
Variedade
Diferentes tipos e origens de dados estruturados ou não, como mensagens, imagens, dados de sensores, vídeos e gravações de voz, acessíveis de uma maneira unificada e consolidada, permitindo a criação de aplicações práticas.

O melhor do open-source gerenciado

Ferramentas disponibilizadas no modelo self-service

Spark

O Spark provê todo o poder distribuído para análises avançadas que fazem uso da memória para processamento em tempo de execução.

Soluções com grande volumes de dados como aplicações IoT ou mesmo onde há movimentação de dados intensa durante a análise se beneficiam da arquitetura In-Memory com processamento em cache.

Com otimizações específicas para análises baseadas em Graph e aprendizado de máquina, as soluções podem ser desenvolvidas utilizando Python, Scala ou mesmo SQL, integrando-se com ferramentas familiares de inteligência de negócio.

Hadoop

O Hadoop armazena e processa quantidades de dados massivas, estruturadas ou não, que variam desde de mídias sociais, e-mails, log, ou até mesmo leituras de sensores IoT e outros dispositivos. Através deste grande volume de dados, programas são escritos para computar os dados de modo distribuído, usufruindo eficientemente das características computacionais de larga escala da nuvem.

O uso do Hadoop no Azure é oferecido através do HDInsight e implementa e distribuição de mais um dos softwares providos pela organização open source Apache, que ajudar a definir os pilares de arquitetura de software no mundo todo. Através do uso do Data Lake na azure, a integração com o Excel e outras ferramentas de Dashboard da Microsoft, como o Power BI é realizada de modo transparente.