Requisitos de tempo para Big Data

A principal consideração ao realizar um projecto de dados grande é a quantidade projetada de tempo real e não em tempo real necessária para levar a cabo a sua iniciativa. Big data é muitas vezes sobre fazer coisas que não eram possíveis porque a tecnologia não foi avançado o suficiente ou o custo era proibitivo. A grande mudança acontecendo com big data é a capacidade de alavancar grandes quantidades de dados sem toda a programação complexa exigida no passado.

Muitas organizações estão em um ponto-de inflexão em termos de gestão de grandes volumes de dados complexos. abordagens de Big Data vai ajudar a manter as coisas em equilíbrio para que as empresas não passar por cima da borda como o volume, variedade e velocidade de alterações de dados. As empresas tiveram um tempo difícil gerir quantidades crescentes de dados que precisa ser administrado em altas velocidades.

Organizações tinha que resolver para analisar pequenos subconjuntos de dados que muitas vezes faltava informação crítica para obter uma imagem completa que os dados podem revelar. Como as tecnologias de big data evoluir e se implantado, as empresas serão capazes de analisar mais facilmente os dados e usá-lo para tomar decisões ou tomar ações.

Os aspectos em tempo real de dados grandes podem ser revolucionário quando as empresas precisam para resolver problemas significativos. Qual é o impacto quando uma organização pode lidar com dados que são de streaming em tempo real? Em geral, esta abordagem em tempo real é mais relevante quando a resposta a um problema é sensível ao tempo e de negócios críticos. Isso pode estar relacionado a uma ameaça de algo importante como detectar o desempenho do equipamento hospital ou antecipar um risco potencial intrusão.

A lista a seguir mostra exemplos de quando uma empresa quer aproveitar esses dados em tempo real para ganhar uma vantagem rápida:

  • Monitorando uma excepção com uma nova peça de informação, como a fraude / inteligência

  • Monitoramento feeds de notícias e mídias sociais para determinar eventos que possam impactar os mercados financeiros, tais como a reação do cliente para um novo anúncio do produto

  • A alteração do seu posicionamento de anúncio durante um grande evento desportivo com base em fluxos de Twitter em tempo real

  • Fornecendo um cupom para um cliente com base no que ele comprou no ponto de venda

Às vezes, streaming de dados que entram em muito rápido e não inclui uma ampla variedade de fontes, por vezes, uma grande variedade existente, e, por vezes, é uma combinação dos dois.

A pergunta que você precisa perguntar a si mesmo se você está se movendo em tempo real é a seguinte: Poderia este (problema) ser resolvido com capacidades tradicionais de gestão da informação ou você precisa de recursos mais recentes? É o volume ou a velocidade pura vai sobrecarregar nossos sistemas? Muitas vezes, é uma combinação dos dois.

Então, se você precisar de capacidades em tempo real, quais são os requisitos de infra-estrutura para suportar isso? A lista a seguir destaca algumas coisas que você precisa considerar sobre a capacidade de um sistema para processar dados, processá-lo e analisá-lo em tempo real:

  • Baixa latência: A latência é o valor de intervalo de tempo que permite que um serviço para executar num ambiente. Algumas aplicações requerem menos latência, o que significa que eles precisam para responder em tempo real. Um fluxo em tempo real vai exigir baixa latência. Então, você precisa estar pensando em poder de computação, bem como restrições de rede.

  • escalabilidade: A escalabilidade é a capacidade de manter um determinado nível de desempenho, mesmo sob cargas crescentes.

  • Versatilidade: Thesystem deve suportar ambos os fluxos de dados estruturados e não estruturados.

  • formato nativo: Usar os dados na sua forma nativa. Transformação leva tempo e dinheiro. A capacidade de usar a ideia de processamento complexas interações nos dados que acionam eventos pode ser transformacional.

A necessidade de processar quantidades continuamente crescentes de dados díspares é um dos factores determinantes da adoção de serviços em nuvem. O modelo de nuvem é em grande escala e distribuída.

menu