O dados Paradox Big

Você encontrará uma nuance sobre análise de dados grande. É realmente sobre dados pequenos. Enquanto isto pode parecer confuso e balcão para toda a premissa, pequena de dados é o produto de análise de dados grande. Este não é um conceito novo, nem é desconhecido para as pessoas que têm vindo a fazer a análise de dados por qualquer período de tempo. O espaço de trabalho global é maior, mas as respostas estão em algum lugar no # 147-pequena # 148.;

análise de dados tradicional começou com bancos de dados preenchidos com as informações dos clientes, informações sobre produtos, transações, dados de telemetria, e assim por diante. Mesmo assim, muitos dados estava disponível para analisar de forma eficiente. Sistemas, redes e software não têm o desempenho ou a capacidade para lidar com a escala. Como uma indústria, as deficiências foram abordadas através da criação de conjuntos de dados menores.

Estes conjuntos de dados menores ainda estavam bastante substantiva, outras deficiências foram rapidamente discovered- o mais gritante foi a incompatibilidade entre os dados eo contexto de trabalho. Se você trabalhou em contas a pagar, você tinha que olhar para uma grande quantidade de dados não relacionados a fazer o seu trabalho. Mais uma vez, a indústria respondeu criando menores, conjuntos de dados contextualmente relevantes - grande a pequeno para ainda menor.

Você pode reconhecer este como a migração de bancos de dados para data warehouses para data marts. Mais frequentemente do que não, os dados para os armazéns e os marts foi escolhido em parâmetros arbitrários ou experimentais, resultando em uma grande quantidade de tentativa e erro. As empresas não estavam recebendo as perspectivas de que precisavam ou eram possíveis porque as reduções de capacidade não se baseavam em fatos computacional.

Inserir dados grandes, com todos os seus volumes, velocidades, e variedades, eo problema permanece ou talvez piora. As deficiências da infra-estrutura foram abordados e pode armazenar e processar enormes quantidades de dados adicionais, mas as novas tecnologias são necessárias especificamente para ajudar a gerenciar dados grandes.

Apesar das aparências, isso é uma coisa maravilhosa. Hoje e no futuro, as empresas terão mais dados do que eles podem imaginar e eles terão os meios para capturar e gerenciá-lo. O que é mais necessário do que nunca é a capacidade de analisar o certo dados de forma bastante oportuna para tomar decisões e ações.

As empresas ainda vai encolher os conjuntos de dados em # 147 de combate a guarnição, # 148- mas eles podem fazê-lo computacionalmente. Eles processam os grandes de dados e transformá-lo em dados pequenos de modo que é mais fácil de compreender. É mais preciso e, uma vez que foi derivado a partir de um ponto de partida muito maior, é mais relevante contextualmente.

menu