Conceitos básicos de Estática e fluxo de dados em Predictive Analyics

Os dados da análise preditiva pode ser identificado como transmitido, estática, ou uma mistura dos dois. dados de streaming mudanças continuously- exemplos incluem o fluxo constante de atualizações do Facebook, tweets no Twitter, e as constantes mudanças dos preços das ações, enquanto o mercado ainda está em aberto.

dados de streaming é continuamente changing- dados estáticos é auto-suficiente e fechado. Os problemas associados com dados estáticos incluem lacunas, outliers ou dados incorretos, todos os quais podem exigir alguma limpeza, preparação e pré-processamento antes de poder utilizar os dados estáticos para uma análise.

Tal como acontece com os dados de streaming, outros problemas podem surgir. O volume pode ser um problema-a enorme quantidade de dados non-stop que chegam constantemente pode ser esmagadora. E quanto mais rápido os dados são em streaming, o mais difícil é para a análise para se recuperar.

Os dois principais modelos de análise de dados em sequência são os seguintes:

  • Examinar apenas os pontos de dados mais recentes e tomar uma decisão sobre o estado do modelo e sua próxima jogada. Esta abordagem é incremental - essencialmente construir uma imagem dos dados que ele chega.

  • Avaliar todo o conjunto de dados, ou um subconjunto do mesmo, para tomar uma decisão cada vez que novos pontos de dados chegam. Esta abordagem é incluído de mais pontos de dados em análise - que constitui o # 147 toda # 148- conjunto de dados muda cada vez que novos dados são adicionados.

Dependendo da natureza do seu negócio e o impacto previsto da decisão, um modelo é preferível sobre o outro.

Alguns domínios de negócios, tais como a análise de questões ambientais, de mercado ou dados de inteligência, prêmio novos dados que chega em tempo real. Todos estes dados devem ser analisados ​​como está sendo transmitido - e interpretada não só corretamente, mas de imediato.

Com base na informação recentemente disponível, o modelo redesenha toda a representação interna do mundo exterior. Se o fizer, fornece-lhe com a base mais up-to-date para uma decisão que você pode precisar de fazer e agir de acordo rapidamente.

Por exemplo, um modelo de análise preditiva pode processar um preço das ações como um feed de dados, mesmo enquanto os dados está mudando rapidamente, analisar os dados no contexto de condições de mercado imediatas existentes em tempo real, e então decidir se a negociar um estoque particular.

Claramente, a análise de dados em sequência difere de análise de dados estáticos. Analisando uma mistura de ambos os tipos de dados podem ser ainda mais desafiador.

menu