Mineração de dados

Computadores e Software / Big Data / Engenharia

A característica distintiva sobre a mineração de dados, em comparação com a consulta, relatórios, ou mesmo OLAP, é que você pode obter informações sem ter de fazer perguntas específicas.

A mineração de dados em missões específicas de negócios
A mineração de dados e inteligência artificial
Mineração de dados e estatísticas

A mineração de dados serve dois papéis principais em sua missão de inteligência de negócios:

o # 147 Diga-me o que poderia acontecer # 148- papel: O primeiro papel de mineração de dados é preditiva, em que você basicamente dizer, # 147 Diga-me o que poderia acontecer. # 148- Usando o conhecimento oculto trancado em seu data warehouse, probabilidades e as probabilidades de tendências e ocorrências futuras são desentocada e apresentado a você.
o # 147 Diga-me algo interessante # 148- papel: Além de possíveis eventos e ocorrências futuras, mineração de dados também tenta retirar informações interessantes que você provavelmente deve saber sobre, como uma relação particularmente incomum entre as vendas de dois produtos diferentes e como essa relação varia de acordo com a colocação em suas lojas de varejo.
Embora muitos desses dados interessantes são susceptíveis de existir, que perguntas você gostaria de perguntar se você estivesse usando um consulta ou ferramenta OLAP, e como você interpretar os resultados? A mineração de dados ajuda-lo nesta árdua tarefa de descobrir o que perguntas a fazer, fazendo muito do trabalho pesado para você.

A mineração de dados em missões específicas de negócios

A mineração de dados é particularmente adequado para esses tipos específicos de missões empresariais:

descobrir a fraude
Determinar a eficácia do programa de marketing
A seleção de quem, a partir de uma grande base de clientes ou a população em geral, você deve direcionar como parte de um programa de marketing
Gerenciamento de ciclo de vida do cliente, incluindo a missão de retenção de clientes
Realizando avançada modelagem de processos de negócios e cenários hipotéticos

Pense sobre o que está por trás de cada uma das missões empresariais na lista anterior:

Uma grande quantidade de dados
Uma ainda maior número de combinações de vários elementos de dados
análise de resultados conjunto intensivo, geralmente envolvendo algoritmos complexos e técnicas estatísticas avançadas

Agora, pense no que você teria que fazer se você estivesse usando um relato ou uma ferramenta OLAP para realizar essas missões. Você acharia praticamente impossível executar completamente qualquer uma das missões anteriores se você tivesse que fazer uma pergunta e obter um resultado, fazer outra pergunta e obter outro resultado, e, em seguida, continuar a repetir esses passos.

A mineração de dados e inteligência artificial

Se você já esteve no campo da tecnologia da informação (TI) durante pelo menos uma década, alguns dos termos anteriores pode soar vagamente familiar. Destravando o conhecimento oculto? funcionalidade preditivo? Espere um minuto - que é a inteligência artificial!

Desde os primeiros dias da computação comercial, tem havido um enorme interesse em desenvolver # máquinas 147-thinking # 148- que pode processar grandes quantidades de dados e tomar decisões com base nessa análise.

Interesse em inteligência artificial (AI) atingiu o seu auge em meados dos anos 1980. Naquele tempo, os fornecedores de banco de dados trabalhou na produção de sistemas de gestão de base de conhecimento (KBMSs) - outros fornecedores saiu com shells do sistema de peritos, ou estruturas de desenvolvimento de aplicações baseadas em AI que utilizaram técnicas tais como forward-encadeamento e para trás-encadeamento para informar os utentes sobre redes decisions- e neurais foram posicionados como o próximo grande desenvolvimento AI.

Interesse em AI diminuiu no início de 1990, quando as expectativas excedidas as capacidades disponíveis e outros delírios, como a migração de cliente / servidor e (é claro) data warehousing, tomou o centro do palco.

Agora, AI está de volta!

A técnica de IA mais alto perfil usado em mineração de dados é redes neurais. redes neurais foram originalmente concebido como um modelo de processamento que imitar a forma como o cérebro humano resolve problemas, usando neurônios e processamento altamente paralelo para fazer padrão de problemas.

Aplicação de algoritmos de redes neurais para as áreas de inteligência de negócios que lida com mineração de dados (mais uma vez, preditiva e # Me 147 dizer algo interessante # 148- missões) parece ser um jogo natural.

Embora o / jogo de rede neural de mineração de dados é definitivamente vale a pena conferir em, você deve fazê-lo com cuidado. Você pode encontrar um monte de tecnologias interessantes e emocionantes que, nas mãos de quem não entender os algoritmos, provavelmente vai falhar.

No entanto, com o conhecimento e educação adequada, você pode fazer um compromisso em grande escala para trazer este tipo de transformação em sua estrutura de inteligência de negócios como o emparelhamento-análise técnica para a análise de negócios focada no OLAP.

mineração de dados e estatísticas

A área mais maduro de mineração de dados é a aplicação de técnicas estatísticas avançadas contra os grandes volumes de dados em seu data warehouse. Diferentes ferramentas de usar diferentes tipos de técnicas estatísticas, adaptados às áreas particulares que estão tentando resolver.

Sem uma base estatística, que você pode encontrar muito de mineração de dados confuso. Você precisa fazer um monte de trabalho para treinar os algoritmos e construir as regras para garantir resultados adequados com conjuntos de dados maiores. No entanto, supondo que você está confortável com esse conceito, ou ter um colega que pode ajudar, aqui estão alguns dos algoritmos mais amplamente alavancada:

algoritmos de classificação: Prever uma ou mais variáveis discretas, com base nos outros atributos do conjunto de dados. Usando algoritmos de classificação, a ferramenta de mineração de dados pode olhar para grandes quantidades de dados e, em seguida, informar que, por exemplo, # 147 clientes que estão retidos por pelo menos duas gerações de compras de produtos tendem a ter as seguintes características: Eles têm uma renda de pelo menos US $ 75.000, e possuem suas próprias casas # 148;.
algoritmos de regressão: Prever uma ou mais variáveis contínuas, tais como lucros ou perdas, com base em outros atributos do conjunto de dados. algoritmos de regressão são conduzidos através de informação histórica apresentada para a ferramenta de mineração de dados # 147 ao longo do tempo, # 148- mais conhecido como séries temporais em formação.
algoritmos de segmentação: Dividir os dados em grupos, ou clusters, de artigos que têm propriedades semelhantes.
algoritmos de associação: Encontrar correlações entre diferentes atributos em um conjunto de dados. A aplicação mais comum deste tipo de algoritmo cria regras de associação, que você pode usar em uma análise de cesta de mercado. Note-se que, por exemplo, se um cliente compra um pacote de software específico, ele ou ela tem uma chance de 65 por cento da compra de pelo menos dois produtos específicos add-on pacotes dentro de duas semanas.
algoritmos de análise de sequência: Resuma sequências frequentes ou episódios em dados, como um fluxo de web-path.

Existem muitos mais métodos. A poeira do que o livro de estatísticas de idade e começar a ler.

Mineração de dados

A mineração de dados em missões específicas de negócios

A mineração de dados e inteligência artificial

mineração de dados e estatísticas

Semelhante

menu