Bancos de Dados e Data Mining

Os dados recolhidos por grandes organizações no âmbito da sua actividade diária é normalmente armazenado em bancos de dados. Mas os administradores de banco de dados podem não estar dispostos a permitir que os mineiros dos dados acesso direto a essas fontes de dados, e acesso directo pode não ser a melhor opção a partir do seu ponto de vista também. acesso directo ao operacionais (usado para operações de rotina) bancos de dados pode ser uma má idéia, porque

  • mineiros de dados usam uma grande quantidade de dados. Você poderia acidentalmente ocupar recursos e interferir com as operações de negócios comuns.

  • obrigações de negócios legais e outros importa. Você poderia não violar uma lei de privacidade de dados ou outro requisito de gerenciamento de dados se o seu acesso a dados não está devidamente controlado.

  • bancos de dados operacionais não estão organizados para mineração de dados. Você pode passar muito tempo lutando para obter os dados que você precisa, e ainda não ter a certeza de acertar.

Quando você precisar de dados de um banco de dados operacional (e você tem a aprovação apropriado usar os dados), você deve discutir as suas necessidades com o administrador responsável por esses dados. Você precisará explicar exatamente o que os dados que você precisa, o formato que você precisa para mineração de dados, e se você precisa os dados apenas uma vez ou em uma base contínua.

A melhor abordagem para os pedidos de uma só vez é muitas vezes para o administrador para extrair os dados para você e entregá-lo em um arquivo de texto ou outro formato aceitável.

acesso a dados em curso é outra questão. O administrador não pode querer fornecer extractos de dados mais e mais, e dando-lhe acesso directo aos sistemas de negócio é arriscado. Uma solução comum é o de criar um banco de dados analítico. Este é um banco de dados relacional comum, que é separado do sistemas de negócios convencionais. Dados são rotineiramente (e automaticamente) transferidos de sistemas de negócios para o banco de dados analítico, e os mineiros de dados pode acessá-lo a qualquer momento.

Se você usar um banco de dados analítico, certifique-se de que ele está organizado adequadamente para apoiar a mineração de dados. Ajude o seu administrador de banco de dados por esboçar um diagrama como o mostrado para demonstrar como os dados devem ser organizados.

image0.jpg

Se o administrador de banco de dados insiste que os dados não podem ser armazenados dessa maneira, pergunte se é possível criar um Visão (Uma consulta armazenada que pode ser consultado como se fosse uma tabela de dados convencional) com a organização que você precisa.

Muitos produtos de mineração de dados é capaz de ler dados a partir de bancos de dados. Os passos necessários variar de acordo com o

  • Design do aplicativo de mineração de dados

  • Estrutura do banco de dados de fonte

  • Middleware, geralmente chamado de condutor (driver ODBC, JDBC driver), Um software especial que medeia entre o software de banco de dados e aplicações

Documentação para a sua aplicação de mineração de dados deve dizer-lhe se ele pode ler dados de um banco de dados, e em caso afirmativo, qual ferramenta ou função para usar, e como. O administrador que configura o banco de dados de análise pode fornecer detalhes sobre como acessar o banco de dados.

Se você já está confortável trabalhando com bancos de dados e outras aplicações, você vai encontrar nada de surpreendente sobre fazer as mesmas coisas com um aplicativo de mineração de dados. Se os bancos de dados são novidade para você, obter uma pessoa com conhecimento da sua organização para orientá-lo através do processo com sua própria aplicação de banco de dados e mineração de dados.

menu