A visualização NoSQL

Armazenar e recuperar grandes quantidades de dados e fazê-lo rápido é grande, e uma vez que você tem seus dados recém-geridos em NoSQL, você pode fazer grandes coisas.

extração de entidade e de enriquecimento

Você pode usar gatilhos de banco de dados, ações de alerta e sistemas externos para analisar dados de origem. Talvez seja principalmente texto livre, mas menciona temas conhecidos. Esses gatilhos e ações de alerta poderia destacar o texto como sendo uma pessoa ou organização, marcação eficazmente o conteúdo em si, eo documento que estabelece dentro.

Um bom exemplo é o conteúdo de um artigo de notícias. Você pode usar uma ferramenta como o Apache Stanbol ou OpenCalais para identificar palavras-chave. Estas ferramentas podem ver # 147-Presidente Putin # 148- e decidir isso se relaciona com uma pessoa chamada Vladimir Putin, que é russo, e é o atual presidente da Federação Russa.

Outros exemplos incluem nomes de doença e dos medicamentos, organizações, temas de conversa, os produtos mencionados, e se um comentário foi positivo ou negativo.

Estes são exemplos de extração de entidade (Que é o processo de extracção automática de tipos de objectos a partir de seus nomes textuais). Ao identificar termos-chave, você pode marcá-los ou envolvê-los em um elemento XML, que o ajuda a pesquisar o conteúdo de forma mais eficaz.

enriquecimento entidade significa adicionar informações com base no texto original, além de identificá-lo. No exemplo Putin, você pode transformar a palavra de texto simples # 147-Putin # 148- em Presidente Putin. Alternativamente, você pode transformar Nº 147, de Londres # 148- em

Londres.

Você pode mostrar esses dados em uma interface de usuário como texto destacado com um link para mais informações sobre cada assunto.

Você pode fornecer enriquecimento usando livre # pesquisa 8208 de texto, alertas, gatilhos de banco de dados, e integrações com software externo, como TEMIS Luxid e SmartLogic.

Pesquisar e alertando

Uma vez que você armazenar suas informações, você pode querer procurá-la. Grátis # search 8208 de texto é simples, mas após a realização de extração de entidade, você tem mais opções. Você pode pesquisar especificamente para uma pessoa chamada # 147-Orange # 148- (como em William de Orange) ao invés de registros de busca que mencionam a laranja prazo - o que, é claro, também é uma cor e uma fruta.

Ao fazê-lo resulta em uma pesquisa mais granular. Ele também permite a navegação facetada. Se você ir para a Amazônia e busca de Harry Potter, você verá categorias para livros, filmes, jogos, e assim por diante. o Categoria de Produto é um exemplo de um faceta, que mostra um aspecto de dados dentro dos resultados de pesquisa - ou seja, os valores mais comuns de cada faceta em todos os resultados de pesquisa, mesmo não aqueles na página atual.

interfaces com o usuário pode suportar explorações ricos em dados (bem como de base Google # buscas 8208-esque). Os usuários também podem utilizá-los para salvar e carregar pesquisas anteriores.

Você pode configurar critérios de pesquisa salvos para que os alertas são ativados quando os registros recém-adicionados corresponder a esse critério. Assim, se um novo recorde chega que corresponda aos seus critérios de pesquisa, uma ação ocorre. Possivelmente # 147-Putin # 148- torna-se # 8197-Putin, ou talvez um e-mail permite que você saiba um novo artigo científico foi publicado.

Nem todos os motores de busca são capazes de fazer com que cada termo da consulta um alerta. Alguns são limitados ao texto outros Fields não pode fazer critérios geoespaciais. Certifique-se o seu pode lidar com os alertas que você precisa configurar.

As funções de agregação

Depois de encontrar informações relevantes, você pode querer cavar mais fundo. Dependendo da fonte, você pode perguntar quantos países têm um PIB de mais de US $ 400 bilhões, ou qual é a idade média de todos os membros da sua árvore genealógica, ou onde é que a maioria das picadas de cobra ocorrem na Austrália. Estes exemplos ilustram como análises são realizadas ao longo de um conjunto de resultados de pesquisa. Estes são contar, dizer cálculos da média, e geoespaciais mapa de calor, respectivamente.

Ser capaz de realizar esses cálculos ao lado dos dados oferece várias vantagens. A primeira vantagem é que você pode usar os índices para acelerar as coisas. Em segundo lugar, esses índices são susceptíveis de ser armazenados na memória, tornando-os ainda mais rápido. Em terceiro lugar, na memória índices são particularmente úteis para um banco de dados NoSQL usando armazenamento Hadoop arquivo System (HDFS). O HDFS não indexação nativa ou em # lojas de coluna 8208-memória para cálculos de agregação de jejum em si mesmo - ele requer um banco de dados NoSQL em cima para fazer isso.

navegação facetada é um exemplo de agregações contagem # 8208 com base em mais de resultados de pesquisa que aparecem em uma interface de usuário. O mesmo é verdadeiro para uma linha do tempo que mostra o número de registros que mencionam um determinado ponto no tempo. Por exemplo, você quer mostrar resultados a partir deste ano, este mês, ou esta hora?

Se você quer esta funcionalidade, certifique-se de seu banco de dados tem a capacidade de calcular agregados de forma eficiente junto aos dados. A maioria dos bancos de dados NoSQL fazer, mas alguns não.

Gráficos e business intelligence

O próximo usuário # ramal 8208 interface óbvia envolve gráficos e visualização de resumos de tabela para informação de gestão ao vivo e análise de business intelligence histórico.

A maioria dos bancos de dados NoSQL proporcionar um fácil # 8208-to # 8208-integrar API REST em sua # 173 bancos de dados. Isto significa que você pode conectar uma série de camadas de aplicações, ou mesmo diretamente conectar aplicações javascript para esses bancos de dados. Uma variedade de bibliotecas excelentes gráficos estão disponíveis para javascript. Você ainda pode usar o R ​​Ecossistema para criar gráficos com base nos dados existentes no esses bancos de dados, depois de instalar um conector de banco de dados apropriado.

Alguns bancos de dados NoSQL ainda fornecer um ODBC ou JDBC de banco de dados relacional plugue # 8208-in. Criando índices dentro de um determinado registro e mostrando-lhes como um # 173-relacional vista é uma maneira elegante para transformar dados não estruturados em um banco de dados NoSQL documento em dados que podem ser analisados ​​com uma ferramenta de inteligência de negócios.

Verifique se o seu fornecedor de banco de dados NoSQL fornece ferramentas de visualização ou tem parceiros de negócios com ferramentas que podem se conectar a esses bancos de dados. Em ferramentas de moda incluem Tableau Server, que é uma empresa moderna partilhada, # Servidor 173-inteligência que suporta a publicação de relatórios interativos sobre os dados em uma variedade de bases de dados, incluindo bancos de dados NoSQL.

menu