Os dados estruturados em um ambiente de dados Big

O termo dados estruturados

geralmente refere-se a dados que tem um comprimento definido e formato para big data. Exemplos de dados estruturados incluem números, datas e grupos de palavras e números chamados cordas. A maioria dos especialistas concorda que este tipo de dados é responsável por cerca de 20 por cento dos dados que está lá fora. Dados estruturados são os dados que você provavelmente está acostumado a lidar com. É geralmente armazenados em um banco de dados.

Fontes de dados grande estruturado

Embora isto possa parecer como o negócio como de costume, na realidade, os dados estruturados está assumindo um novo papel no mundo dos grandes dados. A evolução da tecnologia proporciona novas fontes de dados estruturados sendo produzido - muitas vezes em tempo real e em grandes volumes. As fontes de dados são divididos em duas categorias:

  • Por computador ou máquina gerado: dados gerados por máquina em geral, refere-se a dados que é criado por uma máquina, sem intervenção humana.

  • -Humana gerada: Este é um dado que os seres humanos, em interação com computadores, fornecimento.

Alguns especialistas argumentam que uma terceira categoria que existe é um híbrido entre máquina e humano. Aqui, porém, estamos preocupados com as duas primeiras categorias.

dados estruturados gerados por máquina pode incluir o seguinte:

  • dados do sensor: Exemplos incluem rádio etiquetas de identificação de freqüência, medidores inteligentes, dispositivos médicos e dados de Sistema de Posicionamento Global. As empresas estão interessadas no presente para gestão da cadeia de fornecimento e controle de estoque.

  • dados de log web: Quando os servidores, aplicações, redes, e assim por diante operar, eles capturam todos os tipos de dados sobre a sua actividade. Isso pode elevar-se a grandes volumes de dados que podem ser úteis, por exemplo, para tratar dos acordos de nível de serviço ou para prever violações de segurança.

  • Ponto-de-venda de dados: Quando o caixa furtos o código de barras de qualquer produto que você está comprando, todos os dados associados com o produto é gerado.

  • Dados financeiros: Lotes de sistemas financeiros estão agora programmatic- eles são operados com base em regras pré-definidas que automatizam processos. Dados de negociação de ações é um bom exemplo disso. Ele contém dados estruturados, como o símbolo da empresa e valor do dólar. Alguns desses dados é gerada máquina, e alguns é humano gerado.

Os exemplos de dados gerados em humanos estruturadas podem incluir o seguinte:

  • dados de entrada: Este é qualquer peça de dados que uma entrada de força humana para um computador, tais como nome, idade, renda, as respostas da pesquisa não-livre de forma, e assim por diante. Esses dados podem ser úteis para compreender o comportamento básico do cliente.

  • Clique com o fluxo de dados: Os dados são gerados a cada vez que você clicar em um link em um site. Estes dados podem ser analisados ​​para determinar o comportamento do cliente e padrões de compra.

  • dados relacionados ao jogo: Cada movimento que você faz em um jogo pode ser gravado. Isso pode ser útil na compreensão de como os usuários finais se mover através de um portfólio de jogos.

Quando tomados em conjunto com milhões de outros usuários que apresentam a mesma informação, o tamanho é astronômico. Além disso, grande parte destes dados tem um componente de tempo real para que possa ser útil para a compreensão de padrões que têm o potencial de predição de resultados.

A linha inferior é que este tipo de informação pode ser poderoso e pode ser utilizado para vários fins.

O papel dos bancos de dados relacionais em big data

persistência de dados refere-se a uma base de dados como retém versões de si mesma quando modificado. O grande avô de armazenamentos de dados persistentes é o sistema de gerenciamento de banco de dados relacional. Em sua infância, a indústria de computação utilizado o que são agora consideradas técnicas primitivas para a persistência de dados.

O modelo relacional foi inventado por Edgar Codd, cientista da IBM, na década de 1970 e foi usado pela IBM, Oracle, Microsoft e outros. É ainda em uso hoje ampla e desempenha um papel importante na evolução de dados grandes. Entendendo o banco de dados relacional é importante porque outros tipos de bancos de dados são usados ​​com dados grandes.

Em um modelo relacional, os dados são armazenados numa tabela. Esta base de dados que contém um esquema - isto é, uma representação estrutural de que está na base de dados. Por exemplo, em um banco de dados relacional, o esquema define as tabelas, os campos nas tabelas e as relações entre os dois.

Os dados são armazenados em colunas, cada uma para cada atributo específico. Os dados são também armazenados na fila. O primeiro produto tabela armazena informações- o segundo armazena informações demográficas. Cada um tem vários atributos. Cada tabela pode ser atualizado com novos dados, e os dados podem ser apagados, ler e atualizado. Isso é muitas vezes realizado em um modelo relacional usando uma linguagem de consulta estruturada (SQL).

image0.jpg

Outro aspecto do modelo relacional usando SQL é que as tabelas podem ser consultados usando uma chave comum. A chave comum nas mesas é Cliente.

Você pode enviar uma consulta, por exemplo, para determinar o sexo dos clientes que compraram um produto específico. Pode parecer algo como isto:

Selecione Cliente, Estado, Gênero, produtos dos "tabela demográfica", "tabela de produtos", onde Produto = XXYY

menu