Sistema Hadoop Distributed File (HDFS) Federação
A solução para expandir clusters Hadoop indefinidamente é federado NameNode. Antes Hadoop 2 entrou em cena, clusters Hadoop tinha que viver com o fato de que NameNode colocou limites sobre o grau em que eles poderiam escalar. Poucos grupos foram capazes de escala para além de 3.000 ou 4.000 nós.
necessidade de NameNode para manter registros para cada bloco de dados armazenados no cluster acabou por ser o fator mais importante restringir um maior crescimento cluster. Quando você tem muitos blocos, torna-se cada vez mais difícil para o NameNode para dimensionar-se como o cluster do Hadoop escalas fora.
Especificamente, você deve definir HDFS-se para que você tenha várias instâncias NameNode executados em seus próprios, nós mestres dedicados e, em seguida, fazendo com que cada NameNode responsável apenas pelos blocos de arquivos em seu próprio espaço de nome.

A figura mostra padrões de replicação de blocos de dados em HDFS. Você pode ver um cluster Hadoop com dois NameNodes servindo um único cluster. Os nós escravos, todos contêm blocos de ambos os espaços de nomes.
Sobre o autor
Sistema Hadoop Distributed File (HDFS) para grandes projetos de Dados O Hadoop Distributed File System é uma abordagem versátil, resistente, em cluster para o gerenciamento de arquivos em um ambiente de dados grande. HDFS não é o destino final para os arquivos. Pelo contrário, é um serviço de dados que oferece…
Como escolher uma arquitetura de cluster Hadoop Hadoop é projetado para ser implantado em um grande aglomerado de computadores em rede, com nós mestre (que hospedam os serviços que controlam o armazenamento e processamento de Hadoop) e nós escravos (onde os dados são armazenados e…
Entrada Divide em MapReduce do Hadoop A maneira HDFS foi criado, ele quebra arquivos muito grandes em grandes blocos (por exemplo, medindo 128 MB), e armazena três cópias desses blocos em diferentes nós do cluster. HDFS não tem conhecimento do conteúdo desses arquivos.Em fio,…
Mantenha o controle de blocos de dados com NameNode no HDFS O NameNode atua como o catálogo de endereços para Hadoop Distributed File System (HDFS) porque sabe não só que bloqueia fazer backup de arquivos individuais, mas também onde cada um destes blocos e suas réplicas são armazenados. Quando um…
Gerenciamento de arquivos com o arquivo Hadoop Comandos do sistema HDFS é uma das duas principais componentes do Hadoop framework- o outro é o paradigma computacional conhecido como MapReduce. UMA sistema de arquivos distribuídos é um sistema de arquivos que gerencia o armazenamento através de um cluster em…
Nodes Master na Hadoop Clusters Os nós mestre em clusters Hadoop distribuídos sediar os vários serviços de armazenamento e gerenciamento de processamento, descritas nesta lista, para todo o cluster Hadoop. A redundância é fundamental para evitar pontos únicos de falha,…
Networking e clusters Hadoop Como acontece com qualquer sistema distribuído, a rede pode fazer ou quebrar um cluster Hadoop: Não # 147-go barato. # 148- Uma grande quantidade de conversa ocorre entre os nós mestre e nós escravos em um cluster Hadoop que é essencial para…
Replicando blocos de dados no Hadoop Distributed File System Hadoop Distributed File System (HDFS) é projetado para armazenar dados sobre barato, e mais confiável, hardware. Barato tem um anel atraente para ele, mas levanta preocupações sobre a confiabilidade do sistema como um todo, especialmente para…
Nós escravos no Hadoop Distributed File System (HDFS) Em um cluster Hadoop, cada nó de dados (também conhecido como um nó escravo) Executa um processo de fundo chamado DataNode. Este processo de fundo (também conhecido como um demônio) Mantém o controle das fatias de dados que o sistema armazena…
Nós escravos em clusters Hadoop Em um universo Hadoop, nós escravos são onde os dados Hadoop é armazenado e onde o processamento de dados ocorre. Os seguintes serviços permitem que nós escravos para armazenar e processar dados:NodeManager: Coordena os recursos para um nó…
O Hadoop dfsadmin Opções de comando o dfsadmin ferramentas são um conjunto específico de ferramentas projetadas para ajudá-lo a acabar com a informação sobre o seu sistema de arquivos distribuído Hadoop (HDFS). Como um bônus adicional, você pode usá-los para executar algumas…
A Origem e Design do Hadoop Então, o que exatamente é essa coisa com o nome engraçado - Hadoop? Na sua essência, o Hadoop é uma estrutura para o armazenamento de dados em grandes aglomerados de mercadoria hardware - hardware de computador todos os dias que é acessível e…