10 Hadoop Recursos Digno de um Bookmark

Computadores e Software / Big Data / Gestão de dados

Seguem-se dez recursos Hadoop fantásticos que são dignos de criar um marcador no seu browser. Esses recursos ajudam a criar um plano de aprendizagem ao longo da vida para o Hadoop.

Sistema nervoso central: apache.org
Partilhar este
Universidade hortonworks
Universidade cloudera
Bigdatauniversity.com
Blog planeta big data aggregator
Fórum apache hadoop do quora
O hub ibm big data
Conferências a não perder
Os papéis do google que começou tudo

Sistema nervoso central: Apache.org

o Apache Software Foundation (ASF) é a comunidade central para projetos de software de código aberto. Não apenas qualquer projeto pode ser um projeto Apache - muitos processos baseados em consenso converter um pedaço de software de seus projetos iniciais e código beta (a sua incubadora status) para software de pleno direito, geralmente disponíveis.

A ASF não é apenas onde projetos como o Hadoop são geridos - é onde eles # 147-live e respirar. # 148- Hoje, existem centenas de projetos Apache. Com isto em mente, você deve marcar a A página Apache Hadoop como um de seus recursos de aprendizagem esteio. Este site é importante porque você pode acessar o código fonte lá.

Partilhar este

Twitter não é o lugar para aprender Hadoop per se - afinal, você não pode facilmente dominar a programação MapReduce em aulas que abrangem apenas 140 caracteres. Seja como for, um bom número de grandes gurus de dados estão no Twitter, e expressam opiniões e apontam para recursos que podem torná-lo uma forma mais inteligente de usuário Hadoop.

Uma série de listas de top-influenciador no Twitter tampa paisagem Hadoop e Big Data, e essa é a melhor maneira de encontrar essas personalidades Hadoop e adicioná-los à sua lista Twitter.

Universidade Hortonworks

Universidade Hortonworks oferece treinamento e certificações Hadoop. O site oferece cursos Hadoop construídos para administrador ou desenvolvedor profissionais com a opção de um programa de certificação rigoroso. Hortonworks emprega alguns dos mais profundos e os mais notáveis especialistas Hadoop do mundo, então você tem a garantia de especialização de qualidade por trás do material didático.

Universidade Cloudera

Universidade Cloudera é semelhante em seu modelo de negócios e charter para a Universidade Hortonworks, proporcionando uma série de pistas que vão da tradicional de texto para vídeo de aprendizagem. Cloudera é um dispositivo elétrico proeminente no mundo Hadoop. (Doug Cutting, o # 147-pai # 148- de Hadoop é o seu arquiteto-chefe.) O site oferece um extenso conjunto de cursos, e mais, que são baseados na distribuição Cloudera para Hadoop (CDH).

BigDataUniversity.com

BigDataUniversity.com (Caso não importa quando você digitar a URL no seu navegador) é um recurso fantástico para aprender - você adivinhou - big data. Claro, big data não é apenas Hadoop, assim você vai encontrar mais do que recursos Hadoop neste site. Esta universidade tem mais de 100.000 alunos matriculados e aprender sobre Hadoop e big data todos os dias.

Blog planeta Big Data Aggregator

É ótimo quando o nome de um site lhe diz exatamente o que ele faz - como o planeta Big Blog Dados Agregador: É um agregador de blogs sobre Big Data, o Hadoop, e outros tópicos relacionados no planeta (bem, no Planeta Terra de qualquer maneira).

Ambos os grandes nomes e não-nomes aparecem no site, mas isso é útil: Embora não há, sem dúvida, compromisso com Hadoop pela Cloudera, Hortonworks, IBM, e outros, muitas vezes é refrescante e valioso para começar a exposição aos pensamentos e opiniões de bases, praticantes não-afiliadas por comunidades não ligados a um fornecedor específico em seu roteiro de aprendizagem.

Fórum Apache Hadoop do Quora

o forum Quora Apache Hadoop é a pedra angular para quem quer saber mais sobre o Hadoop, ou cerca de big data, em geral, para essa matéria.

Como em qualquer fórum, a gama de perguntas e respostas que você pode encontrar neste site é estonteante, mas todos eles levá-lo para o que você está procurando: o conhecimento. O site tem ligações com Hadoop e seus componentes individuais - por exemplo, tem fóruns específicos para MapReduce, HDFS, Porco, HBase, e muito mais.

O site também tem associado Hadoop Forums por exemplo, Cloudera e Hortonworks têm grupos de discussão específicos para suas distribuições - um testemunho de quão popular este fórum é.

O Hub IBM Big Data

o Hub IBM Big Data é um excelente lugar para aprender sobre Hadoop e seu ecossistema. Apesar de ser detido e operado pela IBM, o conteúdo deste site não é sempre relacionada com os produtos IBM.

A IBM Big Data Hub fornece qualquer visitante com conhecimento suficiente para matar a sede de ninguém para big data. Você vai encontrar todos os tipos de blogs, vídeos, artigos de analistas, casos de uso, infográficos, apresentações e muito mais. É verdadeiramente um tesouro de grandes recursos de dados.

Conferências a não perder

Há muitas conferências Hadoop e conferências de dados ainda mais grandes - o Summit Hadoop e Strata Hadoop Mundial como as conferências por excelência não deve ser dispensada. Normalmente, um fornecedor de distribuição de co-patrocinadores destas conferências. Por exemplo, Yahoo! e Hortonworks patrocinar a Summit Hadoop, e Cloudera é o co-patrocinador do Strata Hadoop Mundial.

Ambos Strata Hadoop Mundo e da Cúpula Hadoop são a lugares de reunião das mentes mais brilhantes do Hadoop no Business- estas conferências atrair uma grande variedade de profissionais Hadoop-interessadas, incluindo decisores, arquitetos, desenvolvedores, analistas e mais.

Os papéis do Google que começou tudo

O que agora é conhecido como Hadoop tem sua gênese em uma série de artigos escritos por funcionários do Google que foram focadas no problema da indexação da Web.

Enquanto o projeto Apache Nutch (uma tecnologia de código aberto para o rastreamento da Web) foi transformando seu foco em escalar para fora, a fim de índice de volumes maiores de dados da web, o Google publicou um artigo, # 147-O Sistema de Arquivos do Google# 148- (Outubro de 2003), que influenciou muito Doug Cutting e sua co-fundador Nutch, Mike Cafarella. Pouco depois, o Google lançou o seu papel # 147-MapReduce: simplificado Processamento de Dados em grandes aglomerados# 148- (Dezembro de 2004).

Juntos, o conceito de um sistema de arquivos distribuídos e uma estrutura de processamento paralelo em larga escala foram tomadas por corte e Cafarella para desenvolver Apache Hadoop. Claro, cortando comercializado este trabalho, enquanto no Yahoo !, eo resto, como dizem, é história.