Configurando Oozie Workflows

Como um mecanismo de fluxo de trabalho, Oozie permite executar um conjunto de aplicações Hadoop em uma sequência especificada conhecido como fluxo de trabalho. Você pode configurar fluxos de trabalho Oozie em uma de três maneiras, dependendo de suas circunstâncias particulares. Você pode usar

  • O arquivo config-default.xml: Define os parâmetros que não mudam para o fluxo de trabalho.

  • o arquivo job.properties: Define os parâmetros que são comuns para uma determinada implantação do fluxo de trabalho. Definições aqui substituem aquelas feitas no arquivo config-default.xml.

  • o parâmetros de linha de comando: Define os parâmetros que são específicos para a invocação do fluxo de trabalho. Definições aqui substituem aquelas feitas no arquivo job.properties eo arquivo config-default.xml.

Os detalhes de configuração será diferente, dependendo da ação que eles estão associados. Por exemplo, como você pode ver na ação MapReduce (mapa de ação) na listagem a seguir, você tem muito mais coisas para configurar lá:

... @@ 1 serverName: 8021serverName: 8020 @@ 2 @@ 3 jobConfig.xml...mapreduce.map.classdummies.oozie.FlightMilesMappermapreduce.reduce.classdummies.oozie.FlightMilesReducer mapred.mapoutput.key.classorg.apache.hadoop.io.Textmapred.mapoutput.value.classorg.apache.hadoop.io.IntWritablemapred.output.key.classorg.apache.hadoop.io.Textmapred.output.value.classorg.apache.hadoop.io.IntWritablemapred.input.dir'/ Usr / Dirk / flightdata'mapred.output.dir'/ Usr / Dirk / flightmiles'......

Ao contrário de um sistema de arquivos (fs) ação como a mostrada aqui:

......

menu