Como usar CREATE TABLE do Hive Como Select (CTAS)

No exemplo Hive DML mostrado aqui, a técnica poderosa no Hive conhecido como Como Criar tabela Select, ou CTASé ilustrado. Suas construções permitem que você derivar rapidamente tabelas colmeia de outras tabelas como você construir esquemas poderosas para análise de dados grande.

(UMA) colmeia> CREATE TABLE AS myflightinfo2007> SELECT ano, mês, DepTime, ArrTime, FlightNum, origem, Dest DA FlightInfo2007> WHERE (mês = 7 e DAYOFMONTH = 3) e (Origem = 'JFK' E Dest = 'ORD') -(B) colmeia> SELECT * FROM myFlightInfo2007-OK20077 700 834 5447JFK ORD20077 163318125469JFK ORD20077 190521005492JFK ORD20077 145316244133JFK ORD20077 181019564392JFK ORD20077 643 759 903 JFK ORD20077 939 1108907 JFK ORD20077 13131436915 JFK ORD20077 16171755917 JFK ORD20077 20022139919 JFK ORDTime tomadas: 0,089 segundos, obtida: 10 row (s) colmeia> CREATE TABLE myFlightInfo2008 AS> SELECT ano, mês, DepTime, ArrTime, FlightNum, origem, Dest DA FlightInfo2008> WHERE (mês = 7 e DAYOFMONTH = 3) e (Origem = 'JFK' E Dest = 'ORD') - colmeia > SELECT * FROM myFlightInfo2008-OK20087 930 11035199JFK ORD20087 705 849 5687JFK ORD20087 164519145469JFK ORD20087 134515144392JFK ORD20087 171819071217JFK ORD20087 757 929 1323JFK ORD20087 928 1057907 JFK ORD20087 13581532915 JFK ORD20087 16461846917 JFK ORD20087 21292341919 JFK ORDTime tomadas: 0,186 segundos, obtida: 10 row (s)

No passo a, a construir duas tabelas menores derivados da FlightInfo2007 e FlightInfo2008 selecionando um subconjunto dos campos das tabelas maiores para um dia específico (neste caso, 3 de julho), onde a origem do voo é o aeroporto JFK, em Nova York (JFK) e o destino é o aeroporto O'Hare de Chicago (ORD).

Em seguida, no Passo B você simplesmente despejar o conteúdo destas pequenas mesas para que você possa visualizar os dados.

menu