hive

Kiedy używać Hadoop, HBase, Hive i Pig?

Jakie są korzyści z używania Hadoop lub HBase lub Hive ? Z mojego zrozumienia, HBase unika korzystania z Map-reduce i m ... e HDFS. Hive jest interfejsem podobnym do sql dla Hadoop i HBase. Chciałbym też wiedzieć jak ul porównuje się z świnią .

Jaka jest różnica między partycjonowaniem a bucketowaniem tabeli w ulu?

Wiem, że oba są wykonywane na kolumnie w tabeli, ale jak każda operacja jest inna.

Jak ustawic zmienne w skryptach HIVE

Szukam odpowiednika SQL SET varname = value w Hive QL Wiem, że mogę zrobić coś takiego: SET CURRENT_DATE = '2012-09-16'; SELECT * FROM foo WHERE day >= @CURRENT_DATE Ale wtedy dostaję ten błąd: Znak ' @ ' nie jest tutaj obsługiwany

Różnica między tabelami wewnętrznymi ula a tabelami zewnętrznymi?

Czy ktoś może mi powiedzieć jaka jest różnica między tabelą zewnętrzną ula a tabelą wewnętrzną. Wiem, że różnica przychodzi, ... ne w wewnętrznych i tylko metadane są usuwane w tabelach zewnętrznych. Czy ktoś może mi wyjaśnić w kategoriach węzłów proszę.

Jak mogę wypisać wyniki zapytania HiveQL do pliku CSV?

Chcielibyśmy umieścić wyniki zapytania Hive w pliku CSV. Myślałem, że komenda powinna wyglądać tak: insert overwrite direct ... omyślnie, ale nigdy nie mogę znaleźć pliku. Jak mogę znaleźć ten plik lub powinienem wyodrębniać dane w inny sposób? Dzięki!

Ula klaster według vs kolejność według vs Sortuj według

Z tego co rozumiem; Sortuj tylko Sortuj z reduktorem Uporządkować poukładać rzeczy globalnie ale wszystko wrzucić w je ... źć na tym jest tutaj i z przykładu wydaje się, że zamawia je globalnie. Ale z definicji mam wrażenie, że nie zawsze tak jest.

W jaki sposób impala zapewnia szybszą odpowiedź na zapytania w porównaniu do hive

Ostatnio zacząłem szukać odpytywania dużych zbiorów danych CSV leżących na HDFS za pomocą Hive i Impala. Tak jak się spodziew ... e Impala nie pasuje. Jak Impala zapewnia szybszą odpowiedź na zapytania w porównaniu do Hive dla tych samych danych na HDFS?

Jak usunąć i zaktualizować rekord w ulu

Zainstalowałem Hadoop, Hive, Hive JD BC. które mi pasują. Ale nadal mam problem. Jak usunąć lub zaktualizować pojedynczy reko ... ent where id=1; Usage: delete [FILE|JAR|ARCHIVE] <value> [<value>]* Query returned non-zero code: 1, cause: null

Gdzie Hive przechowuje pliki w HDFS?

Chciałbym wiedzieć, jak znaleźć mapowanie pomiędzy tabelami Hive a rzeczywistymi plikami HDFS (a raczej katalogami), które reprezentują. Muszę mieć bezpośredni dostęp do akt. Gdzie Hive przechowuje swoje pliki w HDFS?

Jak Hive porównuje się do HBase?

Jestem zainteresowany dowiedzeniem się, jak niedawno wydany ( http://mirror.facebook.com/facebook/hive/hadoop-0.17 / ) Hive p ... Interfejs podobny do SQL używany przez Hive jest bardzo korzystniejszy od zaimplementowanego przez nas interfejsu API HBase.

Jak zaktualizować / upuścić partycję Hive?

Po dodaniu partycji do tabeli zewnętrznejw Hive, Jak mogę ją zaktualizować/upuścić?

Jak zrobić tabelę HIVE z danych JSON?

Chcę utworzyć tabelę Hive z niektórych danych JSON (zagnieżdżonych) i uruchomić na niej zapytania? Czy to w ogóle możliwe? ... ł tabelą Hive? Czy ktoś ma jakieś przykładowe polecenie, żeby mnie uruchomić, nie mogę znaleźć nic przydatnego w Google ...

Czy jest jakiś sposób, aby uzyskać nazwę kolumny wraz z wyjściem podczas wykonywania dowolnego zapytania w Hive?

W Hive, kiedy wykonujemy zapytanie (jak: select * from employee), nie otrzymujemy żadnych nazw kolumn w wyjściu (jak nazwa, w ... wartości. Czy Jest jakiś sposób, aby nazwy kolumn były wyświetlane wraz z wyjściem podczas wykonywania dowolnego zapytania?

Zbieraj SET() w ulu, zachowuj duplikaty?

Czy istnieje sposób, aby utrzymać duplikaty w zbiorze w ulu, lub symulować rodzaj zbiorczego zbioru, który Ul zapewnia przy u ... ====================== ad3jkfk Array<int>(4,4,2) fkjh43f Array<int>(1,8,8) rjkhd93 Array<int>(7,4,7)

Jak załadować dane do hive z HDFS bez usuwania pliku źródłowego?

Podczas ładowania danych z HDFS do Hive, używając LOAD DATA INPATH 'hdfs_file' INTO TABLE tablename; Polecenie, wygląda n ... alogu hive/warehouse. Czy to możliwe (jak?), aby skopiować go zamiast przenosić, aby plik mógł być używany przez inny proces.

Explode the Array of Struct in Hive

To jest poniższa tabela Ula CREATE EXTERNAL TABLE IF NOT EXISTS SampleTable ( USER_ID BIGINT, NEW_ITEM ARRAY<STRUCT<P ... .purchased_item.timestamps) myTable2 AS myCol2; Czy ktoś może mi pomóc, co robię źle? Wszelkie sugestie będą mile widziane.

Jak skopiować pliki z S3 do Amazon EMR HDFS?

I ' m running hive over EMR, i trzeba skopiować niektóre pliki do wszystkich instancji EMR. Jednym ze sposobów, jak rozum ... lików do HDFS, jednak nie znalazłem prostego sposobu na skopiowanie Straight z S3 do HDFS. Jaki jest najlepszy sposób na to?

Stół Zewnętrzny Hive Pomiń Pierwszy Wiersz

Używam wersji Cloudera Hive i próbuję stworzyć zewnętrzną tabelę nad plikiem csv, który zawiera nazwy kolumn w pierwszej kolu ... ame 1,"John","Doe" 2,"Jane","Doe" Czy ktoś może mi pomóc w pominięciu pierwszego wiersza lub czy muszę dodać krok pośredni?

Do Ulu uzyskanie najlepszych N rekordów w grupie przez zapytanie

Mam następującą tabelę w ulu User-id, User-name, user-address,clicks,impressions,page-id, page-name Muszę znaleźć top 5 u ... me, user-address] dla każdej strony, ale znajduję go trudno skonstruować zapytanie. Jak możemy to zrobić używając HIve UDF ?

Testy integracyjne Hive jobs

Próbuję napisać nietrywialną pracę Hive 'a używając interfejsów Hive i JDBC i mam problem z ustawieniem porządnego testu JUni ... . Problem, jak stwierdzono, polega na tym, że nie jest to realne rozwiązanie do skutecznego testowania przepływów pracy Hive.