name node Vs secondary name node

Hadoop jest spójny i odporny na podział, tzn. należy do kategorii CP teorii CAP.

Hadoop nie jest dostępny, ponieważ wszystkie węzły są zależne od nazwy węzła. Jeśli nazwa węzła spadnie, klaster upadnie.

Ale biorąc pod uwagę fakt, że klaster HDFS ma drugorzędną nazwę węzła, dlaczego cant nazywamy hadoop jako dostępny. Jeśli węzeł o nazwie znajduje się w dół, węzeł o nazwie drugorzędnej może być użyty do zapisu.

Jaka jest główna różnica między nazwą węzeł i nazwa Drugorzędna węzeł, który sprawia, że hadoop jest niedostępny.

Z góry dzięki.

Author: Ravindra babu, 2013-11-14

7 answers

Namenode przechowuje informacje o systemie plików HDFS w pliku o nazwie fsimage. Aktualizacje systemu plików (dodawanie/usuwanie bloków) nie aktualizują pliku fsimage, ale zamiast tego są zalogowane do pliku, więc We / Wy jest szybkie dodawanie tylko strumieniowe w przeciwieństwie do losowych zapisów plików. Podczas restaringu, namenode odczytuje fsimage, a następnie stosuje wszystkie zmiany z pliku dziennika, aby uaktualnić stan systemu plików w pamięci. Ten proces wymaga czasu.

Zadanie secondarynamenode nie polega na być wtórnym do nazwy węzła, ale tylko okresowo czytać dziennik zmian systemu plików i zastosować je do pliku fsimage, doprowadzając go do aktualizacji. Pozwala to na szybsze uruchamianie się namenode następnym razem.

Niestety usługa secondarynamenode nie jest rezerwowym drugorzędnym węzłem nazw, pomimo swojej nazwy. W szczególności, nie oferuje HA dla namenode. Jest to dobrze zilustrowane tutaj .

Zobacz zrozumienie operacji uruchamiania nazw w HDFS.

Zauważ, że nowsze dystrybucje (obecne Hadoop 2.6) wprowadzają namenode High Availability używając NFS (shared storage) i/lub namenode High Availability używając Quorum Journal Manager.

 60
Author: Remus Rusanu,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2015-04-10 09:04:44

Rzeczy zostały zmienione na przestrzeni lat, szczególnie z Hadoop 2.x . Teraz Namenode jest wysoce dostępny z funkcją fail over.

Secondary Namenode jest opcjonalne teraz & Standby Namenode został użyty do przełączania awaryjnego.

Standby NameNode będzie na bieżąco ze wszystkimi zmianami systemu plików wprowadzanymi przez Active NameNode.

HDFS wysoka dostępność jest możliwa dzięki dwóm opcjom: NFS oraz Quorum Journal Manager ale Quorum Journal Manager jest preferowaną opcją.

Zajrzyj do dokumentacji Apache

From Slide 8 from: http://www.slideshare.net/cloudera/hdfs-futures-world2012-widescreen

Gdy jakakolwiek modyfikacja przestrzeni nazw jest wykonywana przez aktywny węzeł, trwale rejestruje zapis modyfikacji do większości tych JNs. Węzeł czuwania odczytuje te zmiany z JNs i stosuje się do własnej nazwy miejsce.

W przypadku przełączania awaryjnego, czuwanie upewni się, że przeczytało wszystkie edycje z JounalNodes przed awansem do stanu aktywnego. Zapewnia to, że stan przestrzeni nazw jest w pełni zsynchronizowany przed przejściem awaryjnym.

Tutaj wpisz opis obrazka

W związku z tym, że proces nie został ukończony w 1999 roku, to nie jest proces.]}

Jak działa proces przełączania awaryjnego Hadoop Namenode?

W związku z Państwa zapytaniami dotyczącymi teorii czapek dla Hadoop:

  1. może być silny spójny
  2. [52]}HDFS jest prawie bardzo Dostępny, chyba że spotkasz się z jakimś pechem Jeśli wszystkie trzy repliki bloku są wyłączone, nie otrzymasz danych.]}
  3. obsługuje partycję danych
 3
Author: Ravindra babu,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-05-23 11:53:50

Name Node jest węzłem głównym, w którym wszystkie metadane są okresowo przechowywane w plikach fsimage i editlog. Ale, gdy nazwa węzła w dół węzeł wtórny będzie online, ale ten węzeł ma tylko dostęp do odczytu do plików fsimage i editlog i nie ma do nich dostępu do zapisu . Wszystkie operacje węzła wtórnego będą przechowywane w folderze tymczasowym . gdy name node powróci do trybu online, folder tymczasowy zostanie skopiowany do name node, a namenode zaktualizuje pliki fsimage i editlog.

 1
Author: sathish samayam,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2015-04-04 06:50:58

Nawet w HDFS High Availability, gdzie są dwa Namenody zamiast jednego NameNode i drugiego Namenode, nie ma dostępności w ścisłym sensie CAP. Dotyczy to tylko komponentu NameNode i nawet tam, jeśli partycja sieciowa oddziela klienta od obu nazw, klaster jest skutecznie niedostępny.

 0
Author: Jeremy Beard,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2015-03-08 18:40:55

Jeśli wyjaśnię to w prosty sposób, Załóżmy nazwę węzła jako men (praca/na żywo) i nazwę wtórną węzła jako bankomat (przechowywanie/przechowywanie danych)
Więc wszystkie funkcje wykonywane przez NN lub men tylko, ale jeśli pójdzie w dół / nie wtedy SNN będzie bezużyteczny to nie działa, ale później może być używany do odzyskiwania danych lub dzienników

 0
Author: Shivendra Pandey,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2015-12-22 18:08:45

Po uruchomieniu NameNode ładuje Fsimage i powtarza dzienniki edycji, aby utworzyć najnowszą zaktualizowaną przestrzeń nazw. Ten proces może zająć dużo czasu, jeśli Rozmiar pliku dziennika edycji jest duży, a tym samym wydłużyć czas uruchamiania. Zadaniem węzła nazw drugorzędnych jest okresowe sprawdzanie dziennika edycji i odtwarzanie w celu utworzenia zaktualizowanego FSImage i przechowywania w trwałej pamięci masowej. Po uruchomieniu Name Node nie musi ponownie odtwarzać dziennika edycji, aby utworzyć zaktualizowany fsimage, używa fsimage utworzonego przez secondary name node.

 0
Author: Gyanprakash Mishra,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-07-11 05:52:16

Namenode jest węzłem głównym, który zawiera metadane w sensie fsimage, a także zawiera dziennik edycji. Dziennik edycji zawiera Ostatnio dodane / usunięte informacje o blokach w przestrzeni nazw kodu nazw. Plik fsimage zawiera metadane całego systemu hadoop w trwałej pamięci masowej. Za każdym razem, gdy musimy wprowadzić zmiany na stałe w fsimage, musimy ponownie uruchomić namenode, aby informacje o logach edycji mogły być zapisane w namenode, ale zajmuje to dużo czasu.

A secondary namenode jest używany do aktualizacji fsimage. Drugi węzeł nazw będzie miał dostęp do dziennika edycji i wprowadzi zmiany w fsimage na stałe, aby następnym razem namenode mógł się szybciej uruchomić.

W zasadzie drugorzędny namenode jest pomocnikiem dla namenode i wykonuje funkcję porządkowania dla namenode.

 0
Author: Er. Himanshu Srivastava,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-09-03 06:38:52