Jak działa algorytm sortowania MapReduce?

Question

Jak działa algorytm sortowania MapReduce?

Jednym z głównych przykładów, który jest używany do wykazania mocy MapReduce jest terasort benchmark. Mam problem ze zrozumieniem podstaw algorytmu sortowania używanego w środowisku MapReduce.

Dla mnie sortowanie polega po prostu na określeniu względnej pozycji elementu w stosunku do wszystkich innych elementów. Sortowanie polega więc na porównaniu "wszystkiego " z"wszystkiego". Twój średni algorytm sortowania (quick, bubble,...) po prostu robi to w inteligentnym sposób.

W moim umyśle podział zbioru danych na wiele kawałków oznacza, że można posortować pojedynczy kawałek, a następnie nadal trzeba zintegrować te kawałki do "kompletnego" w pełni posortowanego zbioru danych. Biorąc pod uwagę terabajtowy zestaw danych rozproszonych po tysiącach systemów, spodziewam się, że będzie to ogromne zadanie.

Więc jak to się naprawdę robi? Jak działa algorytm sortowania MapReduce?

Dzięki za pomoc w zrozumieniu.

97

algorithm sorting parallel-processing hadoop mapreduce

Author: Niels Basjes, 2009-07-20

Source

4 answers

Google Reference: MapReduce: uproszczone przetwarzanie danych na dużych klastrach

Pojawił się w :
OSDI'04: szóste Sympozjum na temat projektowania i wdrażania systemów operacyjnych,
San Francisco, CA, Grudzień 2004.

Ten link ma odniesienie PDF i HTML-Slide.

Istnieje również Strona Wikipedii z opisem z odniesieniami do implementacji.

Również krytyka,

David DeWitt i Michael Stonebraker, pionierski ekspert w dziedzinie równoległych baz danych i architektur shared nothing, wysunął kilka kontrowersyjnych twierdzeń na temat zakresu problemów, do których MapReduce może być używany. Nazwali jego interfejs zbyt niskim poziomem i zapytali, Czy naprawdę reprezentuje zmianę paradygmatu, którą twierdzą jego zwolennicy. Kwestionują twierdzenia zwolenników MapReduce o nowości, powołując się na Teradatę jako przykład sztuki wcześniejszej, która istnieje od ponad dwóch dekad; porównali MapReduce programistów do programistów Codasyl, zauważając, że obaj "piszą w języku niskiego poziomu, wykonując niskopoziomową manipulację rekordami". Wykorzystanie plików wejściowych MapReduce i brak wsparcia dla schematów uniemożliwia ulepszenia wydajności włączone przez wspólne funkcje systemu bazodanowego, takie jak B-trees i partycjonowanie hash, chociaż projekty takie jak PigLatin i Sawzall zaczynają rozwiązywać te problemy.

2

Author: nik,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2014-10-28 17:26:45

Miałem to samo pytanie podczas czytania papieru MapReduce Google. @Yuval F 's ODPOWIEDŹ prawie rozwiązała moją zagadkę.

Jedną z rzeczy, które zauważyłem podczas czytania gazety, jest to, że magia dzieje się w partycjonowaniu(po mapie, przed redukcją).

Artykuł używa hash(key) mod R jako przykład partycjonowania, ale nie jest to jedyny sposób na partycjonowanie danych pośrednich w różnych zadaniach redukcji.

Wystarczy dodać warunki brzegowe do @Yuval F 's answer to make it complete: przypuśćmy, że min(s) i max(S) są minimalnymi i maksymalnymi kluczami wśród włączonych klawiszy; wszystkie klawisze = max(s) Są podzielone na jedno zadanie redukcji.

Nie ma twardych ograniczeń na próbkowanych klawiszach, takich jak min lub max. Po prostu bardziej równomiernie te klucze r rozmieszczone między wszystkimi kluczami, bardziej "równoległy" ten rozproszony system jest i mniej prawdopodobne, że operator reduce ma problem z przepełnieniem pamięci.

1

Author: edwinfj_,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-05-23 10:31:17

Tylko zgaduję...

Biorąc pod uwagę ogromny zestaw danych, można podzielić dane na kilka kawałków, które mają być przetwarzane równolegle(być może przez numer rekordu, np. rekord 1-1000 = partycja 1, i tak dalej).

Przypisz / zaplanuj każdą partycję do konkretnego węzła w klastrze.

Każdy węzeł klastra będzie dalej łamał (mapował) partycję na własną mini partycję, być może według kolejności alfabetycznej klucza. Więc, w partycji 1, daj mi wszystkie rzeczy, które zaczynają się od A i wyjście to do mini partycji a z X. Utwórz nową A (x), Jeśli obecnie istnieje już A (x). Zastąp x numerem sekwencyjnym(być może jest to zadanie schedulera, aby to zrobić). Czyli podaj mi NASTĘPNY A (X) unikalny identyfikator.

Przekaż (zaplanuj) zadania zakończone przez mapera (poprzedni krok) do" zmniejsz " węzły klastra. Reduce node cluster będzie następnie dalej udoskonalać sortowanie poszczególnych części A (x), które będą się dziać, gdy wszystkie zadania mapera zostaną wykonane (nie można faktycznie rozpocząć sortowania wszystkich słów start w / a, gdy nadal istnieje możliwość, że nadal będzie kolejna mini partycja w tworzeniu). Wypisuje wynik w końcowej części posortowanej (np. posortowane-A, posortowane-B, itd.)

Po zakończeniu ponownie połącz posortowaną partycję w pojedynczy zestaw danych. W tym momencie jest to tylko prosta konkatenacja n plików (gdzie n może być 26 jeśli robisz tylko A-Z), itp.

Mogą istnieć pośrednie kroki pomiędzy nimi... Nie jestem pewien :). Tj. dalsza mapa i redukcja po początkowym kroku redukcji.

0

Author: Jimmy Chandra,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-07-20 10:45:56

score 54 · Accepted Answer

Oto kilka szczegółów na temat implementacji Hadoop dla Terasort:

Terasort jest standardowym sortowaniem map/reduce, z wyjątkiem niestandardowego partycjonera, który używa posortowanej listy N - 1 próbkowanych kluczy, które definiują zakres kluczy dla każdego reduce. W szczególności, wszystkie klucze takie, że próbka[i - 1]

Więc ich sztuczka jest w sposób, w jaki określają klawisze podczas fazy mapy. Zasadniczo gwarantują one, że każda wartość w pojedynczym reduktorze jest "wstępnie posortowana" w stosunku do wszystkich innych reduktorów.

Znalazłem odniesienie do papieru poprzez James Hamilton ' s Blog Post.