Pierwsze kroki z MapReduce / Hadoop [zamknięte]

Ostatnio dużo czytam o MapReduce / Hadoop i myślę, że właśnie do tego właśnie zmierza branża. Chcę zacząć uczyć się MapReduce / Hadoop i pomyślałem, że najlepszym sposobem na rozpoczęcie będzie wdrożenie jakiegoś małego projektu. Próbowałem jednak googlować, ale nie mogłem nic znaleźć.

Możecie podać mi jakieś linki lub może jakieś książki, które mogą dać mi praktyczne wprowadzenie do tej technologii. Może to być mały projekt, który mogę zrealizować samodzielnie, aby uzyskać lepsze zrozumienie technologii.

Dzięki, Chander

Author: Chander Shivdasani, 2010-09-01

6 answers

Najczęściej rzucanymi przykładami są tworzenie odwróconego indeksu i implementacja grepa.

Jeśli szukasz więcej informacji:

Naprawdę przyjazne wprowadzenie można znaleźć tutaj. Oryginalny papier jest tutaj.

A to, co wygląda jak dobry przykładowy kod, który cię pobudzi, to tutaj.

 3
Author: dave,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2010-09-01 00:14:13

Cloudera (wydaje dystrybucję Hadoop) ma fantastyczne filmy szkoleniowe online, a także maszynę wirtualną ze wszystkim konfigurowalnym i zdolnym do uruchamiania przykładów z bezpłatnego szkolenia online http://www.cloudera.com/resources/?type=Training

 5
Author: Joe Stein,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2010-09-01 14:03:10

Oto kilka ciekawych artykułów / filmów / samouczków na temat rozpoczęcia korzystania z MapReduce.

 2
Author: Praveen Sripati,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-07-31 01:24:49

Próba spadochronu nad Hadoop bez zrozumienia MapReduce może być bolesna. Myślę, że najłatwiej zrozumieć młotek, to zobaczyć gwóźdź. :) Napisałem artykuł na blogu (Intro to Parallel Processing with MapReduce ), w którym opisuję powszechny problem i pokazuję jak go rozwiązać z MapReduce i bez niego. Następnie przejdę do pokazania, jak MapReduce ułatwia dystrybucję pracy na klastrze.

 2
Author: TraderJoeChicago,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-12-05 21:05:16

Chciałbym również zaproponować alternatywne podejście do nauki, takie jak filmy i wykłady. Jak na YouTube: (możesz śledzić od tego do kilku innych)

 1
Author: pyfunc,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2010-09-01 00:19:49

Cześć myślę, że to najlepszy sposób na rozpoczęcie, za darmo

Http://bigdatauniversity.com/bdu-wp/bdu-course/hadoop-fundamentals-i-version-2/

 0
Author: rio,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2014-02-21 15:40:17