Apache Spark vs. Apache Storm [zamknięty]

Jakie są różnice między Apache Spark a Apache Storm ? Jakie są odpowiednie przypadki użycia dla każdego z nich?

Author: Peter Mortensen, 2014-06-09

1 answers

Apache Spark jest rozproszoną platformą do analizy danych w pamięci-przede wszystkim ukierunkowaną na przyspieszenie zadań analizy wsadowej, iteracyjnych zadań uczenia maszynowego, interaktywnych zapytań i przetwarzania Wykresów.

Jednym z podstawowych wyróżników Spark jest wykorzystanie RDDs lub odpornych rozproszonych zbiorów danych. RDD są świetne do pipelining operatorów równoległych do obliczeń i są, z definicji, niezmienne, co pozwala iskrzyć unikalną formę tolerancji błędów w oparciu o informacje o linii. Jeśli jesteś zainteresowany, na przykład, wykonaniem zadania MapReduce Hadoop znacznie szybciej, Spark jest świetną opcją(chociaż należy wziąć pod uwagę wymagania dotyczące pamięci).

Apache Storm koncentruje się na przetwarzaniu strumieni lub co niektórzy nazywają złożonym przetwarzaniem zdarzeń. Storm implementuje metodę odporną na błędy do wykonywania obliczeń lub rurociągów wielu obliczeń na zdarzeniu, gdy wpływa ono do systemu. Można użyć Storm przekształcić nieustrukturyzowane dane, gdy przepływa do systemu w pożądanym format.

Storm i Spark skupiają się na dość różnych przypadkach użycia. Bardziej "jabłka do jabłek" porównanie byłoby między Storm Tridenti Spark Streaming. Ponieważ RDD Spark są niezmienne, Spark Streaming implementuje metodę "grupowania" przychodzących aktualizacji w zdefiniowanych przez użytkownika odstępach czasu, które są przekształcane w własne RDD. Operatory równoległe Spark mogą następnie wykonywać obliczenia na tych RDD. Różni się od Storm, który zajmuje się każdym wydarzenie indywidualnie.

Jedną z kluczowych różnic między tymi dwoma technologiami jest to, że Spark wykonuje obliczenia równoległe danych, podczas gdy Storm wykonuje obliczenia równoległe Zadań. Każdy projekt sprawia, że kompromisów, które warto wiedzieć. Proponuję sprawdzić te linki.

Edit: odkryte to dzisiaj

 460
Author: plambre,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-01-29 05:35:42