yarn

Jak wyłączyć INFO logowania Spark?

Zainstalowałem Spark za pomocą przewodnika AWS EC2 i mogę uruchomić program dobrze za pomocą skryptu bin/pyspark, aby dostać ... x=y") # - SPARK_PUBLIC_DNS, to set the public dns name of the master or workers export SPARK_SUBMIT_CLASSPATH="$FWDIR/conf"

Kontener działa poza limitami pamięci

W Hadoop v1, przypisałem każdy slot mapper 7 i reducer o rozmiarze 1GB, moje mappers & reducers działa dobrze. Moja maszy ... m, jak mogę się upewnić, że do każdego kontenera nie zostanie przypisana większa ilość splitów niż jest w stanie obsłużyć?

hadoop mapreduce yarn mrv2

Jaki typ klastra wybrać dla Spark?

Jestem nowy w Apache Spark i właśnie dowiedziałem się, że Spark obsługuje trzy typy klastrów: Standalone-czyli Spark będzi ... cany. Powiedzmy, że w przyszłości muszę zbudować duży klaster (setki instancji), do którego typu klastra powinienem się udać?

apache-spark yarn mesos apache-spark-standalone

Spark Kill Running Application

Mam uruchomioną aplikację Spark, w której zajmuje wszystkie rdzenie, w których moje inne aplikacje nie będą przydzielane żadn ... używam wersji CDH i /bin / spark-class w ogóle nie istnieje, aplikacja YARN kill też nie działa. Może ktoś ze mną z tym?

apache-spark pyspark yarn

FetchFailedException lub MetadataFetchFailedException podczas przetwarzania big data set

Gdy uruchamiam kod parsujący z 1 GB dataset, kończy się on bez żadnego błędu. Ale kiedy próbuję 25 gb danych na raz, dostaję ... at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) at java.lang.Thread.run(Thread.java:745)

apache-spark yarn

Jak zapobiec zgubieniu Spark Executors podczas korzystania z trybu klienta YARN?

Cześć mam jedno zadanie Spark, które działa dobrze lokalnie z mniejszą ilością danych, ale kiedy planuję go na YARN do wykona ... --num-executors 12 /home/myuser/myspark-1.0.jar Nie wiem, w czym problem, proszę cię. Jestem nowy w Spark. Z góry dzięki.

apache-spark yarn

Iskra na temat zrozumienia koncepcji przędzy

Próbuję zrozumieć, jak spark działa na klastrze/kliencie YARN. Mam następujące pytanie w głowie. Czy konieczne jest zainsta ... a) pliki konfiguracyjne dla klastra Hadoop". Dlaczego węzeł klienta musi zainstalować Hadoop, gdy wysyła zadanie do klastra?

apache-spark hadoop hdfs yarn

Przędza Apache Hadoop-niedostateczne wykorzystanie rdzeni

Bez względu na to, ile majstrowałem z ustawieniami w yarn-site.xml tj. używając wszystkich poniższych opcji yarn.scheduler. ... ffle.file.buffer.kb 200 Zauważ, że spark.executor.cores jest ustawione na 3, ale to nie działa. Jak to naprawić?

apache-spark hadoop yarn resourcemanager

Jak zalogować się za pomocą log4j do lokalnego systemu plików wewnątrz aplikacji Spark, która działa na YARN?

Buduję aplikację do przesyłania strumieniowego Apache Spark i nie mogę zalogować się do pliku na lokalnym systemie plików , g ... g myApp.jar Nie widzę żadnego /tmp/application.log w lokalnym systemie plików maszyny, na której działa YARN. Co mi umyka.

logging apache-spark log4j yarn

Zasoby Spark nie są w pełni przydzielone na Amazon EMR

Próbuję zmaksymalizować użycie klastra do prostego zadania. Klaster to 1+2 x M3.xlarge, runnning Spark 1.3.1, Hadoop 2.4, Am ... wyjaśniono tutaj? Jak mogę dać więcej pamięci mojemu kierowcy Spark job? (Gdzie powstają zbiory i inne użyteczne operacje)

apache-spark yarn emr

Jakie dodatkowe korzyści przynosi dotychczasowa Mapa?

Yarn różni się warstwą infrastruktury od oryginalnej mapy w następujący sposób: W YARN, job tracker jest podzielony na dwa ... ne treści na temat motywacji przędzy i jej korzyści w stosunku do istniejącego wdrażania Map-reduce, proszę wskaż mi to samo.

hadoop mapreduce yarn

Dlaczego Hadoop raport "niezdrowy węzeł local-dirs i log-dirs są złe"?

[1]}próbuję skonfigurować klaster Hadoop 2.6.0 z pojedynczym węzłem na moim komputerze. On visiting http://localhost:8088/c ... 1 local-dirs are bad: /tmp/hadoop-hduser/nm-local-dir; 1/1 log-dirs are bad: /usr/local/hadoop/logs/userlogs Co się stało?

hadoop yarn

Jak Mogę uzyskać dostęp do S3 / S3N z lokalnej instalacji Hadoop 2.6?

[4]}próbuję odtworzyć Amazon EMR cluster na mojej lokalnej maszynie. W tym celu zainstalowałem najnowszą stabilną wersję Had ... słoików, aby móc czytać S3, ale nie mam pojęcia, skąd je wziąć. Wszelkie wskazówki w tym kierunku będą bardzo mile widziane.

amazon-web-services amazon-s3 hadoop hadoop2 yarn

Dlaczego Yarn na EMR nie przydziela wszystkich węzłów do uruchamiania zadań Spark?

Uruchamiam pracę na Apache Spark na Amazon Elastic Map Reduce (EMR). Obecnie pracuję na emr-4.1.0, który zawiera Amazon Hado ... dy dodawać węzły do uruchomionych zadań spark? Jakie zmienne wchodzą w grę? Pamięć? V-Rdzenie? Cokolwiek? Z góry dzięki!

apache-spark yarn amazon-emr emr elastic-map-reduce

Co to jest yarn-client mode W Spark?

Apache Spark niedawno zaktualizował wersję do 0.8.1, w której dostępny jest tryb yarn-client. Moje pytanie brzmi, co tak napr ... czy "uruchamiany lokalnie"? Gdzie? Na klastrze iskry? Jaka jest szczególna różnica w stosunku do trybu samodzielnego przędzy?

apache-spark yarn

Dlaczego JVM zgłasza więcej pamięci niż ustawiony rozmiar rezydenta procesu Linuksa?

Podczas uruchamiania aplikacji Java (w YARN) z włączonym natywnym śledzeniem pamięci (-XX:NativeMemoryTracking=detail patrz ... 15624 0 15624 Dlaczego JVM wskazuje 2,7 GB pamięci, gdy tylko 1,6 GB jest rezydentem? Gdzie poszła reszta?

linux memory jvm yarn

Apache Spark: ustawianie instancji executora nie zmienia executorów

Mam aplikację Apache Spark działającą na klastrze YARN (spark ma 3 węzły na tym klastrze) w trybie klastra. Gdy aplikacja je ... toś wie, dlaczego nie mogłem zwiększyć liczby moich wykonawców? Przędza.nodemanager.zasoby.memory-mb to 12g w yarn-site.xml

apache-spark yarn

Zrozumieć Spark: Menedżera klastrów, węzłów Master I Driver

Po przeczytaniu tego Pytania, chciałbym zadać dodatkowe pytania: Menedżer klastra jest usługą długo działającą, na który ... ednie pytanie: w przypadku awarii węzła głównego, co dokładnie się stanie i kto jest odpowiedzialny za odzyskanie po awarii?

apache-spark hadoop yarn apache-spark-standalone failover

Ile iskier może mieć pojedyncza aplikacja?

Odkryłem, że jak Spark działa, a tabele rosną w rozmiarze (poprzez połączenia), że spark executors w końcu zabraknie pamięci ... nstalacji spark. Co dokładnie robi zatrzymanie kontekstu spark i dlaczego nie możesz utworzyć nowego, gdy już go zatrzymasz?

apache-spark apache-spark-sql yarn

Apache Helix vs YARN

Jaka jest różnica między Apache Helix a Hadoop YARN (MRv2). Czy ktoś ma doświadczenie z obiema technologiami? Czy ktoś może m ... lix over YARN i dlaczego chłopaki z LinkedIn opracowali własne Zarządzanie klastrem zamiast używać YARN? Z góry dzięki Tobi

java hadoop cluster-computing yarn