dplyr

dplyr: lead() I lag() źle użyte z group by()

Chcę znaleźć element lead() I lag() w każdej grupie, ale miałem złe wyniki. Na przykład dane są takie: library(dplyr) df = ... ii). Ktoś wie, dlaczego to się stało? Dlaczego funkcja arrange() wpływa na wynik (wartości, a nie tylko kolejność)? Dzięki ~

dplyr:: Grupuj przez ciąg znaków wprowadzając kilka nazw zmiennych

Piszę funkcję, w której użytkownik jest proszony o zdefiniowanie jednej lub więcej zmiennych grupujących w wywołaniu funkcji. ... ładzie) do grupować dane za pomocą dplyr? (to pytanie jest w jakiś sposób związane z to jedno , ale nie odpowiedział tam.)

Jak korzystać z %.% operator W R (EDIT: operator przestarzały w 2014)

EDIT:%.% operator jest teraz przestarzały. Użyj %>% z magrittr. PYTANIE PIERWOTNE Do czego służy ten %.% operator?? Widz ... ecjalne operatory, które kręcą się ze znakiem % i kiedy jest technicznie odpowiedni czas, aby użyć ich do lepszego kodowania?

użyj podsumowania dplyr każdego, aby zwrócić jeden wiersz na funkcję?

Używam summarise_each dplyra, aby zastosować funkcję do wielu kolumn danych. Jedną z przyjemnych rzeczy jest to, że możesz z ... max "6.9" "2.5" Czy jest opcja w summarise_each, aby to zrobić? Jeśli nie, Hadley, mógłbyś to dodać?

dplyr: "błąd w n (): Funkcja nie powinna być wywoływana bezpośrednio"

Próbuję odtworzyć jeden z przykładów w pakiecie dplyr, ale ten Komunikat o błędzie. Spodziewam się, aby zobaczyć nową kolumnę ... ars, vs, am) by_vs <- summarise(by_vs_am, n = n()) Błąd w n (): Ta funkcja nie powinna być wywoływana bezpośrednio

Utworzyć zmienną rankingową za pomocą dplyr?

Załóżmy, że mam następujące dane df = data.frame(name=c("A", "B", "C", "D"), score = c(10, 10, 9, 8)) Chcę dodać nową kol ... C 9 2 # 4 D 8 3 Najwyraźniej rank nie robi tego, co mam na myśli. Jakiej funkcji powinienem używać?

Warunkowo liczyć w dplyr

Mam pewne dane dotyczące zamówień członków, które chciałbym agregować według tygodnia zamówienia. Tak wyglądają dane: memb ... 1), count4 = c(2,2,2,1)) Zgaduję, że to tylko mała zmiana funkcji sum, ale mam problem z jej zrozumieniem.

dplyr: niestandardowe nazwy kolumn (spacja, interpunkcja, zaczyna się od liczb)

df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), class = "data.frame") ... cuję na dużym zestawie danych, jak Mogę uzyskać dokładne dopasowanie bez znajomości numeru indeksu lub podobnych nazw kolumn?

dplyr mutate rowSums calculations or custom functions

Próbuję zmutować nową zmienną z obliczeń wiersza, powiedz {[3] } Jak poniżej iris %>% mutate_(sumVar = i ... Zastanawiam się, czy można zrobić coś takiego: iris %>% mutate(sumVar = colsum_function(Sepal.Length:Petal.Width))

Jak replikować zachowanie ddply, które używa niestandardowej funkcji za pomocą dplyr?

Próbuję zastąpić wszystkie moje połączenia plyr dplyr. Istnieje jeszcze kilka zaczepów, a jeden z nich jest z funkcją group_b ... gdy próbuję to samo z dplyr, nie działa to zgodnie z oczekiwaniami. iris %>% group_by(Species) %>% mm Co robię źle?

Filtrowanie obserwacji w dplyr w połączeniu z grepl

Staram się wypracować, jak filtrować niektóre obserwacje z dużego zbioru danych za pomocą dplyr i grepl. Nie jestem wedding g ... #1 apple A #2 orange B #3 banxana A #4 appxxle B Chciałbym to zrobić w środku, jeśli to możliwe.

Przekazać wektor nazw zmiennych do arrange () w dplyr

Chcę przekazać arrange() {dplyr} wektor nazw zmiennych do posortowania. Zazwyczaj po prostu wpisuję zmienne, które chcę, ale ... f_vars) df %>% arrange(get(vector_of_vars)) df %>% arrange(eval(parse(text = paste(vector_of_vars, collapse = ", "))))

Co ma charakter okresu dplyr "."referencje?

Do czego odnosi się okres . w poniższym kodzie dplyr?: (df <- as.data.frame(matrix(rep(1:5, 5), ncol=5))) # V1 V2 V3 V ... k omówiono tutaj )? Również, dlaczego poniższy kod powoduje błąd? dplyr::filter(df, . == 5) # Error: object '.' not found

dplyr LEFT join by less than, greater than condition

To pytanie jest w pewnym sensie związane z kwestiami efektywnego łączenia dwóch ramek danych na nietrywialnych kryteriach i ... oin on columns 'TRUE' x 'TRUE': index out of bounds Chyba że if left_join obsłuży warunek, ale brakuje mojej składni coś?

data.tabela alternatywna dla przypadku dplyr, gdy

Jakiś czas temu wprowadzili ładną alternatywę podobną do SQL do ifelse wewnątrz dplyr, czyli case_when. Czy w data.table ist ... rdzo pomocne i uczyniłoby Kod o wiele bardziej czytelny (jeden z powodów, dla których wciąż używam dplyr w tych przypadkach).

Suma w wielu kolumnach za pomocą dplyr

Moje pytanie polega na podsumowaniu wartości w wielu kolumnach ramki danych i utworzeniu nowej kolumny odpowiadającej temu po ... knąć konieczności podawania żadnych nazw kolumn. Jak mogę to zrobić najefektywniej? Każda pomoc będzie bardzo mile widziana.

dplyr: wybierz nazwy kolumn zawierające białe spacje

df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), class = "data.frame") ... cuję na dużym zestawie danych, jak Mogę uzyskać dokładne dopasowanie bez znajomości numeru indeksu lub podobnych nazw kolumn?

Poprawna składnia mutate if

Chciałbym zastąpić NA wartości zerami poprzez mutate_if w dplyr. Składnia poniżej: set.seed(1) mtcars[sample(1:dim(mtcars)[ ... (1), ...): wartości muszą być długości 1, ale FUN(X[[1]]) wynik to długość 32 Jaka jest poprawna składnia tej operacji?

Używanie funkcji wielu kolumn w dplyr mutuje podczas wywołania

Chciałbym użyć funkcji dplyr mutate_at, Aby zastosować funkcję do kilku kolumn w ramce danych, gdzie funkcja wprowadza kolumn ... dplyr Dplyr:: mutate to add multiple wartości Użycie kolumny wewnątrz funkcji sum() przy użyciu funkcji mutate () dplyr

Jak wykonać wiele lewych złączeń za pomocą dplyr w R [duplikat]

To pytanie ma już odpowiedź tutaj: jednoczesne Scalanie wielu danych.ramki na liście ... To jest kod, którego używam, aby połączyć X i y kod nie działa dla wielu połączeń new <- left_join(x,y,z by = "Flag")