dplyr
dplyr: lead() I lag() źle użyte z group by()
Chcę znaleźć element lead() I lag() w każdej grupie, ale miałem złe wyniki.
Na przykład dane są takie:
library(dplyr)
df = ... ii).
Ktoś wie, dlaczego to się stało? Dlaczego funkcja arrange() wpływa na wynik (wartości, a nie tylko kolejność)? Dzięki ~
dplyr:: Grupuj przez ciąg znaków wprowadzając kilka nazw zmiennych
Piszę funkcję, w której użytkownik jest proszony o zdefiniowanie jednej lub więcej zmiennych grupujących w wywołaniu funkcji. ... ładzie) do grupować dane za pomocą dplyr?
(to pytanie jest w jakiś sposób związane z to jedno , ale nie odpowiedział tam.)
Jak korzystać z %.% operator W R (EDIT: operator przestarzały w 2014)
EDIT:%.% operator jest teraz przestarzały. Użyj %>% z magrittr.
PYTANIE PIERWOTNE
Do czego służy ten %.% operator??
Widz ... ecjalne operatory, które kręcą się ze znakiem % i kiedy jest technicznie odpowiedni czas, aby użyć ich do lepszego kodowania?
użyj podsumowania dplyr każdego, aby zwrócić jeden wiersz na funkcję?
Używam summarise_each dplyra, aby zastosować funkcję do wielu kolumn danych. Jedną z przyjemnych rzeczy jest to, że możesz z ...
max "6.9" "2.5"
Czy jest opcja w summarise_each, aby to zrobić? Jeśli nie, Hadley, mógłbyś to dodać?
dplyr: "błąd w n (): Funkcja nie powinna być wywoływana bezpośrednio"
Próbuję odtworzyć jeden z przykładów w pakiecie dplyr, ale ten Komunikat o błędzie. Spodziewam się, aby zobaczyć nową kolumnę ... ars, vs, am)
by_vs <- summarise(by_vs_am, n = n())
Błąd w n (): Ta funkcja nie powinna być wywoływana bezpośrednio
Utworzyć zmienną rankingową za pomocą dplyr?
Załóżmy, że mam następujące dane
df = data.frame(name=c("A", "B", "C", "D"), score = c(10, 10, 9, 8))
Chcę dodać nową kol ... C 9 2
# 4 D 8 3
Najwyraźniej rank nie robi tego, co mam na myśli. Jakiej funkcji powinienem używać?
Warunkowo liczyć w dplyr
Mam pewne dane dotyczące zamówień członków, które chciałbym agregować według tygodnia zamówienia.
Tak wyglądają dane:
memb ... 1),
count4 = c(2,2,2,1))
Zgaduję, że to tylko mała zmiana funkcji sum, ale mam problem z jej zrozumieniem.
dplyr: niestandardowe nazwy kolumn (spacja, interpunkcja, zaczyna się od liczb)
df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b"
), row.names = c(NA, -3L), class = "data.frame")
... cuję na dużym zestawie danych, jak Mogę uzyskać dokładne dopasowanie bez znajomości numeru indeksu lub podobnych nazw kolumn?
dplyr mutate rowSums calculations or custom functions
Próbuję zmutować nową zmienną z obliczeń wiersza,
powiedz {[3] } Jak poniżej
iris %>%
mutate_(sumVar =
i ...
Zastanawiam się, czy można zrobić coś takiego:
iris %>%
mutate(sumVar = colsum_function(Sepal.Length:Petal.Width))
Jak replikować zachowanie ddply, które używa niestandardowej funkcji za pomocą dplyr?
Próbuję zastąpić wszystkie moje połączenia plyr dplyr. Istnieje jeszcze kilka zaczepów, a jeden z nich jest z funkcją group_b ... gdy próbuję to samo z dplyr, nie działa to zgodnie z oczekiwaniami.
iris %>% group_by(Species) %>% mm
Co robię źle?
Filtrowanie obserwacji w dplyr w połączeniu z grepl
Staram się wypracować, jak filtrować niektóre obserwacje z dużego zbioru danych za pomocą dplyr i grepl. Nie jestem wedding g ... #1 apple A
#2 orange B
#3 banxana A
#4 appxxle B
Chciałbym to zrobić w środku, jeśli to możliwe.
Przekazać wektor nazw zmiennych do arrange () w dplyr
Chcę przekazać arrange() {dplyr} wektor nazw zmiennych do posortowania. Zazwyczaj po prostu wpisuję zmienne, które chcę, ale ... f_vars)
df %>% arrange(get(vector_of_vars))
df %>% arrange(eval(parse(text = paste(vector_of_vars, collapse = ", "))))
Co ma charakter okresu dplyr "."referencje?
Do czego odnosi się okres . w poniższym kodzie dplyr?:
(df <- as.data.frame(matrix(rep(1:5, 5), ncol=5)))
# V1 V2 V3 V ... k omówiono tutaj )?
Również, dlaczego poniższy kod powoduje błąd?
dplyr::filter(df, . == 5)
# Error: object '.' not found
dplyr LEFT join by less than, greater than condition
To pytanie jest w pewnym sensie związane z kwestiami efektywnego łączenia dwóch ramek danych na nietrywialnych kryteriach i ... oin on columns 'TRUE' x 'TRUE': index out of bounds
Chyba że if left_join obsłuży warunek, ale brakuje mojej składni coś?
data.tabela alternatywna dla przypadku dplyr, gdy
Jakiś czas temu wprowadzili ładną alternatywę podobną do SQL do ifelse wewnątrz dplyr, czyli case_when.
Czy w data.table ist ... rdzo pomocne i uczyniłoby Kod o wiele bardziej czytelny (jeden z powodów, dla których wciąż używam dplyr w tych przypadkach).
Suma w wielu kolumnach za pomocą dplyr
Moje pytanie polega na podsumowaniu wartości w wielu kolumnach ramki danych i utworzeniu nowej kolumny odpowiadającej temu po ... knąć konieczności podawania żadnych nazw kolumn.
Jak mogę to zrobić najefektywniej?
Każda pomoc będzie bardzo mile widziana.
dplyr: wybierz nazwy kolumn zawierające białe spacje
df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b"
), row.names = c(NA, -3L), class = "data.frame")
... cuję na dużym zestawie danych, jak Mogę uzyskać dokładne dopasowanie bez znajomości numeru indeksu lub podobnych nazw kolumn?
Poprawna składnia mutate if
Chciałbym zastąpić NA wartości zerami poprzez mutate_if w dplyr. Składnia poniżej:
set.seed(1)
mtcars[sample(1:dim(mtcars)[ ... (1), ...): wartości muszą być długości 1,
ale FUN(X[[1]]) wynik to długość 32
Jaka jest poprawna składnia tej operacji?
Używanie funkcji wielu kolumn w dplyr mutuje podczas wywołania
Chciałbym użyć funkcji dplyr mutate_at, Aby zastosować funkcję do kilku kolumn w ramce danych, gdzie funkcja wprowadza kolumn ... dplyr
Dplyr:: mutate to add multiple wartości
Użycie kolumny wewnątrz funkcji sum() przy użyciu funkcji mutate () dplyr
Jak wykonać wiele lewych złączeń za pomocą dplyr w R [duplikat]
To pytanie ma już odpowiedź tutaj:
jednoczesne Scalanie wielu danych.ramki na liście
...
To jest kod, którego używam, aby połączyć X i y
kod nie działa dla wielu połączeń
new <- left_join(x,y,z by = "Flag")