dplyr
standardowa ocena w dplyr: podsumowanie zmiennej podanej jako ciąg znaków
Aktualizacja lipiec 2020:
dplyr 1.0 zmieniło się prawie wszystko na temat tego pytania, jak również wszystkie odpowiedzi. Zob ... object 'v2' not found
Sprawdziłem kilka powiązane pytania , ale do tej pory żadne z proponowanych rozwiązań nie zadziałało.
Zmień wartość zmiennej za pomocą dplyr [duplikat]
To pytanie ma już odpowiedź tutaj:
Ustaw pewne wartości na Na za pomocą dplyr
... ale nie udało się:
mtcars %>%
mutate(mpg = mpg == NA[cyl == 4]) %>%
as.data.frame()
Jak mógłbym to zrobić z dplyr?
Zamiennik dla "Zmień nazwę" w dplyr
Podoba mi się funkcja zmiany nazwy plyra rename. Ostatnio zacząłem używać dplyr i zastanawiałem się, czy istnieje łatwy sposób na zmianę nazw zmiennych za pomocą funkcji z dplyr, która jest tak łatwa w użyciu, jak plyr rename?
Filtruj wiele wartości w kolumnie łańcuchowej w dplyr
Mam {[3] } z danymi znakowymi w jednej z kolumn.
Chciałbym filtrować wiele opcji w data.frame z tej samej kolumny. Czy jest n ... filt <- filter(dat, name == target)
Dostaję ten błąd:
longer object length is not a multiple of shorter object length
Usuń zduplikowane wiersze za pomocą dplyr
Mam dane.frame like this -
set.seed(123)
df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10)
> ... wana wydajność -
df[!duplicated(df[,1:2]),]
x y z
1 0 1 1
2 1 0 2
4 1 1 4
Szukam rozwiązania przy użyciu dplyr pakietu.
dplyr: odpowiednik ".drop = FALSE " aby zachować grupy o zerowej długości na wyjściu
Podczas używania summarise z plyr'S ddply funkcja, puste kategorie są domyślnie usuwane. Możesz zmienić to zachowanie dodając ... 6 FALSE
Nie do końca na to liczyłem. Czy istnieje dplyr metoda osiągnięcia tego samego wyniku co .drop=FALSE w plyr?
dplyr zmienia wiele typów danych
Do zmiany typów danych mogę użyć czegoś w rodzaju
l1 <- c("fac1","fac2","fac3")
l2 <- c("dbl1","dbl2","dbl3")
dat[,l1 ... dbl2 = as.numeric(dbl2), dbl3 = as.numeric(dbl3)
)
Czy istnieje bardziej elegancki (krótszy) sposób w dplyr?
Thx
Christof
Ustaw pewne wartości Na NA za pomocą dplyr
Próbuję wymyślić prosty sposób, aby zrobić coś takiego z dplyr (data set = dat, zmienna = x):
day$x[dat$x<0]=NA
Powinn ... e to najlepsze, co mogę zrobić w tej chwili. Jest jakiś łatwiejszy sposób?
dat = dat %>% mutate(x=ifelse(x<0,NA,x))
R dplyr: zmiana nazw zmiennych za pomocą funkcji łańcuchowych
(nieco powiązane pytanie: wprowadź nowe nazwy kolumn jako ciąg znaków w funkcji zmiany nazwy dplyr)
W środku łańcucha dplyr ... setosa petal_width 0.246
# 5 versicolor sepal_length 5.936
# 6 versicolor sepal_width 2.770
# ... etc ....
Select columns based on string match-dplyr:: select
Mam ramkę danych ("data") z wieloma kolumnami. Niektóre kolumny zawierają określony ciąg znaków ("search_string").
Jak mogę ... stytut kolumn np.:
select(data,5,7,9:20)
Ale Nie wiem jak uzyskać wektor liczbowy kolumn ID s z mojego grepl() wyrażenia.
Jak zinterpretować wiadomość dplyr ' summary () 'przegrupowującą wyjście przez' x `(override with'.argument grup)?
Zacząłem otrzymywać nową wiadomość (zobacz tytuł postu) podczas uruchamiania group_by i summary () po aktualizacji do dplyr d ... u dplyr? i R agregują się na wielu kolumnach (żaden z nich nie rozwiązuje komunikatu przegrupowania/nadpisania).
Dziękuję!
R rozłożenie wielu kolumn z tidyr [duplikat]
To pytanie ma już odpowiedź tutaj:
Jak mogę rozłożyć powtarzające się miary wielu zmiennych na szeroki f ... onth Amy.A Bob.A Amy.B Bob.B
1 1 9 8 6 5
2 2 7 6 7 6
3 3 6 9 8 7
dplyr:: select funkcja:: select
Jeśli załaduję MASS pakiet:
library(MASS)
Następnie Wczytaj spróbuj uruchomić dplyr::select, pojawia się błąd:
library( ... t(mpg)
# Error in select(`__prev`, mpg) : unused argument (mpg)
Jak mogę używać dplyr::select z załadowanym pakietem MASS?
Uzyskiwanie najwyższych wartości według grup
Oto przykładowa ramka danych:
d <- data.frame(
x = runif(90),
grp = gl(3, 30)
)
Chcę podzbiór d zawierający wie ... ca całość d.
d %>%
arrange_(~ desc(x)) %>%
group_by_(~ grp) %>%
top_n(n = 5)
Jak uzyskać poprawny podzbiór?
Przekazywanie argumentów do funkcji dplyr
Chcę parametryzować następujące obliczenia używając dplyr, które wartości Sepal.Length są powiązane z więcej niż jedną wartoś ...
Jednak to podejście powoduje błędy, ponieważ dplyr wykorzystuje niestandardową ocenę. Jak powinna być zapisana ta funkcja?
R dplyr: upuść wiele kolumn
Mam ramkę danych i listę kolumn w tej ramce danych, które chciałbym upuścić. Jako przykład użyjmy zbioru danych iris. Chciałb ... adley powiedział, że używa "indeksowania negatywnego". To jest to, co (myślę) próbowałem, ale bezskutecznie. Jakieś sugestie?
Czy dplyr może łączyć się z wieloma kolumnami lub kluczem kompozytowym?
Zdaję sobie sprawę, że dplyr v3. 0 pozwala na łączenie różnych zmiennych:
left_join(x, y, by = c("a" = "b") dopasuje x.a do ... ć klucz złożony?
Coś takiego:
left_join(x, y, by = c("a c" = "b d") aby dopasować konkatenację [x.a i x.c] do [y.b i y.d]
filtruj kompletne przypadki w danych.frame using dplyr (case-wise deletion)
Czy możliwe jest filtrowanie danych.ramka do kompletnych przypadków za pomocą dplyr? complete.cases z listą wszystkich zmienn ... amka).
library(dplyr)
df = data.frame(
x1 = c(1,2,3,NA),
x2 = c(1,2,NA,5)
)
df %.%
filter(complete.cases(x1,x2))
Jak określić nazwy kolumn dla X i y podczas łączenia w dplyr?
Mam dwie ramki danych, które chcę połączyć za pomocą dplyr. Pierwsza to ramka danych zawierająca imiona.
test_data <- dat ... rpus Kantrowitza jest złym sposobem na identyfikację płci. Pracuję nad lepszą implementacją, ale najpierw chcę to uruchomić.)
Zastąp brakujące wartości (NA) najnowszymi nie-NA przez grupę
Chciałbym rozwiązać następujący problem z dplyr. Preferowane z jedną z funkcji okna.
Mam ramkę danych z domami i cenami zakup ... D = rep(1:N,each=10), year=1995:2004, price =ifelse(runif(10*N)>0.15, NA,exp(rnorm(10*N))))
Czy jest na to sposób dplyr?