dplyr
dplyr: umieść liczbę wystąpień w nowej zmiennej [duplikat]
To pytanie ma już odpowiedź tutaj:
policz liczbę obserwacji / wierszy na grupę i dodaj wynik do ramki da ... h rzeczy jak:
df %>% group_by(group) %>% rowwise() %>% do(count = nrow(.$var1))
Objaśnienia są bardzo doceniam!
Znajdowanie nakładania się między zestawami interwałów / efektywne nakładanie się połączeń
Przegląd:
Muszę połączyć dwie tabele:
ref zawiera przedziały czasowe (od t1 do t2) wraz z id dla każdego przedziału i spa ... 49: nI 500 600 c 590 595 -0.23325264
50: nI 500 600 c 595 600 0.18845022
space t1 t2 id i.t1 i.t2 res
Jak parametryzować wywołania funkcji w dplyr 0.7?
Wersja dplyr 0.7 zawiera gruntowny przegląd programowania z dplyr. Uważnie przeczytałem ten dokument i staram się zrozumieć, ... n_cyl=mean(cyl))
#> # A tibble: 1 × 2
#> `"am"` mean_cyl
#> <chr> <dbl>
#> 1 am 6.1875
Korzystanie z dplyr do liczenia częstotliwości interakcji, musi zawierać zerowe liczby
Moje pytanie dotyczy pisania kodu za pomocą pakietu dplyr W R
Mam stosunkowo dużą ramkę danych (około 5 milionów wierszy) ... nie połączenie z pustą ramką, ale jestem przekonany musi być prostsze rozwiązanie. Wszelkie sugestie bardzo mile widziane!
Właściwy idiom do dodawania wierszy z liczbą zerową w tidyr/dplyr
Załóżmy, że mam jakieś dane count, które wyglądają tak:
library(tidyr)
library(dplyr)
X.raw <- data.frame(
x = as.f ... bne, używając spread Następnie gather, więc interesuje mnie znalezienie bardziej bezpośredniej trasy w obrębie tidyr i dplyr.
Ponownie zastosuj model zgrupowany do danych
I fit models like so
groupedTrainingSet = group_by(trainingSet, geo);
models = do(groupedTrainingSet, mod = lm(revenue ~ ju ... w stylu
apply(trainingData, fitted =
predict(select(models, geo==geo)$mod, .));
Ale nie jestem pewien co do składni.
Nadpisanie "zmienne Nie pokazane" w dplyr, aby wyświetlić wszystkie kolumny z df
Kiedy mam kolumnę w lokalnej ramce danych, czasami dostaję komunikat Variables not shown taki jak ten (śmieszny) przykład po ... .. ... ...
Variables not shown: Year1 (dbl)
Chcę zobaczyć! Jak Mogę zobaczyć wszystkie kolumny, najlepiej domyślnie.
dplyr count non-NA value in group by [duplicate]
to pytanie ma już odpowiedzi tutaj :
... RUE))
mydf %>% group_by(col_1) %>% mutate(non_na_count = count(col_2, na.rm=TRUE))
Nic nie działało. Jakieś sugestie?
Usuń kolumny/wiersze z brakiem więcej niż X%
Chcę usunąć wszystkie kolumny lub wiersze z więcej niż 50% NAs w ramce danych.
To jest moje rozwiązanie:
# delete columns ...
}
data <- data[-miss,]
Ale szukam ładniejszego / szybszego rozwiązania.
Byłbym również wdzięczny za dplyr Rozwiązanie
Sumowanie funkcji liczenia i agregacji warunkowej na tym samym współczynniku
Szybko i krótko jest to, że mam problemy z podsumowaniem Liczby i agregacją funkcji z warunkami na tym samym współczynniku.
... dokumentację i jestem pewien, że odpowiedzi tam są, ale mogą być zbyt zaawansowane dla mojego zrozumienia. Dzięki w naprzód!
Dplyr - Uporządkuj zgrupowane df według zmiennej grupy nie działającej
Mam dane.ramka zawierająca nazwy klientów, lata i kilka numerów przychodów z każdego roku.
df <- data.frame(client = rep( ... bardziej użyteczne. Niezależnie od tego, nie zmieni się ponownie, ponieważ więcej zmian spowoduje tylko więcej zamieszania.
Jak aktualizować wartości za pomocą dplyr
Obecnie próbuję zaktualizować wartości z danych.frame using dplyr butI don ' t know if it is possible to replace a subset of ... :
subs <- (net4$ave < 10 & net4$ave!=net4$temps2)
net4$ave[subs] <- with(net4[subs,], temps2/NNET*NET)
Thanks
Jak dodać kolumnę zbiorczą do ramki danych R za pomocą dplyr?
Mam to samo pytanie co ten post , ale chcę użyć dplyr:
Z ramką danych R, np:
df <- data.frame(id = rep(1:3, each = 5)
... a pasuje do id?
Bez dplyr zaakceptowane rozwiązanie poprzedniego postu to:
df$csum <- ave(df$value, df$id, FUN=cumsum)
Szybka regresja liniowa według grup
Mam 500K użytkowników i muszę obliczyć regresję liniową (z przechwyceniem) dla każdego z nich.
Każdy użytkownik ma około 30 ... nany jako szybszy, ale nie wydaje się być kompatybilny z dplyr.
Czy istnieje szybki sposób na regresję liniową według grupy?
Jak przekazać ciągi oznaczające wyrażenia do czasowników dplyr 0.7?
Chciałbym zrozumieć, jak przekazać łańcuchy reprezentujące wyrażenia do dplyr, aby zmienne wymienione w łańcuchu były oblicza ... ań tego pytania , ale nie działają one dla bardziej złożonych wyrażeń, takich jak 2 * cyl, które nie są tylko nazwą kolumny.
filtr dplyr z warunkiem na wielu kolumnach
Oto atrapa danych:
father<- c(1, 1, 1, 1, 1)
mother<- c(1, 1, 1, NA, NA)
children <- c(NA, NA, 2, 5, 2)
cousins ...
and so on...
Jak mogę użyć dplyr, aby powiedzieć filtruj całą kolumnę za pomocą na (z wyjątkiem ojca==1 & matki==1)
Znajdź zduplikowane elementy za pomocą dplyr
Próbowałem użyć kodu prezentowanego TUTAJ aby znaleźć wszystkie powielone elementy z dplyr w ten sposób:
library(dplyr)
... st inna funkcja, która osiągnie to bardziej zwięźle niż zawiłe podejście x[duplicated(x) | duplicated(x, from.last = TRUE)])?
Czy istnieje metoda r dplyr dla merge with all = TRUE?
Mam dwa ramki danych R, które chcę połączyć. W prostym R można zrobić:
cost <- data.frame(farm=c('farm A', 'office'), co ... x$trees[is.na(x$trees)] <- 0; są pracochłonne (potrzebuję polecenia na kolumnę) i nie zawsze wydają się działać.
Dzięki
dplyr: jak odwoływać się do kolumn według indeksu kolumny, a nie nazwy kolumny za pomocą mutate?
Używając dplyr, możesz zrobić coś takiego:
iris %>% head %>% mutate(sum=Sepal.Length + Sepal.Width)
Sepal.Length S ... 5.0 3.6 1.4 0.2 setosa 8.6
6 5.4 3.9 1.7 0.4 setosa 9.3
Tworzenie nowych zmiennych z mutate at przy zachowaniu oryginalnych
Rozważ ten prosty przykład:
library(dplyr)
dataframe <- data_frame(helloo = c(1,2,3,4,5,6),
ooo ... zy istnieje rozwiązanie, które nie wymaga przechowywania danych pośrednich i łączenia z powrotem do oryginalnej ramki danych?