dplyr

dplyr: umieść liczbę wystąpień w nowej zmiennej [duplikat]

To pytanie ma już odpowiedź tutaj: policz liczbę obserwacji / wierszy na grupę i dodaj wynik do ramki da ... h rzeczy jak: df %>% group_by(group) %>% rowwise() %>% do(count = nrow(.$var1)) Objaśnienia są bardzo doceniam!

Znajdowanie nakładania się między zestawami interwałów / efektywne nakładanie się połączeń

Przegląd: Muszę połączyć dwie tabele: ref zawiera przedziały czasowe (od t1 do t2) wraz z id dla każdego przedziału i spa ... 49: nI 500 600 c 590 595 -0.23325264 50: nI 500 600 c 595 600 0.18845022 space t1 t2 id i.t1 i.t2 res

Jak parametryzować wywołania funkcji w dplyr 0.7?

Wersja dplyr 0.7 zawiera gruntowny przegląd programowania z dplyr. Uważnie przeczytałem ten dokument i staram się zrozumieć, ... n_cyl=mean(cyl)) #> # A tibble: 1 × 2 #> `"am"` mean_cyl #> <chr> <dbl> #> 1 am 6.1875

Korzystanie z dplyr do liczenia częstotliwości interakcji, musi zawierać zerowe liczby

Moje pytanie dotyczy pisania kodu za pomocą pakietu dplyr W R Mam stosunkowo dużą ramkę danych (około 5 milionów wierszy) ... nie połączenie z pustą ramką, ale jestem przekonany musi być prostsze rozwiązanie. Wszelkie sugestie bardzo mile widziane!

Właściwy idiom do dodawania wierszy z liczbą zerową w tidyr/dplyr

Załóżmy, że mam jakieś dane count, które wyglądają tak: library(tidyr) library(dplyr) X.raw <- data.frame( x = as.f ... bne, używając spread Następnie gather, więc interesuje mnie znalezienie bardziej bezpośredniej trasy w obrębie tidyr i dplyr.

Ponownie zastosuj model zgrupowany do danych

I fit models like so groupedTrainingSet = group_by(trainingSet, geo); models = do(groupedTrainingSet, mod = lm(revenue ~ ju ... w stylu apply(trainingData, fitted = predict(select(models, geo==geo)$mod, .)); Ale nie jestem pewien co do składni.

Nadpisanie "zmienne Nie pokazane" w dplyr, aby wyświetlić wszystkie kolumny z df

Kiedy mam kolumnę w lokalnej ramce danych, czasami dostaję komunikat Variables not shown taki jak ten (śmieszny) przykład po ... .. ... ... Variables not shown: Year1 (dbl) Chcę zobaczyć! Jak Mogę zobaczyć wszystkie kolumny, najlepiej domyślnie.

dplyr count non-NA value in group by [duplicate]

to pytanie ma już odpowiedzi tutaj : ... RUE)) mydf %>% group_by(col_1) %>% mutate(non_na_count = count(col_2, na.rm=TRUE)) Nic nie działało. Jakieś sugestie?

Usuń kolumny/wiersze z brakiem więcej niż X%

Chcę usunąć wszystkie kolumny lub wiersze z więcej niż 50% NAs w ramce danych. To jest moje rozwiązanie: # delete columns ... } data <- data[-miss,] Ale szukam ładniejszego / szybszego rozwiązania. Byłbym również wdzięczny za dplyr Rozwiązanie

Sumowanie funkcji liczenia i agregacji warunkowej na tym samym współczynniku

Szybko i krótko jest to, że mam problemy z podsumowaniem Liczby i agregacją funkcji z warunkami na tym samym współczynniku. ... dokumentację i jestem pewien, że odpowiedzi tam są, ale mogą być zbyt zaawansowane dla mojego zrozumienia. Dzięki w naprzód!

Dplyr - Uporządkuj zgrupowane df według zmiennej grupy nie działającej

Mam dane.ramka zawierająca nazwy klientów, lata i kilka numerów przychodów z każdego roku. df <- data.frame(client = rep( ... bardziej użyteczne. Niezależnie od tego, nie zmieni się ponownie, ponieważ więcej zmian spowoduje tylko więcej zamieszania.

Jak aktualizować wartości za pomocą dplyr

Obecnie próbuję zaktualizować wartości z danych.frame using dplyr butI don ' t know if it is possible to replace a subset of ... : subs <- (net4$ave < 10 & net4$ave!=net4$temps2) net4$ave[subs] <- with(net4[subs,], temps2/NNET*NET) Thanks

Jak dodać kolumnę zbiorczą do ramki danych R za pomocą dplyr?

Mam to samo pytanie co ten post , ale chcę użyć dplyr: Z ramką danych R, np: df <- data.frame(id = rep(1:3, each = 5) ... a pasuje do id? Bez dplyr zaakceptowane rozwiązanie poprzedniego postu to: df$csum <- ave(df$value, df$id, FUN=cumsum)

Szybka regresja liniowa według grup

Mam 500K użytkowników i muszę obliczyć regresję liniową (z przechwyceniem) dla każdego z nich. Każdy użytkownik ma około 30 ... nany jako szybszy, ale nie wydaje się być kompatybilny z dplyr. Czy istnieje szybki sposób na regresję liniową według grupy?

Jak przekazać ciągi oznaczające wyrażenia do czasowników dplyr 0.7?

Chciałbym zrozumieć, jak przekazać łańcuchy reprezentujące wyrażenia do dplyr, aby zmienne wymienione w łańcuchu były oblicza ... ań tego pytania , ale nie działają one dla bardziej złożonych wyrażeń, takich jak 2 * cyl, które nie są tylko nazwą kolumny.

filtr dplyr z warunkiem na wielu kolumnach

Oto atrapa danych: father<- c(1, 1, 1, 1, 1) mother<- c(1, 1, 1, NA, NA) children <- c(NA, NA, 2, 5, 2) cousins ... and so on... Jak mogę użyć dplyr, aby powiedzieć filtruj całą kolumnę za pomocą na (z wyjątkiem ojca==1 & matki==1)

Znajdź zduplikowane elementy za pomocą dplyr

Próbowałem użyć kodu prezentowanego TUTAJ aby znaleźć wszystkie powielone elementy z dplyr w ten sposób: library(dplyr) ... st inna funkcja, która osiągnie to bardziej zwięźle niż zawiłe podejście x[duplicated(x) | duplicated(x, from.last = TRUE)])?

Czy istnieje metoda r dplyr dla merge with all = TRUE?

Mam dwa ramki danych R, które chcę połączyć. W prostym R można zrobić: cost <- data.frame(farm=c('farm A', 'office'), co ... x$trees[is.na(x$trees)] <- 0; są pracochłonne (potrzebuję polecenia na kolumnę) i nie zawsze wydają się działać. Dzięki

dplyr: jak odwoływać się do kolumn według indeksu kolumny, a nie nazwy kolumny za pomocą mutate?

Używając dplyr, możesz zrobić coś takiego: iris %>% head %>% mutate(sum=Sepal.Length + Sepal.Width) Sepal.Length S ... 5.0 3.6 1.4 0.2 setosa 8.6 6 5.4 3.9 1.7 0.4 setosa 9.3

Tworzenie nowych zmiennych z mutate at przy zachowaniu oryginalnych

Rozważ ten prosty przykład: library(dplyr) dataframe <- data_frame(helloo = c(1,2,3,4,5,6), ooo ... zy istnieje rozwiązanie, które nie wymaga przechowywania danych pośrednich i łączenia z powrotem do oryginalnej ramki danych?