data.table

Używam.I zwrócić numery wierszy z danymi.pakiet stołów

Czy ktoś mógłby mi wyjaśnić poprawne użycie .I do zwracania numerów wierszy danych.stolik? Mam takie dane: require(data.ta ... proste, ale wszystko, co udało mi się znaleźć w danych.dokumentacja tabeli jest tym, co robią .I i .N, a nie jak ich używać.

Jak wyodrębnić pierwsze n wierszy na Grupę?

Mam dane.tabela dt. Te dane.tabela jest sortowana najpierw według kolumny date (moja zmienna grupująca), a następnie według k ... mpbell") dt <- data.table(date, age, name) setkeyv(dt,c("date","age")) # Sorts table first by column "date" then by "age"

korzystanie z danych.tabela oznaczająca pierwszy (lub ostatni) rekord w grupie

Biorąc pod uwagę sortkey, jest tam dane.Skrót tabeli do powielania funkcji first i last znalezionych w SAS i SPSS ? Podejści ... ,"y") setkeyv(DT,sortkey) key <- paste(DT$x,DT$y,sep="-") nw <- c( T , key[2:n]!=key[1:(n-1)] ) DT$first <- 1*nw DT

Suma najnowszych wartości w poszczególnych grupach

Dla każdego wiersza moich danych chciałbym obliczyć sumę ostatnich value dla każdego group: dt = data.table(group = c('a',' ... still too slow # this is just to illustrate *a* solution dt[i, desired1 := dt[1:i, value[.N], by = group][, sum(V1)]] }

Podzbiór danych.tabela tylko w drugiej kolumnie klucza 2-kolumnowego, przy użyciu wyszukiwania binarnego, a nie skanowania wektorowego

Niedawno odkryłem wyszukiwanie binarne w data.table. Jeśli tabela jest posortowana na wielu klawiszach, można wyszukiwać tylk ... user system elapsed 0.220 0.068 0.288 R> system.time(DT[y==25]) user system elapsed 0.268 0.092 0.359

Proste tabele częstotliwości z wykorzystaniem danych.tabela

Szukam sposobu na proste agregacje / liczenia za pomocą danych.stolik. Rozważmy dane iris, które mają 50 obserwacji na gatun ... ), Species] Species V1 1: setosa 1 2: versicolor 1 3: virginica 1 Czy jest jakiś elegancki sposób na obejście tego?

rolling łączy dane.tabela W R

[12]}staram się zrozumieć trochę więcej o tym, jak rolling łączy się z pracą i mam pewne zamieszanie, miałem nadzieję, że kto ... ten konkretny id nie istnieje w dt1? Bawiąc się trochę bardziej nie mogę zrozumieć, jaka wartość jest umieszczana w kolumnie.

Dlaczego jest as.Data wolna na wektorze znaków?

Zacząłem używać danych.pakiet tabeli w R, aby zwiększyć wydajność mojego kodu. Używam następującego kodu: sp500 <- read. ... $year+1900)]) user system elapsed 0.304 0.001 0.305 Na MacAir i5 z nieco mniej niż 3000000 obserwacji. Dzięki

Oblicz sumę listy zmiennych według grup

Mam dane.tabela z jednym kluczem i około 100 wierszami liczbowymi, z których jeden jest ustawiony na key. Chciałbym utworzyć ... ,1,1,1,1,1,1,0,1) Count3 <- c(1,0,0,1,0,1,0,1,1,1,1,1,1,0,1) x <- data.table(ID, Count1, Count2, Count3) setkey(x, ID)

R: przekazywanie ramki danych przez odniesienie

R ma semantykę pass-by-value, która minimalizuje przypadkowe skutki uboczne (dobra rzecz). Jednak, gdy kod jest zorganizowany ... e typu agnostycznego pass-by-reference, które ładnie integruje się z R, chociaż moje potrzeby dotyczą wyłącznie ramek danych.

jak utworzyć cytowane wyrażenie z łańcuchów

Biorąc pod uwagę wektor łańcuchów, chciałbym utworzyć wyrażenie bez cudzysłowów. # eg, I would like to go from c("string1" ... .function.of(input) > mydt[ , eval( result )] string1 string2 1: A a 2: B b 3: C c

Łączenie wielu danych.tabele

Zdaję sobie sprawę, że można połączyć (połączyć) dwie data.table z funkcją merge lub z funkcją [.data.table. Jeśli jednak ma ... nkcja, która by to zrobiła? Obecnie uciekam się do do.call(cbind, ...), który działa tylko w bardzo szczególnych przypadkach.

Jak zmienić poziomy kolumny współczynników w danych.tabela

Jaki jest prawidłowy sposób zmiany poziomów kolumny factor w kolumnie data.table (uwaga: nie ramka danych) library(data.t ... Y 4: 4 B 4: 4 Y 5: 5 B 5: 5 Y 6: 6 C 6: 6 Z

data.tabela alternatywna dla przypadku dplyr, gdy

Jakiś czas temu wprowadzili ładną alternatywę podobną do SQL do ifelse wewnątrz dplyr, czyli case_when. Czy w data.table ist ... rdzo pomocne i uczyniłoby Kod o wiele bardziej czytelny (jeden z powodów, dla których wciąż używam dplyr w tych przypadkach).

Dlaczego ma dane.table defined: = zamiast przeciążać < -?

Data.w tabeli wprowadzono operator:=. Dlaczego nie przeciążenie

Dodaj wiersz przez odniesienie na końcu danych.obiekt tabeli

W tym pytaniu twórca pakietu data.table wyjaśnia, dlaczego wiersze nie mogą być wstawiane (lub usuwane) przez odniesienie w ... rbind(a, data.table(id="c", var=3)) rbindlist(list(a, data.table(id="c", var=3))) Czy są w końcu inne (lepsze) metody?

korzystanie z colClasses we freadzie

Nie wiem jak wybrać konkretne kolumny używając opcji colClasses w fread. Próbowałem użyć NULL na kilka sposobów, ale nic nie ... tRversion() [1] ‘3.0.1’ Importowany zestaw danych powinien wyglądać tak: a c 1: 1 10 2: 2 11 3: 3 12 4: 4 13 5: 5 14

R data.table apply function to rows using columns as arguments

Mam następujące data.table x = structure(list(f1 = 1:3, f2 = 3:5), .Names = c("f1", "f2"), row.names = c(NA, -3L), class = ... ja jest bardziej złożona i robi pętle i w ogóle, ale zwraca obliczoną wartość. Jaki byłby najlepszy sposób, aby to osiągnąć?

Pivot na danych.tabela podobna do funkcji melt rehape

Przeczytałem kilka odniesień do podobnych problemów tutaj na SO, ale nie byłem w stanie znaleźć jeszcze rozwiązania i zastana ... em tego z kombinacją listy, itp, ale może brakuje czegoś, co jest oczywiste. Wszystkie UID w dt są unikalne. Z góry dzięki.

Zrozumienie.Ja w danych.tabela W R

Bawiłem się data.table i natknąłem się na rozróżnienie, którego nie jestem pewien, czy do końca rozumiem. Biorąc pod uwagę na ... y możesz mi wyjaśnić różnicę między poniższymi wyrażeniami? 1) DT[J("E"), .I] 2) DT[ , .I[x == "E"] ] 3) DT[x == "E", .I]