data.table

Jak emulować funkcje sqls rank W R?

Jaki jest odpowiednik r funkcji rank, takich jak Oracle ROW_NUMBER(), RANK(), or DENSE_RANK() ("przypisuj wartości całkowite ... zmartwieniem jest występ. Byłoby dobrze, aby uniknąć używania join lub indeksowania dostępu, ze względu na pamięć i szybkość.

Jak grupować dane.tabela po wielu kolumnach?

Używam pakietu data.table, aby przyspieszyć zbiorcze gromadzenie statystyk na zbiorze danych. Jestem ciekaw, czy jest sposób ... róbowałem tego: adShownMedian <- df1[,median(purchaseAmt),by=c("adShown","url")] Ale bez powodzenia. Jakieś sugestie?

knitr zostaje oszukany przez dane.tabela": = " przypisanie

Wygląda na to, że knitr nie rozumie, że DT[, a:=1] nie powinno powodować wyjścia DT do dokumentu. Czy istnieje sposób, aby p ... :=, ale to musi być inna przyczyna, więc jest tu osobne pytanie: dlaczego buforowanie knitr nie działa dla danych.tabela':='?

Zastosuj funkcję do podzbioru danych.kolumny tabeli, według kolumn-indeksy zamiast nazwy

Próbuję zastosować funkcję do grupy kolumn w dużych danych.tabela bez odwoływania się do każdego z osobna. a <- data.tabl ... odwoływania się do nich indywidualnie. (w rzeczywistym zbiorze danych są dziesiątki kolumn, więc byłoby to niepraktyczne)

data.table / faster row-wise recursive update within group

Muszę wykonać następującą rekurencyjną operację wiersz po wierszu, aby uzyskać z: myfun = function (xb, a, b) { z = NULL ... wać b i jego lag (prawdopodobnie używając shift), gdy uruchamiam to operacja wiersz po wierszu w data.table. Jakieś sugestie?

Jak emulować SQL "partition by" w R?

Jak mogę wykonywać funkcje analityczne, takie jak funkcje Oracle ROW_NUMBER(), RANK () lub dense_rank () (zobacz http://www. ... zmartwieniem jest występ. Byłoby dobrze, aby uniknąć używania join lub indeksowania dostępu, ze względu na pamięć i szybkość.

Dynamiczne nazwy kolumn w danych.tabela

Próbuję dodać kolumny do mojego data.table, Gdzie nazwy są dynamiczne. Dodaję muszę użyć argumentu by podczas dodawania tych ... wyróżnienie! Zobacz to podobne pytanie dla nowych przykładów: Przypisz wiele kolumn za pomocą danych.tabela, według grup

Wybierz podzbiór kolumn w danych.tabela R [duplikat]

To pytanie ma już odpowiedź tutaj: Wybieranie podzbioru kolumn w danych.tabela ... Uważam to za dość kłopotliwe, biorąc pod uwagę dane.składnia tabeli jest zwykle tak elegancki. Czy jest na to lepsza metoda?

Wydajne alternatywy do scalania dla większych danych.ramki R

Szukam efektywnej (zarówno z punktu widzenia zasobów komputerowych, jak i nauki/implementacji) metody łączenia dwóch większyc ... nspection:https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/ Dane wytworzone przez anonym

Tłumaczenie złączeń SQL na klucze obce na dane R.składnia tabeli

The data.table pakiet dostarcza wiele takich samych metod obsługi tabel jak SQL. Jeśli tabela zawiera klucz, klucz ten składa ... X2[Y2, 1:2,by = y_id] Nie dostaję pożądanego rezultatu: y_id V1 [1,] 1 1 [2,] 1 2 [3,] 2 1 [4,] 2 2

Przyspiesz dane.grupowanie tabeli przy użyciu wielu rdzeni i programowania równoległego

Mam duży kod, a etap agregacji jest aktualnym wąskim gardłem pod względem szybkości. W moim kodzie chciałbym przyspieszyć k ... dobrym pomysłem na miliony szybkich operacji, ponieważ wysiłek komunikacji między rdzeniami spowalnia wysiłek paralelizacji.

Korzystanie z danych.tabela I i argumenty j w funkcjach

Próbuję napisać kilka funkcji wrappera, aby zmniejszyć powielanie kodu za pomocą data.table. Oto przykład użycia mtcars. Naj ... bleOrder <- function(x, group){ x[, list(Total=length(mpg)), by=eval(group)][order(group)] } tableOrder(mtcars, "car")

data.obliczenia stołowe i równoległe

Following this post: multicore and data.tabela W R , zastanawiałem się, czy istnieje sposób na użycie wszystkich rdzeni przy ... azwyczaj wykonująca obliczenia według grup, może być równoległa. Wydaje się, że {[0] } pozwala na takie operacje z założenia.

Pętla przez kolumny w danych.table and transform these columns

Mam dane.tabela DT z kolumną o nazwie RF i wieloma kolumnami z podkreśleniem _. Chcę przejrzeć wszystkie te kolumny z podkre ... jednak pytanie otwarte, bo nadal jestem ciekaw, dlaczego moje podejście do operatora := nie praca. Więc może ktoś mi pomoże.

Zastąpienie wszystkich brakujących wartości w danych R.tabela z wartością

Jeśli masz dane R.tabela, która ma brakujące wartości, jak zastąpić wszystkie z nich, powiedzmy, wartością 0? Np. aa = data ... 4 10: 10 NA 4 Można to zrobić w jednej linii? Gdyby to była tylko matryca, można by po prostu zrobić: tt[is.na(tt)] = 0

W danych R.table, jak przekazać zmienne parametry do wyrażenia?

Utknąłem z małym problemem R z data.table. Twoja pomoc jest bardzo doceniana. Jak to zrobić: getResult <- function(dt, e ... zywane z innego programu jako zmienna znakowa, więc nie mogę tego zrobić v1<- quote(Sepal.Length), co wydaje się działać.

Czy możliwa jest modyfikacja danych.frame in-place (destrukcyjnie)?

Wygląda na to, że można dodać/usunąć kolumnę do data.table in-place , tzn. bez kopiowania wszystkich pozostałych kolumn do ... ą data.frame? PS. Wiem jak dodawać / usuwać kolumny "funkcjonalnie", czyli tworząc nową ramkę bez modyfikowania oryginalnej.

Zastosuj funkcję na podzbiorze kolumn (.SDcols) podczas stosowania innej funkcji na innej kolumnie (w grupach)

Jest to bardzo podobne do pytania stosującego wspólną funkcję do wielu kolumn data.table uning .SDcols odpowiedzi dokładnie t ... 608 -0.1781543 -0.137625004 Jestem pewien, że to dość prosta rzecz, której mi brakuje, z góry dzięki za wszelkie wskazówki.

R data.okno przesuwne stołu

Jaki jest najlepszy (najszybszy) sposób implementacji funkcji okna przesuwnego z danymi.pakiet stołu? Próbuję obliczyć średn ... numeric(NA)] for(i in nrow(output):1) { print(i) output[i, window_median:=median(get_window(date, factor1, factor2))] }

Szybszy sposób odczytu plików o stałej szerokości

Pracuję z wieloma plikami o stałej szerokości (tzn. bez znaków oddzielających), które muszę wczytać do R. tak więc, zwykle is ... roszę Zobacz również odpowiedź poniżej autorstwa @ MichaelChirico, który dodał kilka świetnych benchmarków i pakiet iotools.