data.table

Znajdowanie nakładania się między zestawami interwałów / efektywne nakładanie się połączeń

Przegląd: Muszę połączyć dwie tabele: ref zawiera przedziały czasowe (od t1 do t2) wraz z id dla każdego przedziału i spa ... 49: nI 500 600 c 590 595 -0.23325264 50: nI 500 600 c 595 600 0.18845022 space t1 t2 id i.t1 i.t2 res

Rolling join na danych.tabela z duplikatami kluczy

Próbuję zrozumieć rolling joins w data.table. Dane do odtworzenia tego podano na końcu. Podane dane."tabela transakcji w por ... d","e"), thisTime = c(6,7,8,9, 6,7,8), key=c("airport","thisTime"))

Szybsza wersja combn

Czy istnieje sposób na przyspieszenie combn polecenia, aby uzyskać wszystkie unikalne kombinacje 2 elementów pobrane z wektor ... liczanie unikalnych kombinacji( jak combn), ale z szybkością data.tabela (patrz drugi fragment kodu). Doceniam każdą pomoc.

Problemy z konwersją długiej listy danych.ramek (~1 mln) na pojedyncze dane.ramka za pomocą do.call i ldply

Wiem, że jest tu wiele pytań na temat sposobów konwersji listy danych.ramki na pojedyncze dane.ramka za pomocą do.call lub ld ... ages: [1] multicore_0.1-7 plyr_1.7.1 rjson_0.2.6 loaded via a namespace (and not attached): [1] tools_2.14.1 >

Szybki odczyt i łączenie kilku plików za pomocą danych.stół (z fread)

Mam kilka różnych plików txt o tej samej strukturze. Teraz chcę je odczytać do R za pomocą freada, a następnie połączyć je w ... w prędkości. Czy jest jakaś składnia w data.table, aby osiągnąć pionowe połączenie, takie jak rbind i union w sql? Dzięki.

Co robi ".N " oznacza w tabeli danych w r?

Mam tabelę danych dt: library(data.table) dt = data.table(a=LETTERS[c(1,1:3)],b=4:7) a b 1: A 4 2: A 5 3: B 6 4: C 7 ... to nie tylko nazwa kolumny? Nie mogę znaleźć dokumentu przez ??".N" W R. próbowałem użyć .K, ale nie działa. Co oznacza .N?

Wyodrębnij kolumnę z danych.tabela jako wektor, według pozycji

Jak wyodrębnić kolumnę z danych.tabela jako wektor według jego położenia? Poniżej kilka fragmentów kodu, które wypróbowałem: ... quote(names(DT)[2]),with=FALSE] # Not a vector # y #1: 3 #2: 4 is.vector(DT[,noquote(names(DT)[2]),with=FALSE]) #[1] FALSE

Wykonaj semi-join z danymi.tabela

Jak wykonać semi-join z danymi.stolik? Semi-join jest jak wewnętrzne join, z tym wyjątkiem, że zwraca tylko kolumny X (nie r ... x) y <- data.table(x = c(1, 1), z = 10:11) x[y] # x y z # 1: 1 a 10 # 2: 1 a 11 A semi-join would return just x[1]

Podzbiór danych.tabela ustawiona według zakresu dat w R

Mam duży zbiór danych w danych.tabelę, którą chciałbym podgrupować według zakresu dat. Mój zestaw danych wygląda tak: tests ... zwłaszcza gdy Lata się zmieniają. Bardziej elegancka metoda uczyniłaby moje życie nieskończenie łatwiejszym. Z góry dzięki!

data.tabela W R-Zastosuj wiele funkcji do wielu kolumn

Próbuję zastosować wiele funkcji do wielu kolumn data.table. Przykład: DT <- data.table("a"=1:5, "b"=2: ... an(b))] Ale to jest zbyt powtarzalne. Czy istnieje dobry sposób na osiągnięcie podobnego wyniku za pomocą .SDcols i lapply?

Przypisanie wartości do konkretnych danych.kolumny i wiersze tabeli

Wciąż Rozumiem ten wielki pakiet... Czy ktoś mógłby mi wyjaśnić przyczynę tego błędu? Dzięki! library(data.table) DT <- ... , var2)] Error in `[<-.data.table`(`*tmp*`, 2, c(var1, var2), value = c(-0.394006912428776, : object 'var1' not found

Utwórz formułę w danych.środowisko tabeli w R

Chciałbym uruchomić regresję w data.table. {[3] } musi być skonstruowany dynamicznie. Wypróbowałem następującą metodę: x ... rcept) b 1: 1 21 -1 2: 2 21 -1 3: 3 21 -1 4: 4 21 -1 5: 5 21 -1

To mój sposób na powielanie wierszy w danych.stół wydajny?

Mam dane Miesięczne w jednym data.table i dane roczne w innym data.table i teraz chcę dopasować dane roczne do odpowiedniej o ... błąd. Myślałem, że jest to po prostu łatwy sposób, aby powiedzieć data.table, że chcesz wszystkie kolumny. Czego mi brakuje?

Scalanie tabeli danych na podstawie zakresów dat

Mam dwie tabele, policies i claims policies<-data.table(policyNumber=c(123,123,124,125), EFDT=as.Date(c ... 2014-01-01 4 2013-10-31 15 5: 125 2013-02-01 2014-02-01 NA <NA> NA

Agregowanie sumy sub i sumy wielkie z danymi.tabela

Mam data.table W R: library(data.table) set.seed(1) DT = data.table( group=sample(letters[1:2],100,replace=TRUE), year ... .Tabela końcowa plyr na moim zbiorze danych, ponieważ jest to bardzo duży zbiór danych, który już mam w danych.format tabeli.

Szukanie lepszego sposobu dodawania kolumn w danych.tabela z tabeli wyszukiwania

Chciałbym utworzyć nową kolumnę key w moich danych.tabela przez scalenie z tabelą wyszukiwania za pomocą wspólnych kolumn ind ... DT) #Don't know why but DT became a data.frame after merge() DT[J("a"), a:=value] DT[J("b"), b:=value] DT[J("c"), c:=value]

Warunkowe zastąpienie wartości kolumn danymi.tabela

Mam następujące dane.tabela: dt <- data.table(col1 = rep("a",6), col2 = c(1,1,1,2,3,1)) Teraz chcę zastąpić wszystkie ... rame spirit: dt$col2[dt$col2==1,] <- "bigDog" Ale zastanawiam się, czy jest inny sposób, więcej "DANE.table oriented"?

Nie-equi dołączyć za pomocą danych.tabela: brak kolumny na wyjściu

Wykonuję lewe połączenie nie-equi używając data.table: OUTPUT <- DT2[DT1, on=.(DOB, FORENAME, SURNAME, POSTCODE, START_D ... zakończenia 31 grudnia! Oczekiwany wynik jest tym, czym powinien być. Ale faktyczna produkcja sprawiła, że wszystko 1-Styczeń

Kiedy używać R, kiedy używać SQL?

Mam bazę danych o średniej wielkości z wieloma połączeniami i tabelami wyszukiwania. Jestem bardziej zaznajomiony z R niż z ... - b.max do tabeli, na przykład w R, Dla każdego wartość w a.group, select which(min (x.dt))) x.dt <- a.time - b.max

Jak wykonać połączenie ponad zakresami dat przy użyciu danych.stolik?

Jak wykonać poniższy (prosty przy użyciu sqldf) przy użyciu danych.tabela i uzyskaj dokładnie taki sam wynik: library(data. ... ldf library(sqldf) sqldf("select * from measurments m, whatWasMeasured wwm where m.time between wwm.start and wwm.end")