data.table
Znajdowanie nakładania się między zestawami interwałów / efektywne nakładanie się połączeń
Przegląd:
Muszę połączyć dwie tabele:
ref zawiera przedziały czasowe (od t1 do t2) wraz z id dla każdego przedziału i spa ... 49: nI 500 600 c 590 595 -0.23325264
50: nI 500 600 c 595 600 0.18845022
space t1 t2 id i.t1 i.t2 res
Rolling join na danych.tabela z duplikatami kluczy
Próbuję zrozumieć rolling joins w data.table. Dane do odtworzenia tego podano na końcu.
Podane dane."tabela transakcji w por ... d","e"),
thisTime = c(6,7,8,9,
6,7,8), key=c("airport","thisTime"))
Szybsza wersja combn
Czy istnieje sposób na przyspieszenie combn polecenia, aby uzyskać wszystkie unikalne kombinacje 2 elementów pobrane z wektor ... liczanie unikalnych kombinacji( jak combn), ale z szybkością data.tabela (patrz drugi fragment kodu).
Doceniam każdą pomoc.
Problemy z konwersją długiej listy danych.ramek (~1 mln) na pojedyncze dane.ramka za pomocą do.call i ldply
Wiem, że jest tu wiele pytań na temat sposobów konwersji listy danych.ramki na pojedyncze dane.ramka za pomocą do.call lub ld ... ages:
[1] multicore_0.1-7 plyr_1.7.1 rjson_0.2.6
loaded via a namespace (and not attached):
[1] tools_2.14.1
>
Szybki odczyt i łączenie kilku plików za pomocą danych.stół (z fread)
Mam kilka różnych plików txt o tej samej strukturze. Teraz chcę je odczytać do R za pomocą freada, a następnie połączyć je w ... w prędkości.
Czy jest jakaś składnia w data.table, aby osiągnąć pionowe połączenie, takie jak rbind i union w sql?
Dzięki.
Co robi ".N " oznacza w tabeli danych w r?
Mam tabelę danych dt:
library(data.table)
dt = data.table(a=LETTERS[c(1,1:3)],b=4:7)
a b
1: A 4
2: A 5
3: B 6
4: C 7
... to nie tylko nazwa kolumny? Nie mogę znaleźć dokumentu przez ??".N" W R. próbowałem użyć .K, ale nie działa. Co oznacza .N?
Wyodrębnij kolumnę z danych.tabela jako wektor, według pozycji
Jak wyodrębnić kolumnę z danych.tabela jako wektor według jego położenia? Poniżej kilka fragmentów kodu, które wypróbowałem: ... quote(names(DT)[2]),with=FALSE] # Not a vector
# y
#1: 3
#2: 4
is.vector(DT[,noquote(names(DT)[2]),with=FALSE])
#[1] FALSE
Wykonaj semi-join z danymi.tabela
Jak wykonać semi-join z danymi.stolik? Semi-join jest jak wewnętrzne join, z tym wyjątkiem, że zwraca tylko kolumny X (nie r ... x)
y <- data.table(x = c(1, 1), z = 10:11)
x[y]
# x y z
# 1: 1 a 10
# 2: 1 a 11
A semi-join would return just x[1]
Podzbiór danych.tabela ustawiona według zakresu dat w R
Mam duży zbiór danych w danych.tabelę, którą chciałbym podgrupować według zakresu dat. Mój zestaw danych wygląda tak:
tests ... zwłaszcza gdy Lata się zmieniają. Bardziej elegancka metoda uczyniłaby moje życie nieskończenie łatwiejszym.
Z góry dzięki!
data.tabela W R-Zastosuj wiele funkcji do wielu kolumn
Próbuję zastosować wiele funkcji do wielu kolumn data.table. Przykład:
DT <- data.table("a"=1:5,
"b"=2: ... an(b))]
Ale to jest zbyt powtarzalne. Czy istnieje dobry sposób na osiągnięcie podobnego wyniku za pomocą .SDcols i lapply?
Przypisanie wartości do konkretnych danych.kolumny i wiersze tabeli
Wciąż Rozumiem ten wielki pakiet... Czy ktoś mógłby mi wyjaśnić przyczynę tego błędu? Dzięki!
library(data.table)
DT <- ... , var2)]
Error in `[<-.data.table`(`*tmp*`, 2, c(var1, var2), value = c(-0.394006912428776, :
object 'var1' not found
Utwórz formułę w danych.środowisko tabeli w R
Chciałbym uruchomić regresję w data.table. {[3] } musi być skonstruowany dynamicznie. Wypróbowałem następującą metodę:
x ... rcept) b
1: 1 21 -1
2: 2 21 -1
3: 3 21 -1
4: 4 21 -1
5: 5 21 -1
To mój sposób na powielanie wierszy w danych.stół wydajny?
Mam dane Miesięczne w jednym data.table i dane roczne w innym data.table i teraz chcę dopasować dane roczne do odpowiedniej o ... błąd. Myślałem, że jest to po prostu łatwy sposób, aby powiedzieć data.table, że chcesz wszystkie kolumny. Czego mi brakuje?
Scalanie tabeli danych na podstawie zakresów dat
Mam dwie tabele, policies i claims
policies<-data.table(policyNumber=c(123,123,124,125),
EFDT=as.Date(c ... 2014-01-01 4 2013-10-31 15
5: 125 2013-02-01 2014-02-01 NA <NA> NA
Agregowanie sumy sub i sumy wielkie z danymi.tabela
Mam data.table W R:
library(data.table)
set.seed(1)
DT = data.table(
group=sample(letters[1:2],100,replace=TRUE),
year ... .Tabela końcowa plyr na moim zbiorze danych, ponieważ jest to bardzo duży zbiór danych, który już mam w danych.format tabeli.
Szukanie lepszego sposobu dodawania kolumn w danych.tabela z tabeli wyszukiwania
Chciałbym utworzyć nową kolumnę key w moich danych.tabela przez scalenie z tabelą wyszukiwania za pomocą wspólnych kolumn ind ... DT) #Don't know why but DT became a data.frame after merge()
DT[J("a"), a:=value]
DT[J("b"), b:=value]
DT[J("c"), c:=value]
Warunkowe zastąpienie wartości kolumn danymi.tabela
Mam następujące dane.tabela:
dt <- data.table(col1 = rep("a",6), col2 = c(1,1,1,2,3,1))
Teraz chcę zastąpić wszystkie ... rame spirit:
dt$col2[dt$col2==1,] <- "bigDog"
Ale zastanawiam się, czy jest inny sposób, więcej "DANE.table oriented"?
Nie-equi dołączyć za pomocą danych.tabela: brak kolumny na wyjściu
Wykonuję lewe połączenie nie-equi używając data.table:
OUTPUT <- DT2[DT1, on=.(DOB, FORENAME, SURNAME, POSTCODE, START_D ... zakończenia 31 grudnia! Oczekiwany wynik jest tym, czym powinien być. Ale faktyczna produkcja sprawiła, że wszystko 1-Styczeń
Kiedy używać R, kiedy używać SQL?
Mam bazę danych o średniej wielkości z wieloma połączeniami i tabelami wyszukiwania.
Jestem bardziej zaznajomiony z R niż z ... - b.max do tabeli, na przykład w R,
Dla każdego wartość w a.group, select which(min (x.dt)))
x.dt <- a.time - b.max
Jak wykonać połączenie ponad zakresami dat przy użyciu danych.stolik?
Jak wykonać poniższy (prosty przy użyciu sqldf) przy użyciu danych.tabela i uzyskaj dokładnie taki sam wynik:
library(data. ... ldf
library(sqldf)
sqldf("select * from measurments m, whatWasMeasured wwm
where m.time between wwm.start and wwm.end")