sqldf
R: jak rbindować dwie ogromne ramki danych bez wyczerpania pamięci
Mam dwie ramki danych df1 i df2, z których każda ma około 10 milionów wierszy i 4 kolumny. Czytam je do R używając RODBC/SQLQ ... tać kluczowy argument dbname = tempfile() w wywołaniu sqldf powyżej, jak sugeruje JD Long w swojej odpowiedzi na to pytanie
Wybierz tylko pierwsze wiersze dla każdej unikalnej wartości kolumny w R
From a dataframe like this
test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10])
test <- test[order(test$id), ... zwalające utworzyć nową kolumnę jak
test$row <- rownames(test)
I uruchomienie tego samego zapytania sqldf z min (row)?
Podsumowanie z warunkami w dplyr
Zilustruję moje pytanie na przykładzie.
Przykładowe dane:
df <- data.frame(ID = c(1, 1, 2, 2, 3, 5), A = c("foo", "bar ... eczy.
Error in sqliteExecStatement(conn, statement, ...) :
RS-DBI driver: (error in statement: no such function: IFELSE)