sqldf

R: jak rbindować dwie ogromne ramki danych bez wyczerpania pamięci

Mam dwie ramki danych df1 i df2, z których każda ma około 10 milionów wierszy i 4 kolumny. Czytam je do R używając RODBC/SQLQ ... tać kluczowy argument dbname = tempfile() w wywołaniu sqldf powyżej, jak sugeruje JD Long w swojej odpowiedzi na to pytanie

Wybierz tylko pierwsze wiersze dla każdej unikalnej wartości kolumny w R

From a dataframe like this test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ... zwalające utworzyć nową kolumnę jak test$row <- rownames(test) I uruchomienie tego samego zapytania sqldf z min (row)?

Podsumowanie z warunkami w dplyr

Zilustruję moje pytanie na przykładzie. Przykładowe dane: df <- data.frame(ID = c(1, 1, 2, 2, 3, 5), A = c("foo", "bar ... eczy. Error in sqliteExecStatement(conn, statement, ...) : RS-DBI driver: (error in statement: no such function: IFELSE)