term-document-matrix

Bardziej efektywny sposób tworzenia korpusu i DTM z rzędami 4M

Mój plik ma ponad 4M wierszy i potrzebuję bardziej wydajnego sposobu konwersji moich danych do korpusu i macierzy terminów do ... ki pojawia mi się błąd, do tego nawet nie wiem czy to zadziała. Ref. http://cran.r-project.org/web/packages/qdap/qdap.pdf

Błąd konwersji tekstu na małe litery za pomocą mapy tm ( ... , tolower)

Próbowałem użyć tm_map. Dało to następujący błąd. Jak mogę to obejść? require(tm) byword<-tm_map(byword, tolower) Error in UseMethod("tm_map", x) : no applicable method for 'tm_map' applied to an object of class "character"