text2vec

Naprawdę szybka wektoryzacja słowa ngram w R

Edit: nowy pakiet text2vec jest doskonały i rozwiązuje ten problem (i wiele innych) naprawdę dobrze. Text2vec na CRAN text2 ... m.time(tau_ng2 <- tau::textcnt(as.list(sents2), n = 2L, method = "string", recursive = TRUE)) tau_t2 / zach_t2 #1.9295619