data-processing

Wielkoskalowe przetwarzanie danych HBase vs Cassandra [zamknięty]

Prawie wylądowałem w Cassandrze po moich badaniach nad rozwiązaniami do przechowywania danych na dużą skalę. Ale ogólnie mówi ... ezproblemowa replikacja i brak funkcji point of failure. A także zachowuje funkcję indeksu wtórnego, więc jest to dobry plus.

Sposoby odczytu tylko wybranych kolumn z pliku do R? (Wesołe medium między " Czytaj.table ' i 'scan'?) [duplikat]

To pytanie ma już odpowiedź tutaj: czytaj tylko ograniczoną liczbę kolumn ... mocą skanowania lub odczytu.tabela wyników? (Co prowadzi do pytania jak wywołać skrypt powłoki i uchwycić jego wyjście w R?).

Lua vs Embedded Lisp i potencjalni inni kandydaci. do przetwarzania danych w oparciu o Zestaw

Aktualny wybór: lua-jit. Imponujące benchmarki, przyzwyczajam się do składni. Pisanie wysokowydajnego ABI będzie wymagało st ... ędzie wolnym oprogramowaniem. Jeśli jesteś zainteresowany współpracą ze mną (lub wkładem) w ten projekt, zostaw komentarz: D

Algorytm grupowania słów anagramowych

Biorąc pod uwagę zbiór słów, musimy znaleźć słowa anagramowe i wyświetlić każdą kategorię samodzielnie przy użyciu najlepszeg ... numbers[i],new StringBuilder(words[i])); } } The problem polega na tym, jak opracować metodę GetUniqueInts(string []).

Obsługa brakujących/niekompletnych Danych W R--czy istnieje funkcja do maskowania, ale nie usuwania NAs?

Jak można się spodziewać po DSL przeznaczonym do analizy danych, R radzi sobie bardzo dobrze z brakującymi/niekompletnymi dan ... y, z metodą mask, która pozwala ukryć--ale nie usunąć--NAs podczas wywołania funkcji. Czy istnieje analogiczna Funkcja W R?