scikit-learn

Wykorzystanie scikit do określenia wkładu każdej funkcji do predykcji określonej klasy

Używam scikit extra trees classifier: model = ExtraTreesClassifier(n_estimators=10000, n_jobs=-1, random_state=0) Gdy mod ... anie klas. Jak to zrobić w scikit learn? Czy jest to możliwe z dodatkowym klasyfikatorem drzew, czy muszę użyć innego modelu?

unigrams & bigrams (TF-idf) mniej dokładne niż tylko unigrams (FF-idf)?

Jest to pytanie o regresję liniową z ngramami, przy użyciu TF-IDF (term frequency - inverse document frequency). Aby to zrobi ... itp.), tym mniej dokładna jest prognoza regresji. Czy to częste? Jak to możliwe? Myślałem, że im więcej funkcji, tym lepiej.

Python scikit dowiedz się pca.wyjaśnione odcięcie współczynnika wariancji

Guru, Wybierając liczbę głównych składników (k), wybieramy k jako najmniejszą wartość, tak aby na przykład zachowano 99% wa ... rn PCA jest tutaj Http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html#sklearn.decomposition.PCA

Różnica między wynikiem cross val i Cross val predict

Chcę ocenić model regresji zbudowany z scikitlearn za pomocą walidacji krzyżowej i getting confused, która z dwóch funkcji cr ... ywu na zmianę liczby fałd. Czy należy się spodziewać takiego zachowania i czy brakuje mi zrozumienia odnośnie CV w SKLearn?

lista wszystkich algorytmów klasyfikacji

Mam problem z klasyfikacją i chciałbym przetestować wszystkie dostępne algorytmy, aby sprawdzić ich wydajność w rozwiązywaniu ... ression() KNeighborsClassifier() GaussianNB() ExtraTreesClassifier() BaggingClassifier() Twoja pomoc jest bardzo doceniana.

Sklearn: ROC dla klasyfikacji multiclass

Przeprowadzam różne eksperymenty z klasyfikacją tekstu. Teraz muszę obliczyć AUC-ROC dla każdego zadania. Dla klasyfikacji bi ... ałem gdzieś, że muszę binaryzować etykiety, ale naprawdę nie rozumiem, jak obliczyć ROC dla klasyfikacji multiclass. Napiwki?

Macierz podobieństwa cosinusów

Kilka pytań na temat stackoverflow wspomina o tym problemie, ale nie znalazłem konkretnego rozwiązania. Mam macierz kwadrato ... i chcę znaleźć jak najwięcej klastrów, jak to możliwe, bez poświęcania precyzji. Będę musiał zaimplementować to w Pythonie.

Wizualizacja drzewa decyzyjnego w scikit-dowiedz się

Próbuję zaprojektować proste drzewo decyzyjne za pomocą scikit-learn w Pythonie (używam Notatnika Ipython Anacondy z Pythonem ... ie stoskoverflow też mi nie pasuje: pytanie Czy ktoś mógłby mi pomóc jak zwizualizować decyzję drzewo w scikit-uczyć się?

sklearn.weryfikacja krzyżowa.StratifiedShuffleSplit-error: "indeksy są poza granicami"

Próbowałem podzielić przykładowy zestaw danych za pomocą warstwowego podziału Shuffle Scikit-learn. Podążałem za przykładem p ... go skryptu dostaję następujący błąd: IndexError: indices are out-of-bounds Czy ktoś mógłby wskazać, co robię źle? Dzięki!

scikit grid search over multiple classifiers python

Chciałem się dowiedzieć, czy istnieje lepszy, bardziej wbudowany sposób na przeszukiwanie sieci i testowanie wielu modeli w j ... re_ Jednak to podejście wciąż daje najlepszy model w obrębie każdego klasyfikatora, a nie porównuje między klasyfikatorami.

Zapisz python random forest model do pliku

W R, Po uruchomieniu modelu "random forest", mogę użyć save.image("***.RData") do przechowywania modelu. Następnie mogę po pr ... mogę załadować modelu w pliku prognozy. Czy możesz oddzielić model i przewidywanie za pomocą pakietu sklearn random forest?

Uzyskaj wartości i Wektory eigen ze sklepu PCA

Jak mogę uzyskać wartości eigen i Wektory eigen aplikacji PCA? from sklearn.decomposition import PCA clf=PCA(0.98,whiten=Tr ... 30) chcę uzyskać wszystkie wartości własne i wektory własne zamiast tylko zredukowanego zbioru z warunkiem konwergencji.

Xgboost domyślnie Xgbclassifier w Pythonie

Próbuję użyć klasyfikatora xgboosts do klasyfikacji niektórych danych binarnych. Kiedy robię najprostszą rzecz i po prostu uż ... ych parametrów, mam to samo dzieje się Czy ktoś wie jakie są domyślne wartości XGBclassifier? żebym mógł zacząć tuningować?

Python lista Ngramów z częstotliwościami

Muszę pobrać najpopularniejsze ngramy z tekstu. Ngrams długość musi być od 1 do 5 słów. Wiem, jak zdobyć bigramy i trygramy ... itgrams: hello my trygramy: hello My name Wiem, jak wykluczyć bigramy z trygramów, ale potrzebuję lepszego rozwiązania.

znajdź ważne cechy klasyfikacji

Próbuję sklasyfikować niektóre dane EEG za pomocą modelu regresji logistycznej (wydaje się, że daje to najlepszą klasyfikację ... lasyfikacji. Czy to możliwe, czy zadaję złe pytanie? Wszelkie komentarze lub referencje papierowe są bardzo mile widziane.

Scikit-learn Zwraca wartość współczynnika determinacji (R^2) poniżej -1

Robię prosty model liniowy. Mam fire = load_data() regr = linear_model.LinearRegression() scores = cross_validation.cross_v ... wanymi danymi cukrzycy, działa to doskonale, ale dla moich danych zwraca te pozornie absurdalne wyniki. Zrobiłem coś nie tak?

scikit-dowiedz się znaczenia TfidfVectorizer?

Czytałem o tfidfvectorizer implementacji scikit-ucz się, nie rozumiem co wynika z metody, na przykład: new_docs = ['He watc ... 0. 0.4736296 0. 0. 0. ]] Czy ktoś mógłby mi wyjaśnić bardziej szczegółowo te wyniki? Dzięki!

Faktoryzacja macierzy nieujemnej Pythona, która obsługuje zarówno zera, jak i brakujące dane?

Szukam implementacji NMF, która ma interfejs Pythona i obsługuje zarówno brakujące dane, jak i zera. Nie chcę przypisywać br ... i minimalizowanej. Wydaje się, że ani scikit-learn, ani nimfa, ani graphlab, ani mahout nie proponują takiej opcji. Dzięki!

Wykonywanie wyboru funkcji Chi-2 na wektorach TF i TF*IDF

Eksperymentuję z wyborem funkcji Chi-2 do niektórych zadań klasyfikacji tekstu. Rozumiem, że test Chi-2 sprawdza zależności B ... torowej TF*IDF. Jak wykonać wybór funkcji Chi-2 na rzeczywistych funkcjach? Dziękuję w Zaliczka dla Twojego rodzaju porady!

Scikit-dowiedz się więcej

W docs dla chi-squared univariate funkcja wyboru funkcji scikit-learn http://scikit-learn.org/stable/modules/generated/sklea ... z chi2 przy stosowaniu scipy.stats.chi2_contingency i ku mojemu przerażeniu, nie jest. chciałbym zapytać, dlaczego nie jest.