statistics
Co jest dobrym rozwiązaniem do obliczania średniej, gdy suma wszystkich wartości przekracza granice dubla?
Mam wymóg, aby obliczyć średnią z bardzo dużego zestawu podwójnych (wartości 10^9). Suma wartości przekracza górną granicę p ... ęc czy ktoś zna jakieś fajne sztuczki do obliczania średniej, które nie wymagają również obliczenia sumy?
Używam Javy 1.5.
Boxplots w matplotlib: markery i odstające
Mam kilka pytań odnośnie boxplots w matplotlib:
Pytanie A . Co znaczniki, które zaznaczam poniżej Q1, Q2 i Q3 reprezentuj ...
Pytanie B Jak matplotlib identyfikujeodstające ? (tzn. skąd wie, że nie są one prawdziwe max i min wartości?)
Pandy-Oblicz Z-score dla wszystkich kolumn
Mam ramkę danych zawierającą pojedynczą kolumnę identyfikatorów, a wszystkie pozostałe kolumny są wartościami liczbowymi, dla ... iem go dobrze. Jeśli indeksowanie jest kluczową częścią rozwiązania tego problemu, proszę o wyjaśnienie sposobu indeksowania.
Biorąc pod uwagę zbiór liczb losowych losowanych z ciągłego rozkładu jednowymiarowego, znajdź rozkład
Biorąc pod uwagę zbiór liczb rzeczywistych narysowanych z nieznanego ciągłego rozkładu jednowymiarowego (powiedzmy, że jest t ... dentyfikacyjny dystrybucji będzie częścią zautomatyzowany proces, więc ręczna interwencja w identyfikacji nie będzie możliwa.
Dobroć funkcji fit w R
Jakich funkcji używasz w R, aby dopasować krzywą do swoich danych i sprawdzić, jak dobrze ta krzywa pasuje? Jakie wyniki są uważane za dobre?
Zmiana kolejności elementów macierzy w celu odzwierciedlenia grupowania kolumn i wierszy w Pythonie
Szukam sposobu, aby wykonać klastrowanie oddzielnie na wierszach macierzy, a nie na jej kolumnach, zmienić kolejność danych w ... macierzy, a następnie wygenerujesz mapę cieplną, grupowanie danych może stać się widoczne dla widza (jak na rysunku powyżej)
Średnia geometryczna: czy jest wbudowany?
Próbowałem znaleźć wbudowaną średnią geometryczną, ale nie mogłem.
(Oczywiście Wbudowany nie zaoszczędzi mi czasu podczas p ... to zauważalny.
W przypadku, gdy nie ma żadnego (w co wątpię) tutaj jest mój.
gm_mean = function(a){prod(a)^(1/length(a))}
Wyjaśnij funkcję kwantyla () w R
Przez cały dzień byłem zdumiony funkcją kwantyla R.
Mam intuicyjne pojęcie o tym, jak działają kwantyle i M. S. w statysty ... ić poprawioną dokumentację, która lepiej wyjaśnia, co się tutaj dzieje.
Kwantyl.R kod źródłowy
lub typu: kwantyl.default
Analiza głównych składników - jak uzyskać wkład ( % ) każdego parametru do Prin.Komp.?
Chcę wiedzieć, w jakim stopniu pomiar / parametr przyczynia się do jednego z obliczonych głównych składników.
Opis świata rz ... _table, cor=T)
biplot(pca) # same: plot(pca$scores[,1], pca$scores[,2])
pca
summary(pca)
Gdzie są ukryte moje informacje?
Tabela częstotliwości dla pojedynczej zmiennej
Ostatnie pytanie newbie pandy na dziś: jak wygenerować tabelę dla jednej serii?
Na przykład:
my_series = pandas.Series([1, ... zebuję: jedna zmienna, liczy się według kategorii. Oh, I byłoby miło, gdyby działało na różne typy danych: ciągi, ints, itp.
Dwuczłonowy Test Kołmogorowa-Smirnowa w Pythonie Scipy
Nie mogę wymyślić, jak zrobić test KS w Scipy.
Po przeczytaniu dokumentacji scipy kstest
Widzę jak sprawdzić gdzie rozkła ... object is not callable
Czy jest sposób na wykonanie testu KS w Pythonie? Jeśli tak, to jak mam to zrobić?
Z góry dziękuję
Obliczanie funkcji korelacji krzyżowej?
W R, używam ccf lub acf do obliczenia pary-wise cross-correlation function tak, że mogę dowiedzieć się, który przesunięcie da ... :
xcorr = lambda x,y : irfft(rfft(x)*rfft(y[::-1]))
x = numpy.array([0,0,1,1])
y = numpy.array([1,1,0,0])
print xcorr(x,y)
Implementacja w Pythonie interwału wyników Wilsona?
Po przeczytaniu Jak nie sortować według średniej oceny, byłem ciekaw, czy ktoś ma implementację Pythona dolnej granicy przedziału ufności wyniku Wilsona dla parametru Bernoulliego?
Jak korzystać z klas boost normal distribution?
Próbuję użyć boost:: normal_distribution w celu wygenerowania rozkładu normalnego ze średnią 0 i sigma 1.
Poniższy kod nie d ... .
Z góry dziękuję wszystkim!
EDIT: tak się dzieje kiedy masz terminy i unikać studiowania teorii przed wykonaniem praktyki.
Kwantyl-Wykres Kwantylowy z użyciem Scypy
Jak stworzyć QQ-plot używając Pythona?
Zakładając, że masz duży zestaw pomiarów i używasz jakiejś funkcji kreślarskiej, któr ... ak i Matlab dostarczają do tego gotowe funkcje, ale zastanawiam się, jaka byłaby najczystsza metoda implementacji w Pythonie.
Czy w SQL serverze istnieje jakaś funkcja regresji liniowej?
Czy istnieją jakieś funkcje regresji liniowej w SQL Server 2005/2008, podobne do funkcji regresji liniowej w Oracle?
Co zrobić wszystkie dystrybucje dostępne w scipy.statystyki wyglądają jak?
Wizualizacja scipy.stats dystrybucje
Histogram może być wykonany z scipy.stats normalnej zmiennej losowej , aby zobaczyć, ... s stats
d = stats.norm()
rv = d.rvs(100000)
pd.Series(rv).hist(bins=32, normed=True)
Jak wyglądają Pozostałe dystrybucje?
Jak wygenerować dystrybucje given, mean, SD, skew i kurtosis w R?
Czy jest możliwe wygenerowanie rozkładów w R, dla których znane są średnie, SD, skew i kurtosis? Do tej pory wydaje się, że n ... je pakiet dostosowany do generowania konkretnych dystrybucji, które można by dostosować, to jeszcze go nie znalazłem.
Dzięki
Jak obliczyć 95% przedział ufności dla nachylenia w modelu regresji liniowej w R
Oto ćwiczenie ze wstępnych statystyk z R:
Z zestawem danych rmr, Wykres metabolizmu w stosunku do masy ciała. Dopasować mod ... 143.3 1708
Wiem jak obliczyć przewidywane y przy danym x ale jak Mogę obliczyć przedział ufności dla nachylenia?
Różnica R i SPSS
Wkrótce przeanalizuję ogromną ilość danych związanych z ruchem sieciowym i wstępnie przetworzę dane, aby je przeanalizować. O ... tym, że SPSS ma GUI). I tak będę głównie pracować ze skryptami w obu przypadkach, więc chciałem wiedzieć o innych różnicach.