statistics

Co jest dobrym rozwiązaniem do obliczania średniej, gdy suma wszystkich wartości przekracza granice dubla?

Mam wymóg, aby obliczyć średnią z bardzo dużego zestawu podwójnych (wartości 10^9). Suma wartości przekracza górną granicę p ... ęc czy ktoś zna jakieś fajne sztuczki do obliczania średniej, które nie wymagają również obliczenia sumy? Używam Javy 1.5.

Boxplots w matplotlib: markery i odstające

Mam kilka pytań odnośnie boxplots w matplotlib: Pytanie A . Co znaczniki, które zaznaczam poniżej Q1, Q2 i Q3 reprezentuj ...               Pytanie B Jak matplotlib identyfikujeodstające ? (tzn. skąd wie, że nie są one prawdziwe max i min wartości?)

Pandy-Oblicz Z-score dla wszystkich kolumn

Mam ramkę danych zawierającą pojedynczą kolumnę identyfikatorów, a wszystkie pozostałe kolumny są wartościami liczbowymi, dla ... iem go dobrze. Jeśli indeksowanie jest kluczową częścią rozwiązania tego problemu, proszę o wyjaśnienie sposobu indeksowania.

Biorąc pod uwagę zbiór liczb losowych losowanych z ciągłego rozkładu jednowymiarowego, znajdź rozkład

Biorąc pod uwagę zbiór liczb rzeczywistych narysowanych z nieznanego ciągłego rozkładu jednowymiarowego (powiedzmy, że jest t ... dentyfikacyjny dystrybucji będzie częścią zautomatyzowany proces, więc ręczna interwencja w identyfikacji nie będzie możliwa.

Dobroć funkcji fit w R

Jakich funkcji używasz w R, aby dopasować krzywą do swoich danych i sprawdzić, jak dobrze ta krzywa pasuje? Jakie wyniki są uważane za dobre?

Zmiana kolejności elementów macierzy w celu odzwierciedlenia grupowania kolumn i wierszy w Pythonie

Szukam sposobu, aby wykonać klastrowanie oddzielnie na wierszach macierzy, a nie na jej kolumnach, zmienić kolejność danych w ... macierzy, a następnie wygenerujesz mapę cieplną, grupowanie danych może stać się widoczne dla widza (jak na rysunku powyżej)

Średnia geometryczna: czy jest wbudowany?

Próbowałem znaleźć wbudowaną średnią geometryczną, ale nie mogłem. (Oczywiście Wbudowany nie zaoszczędzi mi czasu podczas p ... to zauważalny. W przypadku, gdy nie ma żadnego (w co wątpię) tutaj jest mój. gm_mean = function(a){prod(a)^(1/length(a))}

Wyjaśnij funkcję kwantyla () w R

Przez cały dzień byłem zdumiony funkcją kwantyla R. Mam intuicyjne pojęcie o tym, jak działają kwantyle i M. S. w statysty ... ić poprawioną dokumentację, która lepiej wyjaśnia, co się tutaj dzieje. Kwantyl.R kod źródłowy lub typu: kwantyl.default

Analiza głównych składników - jak uzyskać wkład ( % ) każdego parametru do Prin.Komp.?

Chcę wiedzieć, w jakim stopniu pomiar / parametr przyczynia się do jednego z obliczonych głównych składników. Opis świata rz ... _table, cor=T) biplot(pca) # same: plot(pca$scores[,1], pca$scores[,2]) pca summary(pca) Gdzie są ukryte moje informacje?

Tabela częstotliwości dla pojedynczej zmiennej

Ostatnie pytanie newbie pandy na dziś: jak wygenerować tabelę dla jednej serii? Na przykład: my_series = pandas.Series([1, ... zebuję: jedna zmienna, liczy się według kategorii. Oh, I byłoby miło, gdyby działało na różne typy danych: ciągi, ints, itp.

Dwuczłonowy Test Kołmogorowa-Smirnowa w Pythonie Scipy

Nie mogę wymyślić, jak zrobić test KS w Scipy. Po przeczytaniu dokumentacji scipy kstest Widzę jak sprawdzić gdzie rozkła ... object is not callable Czy jest sposób na wykonanie testu KS w Pythonie? Jeśli tak, to jak mam to zrobić? Z góry dziękuję

Obliczanie funkcji korelacji krzyżowej?

W R, używam ccf lub acf do obliczenia pary-wise cross-correlation function tak, że mogę dowiedzieć się, który przesunięcie da ... : xcorr = lambda x,y : irfft(rfft(x)*rfft(y[::-1])) x = numpy.array([0,0,1,1]) y = numpy.array([1,1,0,0]) print xcorr(x,y)

Implementacja w Pythonie interwału wyników Wilsona?

Po przeczytaniu Jak nie sortować według średniej oceny, byłem ciekaw, czy ktoś ma implementację Pythona dolnej granicy przedziału ufności wyniku Wilsona dla parametru Bernoulliego?

Jak korzystać z klas boost normal distribution?

Próbuję użyć boost:: normal_distribution w celu wygenerowania rozkładu normalnego ze średnią 0 i sigma 1. Poniższy kod nie d ... . Z góry dziękuję wszystkim! EDIT: tak się dzieje kiedy masz terminy i unikać studiowania teorii przed wykonaniem praktyki.

Kwantyl-Wykres Kwantylowy z użyciem Scypy

Jak stworzyć QQ-plot używając Pythona? Zakładając, że masz duży zestaw pomiarów i używasz jakiejś funkcji kreślarskiej, któr ... ak i Matlab dostarczają do tego gotowe funkcje, ale zastanawiam się, jaka byłaby najczystsza metoda implementacji w Pythonie.

Czy w SQL serverze istnieje jakaś funkcja regresji liniowej?

Czy istnieją jakieś funkcje regresji liniowej w SQL Server 2005/2008, podobne do funkcji regresji liniowej w Oracle?

Co zrobić wszystkie dystrybucje dostępne w scipy.statystyki wyglądają jak?

Wizualizacja scipy.stats dystrybucje Histogram może być wykonany z scipy.stats normalnej zmiennej losowej , aby zobaczyć, ... s stats d = stats.norm() rv = d.rvs(100000) pd.Series(rv).hist(bins=32, normed=True) Jak wyglądają Pozostałe dystrybucje?

Jak wygenerować dystrybucje given, mean, SD, skew i kurtosis w R?

Czy jest możliwe wygenerowanie rozkładów w R, dla których znane są średnie, SD, skew i kurtosis? Do tej pory wydaje się, że n ... je pakiet dostosowany do generowania konkretnych dystrybucji, które można by dostosować, to jeszcze go nie znalazłem. Dzięki

Jak obliczyć 95% przedział ufności dla nachylenia w modelu regresji liniowej w R

Oto ćwiczenie ze wstępnych statystyk z R: Z zestawem danych rmr, Wykres metabolizmu w stosunku do masy ciała. Dopasować mod ... 143.3 1708 Wiem jak obliczyć przewidywane y przy danym x ale jak Mogę obliczyć przedział ufności dla nachylenia?

Różnica R i SPSS

Wkrótce przeanalizuję ogromną ilość danych związanych z ruchem sieciowym i wstępnie przetworzę dane, aby je przeanalizować. O ... tym, że SPSS ma GUI). I tak będę głównie pracować ze skryptami w obu przypadkach, więc chciałem wiedzieć o innych różnicach.