outliers

Jak usunąć wartości odstające z zbioru danych

Mam kilka wielowymiarowych danych piękna vs wieku. Wiek waha się od 20-40 w odstępach 2 (20, 22, 24....40), a dla każdego zap ... jak R oblicza wartości odstające dla swoich działek pudełkowych. Poniżej znajduje się przykład, jak mogą wyglądać moje dane.

Jak nazywasz średnią, która nie zawiera wartości odstających?

Jak nazywa się średnią, która nie zawiera wartości odstających? Na przykład jeśli masz zestaw: {90,89,92,91,5} avg = 73.4 Ale wyłączając odstające (5) mamy {90,89,92,91(,5)} avg = 90.5 Jak opisujesz tę średnią w statystykach?

Jak korzystać z testów odstających w kodzie R

W ramach analizy danych chcę przetestować wartości odstające, a następnie wykonać dalsze obliczenia z tymi wartościami odstaj ... Znalazłem pakiet outlier, który ma różne testy, ale nie jestem pewien, jak najlepiej wykorzystać je do mojego obiegu pracy.

matplotlib: lekceważenie odstępów podczas wykreślania

Wymyślam dane z różnych testów. Czasami w teście zdarza mi się mieć jeden odstający (powiedzmy 0.1), podczas gdy wszystkie in ... e zaburzyłyby oś x na moim wykresie? Czy powinienem po prostu wziąć 95 percentyla i mieć zakres [0, 95_percentile] na osi x?

Usuń w pełni odstające elementy z wielu kartotek wykonanych za pomocą ggplot2 w R i wyświetl w rozszerzonym formacie

Mam kilka danych tutaj [w.plik txt] który wczytałem do ramki danych DF, df <- read.table("data.txt", header=T,sep="\t" ... odstające nadal pozostają. Czy ktoś mógłby mi podpowiedzieć jak całkowicie usunąć z tego wykresu wszystkie outlier, Dzięki.

Usuwanie wartości odstających w ramce danych Pandy za pomocą percentyli

Mam DataFrame df z 40 kolumnami i wieloma rekordami. Df: User_id | Col1 | Col2 | Col3 | Col4 | Col5 | Col6 | Col7 |...| C ... r_id) nie robiąc tego ręcznie? Moim celem jest uzyskanie ramki danych bez zapisów, które miały wartości odstające. Dziękuję!

Potrzebujesz zestawu danych do wykrywania oszustw [zamknięty]

Mam algorytm wykrywania oszustw i chcę sprawdzić, czy działa przeciwko zestawowi danych z prawdziwego świata. Mój algorytm mówi, że twierdzenie jest zwykłe lub nie. Czy są dostępne jakieś zestawy danych?