categorical-data

Jak zmusić R do użycia określonego poziomu czynnika jako odniesienia w regresji?

Jak mogę powiedzieć R, aby używał określonego poziomu jako odniesienia, jeśli używam binarnych zmiennych objaśniających w reg ... oziomu. lm(x ~ y + as.factor(b)) Z b {0, 1, 2, 3, 4}. Załóżmy, że chcę użyć 3 zamiast zera, które jest używane przez R.

Tworzenie manekinów z kolumn z wieloma wartościami w pandach

Szukam sposobu na rozwiązanie poniższego problemu. Metoda pandas.get_dummies() jest świetna do tworzenia manekinów z kategor ... po kroku, aby go uzyskać, ale to nie obejmowałoby get_dummies (). Dzięki Edytowane, mam nadzieję, że jest bardziej jasne!

Jak (i dlaczego) stosujesz kontrasty?

W jakich przypadkach tworzysz kontrasty w swojej analizie? Jak to się robi i w jakim celu się go stosuje? Sprawdziłem ?contrasts i ?C - oba prowadzą do "rozdziału 2 modeli statystycznych w S", który nie jest dla mnie łatwo dostępny.

Zrób Histogram częstotliwości dla zmiennych czynników

Jestem nowy w R, więc przepraszam za tak podstawowe pytanie. Spędziłem godzinę googlując ten problem, ale nie mogłem znaleźć ... ewał. Pomijając problemy z etykietowaniem, nie mogę wymyślić, jak stworzyć prosty histogram częstotliwości według kategorii.

Pandy: Konwertuj Kategorie na liczby

Załóżmy, że mam ramkę danych z krajami, która wygląda następująco: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Wiem ... es().values] Jest to nieco łatwiejsze do zrobienia w R używając 'czynników', więc mam nadzieję, że pandy mają coś podobnego.

Onehotencoder kategoryczne funkcje przestarzałe, jak przekształcić określoną kolumnę

Muszę przekształcić niezależne pole z ciągu znaków do notacji arytmetycznej. Do transformacji używam Onehotencodera. Mój zbió ... niezależne kolumny, takie jak kraj, wiek, wynagrodzenie itp. Jak osiągnąć transformację tylko na zbiorze danych 0. kolumna?

Dodaj dodatkowy poziom do czynników w dataframe

Mam ramkę danych z numerycznymi i uporządkowanymi kolumnami czynnika. Mam wiele wartości NA, więc żaden poziom nie jest im pr ... ot], factor, levelsList) Oczywiście, to nie działa poprawnie. Chcę zamówić poziom "No Answer" dodany na ostatnim miejscu.

Kodowanie One-Hot W [R] | kategoryczne na atrapy zmiennych [duplikat]

To pytanie ma już odpowiedź tutaj: wszystkie poziomy czynnika w macierzy modelu w R ... ążliwe, aby ocenić, czy ma się około 50 zmiennych funkcji, z czego więcej niż pięć (5) z nich jest zmiennymi kategorycznymi.

Konwersja wartości kategorycznych na binarne za pomocą pand

Próbuję przekonwertować wartości kategoryczne na wartości binarne za pomocą pand. Chodzi o to, aby rozważyć każdą unikalną wa ... licę i nazwy kolumn zostały utracone. Alternatywnie, czy istnieje znacznie skuteczny sposób na wykonanie powyższej operacji?.

Problemy z binarnym kodowaniem one-hot (one-of-K) w Pythonie

Kodowanie binarne one-hot (znane również jako one-of-K) polega na tworzeniu jednej kolumny binarnej dla każdej odrębnej warto ... sób na kodowanie binarne jedno-gorące w ramce danych pandy, jeśli mamy nasz podział danych w zestawie treningowym i testowym?