pandas

Konwertuj dane kategoryczne w ramce danych pandy

Mam ramkę danych z tego typu danymi (za dużo kolumn): col1 int64 col2 int64 col3 category col4 ... a praktyka. To praca, ale w moim dataframe wiele kolumn i nie chcę robić tego ręcznie. Jak to zrobić i po prostu sprytnie?

Zastosowanie funkcji z wieloma argumentami do utworzenia nowej kolumny pandy

Chcę utworzyć nową kolumnę w ramce danych pandas poprzez zastosowanie funkcji do dwóch istniejących kolumn. Po tej odpowiedzi ... rzykład, jak utworzyć nową kolumnę, przekazując kolumnę a i kolumnę B do poniższej funkcji? def fxy(x, y): return x * y

Wydobywanie tylko miesiąca i roku z kolumny DateTime Pandy (Python)

Mam ramkę danych, df, z następującą kolumną: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 ... onownie wybrać inną kolumnę używając indeksu. Ale i tak chciałbym metodę na rekonfigurowanie całej kolumny. Jakieś pomysły?

grupowanie wierszy na liście w Pandzie groupby

Mam ramkę danych typu: A 1 A 2 B 5 B 5 B 4 C 6 Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach: A [1,2] B [5,5,4] C [6] Czy można zrobić coś takiego używając pandy groupby?

Split (explode) wejście łańcucha danych do oddzielnych wierszy

Mam pandas dataframe, w którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde ... np.array([row] * len(letters)) out['var1'] = letters a['idx'] = range(a.shape[0]) z = a.groupby('idx') z.transform(fun)

Łączenie dwóch serii w ramkę danych w pandy

Mam dwie serie s1 i s2 z tymi samymi (nie kolejnymi) indeksami. Jak połączyć s1 i s2 z dwoma kolumnami w ramce danych i zachować jeden z indeksów jako trzecią kolumnę?

Jakie są plusy i minusy między get manekiny (Pandy) i OneHotEncoder (Scikit-learn)?

Uczę się różnych metod konwersji zmiennych kategorycznych na liczbowe dla klasyfikatorów uczenia maszynowego. Natknąłem się ... mies(DF_data["target"]) #1000 loops, best of 3: 777 µs per loop %timeit f1(DF_data) #100 loops, best of 3: 2.91 ms per loop

Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów

Bez użycia groupby Jak odfiltrować dane bez NaN? Powiedzmy, że mam macierz, w której klienci wypełnią {[5] } lub którąkolwiek ... g John 3 3 mol Graham NaN Zgaduję, że potrzebuję czegoś takiego ~np.isnan, ale tilda nie działa ze strunami.

Pobieranie listy list do pandy DataFrame

Czytam zawartość arkusza kalkulacyjnego do pandy. DataNitro ma metodę, która zwraca prostokątny wybór komórek jako listę li ... i istnieć metoda, aby to zrobić. Nie można go znaleźć w dokumentacji. Jakieś wskazówki do metody, która by to uprościła?

Jak uzyskać wartość z komórki ramki danych?

Skonstruowałem warunek, który wydobywa dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df[ ... lumnę (tj. jedna komórka). Nie tego potrzebuję. Potrzebuję jednej wartości (jeden numer float). Jak mogę to zrobić w pandach?

pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X

Mam DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], ... NaN 1 0 1 5 6.8 6.8 1 0 5 0 0 [4 rows x 7 columns]

Tworzenie dataframe ze słownika, gdzie wpisy mają różną długość

Powiedzmy, że mam słownik z 10 parami klucz-wartość. Każdy wpis zawiera tablicę numpy. Jednak długość tablicy nie jest taka s ... l be the same length Jak to przezwyciężyć? Cieszę się, że pandy używają NaN do wstawiania tych kolumn dla krótszych wpisów.

Znajdź indeks elementu w serii pandy

Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak Mogę uzyskać indeks pewnego ele ... = el: return i return None print find(myseries, 7) Ale zakładam, że powinien być lepszy sposób. Naprawdę?

Pobieranie historii ceny akcji automatycznie z yahoo finance w Pythonie

Czy istnieje sposób na automatyczne pobieranie historycznych cen akcji z yahoo finance lub Google finance (format csv)? Najlepiej w Pythonie.

Normalizacja danych w pandach

Załóżmy, że mam ramkę danych pandy df: Chcę obliczyć średnią kolumnową ramki danych. To proste: df.apply(average) Nas ... jego kolumny i podzielić przez jej zakres. Nie jestem pewien, jak to zrobić Każda pomoc/wskazówki są bardzo mile widziane.

Konwertuj listę słowników do Dataframe

Mam listę takich słowników: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "februa ... najlepszym rozwiązaniem, jakie mogłem znaleźć. Jak mogę zamienić listę słowników w ramkę danych pandy, jak pokazano powyżej?

Wybieranie / wyłączanie zestawów kolumn w pandach

Chciałbym tworzyć widoki lub ramki danych z istniejącej ramki danych na podstawie selekcji kolumn. Na przykład, chciałbym ut ... bardziej ogólnie, jakie mechanizmy ma Panda, aby wspierać wybieranie i wykluczenia dowolnych zestawów kolumn z ramki danych?

Konwertuj typ kolumny DataFrame z string na datetime

Jak skonwertować kolumnę DataFrame ciągów znaków (w formacie dd / mm / RRRR) na datetimes?

Nazywanie zwracanych kolumn w funkcji agregatowej? [duplikat]

to pytanie ma już odpowiedzi tutaj : ... n": np.mean, "std": np.std}}) (tj. Chcę wziąć mean I std column2, ale zwróć te kolumny jako "mean" I "std") Co mi umyka?

Jak dodać dane pandy do istniejącego pliku csv?

Chcę wiedzieć, czy możliwe jest użycie funkcji pandas to_csv() do dodania ramki danych do istniejącego pliku csv. Plik csv ma taką samą strukturę jak załadowane dane.