pandas pg. 7

Konwertuj dane kategoryczne w ramce danych pandy

Mam ramkę danych z tego typu danymi (za dużo kolumn): col1 int64 col2 int64 col3 category col4 ... a praktyka. To praca, ale w moim dataframe wiele kolumn i nie chcę robić tego ręcznie. Jak to zrobić i po prostu sprytnie?

python pandas

Zastosowanie funkcji z wieloma argumentami do utworzenia nowej kolumny pandy

Chcę utworzyć nową kolumnę w ramce danych pandas poprzez zastosowanie funkcji do dwóch istniejących kolumn. Po tej odpowiedzi ... rzykład, jak utworzyć nową kolumnę, przekazując kolumnę a i kolumnę B do poniższej funkcji? def fxy(x, y): return x * y

python pandas

Wydobywanie tylko miesiąca i roku z kolumny DateTime Pandy (Python)

Mam ramkę danych, df, z następującą kolumną: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 ... onownie wybrać inną kolumnę używając indeksu. Ale i tak chciałbym metodę na rekonfigurowanie całej kolumny. Jakieś pomysły?

python pandas

grupowanie wierszy na liście w Pandzie groupby

Mam ramkę danych typu: A 1 A 2 B 5 B 5 B 4 C 6 Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach: A [1,2] B [5,5,4] C [6] Czy można zrobić coś takiego używając pandy groupby?

python pandas

Split (explode) wejście łańcucha danych do oddzielnych wierszy

Mam pandas dataframe, w którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde ... np.array([row] * len(letters)) out['var1'] = letters a['idx'] = range(a.shape[0]) z = a.groupby('idx') z.transform(fun)

python pandas dataframe numpy

Łączenie dwóch serii w ramkę danych w pandy

Mam dwie serie s1 i s2 z tymi samymi (nie kolejnymi) indeksami. Jak połączyć s1 i s2 z dwoma kolumnami w ramce danych i zachować jeden z indeksów jako trzecią kolumnę?

python pandas dataframe series

Jakie są plusy i minusy między get manekiny (Pandy) i OneHotEncoder (Scikit-learn)?

Uczę się różnych metod konwersji zmiennych kategorycznych na liczbowe dla klasyfikatorów uczenia maszynowego. Natknąłem się ... mies(DF_data["target"]) #1000 loops, best of 3: 777 µs per loop %timeit f1(DF_data) #100 loops, best of 3: 2.91 ms per loop

python pandas machine-learning scikit-learn dummy-variable

Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów

Bez użycia groupby Jak odfiltrować dane bez NaN? Powiedzmy, że mam macierz, w której klienci wypełnią {[5] } lub którąkolwiek ... g John 3 3 mol Graham NaN Zgaduję, że potrzebuję czegoś takiego ~np.isnan, ale tilda nie działa ze strunami.

python pandas dataframe

Pobieranie listy list do pandy DataFrame

Czytam zawartość arkusza kalkulacyjnego do pandy. DataNitro ma metodę, która zwraca prostokątny wybór komórek jako listę li ... i istnieć metoda, aby to zrobić. Nie można go znaleźć w dokumentacji. Jakieś wskazówki do metody, która by to uprościła?

python pandas datanitro

Jak uzyskać wartość z komórki ramki danych?

Skonstruowałem warunek, który wydobywa dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df[ ... lumnę (tj. jedna komórka). Nie tego potrzebuję. Potrzebuję jednej wartości (jeden numer float). Jak mogę to zrobić w pandach?

python pandas dataframe

pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X

Mam DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], ... NaN 1 0 1 5 6.8 6.8 1 0 5 0 0 [4 rows x 7 columns]

python pandas dataframe selection

Tworzenie dataframe ze słownika, gdzie wpisy mają różną długość

Powiedzmy, że mam słownik z 10 parami klucz-wartość. Każdy wpis zawiera tablicę numpy. Jednak długość tablicy nie jest taka s ... l be the same length Jak to przezwyciężyć? Cieszę się, że pandy używają NaN do wstawiania tych kolumn dla krótszych wpisów.

python pandas

Znajdź indeks elementu w serii pandy

Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak Mogę uzyskać indeks pewnego ele ... = el: return i return None print find(myseries, 7) Ale zakładam, że powinien być lepszy sposób. Naprawdę?

python pandas

Pobieranie historii ceny akcji automatycznie z yahoo finance w Pythonie

Czy istnieje sposób na automatyczne pobieranie historycznych cen akcji z yahoo finance lub Google finance (format csv)? Najlepiej w Pythonie.

pandas google-finance finance yahoo-finance stockquotes

Normalizacja danych w pandach

Załóżmy, że mam ramkę danych pandy df: Chcę obliczyć średnią kolumnową ramki danych. To proste: df.apply(average) Nas ... jego kolumny i podzielić przez jej zakres. Nie jestem pewien, jak to zrobić Każda pomoc/wskazówki są bardzo mile widziane.

python pandas numpy

Konwertuj listę słowników do Dataframe

Mam listę takich słowników: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "februa ... najlepszym rozwiązaniem, jakie mogłem znaleźć. Jak mogę zamienić listę słowników w ramkę danych pandy, jak pokazano powyżej?

python pandas dataframe dictionary

Wybieranie / wyłączanie zestawów kolumn w pandach

Chciałbym tworzyć widoki lub ramki danych z istniejącej ramki danych na podstawie selekcji kolumn. Na przykład, chciałbym ut ... bardziej ogólnie, jakie mechanizmy ma Panda, aby wspierać wybieranie i wykluczenia dowolnych zestawów kolumn z ramki danych?

python pandas

pandas

Konwertuj dane kategoryczne w ramce danych pandy

Zastosowanie funkcji z wieloma argumentami do utworzenia nowej kolumny pandy

Wydobywanie tylko miesiąca i roku z kolumny DateTime Pandy (Python)

grupowanie wierszy na liście w Pandzie groupby

Split (explode) wejście łańcucha danych do oddzielnych wierszy

Łączenie dwóch serii w ramkę danych w pandy

Jakie są plusy i minusy między get manekiny (Pandy) i OneHotEncoder (Scikit-learn)?

Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów

Pobieranie listy list do pandy DataFrame

Jak uzyskać wartość z komórki ramki danych?

pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X

Tworzenie dataframe ze słownika, gdzie wpisy mają różną długość

Znajdź indeks elementu w serii pandy

Pobieranie historii ceny akcji automatycznie z yahoo finance w Pythonie

Normalizacja danych w pandach

Konwertuj listę słowników do Dataframe

Wybieranie / wyłączanie zestawów kolumn w pandach

Konwertuj typ kolumny DataFrame z string na datetime

Nazywanie zwracanych kolumn w funkcji agregatowej? [duplikat]

Jak dodać dane pandy do istniejącego pliku csv?