pandas
Konwertuj dane kategoryczne w ramce danych pandy
Mam ramkę danych z tego typu danymi (za dużo kolumn):
col1 int64
col2 int64
col3 category
col4 ... a praktyka. To praca, ale w moim dataframe wiele kolumn i nie chcę robić tego ręcznie.
Jak to zrobić i po prostu sprytnie?
Zastosowanie funkcji z wieloma argumentami do utworzenia nowej kolumny pandy
Chcę utworzyć nową kolumnę w ramce danych pandas poprzez zastosowanie funkcji do dwóch istniejących kolumn. Po tej odpowiedzi ... rzykład, jak utworzyć nową kolumnę, przekazując kolumnę a i kolumnę B do poniższej funkcji?
def fxy(x, y):
return x * y
Wydobywanie tylko miesiąca i roku z kolumny DateTime Pandy (Python)
Mam ramkę danych, df, z następującą kolumną:
df['ArrivalDate'] =
...
936 2012-12-31
938 2012-12-29
965 2012-12-31
966 ... onownie wybrać inną kolumnę używając indeksu.
Ale i tak chciałbym metodę na rekonfigurowanie całej kolumny. Jakieś pomysły?
grupowanie wierszy na liście w Pandzie groupby
Mam ramkę danych typu:
A 1
A 2
B 5
B 5
B 4
C 6
Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach:
A [1,2]
B [5,5,4]
C [6]
Czy można zrobić coś takiego używając pandy groupby?
Split (explode) wejście łańcucha danych do oddzielnych wierszy
Mam pandas dataframe, w którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde ... np.array([row] * len(letters))
out['var1'] = letters
a['idx'] = range(a.shape[0])
z = a.groupby('idx')
z.transform(fun)
Łączenie dwóch serii w ramkę danych w pandy
Mam dwie serie s1 i s2 z tymi samymi (nie kolejnymi) indeksami. Jak połączyć s1 i s2 z dwoma kolumnami w ramce danych i zachować jeden z indeksów jako trzecią kolumnę?
Jakie są plusy i minusy między get manekiny (Pandy) i OneHotEncoder (Scikit-learn)?
Uczę się różnych metod konwersji zmiennych kategorycznych na liczbowe dla klasyfikatorów uczenia maszynowego. Natknąłem się ... mies(DF_data["target"])
#1000 loops, best of 3: 777 µs per loop
%timeit f1(DF_data)
#100 loops, best of 3: 2.91 ms per loop
Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów
Bez użycia groupby Jak odfiltrować dane bez NaN?
Powiedzmy, że mam macierz, w której klienci wypełnią {[5] } lub którąkolwiek ... g John 3
3 mol Graham NaN
Zgaduję, że potrzebuję czegoś takiego ~np.isnan, ale tilda nie działa ze strunami.
Pobieranie listy list do pandy DataFrame
Czytam zawartość arkusza kalkulacyjnego do pandy. DataNitro ma metodę, która zwraca prostokątny wybór komórek jako listę li ... i istnieć metoda, aby to zrobić. Nie można go znaleźć w dokumentacji. Jakieś wskazówki do metody, która by to uprościła?
Jak uzyskać wartość z komórki ramki danych?
Skonstruowałem warunek, który wydobywa dokładnie jeden wiersz z mojej ramki danych:
d2 = df[(df['l_ext']==l_ext) & (df[ ... lumnę (tj. jedna komórka). Nie tego potrzebuję. Potrzebuję jednej wartości (jeden numer float). Jak mogę to zrobić w pandach?
pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X
Mam DataFrame:
import pandas as pd
import numpy as np
df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8],
... NaN 1 0 1
5 6.8 6.8 1 0 5 0 0
[4 rows x 7 columns]
Tworzenie dataframe ze słownika, gdzie wpisy mają różną długość
Powiedzmy, że mam słownik z 10 parami klucz-wartość. Każdy wpis zawiera tablicę numpy. Jednak długość tablicy nie jest taka s ... l be the same length
Jak to przezwyciężyć? Cieszę się, że pandy używają NaN do wstawiania tych kolumn dla krótszych wpisów.
Znajdź indeks elementu w serii pandy
Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak Mogę uzyskać indeks pewnego ele ... = el:
return i
return None
print find(myseries, 7)
Ale zakładam, że powinien być lepszy sposób. Naprawdę?
Pobieranie historii ceny akcji automatycznie z yahoo finance w Pythonie
Czy istnieje sposób na automatyczne pobieranie historycznych cen akcji z yahoo finance lub Google finance (format csv)? Najlepiej w Pythonie.
Normalizacja danych w pandach
Załóżmy, że mam ramkę danych pandy df:
Chcę obliczyć średnią kolumnową ramki danych.
To proste:
df.apply(average)
Nas ... jego kolumny i podzielić przez jej zakres. Nie jestem pewien, jak to zrobić
Każda pomoc/wskazówki są bardzo mile widziane.
Konwertuj listę słowników do Dataframe
Mam listę takich słowników:
[{'points': 50, 'time': '5:00', 'year': 2010},
{'points': 25, 'time': '6:00', 'month': "februa ... najlepszym rozwiązaniem, jakie mogłem znaleźć. Jak mogę zamienić listę słowników w ramkę danych pandy, jak pokazano powyżej?
Wybieranie / wyłączanie zestawów kolumn w pandach
Chciałbym tworzyć widoki lub ramki danych z istniejącej ramki danych na podstawie selekcji kolumn.
Na przykład, chciałbym ut ... bardziej ogólnie, jakie mechanizmy ma Panda, aby wspierać wybieranie i wykluczenia dowolnych zestawów kolumn z ramki danych?
Konwertuj typ kolumny DataFrame z string na datetime
Jak skonwertować kolumnę DataFrame ciągów znaków (w formacie dd / mm / RRRR) na datetimes?
Nazywanie zwracanych kolumn w funkcji agregatowej? [duplikat]
to pytanie ma już odpowiedzi tutaj :
... n": np.mean, "std": np.std}})
(tj. Chcę wziąć mean I std column2, ale zwróć te kolumny jako "mean" I "std")
Co mi umyka?
Jak dodać dane pandy do istniejącego pliku csv?
Chcę wiedzieć, czy możliwe jest użycie funkcji pandas to_csv() do dodania ramki danych do istniejącego pliku csv. Plik csv ma taką samą strukturę jak załadowane dane.