pandas
Pandy count (distinct) odpowiednik
Używam pandy jako substytutu db, ponieważ mam wiele baz danych (oracle, mssql, itp.) i nie jestem w stanie wykonać sekwencji ... IENTCODE) FROM table GROUP BY YEARMONTH;
A wynikiem będzie
201301 5000
201302 13245
Jak mogę to zrobić w pandach?
policz częstotliwość występowania wartości w kolumnie ramki danych
Mam zbiór danych
|category|
cat a
cat b
cat a
Chciałbym móc zwrócić coś takiego (pokazując unikalne wartości i częstotliwość)
category | freq |
cat a 2
cat b 1
Jak sprawdzić, które kolumny zawierają dowolną wartość NaN w ramce danych Pandy
Podano ramkę danych pandy zawierającą możliwe wartości NaN rozrzucone tu i ówdzie:
Pytanie: Jak określić, które kolumny zawierają wartości NaN? W szczególności, Czy Mogę uzyskać listę nazw kolumn zawierających Nan?
Pandy indeks tytuł kolumny lub nazwa
Jak uzyskać nazwę kolumny indeksu w Pythonie? Oto przykładowy dataframe:
Column 1
Index Title
Apple ... ies", "Ducks"]}
df = pd.DataFrame(data)
df.index = df["Index Title"]
del df["Index Title"]
print df
Ktoś wie jak to zrobić?
Pokaż ramkę danych jako tabelę w notebooku iPython
Używam notebooka iPython. Kiedy to robię:
df
Dostaję piękny stół z komórkami. Jednak jeśli to zrobię:
df1
df2
To n ... że wyjście jest bardzo wysokie.
Czy istnieje sposób, aby zmusić go do wydrukowania pięknych tabel dla obu zestawów danych?
Jak uzyskać dostęp do pandy groupby dataframe według klucza
Jak uzyskać dostęp do odpowiedniej ramki danych groupby w obiekcie groupby za pomocą klucza? Z następującą grupą:
rand = np ... 14
Ale to trochę paskudne, biorąc pod uwagę, jak miłe pandy zwykle są w tych rzeczach.
Jaki jest na to wbudowany sposób?
Dołączanie listy lub serii do ramki danych pandy jako wiersz?
Więc zainicjowałem pustą ramkę danych pandy i chciałbym iteracyjnie dopisać listy (lub serie) jako wiersze w tej ramce danych. Jak najlepiej to zrobić?
JSON do pandy DataFrame
To, co próbuję zrobić, to wyodrębnić dane wysokości z google maps API wzdłuż ścieżki określonej przez współrzędne szerokości ... result[u'elevation'])
df = pd.DataFrame([lat,lng,el]).T
Kończy się ramka danych z kolumnami Szerokość, Długość, Wysokość
Przypisywanie kategorycznych brakujących wartości w scikit-ucz się
Mam dane pandy z kilkoma kolumnami typu tekstowego. Istnieje kilka wartości NaN wraz z tymi kolumnami tekstowymi. Próbuję prz ... un1' jest zwykłą (nie brakującą) wartością z pierwszej kolumny o categorical data.
Każda pomoc będzie bardzo mile widziana]}
Umieszczanie wielu ramek danych Pythona pandy w jednym arkuszu excel
Dość łatwo jest dodać wiele ramek danych pand do książki roboczej Excela, o ile są to różne arkusze robocze. Ale jest to niec ... eśli istnieje inny sposób na umieszczenie wielu ramek danych w Excelu przy użyciu wbudowanego funkcjonalność DF. to_excel !!
Agregacja w pandach
Jak wykonać agregację z pand?
Brak ramki danych po agregacji! Co się stało?
Jak agregować głównie kolumny łańcuchów (do lis ...
Należy pamiętać, że ten post nie ma na celu zastąpienia dokumentacji o agregacji i o groupby , więc przeczytaj to również!
Lista najwyższych par korelacji z dużej macierzy korelacji w Pandzie?
Jak znaleźć najlepsze korelacje w macierzy korelacji z pand? Istnieje wiele odpowiedzi na temat tego, jak to zrobić z R (Poka ... R), ale zastanawiam się, jak to zrobić z pand? W moim przypadku matryca jest 4460x4460, więc nie mogę tego zrobić wizualnie.
Zmiana nazwy nagłówka pojedynczej kolumny w ramce danych pandy
Mam ramkę danych o nazwie data. Jak zmienić nazwę tylko jednego nagłówka kolumny? Na przykład gdp do log(gdp)?
data =
y ... 8 7 2
3 3 4 7
4 6 7 7
5 4 8 3
6 8 2 8
7 9 9 10
8 6 6 4
9 10 10 7
Jak dodać pustą kolumnę do ramki danych?
Jak najłatwiej dodać pustą kolumnę do obiektu pandy DataFrame? Najlepsze, na co się natknąłem to coś w stylu
df['foo'] = df.apply(lambda _: '', axis=1)
Czy istnieje metoda mniej przewrotna?
Pandy-część miejscowości
To oczywiście proste, ale jako numpy newbe utknąłem.
Mam plik CSV, który zawiera 3 kolumny, Stan, identyfikator biura i sprz ... 6 959285
Nie wiem, jak "sięgnąć" do state poziomu groupby, aby sumować sales dla całego state do Oblicz ułamek.
Jaka jest różnica między serią pandy a jednokolumnową ramką danych?
Dlaczego pandy rozróżniają Series i jednokolumnowe DataFrame?
Innymi słowy: jaki jest powód istnienia klasy Series?
Używam głównie szeregów czasowych z indeksem datetime, może to pomoże ustawić kontekst.
Python / Pandas-GUI do przeglądania ramki danych lub macierzy
Używam pakietu Pandas i tworzy on obiekt DataFrame, który jest w zasadzie oznakowaną macierzą. Często mam kolumny, które mają ... trzeby są ograniczone, niechętnie muszę nauczyć się dużego frameworka GUI i zrobić kilka kodowania dla tego jednego kawałka.)
Pandy - jak uzyskać indeks ramki danych jako tablicę
Czy wiesz, jak uzyskać kolumnę indeksu ramki danych jako tablicę? Mam listę numerów akcesyjnych w kolumnie " Accession "pliku ... lumnę" Accession". Teraz kolumna "Accession" musi być zestawem etykiet w późniejszym etapie, ale nie wiem, jak go wyodrębnić.
pandy grupowe sortowanie w grupach
Chcę pogrupować ramkę danych według dwóch kolumn, a następnie posortować zagregowane wyniki w grupach.
In [167]:
df
Out[167 ... lu:
count
job source
market A 5
D 4
B 3
sales E 7
C 6
B 4
Tworzenie heatmap z pandy DataFrame
Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować heatmap przy użyciu DataFrame z pakietu pandas. ... 18 0.702019 1.596048
ddd 0.137160 0.147368 1.504663 0.202822
eee 0.134540 3.708104 0.309097 1.641090
>>>