pandas

Pandy count (distinct) odpowiednik

Używam pandy jako substytutu db, ponieważ mam wiele baz danych (oracle, mssql, itp.) i nie jestem w stanie wykonać sekwencji ... IENTCODE) FROM table GROUP BY YEARMONTH; A wynikiem będzie 201301 5000 201302 13245 Jak mogę to zrobić w pandach?

policz częstotliwość występowania wartości w kolumnie ramki danych

Mam zbiór danych |category| cat a cat b cat a Chciałbym móc zwrócić coś takiego (pokazując unikalne wartości i częstotliwość) category | freq | cat a 2 cat b 1

Jak sprawdzić, które kolumny zawierają dowolną wartość NaN w ramce danych Pandy

Podano ramkę danych pandy zawierającą możliwe wartości NaN rozrzucone tu i ówdzie: Pytanie: Jak określić, które kolumny zawierają wartości NaN? W szczególności, Czy Mogę uzyskać listę nazw kolumn zawierających Nan?

Pandy indeks tytuł kolumny lub nazwa

Jak uzyskać nazwę kolumny indeksu w Pythonie? Oto przykładowy dataframe: Column 1 Index Title Apple ... ies", "Ducks"]} df = pd.DataFrame(data) df.index = df["Index Title"] del df["Index Title"] print df Ktoś wie jak to zrobić?

Pokaż ramkę danych jako tabelę w notebooku iPython

Używam notebooka iPython. Kiedy to robię: df Dostaję piękny stół z komórkami. Jednak jeśli to zrobię: df1 df2 To n ... że wyjście jest bardzo wysokie. Czy istnieje sposób, aby zmusić go do wydrukowania pięknych tabel dla obu zestawów danych?

Jak uzyskać dostęp do pandy groupby dataframe według klucza

Jak uzyskać dostęp do odpowiedniej ramki danych groupby w obiekcie groupby za pomocą klucza? Z następującą grupą: rand = np ... 14 Ale to trochę paskudne, biorąc pod uwagę, jak miłe pandy zwykle są w tych rzeczach. Jaki jest na to wbudowany sposób?

Dołączanie listy lub serii do ramki danych pandy jako wiersz?

Więc zainicjowałem pustą ramkę danych pandy i chciałbym iteracyjnie dopisać listy (lub serie) jako wiersze w tej ramce danych. Jak najlepiej to zrobić?

JSON do pandy DataFrame

To, co próbuję zrobić, to wyodrębnić dane wysokości z google maps API wzdłuż ścieżki określonej przez współrzędne szerokości ... result[u'elevation']) df = pd.DataFrame([lat,lng,el]).T Kończy się ramka danych z kolumnami Szerokość, Długość, Wysokość

Przypisywanie kategorycznych brakujących wartości w scikit-ucz się

Mam dane pandy z kilkoma kolumnami typu tekstowego. Istnieje kilka wartości NaN wraz z tymi kolumnami tekstowymi. Próbuję prz ... un1' jest zwykłą (nie brakującą) wartością z pierwszej kolumny o categorical data. Każda pomoc będzie bardzo mile widziana]}

Umieszczanie wielu ramek danych Pythona pandy w jednym arkuszu excel

Dość łatwo jest dodać wiele ramek danych pand do książki roboczej Excela, o ile są to różne arkusze robocze. Ale jest to niec ... eśli istnieje inny sposób na umieszczenie wielu ramek danych w Excelu przy użyciu wbudowanego funkcjonalność DF. to_excel !!

Agregacja w pandach

Jak wykonać agregację z pand? Brak ramki danych po agregacji! Co się stało? Jak agregować głównie kolumny łańcuchów (do lis ... Należy pamiętać, że ten post nie ma na celu zastąpienia dokumentacji o agregacji i o groupby , więc przeczytaj to również!

Lista najwyższych par korelacji z dużej macierzy korelacji w Pandzie?

Jak znaleźć najlepsze korelacje w macierzy korelacji z pand? Istnieje wiele odpowiedzi na temat tego, jak to zrobić z R (Poka ... R), ale zastanawiam się, jak to zrobić z pand? W moim przypadku matryca jest 4460x4460, więc nie mogę tego zrobić wizualnie.

Zmiana nazwy nagłówka pojedynczej kolumny w ramce danych pandy

Mam ramkę danych o nazwie data. Jak zmienić nazwę tylko jednego nagłówka kolumny? Na przykład gdp do log(gdp)? data = y ... 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7

Jak dodać pustą kolumnę do ramki danych?

Jak najłatwiej dodać pustą kolumnę do obiektu pandy DataFrame? Najlepsze, na co się natknąłem to coś w stylu df['foo'] = df.apply(lambda _: '', axis=1) Czy istnieje metoda mniej przewrotna?

Pandy-część miejscowości

To oczywiście proste, ale jako numpy newbe utknąłem. Mam plik CSV, który zawiera 3 kolumny, Stan, identyfikator biura i sprz ... 6 959285 Nie wiem, jak "sięgnąć" do state poziomu groupby, aby sumować sales dla całego state do Oblicz ułamek.

Jaka jest różnica między serią pandy a jednokolumnową ramką danych?

Dlaczego pandy rozróżniają Series i jednokolumnowe DataFrame? Innymi słowy: jaki jest powód istnienia klasy Series? Używam głównie szeregów czasowych z indeksem datetime, może to pomoże ustawić kontekst.

Python / Pandas-GUI do przeglądania ramki danych lub macierzy

Używam pakietu Pandas i tworzy on obiekt DataFrame, który jest w zasadzie oznakowaną macierzą. Często mam kolumny, które mają ... trzeby są ograniczone, niechętnie muszę nauczyć się dużego frameworka GUI i zrobić kilka kodowania dla tego jednego kawałka.)

Pandy - jak uzyskać indeks ramki danych jako tablicę

Czy wiesz, jak uzyskać kolumnę indeksu ramki danych jako tablicę? Mam listę numerów akcesyjnych w kolumnie " Accession "pliku ... lumnę" Accession". Teraz kolumna "Accession" musi być zestawem etykiet w późniejszym etapie, ale nie wiem, jak go wyodrębnić.

pandy grupowe sortowanie w grupach

Chcę pogrupować ramkę danych według dwóch kolumn, a następnie posortować zagregowane wyniki w grupach. In [167]: df Out[167 ... lu: count job source market A 5 D 4 B 3 sales E 7 C 6 B 4

Tworzenie heatmap z pandy DataFrame

Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować heatmap przy użyciu DataFrame z pakietu pandas. ... 18 0.702019 1.596048 ddd 0.137160 0.147368 1.504663 0.202822 eee 0.134540 3.708104 0.309097 1.641090 >>>