pandas

Jak wybrać wiersze z ramki danych na podstawie wartości kolumn

Jak mogę wybrać wiersze z DataFrame na podstawie wartości w jakiejś kolumnie w Pandzie? W SQL użyłbym: SELECT * FROM table WHERE colume_name = some_value Próbowałem zajrzeć do dokumentacji Pandy, ale nie od razu znalazłem odpowiedź.

"Duże przepływy danych" za pomocą pand

Przez wiele miesięcy ucząc się pand starałem się znaleźć odpowiedź na to pytanie. Używam SAS do mojej codziennej pracy i jes ... awać wiersze do zbioru danych. Prawie zawsze będę tworzyć nowe kolumny(zmienne lub funkcje w statystyce/uczeniu maszynowym).

"Duże przepływy danych" za pomocą pand

Przez wiele miesięcy ucząc się pand starałem się znaleźć odpowiedź na to pytanie. Używam SAS do mojej codziennej pracy i jes ... awać wiersze do zbioru danych. Prawie zawsze będę tworzyć nowe kolumny(zmienne lub funkcje w statystyce/uczeniu maszynowym).

Jak iterować wiersze w ramce danych w pandach

Mam DataFrame od Pandy: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.Dat ... ow in df.T.iteritems(): Lub for row in df.iterrows(): Ale nie rozumiem, czym jest obiekt row i jak mogę z nim pracować.

Zmień typ kolumny w pandy

Chcę przekonwertować tabelę, reprezentowaną jako lista list, na Pandas DataFrame. Jako niezwykle uproszczony przykład: a = ... ślać, które kolumny są tego typu. Wszystko, co mogę zagwarantować, to to, że każda kolumna zawiera wartości tego samego typu.

Usuń kolumnę z ramki danych pandy

Podczas usuwania kolumny w ramce danych używam: del df['column_name'] I to działa świetnie. Dlaczego nie mogę użyć następ ... del df.column_name Ponieważ można uzyskać dostęp do kolumny / serii jako df.column_name, spodziewałem się, że to zadziała.

Czym różnią się iloc i loc?

Czy ktoś może wyjaśnić, czym różnią się te dwie metody krojenia? I ' ve seen the docs , i widziałem te odpowiedzi , ale nad ... również wiedzieć, jak te dwie funkcje różnią się od df.ix[:5], ale {[3] } została usunięta z pandas 1.0, więc mam to gdzieś.

Pandy101

Jak wykonać (INNER| (LEFT|RIGHT|FULL) OUTER) JOIN z pand? Jak dodać Nan dla brakujących wierszy po połączeniu? Jak pozbyć s ... we typy złączy (przeczytaj najpierw) Połączenia oparte na indeksach Uogólnienie na wiele DataFrames Cross join

Zmiana nazwy kolumn w pandach

Mam ramkę danych używającą pand i etykiet kolumn, które muszę edytować, aby zastąpić oryginalne etykiety kolumn. Chciałbym ... Do ['a', 'b', 'c', 'd', 'e']. Mam edytowane nazwy kolumn zapisane na liście, ale nie wiem, jak zastąpić nazwy kolumn.

Jak upuścić wiersze ramki danych Pandy, których wartością w określonej kolumnie jest NaN

Mam to DataFrame i chcę tylko te rekordy, których EPS kolumna nie jest NaN: >>> df STK_ID EPS c ... STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN Jak mam to zrobić?

Jak obracać ramkę danych?

Co to jest pivot? Jak się obracać? czy to pivot? długi format do szerokiego formatu? Widziałem wiele pytań, które pytają ... a 2 1 1 b 2 1 0 c 1 0 0 Do 1|1 2|1 2|2 a 2 1 1 b 2 1 0 c 1 0 0

Tworzenie ramki danych pandy poprzez dołączanie jednego wiersza na raz

Rozumiem, że pandy są przeznaczone do ładowania w pełni wypełnionych DataFrame, ale muszę utworzyć pustą ramkę danych, a nas ... się bardzo dziwne : - / (nie dodaje wartości ciągu) Jak mogę dodać nowy wiersz do ramki danych (z różnymi typami kolumn) ?

Jak radzić sobie z SettingWithCopyWarning w Pandy

Tło Właśnie uaktualniłem moje pandy z 0.11 do 0.13. 0rc1. Teraz aplikacja wyskakuje wiele nowych ostrzeżeń. Jeden z nich tak ... using .loc[row_index,col_indexer] = value instead quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])

Pandy warunkowe utworzenie kolumny serii / ramki danych

Mam ramkę danych zgodnie z poniższymi wersjami: Type Set 1 A Z 2 B Z 3 B ... tóra ustawi kolor 'green' if Set == 'Z' i 'red' if Set równa się cokolwiek innego. Jaki jest najlepszy sposób, aby to zrobić?

Jak iterować wiersze w ramce danych w pandach?

Mam DataFrame od pandy: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.Dat ... w in df.T.iteritems(): Lub for row in df.iterrows(): Ale ja nie zrozum, czym jest obiekt row i jak mogę z nim pracować.

Usuń kolumnę z ramki danych pandy za pomocą del df.nazwa kolumny

Podczas usuwania kolumny w ramce danych używam: del df['column_name'] I to działa świetnie. Dlaczego nie mogę użyć następ ... ementów? del df.column_name ponieważ możesz uzyskać dostęp do kolumny/serii jako df.column_name, oczekuję, że to zadziała.

Jak rozwinąć wyświetlacz wyjściowy, aby zobaczyć więcej kolumn ramki danych pandy?

Czy istnieje sposób na rozszerzenie wyświetlania danych wyjściowych w trybie interaktywnym lub skryptowym? W szczególności u ... u pand i describe() jest unikanie używania drugiego programu, takiego jak Stata, do podstawowej manipulacji danymi i badania.

Jak zrobić dobre powtarzalne pandy przykłady

odpowiedzi na to pytanie są wysiłkiem społeczności. Edytuj istniejące odpowiedzi, aby poprawić ten post. Obecnie nie przyjmu ... du, czy istnieje odpowiednik R dput(), który pozwala na wygenerowanie kodu do kopiowania w celu regeneracji struktury danych?

Uzyskaj statystyki dla każdej grupy (takie jak count, mean, etc) za pomocą pandas GroupBy?

Mam ramkę danych df i używam kilku kolumn od niej do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej. W skrócie: jak uzyskać grupowe statystyki dla ramki danych?

Dodawanie nowej kolumny do istniejącego DataFrame w Pythonie

Mam następujący indeksowany DataFrame z nazwanymi kolumnami i wierszami nie-ciągłymi liczbami: a b ... end, merge, ale nie dostałem pożądanego rezultatu, tylko co najwyżej błędy. Jak Mogę dodać kolumnę e do powyższego przykładu?