pandas

Użyj listy wartości, aby wybrać wiersze z ramki danych pandy [duplikat]

Możliwy duplikat:jak filtrować wiersze ramki danych pand według "wewnątrz" / "w"? Powiedzmy, że mam następujące ramk ... Ale jak Mogę ustawić na podstawie listy wartości? - coś takiego: list_of_values = [3,6] y = df[df['A'] in list_of_values]

Jak grupować wiersze ramki danych w liście w Pandzie groupby

Mam ramkę danych pandy df Jak: a b A 1 A 2 B 5 B 5 B 4 C 6 Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach : A [1,2] B [5,5,4] C [6] Czy można zrobić coś takiego używając pandy groupby?

Konwersja pomiędzy datetime, Timestamp i datetime64

Jak przekonwertować obiekt numpy.datetime64 na datetime.datetime (lub Timestamp)? W poniższym kodzie tworzę obiekty datetime ... 00:00.000000000+0100') Które powinno być datetime.datetime(2002, 6, 28, 1, 0), oraz nie długo (!) (1025222400000000000L)...

Jak podzielić kolumnę DataFrame string na dwie kolumny?

Mam ramkę danych z jedną kolumną (string) i chciałbym podzielić ją na dwie kolumny (string), z nagłówkiem jednej kolumny jako ... UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL

Wyodrębnianie tylko miesiąca i roku oddzielnie od Kolumny DateTime Pandy

Mam ramkę danych, df, z następującą kolumną: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 ... onownie wybrać inną kolumnę używając indeksu. Ale i tak chciałbym metodę na rekonfigurowanie całej kolumny. Jakieś pomysły?

Importuj wiele plików csv do pandy i połącz w jedną ramkę danych

Chciałbym wczytać kilka plików csv z katalogu do pand i połączyć je w jedną dużą ramkę danych. Nie byłem jednak w stanie tego ... oncatenate all data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True) Chyba potrzebuję pomocy w pętli for???

Jak radzić sobie z SettingWithCopyWarning w Pandy?

Tło Właśnie uaktualniłem moje pandy z 0.11 do 0.13. 0rc1. Teraz aplikacja wyskakuje wiele nowych ostrzeżeń. Jeden z nich ta ... using .loc[row_index,col_indexer] = value instead quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])

Wykres macierzy korelacji za pomocą pand

Mam zbiór danych z ogromną liczbą funkcji, więc analiza macierzy korelacji stała się bardzo trudna. Chcę wykreślić macierz ko ... corr() z biblioteki pandas. Czy jest jakaś wbudowana funkcja dostarczana przez Bibliotekę pandas do wykreślania tej macierzy?

Ustaw wartość dla konkretnej komórki w ramce danych pandy za pomocą indeksu

I ' ve created a Pandas DataFrame df=DataFrame(index=['A','B','C'], columns=['x','y']) I mam to x y A NaN Na ... Z tym kodem: df.xs('C')['x']=10 Ale zawartość df nie uległa zmianie. To znowu tylko Nan w dataframe. Jakieś sugestie?

Jak zresetować indeks w ramce danych pandy? [duplikat]

to pytanie ma już odpowiedzi tutaj : ... ]. Jak mogę to zrobić? Wygląda na to, że działa: df = df.reset_index() del df['index'] Nie działa: df = df.reindex()

Czy for-loops w pandach są naprawdę złe? Kiedy powinno mnie to obchodzić?

Czy for pętle są naprawdę "złe"? Jeśli nie, w jakiej sytuacji (- ach) byłyby lepsze niż stosowanie bardziej konwencjonalnego ... których pętle for są zwykle lepsze niż konwencjonalne iterowanie danych. Ten post ma na celu uchwycenie tego dla potomności.

Jak sprawdzić czy jakakolwiek wartość to NaN w ramce danych Pandy

W Pythonie, jaki jest najlepszy sposób, aby sprawdzić, czy ramka danych ma jedną (lub więcej) Wartość NaN? Wiem o funkcji pd.isnan, ale to zwraca ramkę danych logicznych dla każdego elementu. Ten post tutaj też nie odpowiada na moje pytanie.

Co oznacza axis w pandach?

Oto Mój kod do wygenerowania ramki danych: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2), ... zekuję, że wynik polecenia będzie A 0.626386 B 1.523255 dtype: float64 Oto moje pytanie: co oznacza axis w pandach?

Kiedy powinienem (nie) chcieć używać pandy apply () w moim kodzie?

Widziałem wiele odpowiedzi na pytania dotyczące przepełnienia stosu związane z wykorzystaniem metody Pandy apply. Widziałem r ... bić mój kod apply-za darmo? czy są kiedykolwiek sytuacje, w których apply jest dobre (lepsze niż inne możliwe rozwiązania)?

Jak uzyskać liczbę wierszy ramki danych Pandy?

Próbuję zdobyć liczbę wierszy dataframe df z pand, a oto mój kod. Metoda 1: total_rows = df.count print total_rows +1 Me ... dpowiedzią udzieloną przez @ root najlepszym (najszybszym) sposobem sprawdzenia długości df jest wywołanie: df.shape[0]

pandas resample documentation [closed]

Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie robi dobrej roboty wyjaśniając opcje. Więc większość op ... s.resample i jak ją wprowadzić? Jeśli tak, to gdzie, bo nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?

Pretty-wydrukuj całą serię pand / DataFrame

Często pracuję z seriami i DataFrames na terminalu. Domyślna __repr__ dla serii zwraca zmniejszoną próbkę, z niektórymi warto ... yłoby wspierać odpowiednie wyrównanie, być może granice między kolumnami, a może nawet kodowanie kolorami dla różnych kolumn.

Jak unnest (eksplodować) kolumnę w ramce danych pandy?

Mam następujący DataFrame, gdzie jedna z kolumn jest obiektem (komórka typu list): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1 ... ziej czasochłonne apply, co nie jest zalecane, sprawdź więcej informacji Kiedy powinienem użyć pandy apply() w moim kodzie?)

Dlaczego moje pandy nie działają w funkcji "apply" odwołującej się do wielu kolumn? [zamknięte]

zamknięte. to pytanie jest nie powtarzalne lub spowodowane literówkami . Obecnie nie przyjmuje odpowiedzi. ... my_test(a): cum_diff = 0 for ix in df.index(): cum_diff = cum_diff + (a - df['a'][ix]) return cum_diff

Jak przekonwertować indeks pand w ramce danych na kolumnę?

Wydaje się to dość oczywiste, ale nie mogę zrozumieć, jak przekonwertować indeks ramki danych na kolumnę? Na przykład: df= ... = index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596