pandas

Remapuj wartości w kolumnie pandy za pomocą dict

Mam słownik, który wygląda tak: di = {1: "A", 2: "B"} Chciałbym zastosować go do kolumny "col1" ramki danych podobnej do: ... wodu googlowanie terminów odnoszących się do tego pokazuje mi tylko linki o tym, jak robić kolumny z dictów i vice-versa: - /

Znajdź kolumnę, której nazwa zawiera określony ciąg znaków

Mam ramkę danych z nazwami kolumn i chcę znaleźć tę, która zawiera określony ciąg znaków, ale nie do końca go pasuje. Szukam ... później za pomocą df['name'] lub df[name] Jak zwykle. Próbowałem znaleźć sposób, aby to zrobić, bez skutku. Jakieś wskazówki?

Zastosuj funkcję pandy do kolumny, aby utworzyć wiele nowych kolumn?

Jak to zrobić w pandach: Mam funkcję extract_text_features na jednej kolumnie tekstowej, zwracającą wiele kolumn wyjściowyc ... iterrows() jest co najmniej 20x wolniej, więc poddałem się i podzieliłem funkcję na sześć odrębnych wywołań .map(lambda ...).

Jak upuścić listę wierszy z ramki danych Pandy?

Mam dataframe df: >>> df sales discount net_sales cogs STK_ID RPT_Date ... 915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459 Jak lub jaka funkcja może to zrobić ?

Jak usunąć wiersze z ramki danych pandy na podstawie wyrażenia warunkowego

Mam ramkę danych pandy i chcę usunąć z niej wiersze, w których długość ciągu znaków w danej kolumnie jest większa niż 2. Wiem ... olumn name']) < 2)] Ale dostaję tylko błąd: KeyError: u'no item named False' Czy ktoś może powiedz mi, co robię źle?

Zmień Nazwę Pandy DataFrame Index

Mam plik csv bez nagłówka, z indeksem DateTime. Chcę zmienić nazwę indeksu i nazwy kolumny, ale z df.rename () tylko nazwa ko ... 2002-06-18 0.112000 2002-06-22 0.190333 2002-06-26 0.134000 2002-06-30 0.093000 2002-07-04 0.098667

Jak zresetować indeks w ramce danych pandy?

Mam ramkę danych, z której usuwam kilka wierszy. W rezultacie otrzymuję ramkę danych, w której indeks jest coś takiego: [1,5, ... ogę to zrobić? Dodano Wygląda na to, że działa: df = df.reset_index() del df['index'] Nie działa: df = df.reindex()

Upuść wszystkie zduplikowane wiersze na wiele kolumn w Pythonie

The pandas drop_duplicates funkcja jest świetna do "unikania" ramki danych. Jednak jednym z argumentów słowa kluczowego do pr ... 3 bar 1 A Jako przykład chciałbym upuścić wiersze, które pasują do kolumn A i C, więc powinno to upuścić wiersze 0 i 1.

Pandy timeseries wykresy ustawianie osi X głównych i mniejszych kleszczy i etykiet

Chcę być w stanie ustawić duże i małe xticki i ich etykiety dla wykresu szeregów czasowych wykreślonego z obiektu szeregów cz ... bels.append(x.strftime('%d\n%a')) Jest to jednak trochę jak robienie osi x za pomocą ax.annotate: możliwe, ale nie idealne.

Wybierz wiersze ramki danych między dwiema datami

Tworzę DataFrame z pliku csv w następujący sposób: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=Tru ... tylko wiersze z wartościami daty, które mieszczą się w określonym zakresie dat lub między dwoma określonymi wartościami daty?

Znajdź wiersz, w którym wartości dla kolumny są maksymalne w ramce danych pandy

Jak mogę znaleźć wiersz, dla którego wartość konkretnej kolumny wynosi maximal ? df.max() da mi maksymalną wartość dla każdej kolumny, Nie wiem, jak uzyskać odpowiedni wiersz.

Wiele agregacji tej samej kolumny za pomocą pandy GroupBy.agg()

Czy jest wbudowany sposób na zastosowanie dwóch różnych funkcji agregujących f1, f2 do tej samej kolumny df["returns"], bez k ... zdefiniowaniem funkcji pomocniczej, która po prostu stosuje obie funkcje wewnątrz niego? (Jak to w ogóle działa z agregacją?)

Pandas groupby: jak zdobyć związek strun

Mam taki dataframe: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643 ... Jest pandas.core.groupby.SeriesGroupBy object Więc miałem nadzieję, że jakakolwiek metoda serii zadziała. Jakieś pomysły?

Jak pozbyć się kolumny "Unnamed: 0" w ramce danych pandy?

Mam sytuację, w której czasami kiedy czytam csv z df dostaję niechcianą kolumnę podobną do indeksu o nazwie unnamed:0. file ... 0 1 2 3 1 1 4 5 6 2 2 7 8 9 To bardzo irytujące! Czy ktoś ma pomysł jak się tego pozbyć?

Python: uzyskanie wiersza, który ma maksymalną wartość w grupach za pomocą groupby

Mam nadzieję, że znajdę pomoc na moje pytanie. Szukam rozwiązania dla następującego problemu: Mam dataFrame jak: Sp Mt ... stkie wiersze, w których count równa się max w każdej grupie np: MM2 S4 bg 10 MM4 S2 cb 8 MM4 S2 uyi 8

Wartość prawdy szeregu jest niejednoznaczna. Użyj. empty, a.bool(), a.item(), A.any() lub A. all()

Problem z filtrowaniem wynikowej ramki danych z warunkiem or. Chcę, aby mój wynik df wyodrębnił wszystkie wartości kolumny {[ ... ego a.empty(), a.bool(), a.item(),a.any() or a.all(). result = result[(result['var']>0.25) or (result['var']<-0.25)]

Jak przekonwertować wynik zapytania SQL na strukturę danych?

Każda pomoc w tym problemie będzie bardzo mile widziana. Więc w zasadzie chcę uruchomić zapytanie do mojej bazy danych SQL i ... jakby chcę zrozumieć, jaki jest format / typ danych mojej zmiennej "resoverall" i jak umieścić go w strukturze danych pandy.

Zastosuj vs transform na obiekcie grupy

Rozważmy następujący dataframe: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 ... 'two', 'three', 'two', 'two', 'one', 'three'], 'C' : randn(8), 'D' : randn(8)})

wyodrębnij wartość kolumny na podstawie innej kolumny

Utknąłem na wyciąganiu wartości jednej zmiennej warunkującej na inną zmienną. Na przykład, następujący dataframe: A B p1 1 ... Jak mogę uzyskać wartość A Kiedy B=3? Za każdym razem, gdy wyodrębniałem wartość A, otrzymywałem obiekt, a nie ciąg znaków.

Wyniki pand apply vs np.wektoryzacja, aby utworzyć nową kolumnę z istniejących kolumn

Używam ramek danych Pandy i chcę utworzyć nową kolumnę jako funkcję istniejących kolumn. Nie widziałem dobrej dyskusji na tem ... ości z innych kolumn Jak używać funkcji "apply" do wielu kolumn? Jak zastosować funkcję do dwóch kolumn Pandy dataframe