pandas

Różnica między metodami map, applymap I apply w pandach

Czy możesz mi powiedzieć, kiedy użyć tych metod wektoryzacji z podstawowymi przykładami? Widzę, że map jest metodą Series, ... ego mamy dwie metody zastosowania funkcji do ramki danych? Ponownie, proste przykłady, które ilustrują użycie byłoby świetne!

Zapisanie ramki danych pandy do pliku CSV

Mam w Pandzie ramkę danych, którą chciałbym zapisać do pliku CSV. Robię to używając: df.to_csv('out.csv') I uzyskanie błę ... ób na zapis do pliku rozdzielanego tabulatorami zamiast pliku CSV przy użyciu np. metody 'to-tab' (która chyba nie istnieje)?

Wybieranie wielu kolumn w ramce danych pandy

Mam dane w różnych kolumnach, ale nie wiem, jak je wyodrębnić, aby zapisać je w innej zmiennej. index a b c 1 2 ... wybrać 'a', 'b' i zapisać to do df1? Próbowałem df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Nic nie działa. (Minor Edit)

Usuwanie wiersza DataFrame w Pandzie na podstawie wartości kolumny

Mam następujący DataFrame: daysago line_race rating rw wrating line_date ... -1 0.016647 -0.016647 Muszę usunąć wiersze, w których {[1] } jest równe 0. Jaki jest najskuteczniejszy sposób na to?

Wybierz wiersze w ramce danych pandy MultiIndex

Jakie są najczęstsze sposoby wybierania / filtrowania wierszy ramki danych, której indeks jest MultiIndex? krojenie na pods ... nywać operacje przyporządkowania na nich, lub wszelkie dyskusje związane z wydajnością (są to oddzielne tematy na inny raz).

Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości [duplikat]

to pytanie ma już odpowiedzi tutaj : ... TK_ID'] in stk_list] # this does not works in pandas Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?

Jak filtrować dane Pandy używając 'in' I 'not in' jak w SQL

Jak mogę uzyskać odpowiedniki SQL IN i NOT IN? Mam listę z wymaganymi wartościami. Oto scenariusz: df = pd.DataFrame({'count ... ', on='country') not_in = not_in[pd.isnull(not_in['matched'])] Ale to wygląda na straszną kludge. Czy ktoś może to poprawić?

Pandy - jak spłaszczyć indeks hierarchiczny w kolumnach

Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z operacji groupby.agg): USAF WBAN year month day ... 9999999969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}

Jak przekonwertować indeks ramki danych pandy na kolumnę?

Wydaje się to dość oczywiste, ale nie mogę wymyślić, jak przekonwertować indeks ramki danych na kolumnę? Na przykład: df= ... = index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

Jaki jest najskuteczniejszy sposób pętli przez ramki danych z pand?

Chcę wykonywać własne złożone operacje na danych finansowych w dataframes w sposób sekwencyjny. Na przykład używam następują ... den również pobiera indeks (ewentualnie przez generator do pamięci)? df.iteritems niestety tylko iteruje kolumna po kolumnie.

Konwersja obiektu Panas GroupBy na DataFrame

Zaczynam od takich danych wejściowych df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" ... 2 2 Mallory Seattle 1 1 Nie wiem, jak to osiągnąć w dokumentacji pand. Wszelkie wskazówki będą mile widziane.

Konwertuj listę słowników do ramki danych pandy

Mam listę takich słowników: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "februa ... Uwaga: kolejność kolumn nie ma znaczenia. Jak mogę przekształcić listę słowników w ramkę danych pandy, jak pokazano powyżej?

Pobierz listę z nagłówków kolumn pandy DataFrame

Chcę uzyskać listę nagłówków kolumn z ramki danych pandy. Ramka danych będzie pochodzić z wejścia użytkownika, więc nie będę ... 10 8 6 6 4 9 10 10 7 Chciałbym otrzymać listę taką jak ta poniżej: >>> header_list [y, gdp, cap]

Pandy odczytują opcje csv low memory i dtype

Podczas wywoływania df = pd.read_csv('somefile.csv') Otrzymuję: /Users/josh/anaconda / envs / py27 / lib / python2. ... _memory = False. Dlaczego opcja dtype jest powiązana z low_memory i dlaczego zrobienie jej False pomogłoby w tym problemie?

pandy resamplują dokumentację

Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie robi dobrej roboty wyjaśniając opcje. Więc większość op ... s.resample i jak ją wprowadzić? Jeśli tak, to gdzie, bo nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?

Uzyskaj wiersz(Y), który ma maksymalną wartość w grupach za pomocą groupby

Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla kolumny count, po pogrupowaniu przez ko ... kie wiersze, w których count równa się max, w każdej grupie np.: MM2 S4 bg 10 MM4 S2 cb 8 MM4 S2 uyi 8

Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości

Mam Python pandas DataFrame rpt: rpt <class 'pandas.core.frame.DataFrame'> MultiIndex: 47518 entries, ('000002', '201 ... TK_ID'] in stk_list] # this does not works in pandas Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?

Usuń wiersze pandy z zduplikowanymi indeksami

Jak usunąć wiersze o zduplikowanych wartościach indeksu? W ramce danych pogodowych poniżej, czasami Naukowiec wraca i koryguj ... dla dowolnej wartości DatetimeIndex, ale utknąłem na wymyślaniu group_by lub pivot (lub ???) oświadczenia, aby to zadziałało.

Jak obrócić ramkę danych

Co to jest pivot? Jak się obracać? czy to pivot? długi format do szerokiego formatu? Widziałem wiele pytań, które pytają o ... 0 1 1 row2 1 0 2 1 2 row3 0 1 0 2 0 row4 0 1 2 2 1

Jak zastąpić wartości NaN przez zera w kolumnie ramki danych Pandy?

Mam ramkę danych Pandy jak poniżej: itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 ... kie metody, które wypróbowałem, nie zadziałały lub nie rozpoznały NaN. Wszelkie wskazówki lub rozwiązania będą mile widziane.