pandas pg. 2

Różnica między metodami map, applymap I apply w pandach

Czy możesz mi powiedzieć, kiedy użyć tych metod wektoryzacji z podstawowymi przykładami? Widzę, że map jest metodą Series, ... ego mamy dwie metody zastosowania funkcji do ramki danych? Ponownie, proste przykłady, które ilustrują użycie byłoby świetne!

Zapisanie ramki danych pandy do pliku CSV

Mam w Pandzie ramkę danych, którą chciałbym zapisać do pliku CSV. Robię to używając: df.to_csv('out.csv') I uzyskanie błę ... ób na zapis do pliku rozdzielanego tabulatorami zamiast pliku CSV przy użyciu np. metody 'to-tab' (która chyba nie istnieje)?

python pandas dataframe csv

Wybieranie wielu kolumn w ramce danych pandy

Mam dane w różnych kolumnach, ale nie wiem, jak je wyodrębnić, aby zapisać je w innej zmiennej. index a b c 1 2 ... wybrać 'a', 'b' i zapisać to do df1? Próbowałem df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Nic nie działa. (Minor Edit)

python pandas dataframe select

Usuwanie wiersza DataFrame w Pandzie na podstawie wartości kolumny

Mam następujący DataFrame: daysago line_race rating rw wrating line_date ... -1 0.016647 -0.016647 Muszę usunąć wiersze, w których {[1] } jest równe 0. Jaki jest najskuteczniejszy sposób na to?

python pandas

Wybierz wiersze w ramce danych pandy MultiIndex

Jakie są najczęstsze sposoby wybierania / filtrowania wierszy ramki danych, której indeks jest MultiIndex? krojenie na pods ... nywać operacje przyporządkowania na nich, lub wszelkie dyskusje związane z wydajnością (są to oddzielne tematy na inny raz).

python slice pandas dataframe multi-index

Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości [duplikat]

to pytanie ma już odpowiedzi tutaj : ... TK_ID'] in stk_list] # this does not works in pandas Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?

python pandas dataframe

Jak filtrować dane Pandy używając 'in' I 'not in' jak w SQL

Jak mogę uzyskać odpowiedniki SQL IN i NOT IN? Mam listę z wymaganymi wartościami. Oto scenariusz: df = pd.DataFrame({'count ... ', on='country') not_in = not_in[pd.isnull(not_in['matched'])] Ale to wygląda na straszną kludge. Czy ktoś może to poprawić?

python pandas dataframe sql-function

Pandy - jak spłaszczyć indeks hierarchiczny w kolumnach

Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z operacji groupby.agg): USAF WBAN year month day ... 9999999969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}

python pandas dataframe

Jak przekonwertować indeks ramki danych pandy na kolumnę?

Wydaje się to dość oczywiste, ale nie mogę wymyślić, jak przekonwertować indeks ramki danych na kolumnę? Na przykład: df= ... = index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

python indexing pandas dataframe series

Jaki jest najskuteczniejszy sposób pętli przez ramki danych z pand?

Chcę wykonywać własne złożone operacje na danych finansowych w dataframes w sposób sekwencyjny. Na przykład używam następują ... den również pobiera indeks (ewentualnie przez generator do pamięci)? df.iteritems niestety tylko iteruje kolumna po kolumnie.

python performance pandas for-loop

Konwersja obiektu Panas GroupBy na DataFrame

Zaczynam od takich danych wejściowych df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" ... 2 2 Mallory Seattle 1 1 Nie wiem, jak to osiągnąć w dokumentacji pand. Wszelkie wskazówki będą mile widziane.

python pandas dataframe group-by multi-index

Konwertuj listę słowników do ramki danych pandy

Mam listę takich słowników: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "februa ... Uwaga: kolejność kolumn nie ma znaczenia. Jak mogę przekształcić listę słowników w ramkę danych pandy, jak pokazano powyżej?

python pandas dataframe dictionary

Pobierz listę z nagłówków kolumn pandy DataFrame

Chcę uzyskać listę nagłówków kolumn z ramki danych pandy. Ramka danych będzie pochodzić z wejścia użytkownika, więc nie będę ... 10 8 6 6 4 9 10 10 7 Chciałbym otrzymać listę taką jak ta poniżej: >>> header_list [y, gdp, cap]

python pandas dataframe

Pandy odczytują opcje csv low memory i dtype

Podczas wywoływania df = pd.read_csv('somefile.csv') Otrzymuję: /Users/josh/anaconda / envs / py27 / lib / python2. ... _memory = False. Dlaczego opcja dtype jest powiązana z low_memory i dlaczego zrobienie jej False pomogłoby w tym problemie?

python pandas dataframe parsing numpy

pandy resamplują dokumentację

Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie robi dobrej roboty wyjaśniając opcje. Więc większość op ... s.resample i jak ją wprowadzić? Jeśli tak, to gdzie, bo nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?

python pandas documentation

Uzyskaj wiersz(Y), który ma maksymalną wartość w grupach za pomocą groupby

Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla kolumny count, po pogrupowaniu przez ko ... kie wiersze, w których count równa się max, w każdej grupie np.: MM2 S4 bg 10 MM4 S2 cb 8 MM4 S2 uyi 8

python pandas pandas-groupby max

Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości

Mam Python pandas DataFrame rpt: rpt <class 'pandas.core.frame.DataFrame'> MultiIndex: 47518 entries, ('000002', '201 ... TK_ID'] in stk_list] # this does not works in pandas Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?

python pandas dataframe

Usuń wiersze pandy z zduplikowanymi indeksami

Jak usunąć wiersze o zduplikowanych wartościach indeksu? W ramce danych pogodowych poniżej, czasami Naukowiec wraca i koryguj ... dla dowolnej wartości DatetimeIndex, ale utknąłem na wymyślaniu group_by lub pivot (lub ???) oświadczenia, aby to zadziałało.

python pandas dataframe duplicates

Jak obrócić ramkę danych

Co to jest pivot? Jak się obracać? czy to pivot? długi format do szerokiego formatu? Widziałem wiele pytań, które pytają o ... 0 1 1 row2 1 0 2 1 2 row3 0 1 0 2 0 row4 0 1 2 2 1

python pandas group-by pivot pandas-groupby

Jak zastąpić wartości NaN przez zera w kolumnie ramki danych Pandy?

Mam ramkę danych Pandy jak poniżej: itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 ... kie metody, które wypróbowałem, nie zadziałały lub nie rozpoznały NaN. Wszelkie wskazówki lub rozwiązania będą mile widziane.

python pandas dataframe nan