pandas
Różnica między metodami map, applymap I apply w pandach
Czy możesz mi powiedzieć, kiedy użyć tych metod wektoryzacji z podstawowymi przykładami?
Widzę, że map jest metodą Series, ... ego mamy dwie metody zastosowania funkcji do ramki danych? Ponownie, proste przykłady, które ilustrują użycie byłoby świetne!
Zapisanie ramki danych pandy do pliku CSV
Mam w Pandzie ramkę danych, którą chciałbym zapisać do pliku CSV. Robię to używając:
df.to_csv('out.csv')
I uzyskanie błę ... ób na zapis do pliku rozdzielanego tabulatorami zamiast pliku CSV przy użyciu np. metody 'to-tab' (która chyba nie istnieje)?
Wybieranie wielu kolumn w ramce danych pandy
Mam dane w różnych kolumnach, ale nie wiem, jak je wyodrębnić, aby zapisać je w innej zmiennej.
index a b c
1 2 ... wybrać 'a', 'b' i zapisać to do df1?
Próbowałem
df1 = df['a':'b']
df1 = df.ix[:, 'a':'b']
Nic nie działa.
(Minor Edit)
Usuwanie wiersza DataFrame w Pandzie na podstawie wartości kolumny
Mam następujący DataFrame:
daysago line_race rating rw wrating
line_date ... -1 0.016647 -0.016647
Muszę usunąć wiersze, w których {[1] } jest równe 0. Jaki jest najskuteczniejszy sposób na to?
Wybierz wiersze w ramce danych pandy MultiIndex
Jakie są najczęstsze sposoby wybierania / filtrowania wierszy ramki danych, której indeks jest MultiIndex?
krojenie na pods ... nywać operacje przyporządkowania na nich, lub wszelkie dyskusje związane z wydajnością (są to oddzielne tematy na inny raz).
Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości [duplikat]
to pytanie ma już odpowiedzi tutaj :
... TK_ID'] in stk_list] # this does not works in pandas
Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?
Jak filtrować dane Pandy używając 'in' I 'not in' jak w SQL
Jak mogę uzyskać odpowiedniki SQL IN i NOT IN?
Mam listę z wymaganymi wartościami.
Oto scenariusz:
df = pd.DataFrame({'count ... ', on='country')
not_in = not_in[pd.isnull(not_in['matched'])]
Ale to wygląda na straszną kludge. Czy ktoś może to poprawić?
Pandy - jak spłaszczyć indeks hierarchiczny w kolumnach
Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z operacji groupby.agg):
USAF WBAN year month day ... 9999999969,
3: 3.9199999999999982,
4: 10.940000000000001},
('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}
Jak przekonwertować indeks ramki danych pandy na kolumnę?
Wydaje się to dość oczywiste, ale nie mogę wymyślić, jak przekonwertować indeks ramki danych na kolumnę?
Na przykład:
df=
... =
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
Jaki jest najskuteczniejszy sposób pętli przez ramki danych z pand?
Chcę wykonywać własne złożone operacje na danych finansowych w dataframes w sposób sekwencyjny.
Na przykład używam następują ... den również pobiera indeks (ewentualnie przez generator do pamięci)? df.iteritems niestety tylko iteruje kolumna po kolumnie.
Konwersja obiektu Panas GroupBy na DataFrame
Zaczynam od takich danych wejściowych
df1 = pandas.DataFrame( {
"Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" ... 2 2
Mallory Seattle 1 1
Nie wiem, jak to osiągnąć w dokumentacji pand. Wszelkie wskazówki będą mile widziane.
Konwertuj listę słowników do ramki danych pandy
Mam listę takich słowników:
[{'points': 50, 'time': '5:00', 'year': 2010},
{'points': 25, 'time': '6:00', 'month': "februa ... Uwaga: kolejność kolumn nie ma znaczenia.
Jak mogę przekształcić listę słowników w ramkę danych pandy, jak pokazano powyżej?
Pobierz listę z nagłówków kolumn pandy DataFrame
Chcę uzyskać listę nagłówków kolumn z ramki danych pandy. Ramka danych będzie pochodzić z wejścia użytkownika, więc nie będę ... 10
8 6 6 4
9 10 10 7
Chciałbym otrzymać listę taką jak ta poniżej:
>>> header_list
[y, gdp, cap]
Pandy odczytują opcje csv low memory i dtype
Podczas wywoływania
df = pd.read_csv('somefile.csv')
Otrzymuję:
/Users/josh/anaconda / envs / py27 / lib / python2. ... _memory = False.
Dlaczego opcja dtype jest powiązana z low_memory i dlaczego zrobienie jej False pomogłoby w tym problemie?
pandy resamplują dokumentację
Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie robi dobrej roboty wyjaśniając opcje.
Więc większość op ... s.resample i jak ją wprowadzić? Jeśli tak, to gdzie, bo nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?
Uzyskaj wiersz(Y), który ma maksymalną wartość w grupach za pomocą groupby
Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla kolumny count, po pogrupowaniu przez ko ... kie wiersze, w których count równa się max, w każdej grupie np.:
MM2 S4 bg 10
MM4 S2 cb 8
MM4 S2 uyi 8
Filtruj wiersze ramki danych, jeśli wartość w kolumnie znajduje się na ustawionej liście wartości
Mam Python pandas DataFrame rpt:
rpt
<class 'pandas.core.frame.DataFrame'>
MultiIndex: 47518 entries, ('000002', '201 ... TK_ID'] in stk_list] # this does not works in pandas
Ponieważ pandy nie akceptują powyższego polecenia, jak osiągnąć cel?
Usuń wiersze pandy z zduplikowanymi indeksami
Jak usunąć wiersze o zduplikowanych wartościach indeksu?
W ramce danych pogodowych poniżej, czasami Naukowiec wraca i koryguj ... dla dowolnej wartości DatetimeIndex, ale utknąłem na wymyślaniu group_by lub pivot (lub ???) oświadczenia, aby to zadziałało.
Jak obrócić ramkę danych
Co to jest pivot?
Jak się obracać?
czy to pivot?
długi format do szerokiego formatu?
Widziałem wiele pytań, które pytają o ... 0 1 1
row2 1 0 2 1 2
row3 0 1 0 2 0
row4 0 1 2 2 1
Jak zastąpić wartości NaN przez zera w kolumnie ramki danych Pandy?
Mam ramkę danych Pandy jak poniżej:
itm Date Amount
67 420 2012-09-30 00:00:00 65211
68 421 ... kie metody, które wypróbowałem, nie zadziałały lub nie rozpoznały NaN.
Wszelkie wskazówki lub rozwiązania będą mile widziane.