pandas

Pandy konwertują ramkę danych na tablicę krotek

Manipulowałem niektórymi danymi za pomocą pand i teraz chcę przeprowadzić zapis wsadowy z powrotem do bazy danych. Wymaga to ... (2012,2,17),24.75,25.03), (datetime.date(2012,2,16),25.00,25.07), ...etc. ] Jakieś sugestie, jak Mogę to skutecznie zrobić?

Wczytaj dane z txt za pomocą pandy

Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę je przechowywać w tablicy, gdzie mogę uzyskać dostęp d ... na. Jak mogę go podzielić, aby przechowywać różne elementy osobno (aby móc wywołać data[i,j])? Jak mogę zdefiniować nagłówek?

Pisanie do bazy MySQL za pomocą SQLAlchemy, do sql

Próba zapisu ramki danych do tabeli MySQL przy użyciu to_sql. Wcześniej korzystał z flavor= 'mysql' , jednak w przyszłości z ... le_table2', con=engine, if_exists = 'append', index=False) >>AttributeError: 'Engine' object has no attribute 'cursor'

Wybieranie wierszy z ramki danych Pandy o złożonym (hierarchicznym) indeksie

Podejrzewam, że jest to banalne, ale jeszcze nie odkryłem zaklęcia, które pozwoli mi wybrać wiersze z pandy dataframe na pods ... wiersze gdzie: group1 = = " a " group1 = = " a "& group2 = = " c " group2 = = " c " group1 in ["a", "b", "c"]

Porównywanie dwóch ram danych i uzyskiwanie różnic

Mam dwa ramki danych. Przykłady: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 O ... ie, aby zwróciło False, ale nie mogę dowiedzieć się, jak faktycznie zobaczyć różne wiersze. Dowolne wskaźniki byłyby Witamy

Pandy otrzymują najwyższe N rekordów w każdej grupie

Przypuśćmy, że mam taką ramkę danych pandy: >>> df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4],'value':[1,2,3,1,2,3,4 ... go? A także jest bardziej eleganckie podejście do rekordów liczbowych w każdej grupie (jak funkcja okna SQL row_number () ).

Dodawanie obliczonych kolumn do ramki danych w pandach

Mam zestaw danych OHLC, który parsowałem z CSV do ramki danych Pandy i ponownie próbkowałem do 15 min: <class 'pandas.co ... j niż jednego paska (T), Jak mogę odwoływać się do różnych wierszy (np. T-1, T-2 itp.) z definicji funkcji? Z góry dziękuję.

Jak zachować indeks podczas korzystania z pand merge

Chciałbym połączyć dwa DataFrames i zachować Indeks z pierwszej klatki jako indeks na scalonym zbiorze danych. Jednak, kiedy ... 9]: _.index Out[9]: Int64Index([0, 1, 2], dtype='int64') EDIT: przełączony na przykładowy kod, który można łatwo odtworzyć

Pandy dataframe get pierwszy wiersz każdej grupy

[6]}mam pandy [4]} jak podążać. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : [" ... . In [25]: for index, row in df.iterrows(): ....: df2 = pd.DataFrame(df.groupby(['id','value']).reset_index().ix[0])

pandy unikalne wartości wiele kolumn

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', ' ... lepszy sposób na zwrócenie unikalnych wartości 'Col1' i 'Col2'? Pożądane wyjście to 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

Jak uzyskać listę wszystkich zduplikowanych elementów za pomocą pandy w Pythonie?

Mam listę przedmiotów, które prawdopodobnie mają problemy z eksportem. Chciałbym uzyskać listę zduplikowanych elementów, aby ... A036 i oba wpisy 11795 i wszelkie inne zduplikowane wpisy, zamiast tylko pierwszego. Każda pomoc jest najbardziej doceniana.

Oblicz * toczenie * maksymalne obsunięcie serii pandy

Całkiem łatwo jest napisać funkcję, która oblicza maksymalne obsunięcie szeregu czasowego. Trzeba trochę pomyśleć, aby zapis ... m w moim poście, to rolling_dd_custom. Myślę, że to może być bardzo szybkim rozwiązaniem, jeśli zaimplementowane w Cythonie.

Pandy: suma wierszy DataFrame dla podanych kolumn

Mam następujący DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'] ... [['a','b','d']].map(sum) Ale nie! Chciałbym uświadomić sobie, że operacja ma listę kolumn ['a','b','d'] i df jako wejścia.

Zastąp wartość dla wybranej komórki w ramce danych bez użycia indeksu

Jest to dość podobne pytanie do to pytanie , ale z jedną kluczową różnicą: wybieram dane, które chcę zmienić nie według indek ... najlepszy sposób, aby to zrobić? Idealnie rozwiązanie powinno używać numeru wiersza, ponieważ normalnie nie wiesz, że z góry!

Pandy-Oblicz Z-score dla wszystkich kolumn

Mam ramkę danych zawierającą pojedynczą kolumnę identyfikatorów, a wszystkie pozostałe kolumny są wartościami liczbowymi, dla ... iem go dobrze. Jeśli indeksowanie jest kluczową częścią rozwiązania tego problemu, proszę o wyjaśnienie sposobu indeksowania.

Ramka danych pandy z kolumną multiindex - merge levels

Mam ramkę danych, grouped, z kolumnami multiindex jak poniżej: import pandas as pd codes = ["one","two","three"]; colours = ... śli nie jest to możliwe, czy istnieje sposób na groupby(), Jak to zrobiłem powyżej, bez tworzenia kolumn z wieloma indeksami?

Jak zastąpić tekst w kolumnie ramki danych Pandy?

W moim dataframe mam taką kolumnę: range "(2,30)" "(50,290)" "(400,1000)" ... I chcę zamienić , przecinek na - myślnik. Ob ... cnie używam tej metody, ale nic się nie zmieniło. org_info_exc['range'].replace(',', '-', inplace=True) Czy ktoś może pomóc?

Czym jest dtype ('O') w pandach?

Mam ramkę danych w pandach i próbuję rozgryźć, jakie są typy jego wartości. Nie jestem pewien, jaki jest typ kolumny 'Test'. Jednak gdy biegnę myFrame['Test'].dtype, dostaję; dtype('O') Co to znaczy?

iteracja wiersz po wierszu przez ramkę danych pandy [duplikat]

Możliwy duplikat:jaki jest najskuteczniejszy sposób pętli przez ramki danych z pand? Szukam iteracji rząd po rzędzie ... erformatywny i / lub bardziej idiomatyczny sposób, aby to zrobić? Wiem o apply, ale czasami wygodniej jest użyć pętli for.

Assign pandy dataframe column dtypes

Chcę ustawić dtype S wielu kolumn w pd.Dataframe (mam plik, który musiałem ręcznie parsować do listy list, ponieważ plik nie ... mydata.columns: mydata[c] = mydata[c].astype(dtypes[c]) print mydata['y'].dtype #=> int64 Czy jest lepszy sposób?