pandas
Pandy konwertują ramkę danych na tablicę krotek
Manipulowałem niektórymi danymi za pomocą pand i teraz chcę przeprowadzić zapis wsadowy z powrotem do bazy danych. Wymaga to ... (2012,2,17),24.75,25.03),
(datetime.date(2012,2,16),25.00,25.07),
...etc. ]
Jakieś sugestie, jak Mogę to skutecznie zrobić?
Wczytaj dane z txt za pomocą pandy
Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę je przechowywać w tablicy, gdzie mogę uzyskać dostęp d ... na. Jak mogę go podzielić, aby przechowywać różne elementy osobno (aby móc wywołać data[i,j])? Jak mogę zdefiniować nagłówek?
Pisanie do bazy MySQL za pomocą SQLAlchemy, do sql
Próba zapisu ramki danych do tabeli MySQL przy użyciu to_sql. Wcześniej korzystał z flavor= 'mysql' , jednak w przyszłości z ... le_table2', con=engine, if_exists = 'append', index=False)
>>AttributeError: 'Engine' object has no attribute 'cursor'
Wybieranie wierszy z ramki danych Pandy o złożonym (hierarchicznym) indeksie
Podejrzewam, że jest to banalne, ale jeszcze nie odkryłem zaklęcia, które pozwoli mi wybrać wiersze z pandy dataframe na pods ... wiersze gdzie:
group1 = = " a "
group1 = = " a "& group2 = = " c "
group2 = = " c "
group1 in ["a", "b", "c"]
Porównywanie dwóch ram danych i uzyskiwanie różnic
Mam dwa ramki danych. Przykłady:
df1:
Date Fruit Num Color
2013-11-24 Banana 22.1 Yellow
2013-11-24 Orange 8.6 O ... ie, aby zwróciło False, ale nie mogę dowiedzieć się, jak faktycznie zobaczyć różne wiersze.
Dowolne wskaźniki byłyby Witamy
Pandy otrzymują najwyższe N rekordów w każdej grupie
Przypuśćmy, że mam taką ramkę danych pandy:
>>> df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4],'value':[1,2,3,1,2,3,4 ... go? A także jest bardziej eleganckie podejście do rekordów liczbowych w każdej grupie (jak funkcja okna SQL row_number () ).
Dodawanie obliczonych kolumn do ramki danych w pandach
Mam zestaw danych OHLC, który parsowałem z CSV do ramki danych Pandy i ponownie próbkowałem do 15 min:
<class 'pandas.co ... j niż jednego paska (T), Jak mogę odwoływać się do różnych wierszy (np. T-1, T-2 itp.) z definicji funkcji?
Z góry dziękuję.
Jak zachować indeks podczas korzystania z pand merge
Chciałbym połączyć dwa DataFrames i zachować Indeks z pierwszej klatki jako indeks na scalonym zbiorze danych. Jednak, kiedy ... 9]: _.index
Out[9]: Int64Index([0, 1, 2], dtype='int64')
EDIT: przełączony na przykładowy kod, który można łatwo odtworzyć
Pandy dataframe get pierwszy wiersz każdej grupy
[6]}mam pandy [4]} jak podążać.
df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7],
'value' : [" ... .
In [25]: for index, row in df.iterrows():
....: df2 = pd.DataFrame(df.groupby(['id','value']).reset_index().ix[0])
pandy unikalne wartości wiele kolumn
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'],
'Col2': ['Joe', 'Steve', 'Bob', 'Bob', ' ... lepszy sposób na zwrócenie unikalnych wartości 'Col1' i 'Col2'?
Pożądane wyjście to
'Bob', 'Joe', 'Bill', 'Mary', 'Steve'
Jak uzyskać listę wszystkich zduplikowanych elementów za pomocą pandy w Pythonie?
Mam listę przedmiotów, które prawdopodobnie mają problemy z eksportem. Chciałbym uzyskać listę zduplikowanych elementów, aby ... A036 i oba wpisy 11795 i wszelkie inne zduplikowane wpisy, zamiast tylko pierwszego. Każda pomoc jest najbardziej doceniana.
Oblicz * toczenie * maksymalne obsunięcie serii pandy
Całkiem łatwo jest napisać funkcję, która oblicza maksymalne obsunięcie szeregu czasowego. Trzeba trochę pomyśleć, aby zapis ... m w moim poście, to rolling_dd_custom. Myślę, że to może być bardzo szybkim rozwiązaniem, jeśli zaimplementowane w Cythonie.
Pandy: suma wierszy DataFrame dla podanych kolumn
Mam następujący DataFrame:
In [1]:
import pandas as pd
df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'] ... [['a','b','d']].map(sum)
Ale nie!
Chciałbym uświadomić sobie, że operacja ma listę kolumn ['a','b','d'] i df jako wejścia.
Zastąp wartość dla wybranej komórki w ramce danych bez użycia indeksu
Jest to dość podobne pytanie do to pytanie , ale z jedną kluczową różnicą: wybieram dane, które chcę zmienić nie według indek ... najlepszy sposób, aby to zrobić? Idealnie rozwiązanie powinno używać numeru wiersza, ponieważ normalnie nie wiesz, że z góry!
Pandy-Oblicz Z-score dla wszystkich kolumn
Mam ramkę danych zawierającą pojedynczą kolumnę identyfikatorów, a wszystkie pozostałe kolumny są wartościami liczbowymi, dla ... iem go dobrze. Jeśli indeksowanie jest kluczową częścią rozwiązania tego problemu, proszę o wyjaśnienie sposobu indeksowania.
Ramka danych pandy z kolumną multiindex - merge levels
Mam ramkę danych, grouped, z kolumnami multiindex jak poniżej:
import pandas as pd
codes = ["one","two","three"];
colours = ... śli nie jest to możliwe, czy istnieje sposób na groupby(), Jak to zrobiłem powyżej, bez tworzenia kolumn z wieloma indeksami?
Jak zastąpić tekst w kolumnie ramki danych Pandy?
W moim dataframe mam taką kolumnę:
range
"(2,30)"
"(50,290)"
"(400,1000)"
...
I chcę zamienić , przecinek na - myślnik. Ob ... cnie używam tej metody, ale nic się nie zmieniło.
org_info_exc['range'].replace(',', '-', inplace=True)
Czy ktoś może pomóc?
Czym jest dtype ('O') w pandach?
Mam ramkę danych w pandach i próbuję rozgryźć, jakie są typy jego wartości. Nie jestem pewien, jaki jest typ kolumny 'Test'. Jednak gdy biegnę myFrame['Test'].dtype, dostaję;
dtype('O')
Co to znaczy?
iteracja wiersz po wierszu przez ramkę danych pandy [duplikat]
Możliwy duplikat:jaki jest najskuteczniejszy sposób pętli przez ramki danych z pand?
Szukam iteracji rząd po rzędzie ... erformatywny i / lub bardziej idiomatyczny sposób, aby to zrobić? Wiem o apply, ale czasami wygodniej jest użyć pętli for.
Assign pandy dataframe column dtypes
Chcę ustawić dtype S wielu kolumn w pd.Dataframe (mam plik, który musiałem ręcznie parsować do listy list, ponieważ plik nie ... mydata.columns:
mydata[c] = mydata[c].astype(dtypes[c])
print mydata['y'].dtype #=> int64
Czy jest lepszy sposób?