pandas

Utworzenie pustej ramki danych pandy, a następnie jej wypełnienie?

Zaczynam od pandy Data Frame docs tutaj: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Chciałbym iteracyjnie w ... symb in valdict: valdict[symb][thedate] = 1+valdict[symb][thedate - dt.timedelta(days=1)] print valdict

Wybór według złożonych kryteriów z pand.DataFrame

Na przykład mam proste DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in ... A", dla których odpowiednie wartości dla " B "będą większe niż 50, a dla" C " - nie równe 900, używając metod i idiomów pand?

Python Pandas: pobranie indeksu wierszy, które kolumny pasują do określonej wartości

Biorąc pod uwagę ramkę z kolumną "BoolCol", chcemy znaleźć indeksy ramki, w której wartości dla "BoolCol" = = True Obecnie ... dy sprawdzam je wykonując: df.iloc[i]['BoolCol'] Wynik jest rzeczywiście Fałsz!! Jaki byłby właściwy sposób Pandy na to?

Jak przekonwertować serię pand lub indeks na tablicę Numpy? [duplikat]

to pytanie ma już odpowiedzi tutaj : ... miesięcy temu . Czy wiesz, jak uzyskać indeks lub kolumnę ramki danych jako tablicę NumPy lub listę Pythona?

Zastosuj wiele funkcji do wielu kolumn groupby

Docs pokazuje, jak zastosować wiele funkcji na obiekcie groupby jednocześnie używając dict z nazwami kolumn wyjściowych jako ... ć, lub możliwość, że ta funkcjonalność może zostać dodana, czy po prostu będę musiał iterację przez groupby ręcznie? Dzięki

Duża, trwała ramka danych w pandach

[2]}badam przejście na python i pandas jako wieloletni użytkownik SAS. Jednak podczas testów dziwiłem się, że pythonowi za ... jest coś analogicznego w pandas? Regularnie pracuję z dużymi plikami i nie mieć dostęp do rozproszonej sieci obliczeniowej.

Konwertuj Python dict na ramkę danych

Mam Słownik Pythona jak poniżej: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'201 ... t w obiekt szeregowy, ale to nie wydaje się utrzymywać relacji między kolumnami: s = Series(my_dict,index=my_dict.keys())

Wybieranie wiersza serii/ramki danych według indeksu liczb całkowitych

Jestem ciekaw dlaczego df[2] nie jest obsługiwane, podczas gdy df.ix[2] i df[2:3] oba działają. In [26]: df.ix[2] Out[26]: ... indeksowania Pythona. Czy istnieje projektowy powód, aby nie wspierać indeksowania wiersza przez pojedynczą liczbę całkowitą?

Jak podzielić dane na 3 zestawy (pociąg, Walidacja i test)?

Mam ramkę danych pandy i chcę podzielić ją na 3 oddzielne zestawy. Wiem, że używając train_test_split z sklearn.cross_valid ... oś dopasowanie wskaźników. Ale czy istnieje bardziej standardowy / wbudowany sposób na podzielić dane na 3 zestawy zamiast 2?

Jak mogę użyć funkcji apply () dla pojedynczej kolumny?

Mam ramkę danych pandy z dwiema kolumnami. Muszę zmienić wartości pierwszej kolumny bez wpływu na drugą i odzyskać całą ramkę danych z tylko wartości pierwszej kolumny zmienione. Jak mogę to zrobić używając apply in pands?

Wskaźnik postępu podczas operacji pandy

Regularnie wykonuję operacje pand na ramkach danych przekraczających 15 milionów wierszy i chciałbym mieć dostęp do wskaźnika ... iała funkcja apply i raportuje postęp jako skończony ułamek tych podzbiorów. Czy to może coś, co należy dodać do biblioteki?

UnicodeDecodeError podczas czytania pliku CSV w Pythonie

Uruchamiam program, który przetwarza 30,000 podobnych plików. Losowa ich liczba zatrzymuje się i powoduje ten błąd... Fil ... tworzenie tych plików pochodzi z tego samego miejsca. Jaki jest najlepszy sposób na poprawienie tego, aby kontynuować import?

Dlaczego pandy w Pythonie były szybsze od danych?tabela fuzji W R w 2012 roku?

Ostatnio natknąłem się na pandas bibliotekę dla Pythona, która zgodnie z Ten benchmark wykonuje bardzo szybkie scalanie w pam ... ię do merge(X, Y, all=FALSE) i merge(X, Y, all=TRUE)? Oto kod R i Kod Pythona używany do porównywania różnych pakietów.

Get column index from column name in python

W R, gdy musisz pobrać indeks kolumny na podstawie nazwy kolumny, możesz to zrobić idx <- which(names(my_data)==my_colum_name) Czy istnieje sposób, aby zrobić to samo z pand dataframes?

Wyprowadzanie różnicy w dwóch ramkach danych Pandy obok siebie - podkreślanie różnicy

Staram się dokładnie podkreślić, co zmieniło się między dwoma ramkami danych. Załóżmy, że mam dwa ramki danych Pythona: "S ... n vacation" Myślę, że mógłbym zrobić wiersz po wierszu i kolumna po kolumnie porównanie, ale czy jest łatwiejszy sposób?

Zmiana nazwy konkretnej kolumny w ramce danych pandy

Szukałem eleganckiego sposobu na zmianę określonej nazwy kolumny w DataFrame. Odtwórz dane ... import pandas as pd d = { ... rstwowy ... próba ta nie powiodła się ... df.columns[df.columns.tolist().index('one')] = 'another_name' / Align = "left" /

Jak podzielić kolumnę na dwie kolumny?

Mam ramkę danych z jedną kolumną i chciałbym podzielić ją na dwie kolumny, z nagłówkiem jednej kolumny jako ' fips' a drugiej ... UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL

pandy trójdrożne łączące wiele ramek danych na kolumnach

Mam 3 pliki CSV. Każda ma pierwszą kolumnę jako (string) nazwy osób, podczas gdy wszystkie pozostałe kolumny w każdej ramce d ... estem zdezorientowany, co hierarchiczny schemat indeksowania ma wspólnego z tworzeniem połączenie oparte na jednym indeksie.

Jak filtrować wiersze zawierające wzór łańcucha z ramki danych Pandy [duplicate]

to pytanie ma już odpowiedzi tutaj : ... wać wiersze zawierające słowo kluczowe " piłka?"Na przykład wyjście powinno być: ids vals aball 1 bball 2 fball 4

Jak zaimportować dane z mongodb do pandy?

Mam dużą ilość danych w zbiorze w mongodb, które muszę przeanalizować. Jak zaimportować te dane do pandy? Jestem nowy dla pa ... Reading" } ], "latestReportTime" : ISODate("2013-04-02T08:43:55.463Z"), "sensorName" : "56847890-0", "reportCount" : 8 }