pandas
Jak wybrać wiersze z ramki danych na podstawie wartości kolumn
Jak mogę wybrać wiersze z DataFrame na podstawie wartości w jakiejś kolumnie w Pandzie?
W SQL użyłbym:
SELECT *
FROM table
WHERE colume_name = some_value
Próbowałem zajrzeć do dokumentacji Pandy, ale nie od razu znalazłem odpowiedź.
"Duże przepływy danych" za pomocą pand
Przez wiele miesięcy ucząc się pand starałem się znaleźć odpowiedź na to pytanie. Używam SAS do mojej codziennej pracy i jes ... awać wiersze do zbioru danych. Prawie zawsze będę tworzyć nowe kolumny(zmienne lub funkcje w statystyce/uczeniu maszynowym).
"Duże przepływy danych" za pomocą pand
Przez wiele miesięcy ucząc się pand starałem się znaleźć odpowiedź na to pytanie. Używam SAS do mojej codziennej pracy i jes ... awać wiersze do zbioru danych. Prawie zawsze będę tworzyć nowe kolumny(zmienne lub funkcje w statystyce/uczeniu maszynowym).
Jak iterować wiersze w ramce danych w pandach
Mam DataFrame od Pandy:
import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.Dat ... ow in df.T.iteritems():
Lub
for row in df.iterrows():
Ale nie rozumiem, czym jest obiekt row i jak mogę z nim pracować.
Zmień typ kolumny w pandy
Chcę przekonwertować tabelę, reprezentowaną jako lista list, na Pandas DataFrame. Jako niezwykle uproszczony przykład:
a = ... ślać, które kolumny są tego typu. Wszystko, co mogę zagwarantować, to to, że każda kolumna zawiera wartości tego samego typu.
Usuń kolumnę z ramki danych pandy
Podczas usuwania kolumny w ramce danych używam:
del df['column_name']
I to działa świetnie. Dlaczego nie mogę użyć następ ...
del df.column_name
Ponieważ można uzyskać dostęp do kolumny / serii jako df.column_name, spodziewałem się, że to zadziała.
Czym różnią się iloc i loc?
Czy ktoś może wyjaśnić, czym różnią się te dwie metody krojenia?
I ' ve seen the docs ,
i widziałem te odpowiedzi , ale nad ... również wiedzieć, jak te dwie funkcje różnią się od df.ix[:5], ale {[3] } została usunięta z pandas 1.0, więc mam to gdzieś.
Pandy101
Jak wykonać (INNER| (LEFT|RIGHT|FULL) OUTER) JOIN z pand?
Jak dodać Nan dla brakujących wierszy po połączeniu?
Jak pozbyć s ... we typy złączy (przeczytaj najpierw)
Połączenia oparte na indeksach
Uogólnienie na wiele DataFrames
Cross join
Zmiana nazwy kolumn w pandach
Mam ramkę danych używającą pand i etykiet kolumn, które muszę edytować, aby zastąpić oryginalne etykiety kolumn.
Chciałbym ...
Do
['a', 'b', 'c', 'd', 'e'].
Mam edytowane nazwy kolumn zapisane na liście, ale nie wiem, jak zastąpić nazwy kolumn.
Jak upuścić wiersze ramki danych Pandy, których wartością w określonej kolumnie jest NaN
Mam to DataFrame i chcę tylko te rekordy, których EPS kolumna nie jest NaN:
>>> df
STK_ID EPS c ... STK_ID RPT_Date
600016 20111231 600016 4.3 NaN
601939 20111231 601939 2.5 NaN
Jak mam to zrobić?
Jak obracać ramkę danych?
Co to jest pivot?
Jak się obracać?
czy to pivot?
długi format do szerokiego formatu?
Widziałem wiele pytań, które pytają ...
a 2 1 1
b 2 1 0
c 1 0 0
Do
1|1 2|1 2|2
a 2 1 1
b 2 1 0
c 1 0 0
Tworzenie ramki danych pandy poprzez dołączanie jednego wiersza na raz
Rozumiem, że pandy są przeznaczone do ładowania w pełni wypełnionych DataFrame, ale muszę utworzyć pustą ramkę danych, a nas ... się bardzo dziwne : - / (nie dodaje wartości ciągu)
Jak mogę dodać nowy wiersz do ramki danych (z różnymi typami kolumn) ?
Jak radzić sobie z SettingWithCopyWarning w Pandy
Tło
Właśnie uaktualniłem moje pandy z 0.11 do 0.13. 0rc1. Teraz aplikacja wyskakuje wiele nowych ostrzeżeń. Jeden z nich tak ... using .loc[row_index,col_indexer] = value instead
quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])
Pandy warunkowe utworzenie kolumny serii / ramki danych
Mam ramkę danych zgodnie z poniższymi wersjami:
Type Set
1 A Z
2 B Z
3 B ... tóra ustawi kolor 'green' if Set == 'Z' i 'red' if Set równa się cokolwiek innego.
Jaki jest najlepszy sposób, aby to zrobić?
Jak iterować wiersze w ramce danych w pandach?
Mam DataFrame od pandy:
import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.Dat ... w in df.T.iteritems():
Lub
for row in df.iterrows():
Ale ja nie zrozum, czym jest obiekt row i jak mogę z nim pracować.
Usuń kolumnę z ramki danych pandy za pomocą del df.nazwa kolumny
Podczas usuwania kolumny w ramce danych używam:
del df['column_name']
I to działa świetnie. Dlaczego nie mogę użyć następ ... ementów?
del df.column_name
ponieważ możesz uzyskać dostęp do kolumny/serii jako df.column_name, oczekuję, że to zadziała.
Jak rozwinąć wyświetlacz wyjściowy, aby zobaczyć więcej kolumn ramki danych pandy?
Czy istnieje sposób na rozszerzenie wyświetlania danych wyjściowych w trybie interaktywnym lub skryptowym?
W szczególności u ... u pand i describe() jest unikanie używania drugiego programu, takiego jak Stata, do podstawowej manipulacji danymi i badania.
Jak zrobić dobre powtarzalne pandy przykłady
odpowiedzi na to pytanie są wysiłkiem społeczności. Edytuj istniejące odpowiedzi, aby poprawić ten post. Obecnie nie przyjmu ... du, czy istnieje odpowiednik R dput(), który pozwala na wygenerowanie kodu do kopiowania w celu regeneracji struktury danych?
Uzyskaj statystyki dla każdej grupy (takie jak count, mean, etc) za pomocą pandas GroupBy?
Mam ramkę danych df i używam kilku kolumn od niej do groupby:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej.
W skrócie: jak uzyskać grupowe statystyki dla ramki danych?
Dodawanie nowej kolumny do istniejącego DataFrame w Pythonie
Mam następujący indeksowany DataFrame z nazwanymi kolumnami i wierszami nie-ciągłymi liczbami:
a b ... end, merge, ale nie dostałem pożądanego rezultatu, tylko co najwyżej błędy. Jak Mogę dodać kolumnę e do powyższego przykładu?