pandas-groupby

Jak obracać ramkę danych?

Co to jest pivot? Jak się obracać? czy to pivot? długi format do szerokiego formatu? Widziałem wiele pytań, które pytają ... a 2 1 1 b 2 1 0 c 1 0 0 Do 1|1 2|1 2|2 a 2 1 1 b 2 1 0 c 1 0 0

Uzyskaj statystyki dla każdej grupy (takie jak count, mean, etc) za pomocą pandas GroupBy?

Mam ramkę danych df i używam kilku kolumn od niej do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej. W skrócie: jak uzyskać grupowe statystyki dla ramki danych?

Uzyskaj wiersz(Y), który ma maksymalną wartość w grupach za pomocą groupby

Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla kolumny count, po pogrupowaniu przez ko ... kie wiersze, w których count równa się max, w każdej grupie np.: MM2 S4 bg 10 MM4 S2 cb 8 MM4 S2 uyi 8

Jak obrócić ramkę danych

Co to jest pivot? Jak się obracać? czy to pivot? długi format do szerokiego formatu? Widziałem wiele pytań, które pytają o ... 0 1 1 row2 1 0 2 1 2 row3 0 1 0 2 0 row4 0 1 2 2 1

Jak grupować wiersze ramki danych w liście w Pandzie groupby

Mam ramkę danych pandy df Jak: a b A 1 A 2 B 5 B 5 B 4 C 6 Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach : A [1,2] B [5,5,4] C [6] Czy można zrobić coś takiego używając pandy groupby?

Wiele agregacji tej samej kolumny za pomocą pandy GroupBy.agg()

Czy jest wbudowany sposób na zastosowanie dwóch różnych funkcji agregujących f1, f2 do tej samej kolumny df["returns"], bez k ... zdefiniowaniem funkcji pomocniczej, która po prostu stosuje obie funkcje wewnątrz niego? (Jak to w ogóle działa z agregacją?)

Łączenie strun z kilku rzędów za pomocą Pandy groupby

Chcę połączyć kilka łańcuchów w ramce danych opartej na groupedby w pandach. To jest mój kod do tej pory: import pandas a ... zumiem, jak mogę użyć groupby i zastosować jakiś rodzaj konkatenacji łańcuchów w kolumnie "tekst". Każda pomoc mile widziana!

Agregacja w pandach

Jak wykonać agregację z pand? Brak ramki danych po agregacji! Co się stało? Jak agregować głównie kolumny łańcuchów (do lis ... Należy pamiętać, że ten post nie ma na celu zastąpienia dokumentacji o agregacji i o groupby , więc przeczytaj to również!

Zachowaj inne kolumny podczas wykonywania groupby

Używam groupby na ramce danych pandy, aby upuścić wszystkie wiersze, które nie mają minimum określonej kolumny. Coś takiego: ... Ale żaden z nich nie działa(zdałem sobie sprawę z tego, że składnia jest przeznaczona do agregowania po utworzeniu grupy).

Grupuj ramki danych i zbieraj sumy i policz?

Mam ramkę danych, która wygląda tak: Company Name Organisation Name Amount 10118 Vifor Pharma ... umować lub liczyć: df.groupby('Company Name').sum() df.groupby('Company Name').count() Ale nie jak zrobić jedno i drugie!

Policz unikalne wartości z pand na grupy [duplikat]

To pytanie ma już odpowiedź tutaj: pandy count(distinct) equivalent ... groupby(['domain', 'ID']).count() Ale chcę dostać domain, count vk.com 3 twitter.com 2 facebook.com 1 google.com 1

Pandy liczba wierszy w grupie w kolejności rosnącej

Podano następującą ramkę danych: import pandas as pd import numpy as np df=pd.DataFrame({'A':['A','A','A','B','B','B'], ... 2 5 B a 3 Próbowałem tego do tej pory: df['C']=df.groupby(['A','B'])['B'].transform('rank') ...ale to nie działa!

Pandy GroupBy.zastosuj metodę duplikuje pierwszą grupę

Moje pierwsze pytanie: Jestem zdezorientowany co do tego zachowania metody apply of groupby w Pandzie (0.12.0-4), wydaje się, ... ', group_keys = True).apply(addone) >>> print(df2) class count 0 A 2 1 B 1 2 C 3

dlaczego pandy rolling używają jednego wymiaru ndarray

Zostałem zmotywowany do użycia funkcji pandy rolling do wykonania regresji wieloskładnikowej (to pytanie dotyczy , a nie regr ... ałtu (window, len(df.columns)). Pytanie dlaczego? Nie mam teraz sposobu, aby łatwo uruchomić regresję rolling Multi-factor.

Python Pandy: Oblicz średnią ruchomą w grupie

Mam ramkę danych zawierającą szeregi czasowe dla 100 obiektów: object period value 1 1 24 1 2 67 ... alculate MA~) A następnie połączyć tę serię z oryginalną ramką danych przez obiekt? Nie można wymyśleć dokładnych poleceń

Groupby w Pythonie: szybki sposób

Chcę poprawić czas groupby w Pythonie pandas. Mam ten kod: df["Nbcontrats"] = df.groupby(['Client', 'Month'])['Contrat'].t ... ntrat'].transform(len) 1 loops, best of 3: 391 ms per loop df.shape Out[309]: (7464, 61) Jak mogę poprawić wykonanie czas?

Wartość Groupby liczy się na ramce danych

Mam następujący dataframe: df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 't ... ziała, ponieważ value_counts Działa na serii groupby, a nie na ramce danych. W każdym razie mogę to osiągnąć bez zapętlania?

Pandy groupby z koszem

Mam ramkę danych, która wygląda tak: +----------+---------+-------+ | username | post_id | views | +----------+---------+-- ... 000] 2332 (5000, 10000] 1118 (10000, 50000] 570 (50000, 10000000] 14 Name: username, dtype: int64

Kiedy należy stosować df.value counts () vs df.groupby ("...").count ()?

Słyszałem, że w pandach często jest wiele sposobów na zrobienie tego samego, ale zastanawiałem się ... ]} Jeśli próbuję pog ... zbę pozycji o tej wartości, kiedy ma sens użycie df.groupby('colA').count() i kiedy ma sens użycie df['colA'].value_counts()?