pandas-groupby
Jak obracać ramkę danych?
Co to jest pivot?
Jak się obracać?
czy to pivot?
długi format do szerokiego formatu?
Widziałem wiele pytań, które pytają ...
a 2 1 1
b 2 1 0
c 1 0 0
Do
1|1 2|1 2|2
a 2 1 1
b 2 1 0
c 1 0 0
Uzyskaj statystyki dla każdej grupy (takie jak count, mean, etc) za pomocą pandas GroupBy?
Mam ramkę danych df i używam kilku kolumn od niej do groupby:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej.
W skrócie: jak uzyskać grupowe statystyki dla ramki danych?
Uzyskaj wiersz(Y), który ma maksymalną wartość w grupach za pomocą groupby
Jak znaleźć wszystkie wiersze w ramce danych pandy, które mają maksymalną wartość dla kolumny count, po pogrupowaniu przez ko ... kie wiersze, w których count równa się max, w każdej grupie np.:
MM2 S4 bg 10
MM4 S2 cb 8
MM4 S2 uyi 8
Jak obrócić ramkę danych
Co to jest pivot?
Jak się obracać?
czy to pivot?
długi format do szerokiego formatu?
Widziałem wiele pytań, które pytają o ... 0 1 1
row2 1 0 2 1 2
row3 0 1 0 2 0
row4 0 1 2 2 1
Jak grupować wiersze ramki danych w liście w Pandzie groupby
Mam ramkę danych pandy df Jak:
a b
A 1
A 2
B 5
B 5
B 4
C 6
Chcę pogrupować według pierwszej kolumny i uzyskać drugą kolumnę jako listy w wierszach :
A [1,2]
B [5,5,4]
C [6]
Czy można zrobić coś takiego używając pandy groupby?
Wiele agregacji tej samej kolumny za pomocą pandy GroupBy.agg()
Czy jest wbudowany sposób na zastosowanie dwóch różnych funkcji agregujących f1, f2 do tej samej kolumny df["returns"], bez k ... zdefiniowaniem funkcji pomocniczej, która po prostu stosuje obie funkcje wewnątrz niego? (Jak to w ogóle działa z agregacją?)
Łączenie strun z kilku rzędów za pomocą Pandy groupby
Chcę połączyć kilka łańcuchów w ramce danych opartej na groupedby w pandach.
To jest mój kod do tej pory:
import pandas a ... zumiem, jak mogę użyć groupby i zastosować jakiś rodzaj konkatenacji łańcuchów w kolumnie "tekst". Każda pomoc mile widziana!
Agregacja w pandach
Jak wykonać agregację z pand?
Brak ramki danych po agregacji! Co się stało?
Jak agregować głównie kolumny łańcuchów (do lis ...
Należy pamiętać, że ten post nie ma na celu zastąpienia dokumentacji o agregacji i o groupby , więc przeczytaj to również!
Zachowaj inne kolumny podczas wykonywania groupby
Używam groupby na ramce danych pandy, aby upuścić wszystkie wiersze, które nie mają minimum określonej kolumny. Coś takiego: ...
Ale żaden z nich nie działa(zdałem sobie sprawę z tego, że składnia jest przeznaczona do agregowania po utworzeniu grupy).
Grupuj ramki danych i zbieraj sumy i policz?
Mam ramkę danych, która wygląda tak:
Company Name Organisation Name Amount
10118 Vifor Pharma ... umować lub liczyć:
df.groupby('Company Name').sum()
df.groupby('Company Name').count()
Ale nie jak zrobić jedno i drugie!
Policz unikalne wartości z pand na grupy [duplikat]
To pytanie ma już odpowiedź tutaj:
pandy count(distinct) equivalent
... groupby(['domain', 'ID']).count()
Ale chcę dostać
domain, count
vk.com 3
twitter.com 2
facebook.com 1
google.com 1
Pandy liczba wierszy w grupie w kolejności rosnącej
Podano następującą ramkę danych:
import pandas as pd
import numpy as np
df=pd.DataFrame({'A':['A','A','A','B','B','B'],
... 2
5 B a 3
Próbowałem tego do tej pory:
df['C']=df.groupby(['A','B'])['B'].transform('rank')
...ale to nie działa!
Pandy GroupBy.zastosuj metodę duplikuje pierwszą grupę
Moje pierwsze pytanie:
Jestem zdezorientowany co do tego zachowania metody apply of groupby w Pandzie (0.12.0-4), wydaje się, ... ', group_keys = True).apply(addone)
>>> print(df2)
class count
0 A 2
1 B 1
2 C 3
dlaczego pandy rolling używają jednego wymiaru ndarray
Zostałem zmotywowany do użycia funkcji pandy rolling do wykonania regresji wieloskładnikowej (to pytanie dotyczy , a nie regr ... ałtu (window, len(df.columns)).
Pytanie dlaczego?
Nie mam teraz sposobu, aby łatwo uruchomić regresję rolling Multi-factor.
Python Pandy: Oblicz średnią ruchomą w grupie
Mam ramkę danych zawierającą szeregi czasowe dla 100 obiektów:
object period value
1 1 24
1 2 67 ... alculate MA~)
A następnie połączyć tę serię z oryginalną ramką danych przez obiekt? Nie można wymyśleć dokładnych poleceń
Groupby w Pythonie: szybki sposób
Chcę poprawić czas groupby w Pythonie pandas.
Mam ten kod:
df["Nbcontrats"] = df.groupby(['Client', 'Month'])['Contrat'].t ... ntrat'].transform(len)
1 loops, best of 3: 391 ms per loop
df.shape
Out[309]: (7464, 61)
Jak mogę poprawić wykonanie czas?
Wartość Groupby liczy się na ramce danych
Mam następujący dataframe:
df = pd.DataFrame([
(1, 1, 'term1'),
(1, 2, 'term2'),
(1, 1, 'term1'),
(1, 1, 't ... ziała, ponieważ value_counts Działa na serii groupby, a nie na ramce danych.
W każdym razie mogę to osiągnąć bez zapętlania?
Pandy groupby z koszem
Mam ramkę danych, która wygląda tak:
+----------+---------+-------+
| username | post_id | views |
+----------+---------+-- ... 000] 2332
(5000, 10000] 1118
(10000, 50000] 570
(50000, 10000000] 14
Name: username, dtype: int64
Kiedy należy stosować df.value counts () vs df.groupby ("...").count ()?
Słyszałem, że w pandach często jest wiele sposobów na zrobienie tego samego, ale zastanawiałem się ... ]}
Jeśli próbuję pog ... zbę pozycji o tej wartości, kiedy ma sens użycie df.groupby('colA').count() i kiedy ma sens użycie df['colA'].value_counts()?