dataframe
Agregacja w pandach
Jak wykonać agregację z pand?
Brak ramki danych po agregacji! Co się stało?
Jak agregować głównie kolumny łańcuchów (do lis ...
Należy pamiętać, że ten post nie ma na celu zastąpienia dokumentacji o agregacji i o groupby , więc przeczytaj to również!
Zmiana nazwy nagłówka pojedynczej kolumny w ramce danych pandy
Mam ramkę danych o nazwie data. Jak zmienić nazwę tylko jednego nagłówka kolumny? Na przykład gdp do log(gdp)?
data =
y ... 8 7 2
3 3 4 7
4 6 7 7
5 4 8 3
6 8 2 8
7 9 9 10
8 6 6 4
9 10 10 7
Podziel kolumnę na separatorze w ramce danych [duplikat]
To pytanie ma już odpowiedź tutaj:
Podziel kolumnę łańcuchową ramki danych na wiele kolumn
... dwie w ramce danych at na podstawie ogranicznika. Na przykład,
a|b
b|c
Zostać
a b
b c
W ramce danych.
Dzięki!
Usuń kolumny z dataframe, gdzie wszystkie wartości są NA
Mam problem z ramką danych i sam nie mogłem rozwiązać tego problemu:
Ramka danych ma dowolne właściwości jako kolumny i k ... ersz reprezentuje jeden zestaw danych.
Pytanie brzmi:
Jak pozbyć się kolumn gdzie dla wszystkich wierszy wartością jest NA?
Podziel rozdzielone ciągi w kolumnie i Wstaw jako nowe wiersze [duplikat]
To pytanie ma już odpowiedź tutaj:
rozdzielone przecinkami łańcuchy w kolumnie na oddzielne wiersze
... split(), aby najpierw wypluć V2, a następnie wrzucić listę do ramki danych. Nie zadziałało. Każda pomoc będzie mile widziana.
Jaki jest najbardziej efektywny sposób tworzenia listy jako ramki danych?
Bardzo często chcę przekonwertować listę, w której każdy indeks ma identyczne typy elementów do ramki danych. Na przykład, m ... rame(do.call(cbind, new.list), stringsAsFactors=FALSE)
To jednak wydaje się bardzo nieefektywne. Jest na to lepszy sposób?
Elegancki sposób zgłaszania brakujących wartości w danych.ramka
Oto mały fragment kodu, który napisałem, aby zgłosić zmienne z brakującymi wartościami z ramki danych. Próbuję wymyślić bard ... a z danymi.ramki z dziesiątkami do setek zmiennych, więc kluczowe jest, aby zgłaszać tylko zmienne z brakującymi wartościami.
Python / Pandas-GUI do przeglądania ramki danych lub macierzy
Używam pakietu Pandas i tworzy on obiekt DataFrame, który jest w zasadzie oznakowaną macierzą. Często mam kolumny, które mają ... trzeby są ograniczone, niechętnie muszę nauczyć się dużego frameworka GUI i zrobić kilka kodowania dla tego jednego kawałka.)
Numeracja wierszy w grupach w ramce danych
Praca z ramką danych podobną do tej:
set.seed(100)
df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5 ... ccc 0.39848790 2
13 ccc 0.62499648 3
14 ccc 0.76255108 4
15 ccc 0.88216552 5
Jaki byłby na to dobry sposób?
Uporządkuj rzędy ramek danych według wektora o określonym porządku
Czy istnieje łatwiejszy sposób, aby zapewnić, że wiersze ramki danych są uporządkowane według wektora "docelowego", jak ten, ... })
df <- df[idx,]
rownames(df) <- NULL
df
# name value
# 1 b TRUE
# 2 c FALSE
# 3 a TRUE
# 4 d FALSE
Jak dodawać wiersze do ramki danych R
Rozglądałem się po StackOverflow, ale nie mogę znaleźć rozwiązania specyficznego dla mojego problemu, polegającego na dodawan ... $y, toString(i))
}
Spróbowałem też funkcjic, append, i merge bez powodzenia. Proszę daj mi znać jeśli masz jakieś sugestie.
Python: uzyskaj liczbę częstotliwości na podstawie dwóch kolumn (zmiennych) w ramce danych Panda niektóre apery wierszy
Witam Mam następujący dataframe.
Group Size
Short Small
Short Small
Moderate ... Small 2
Moderate Medium 1
Moderate Small 1
Tall Large 1
Konwertuj pandy Series do DataFrame
Mam Pandy Seria sf:
email
[email protected] [1.0, 0.0, 0.0]
[email protected] [2.0, 0.0, 0.0]
[email protected] [1.0, ... s=['email'])
df2 = pd.DataFrame(data=sf.values, columns=['list'])
df = pd.merge(df1, df2, left_index=True, right_index=True)
Konstruowanie ramki danych pandy z wartości w zmiennych daje " ValueError: jeśli używasz wszystkich wartości skalarnych, musisz przekazać indeks"
To może być proste pytanie, ale nie wiem, jak to zrobić. Powiedzmy, że mam dwie zmienne w następujący sposób.
a = 2
b = 3
... indeks
Próbowałem również tego:
df2 = (pd.DataFrame({'a':a,'b':b})).reset_index()
To daje ten sam komunikat o błędzie.
Pandy wybierając po etykiecie czasami zwracają serie, czasami zwracają DataFrame
W pandach, kiedy zaznaczam etykietę, która ma tylko jeden wpis w indeksie, otrzymuję serię, ale kiedy zaznaczam wpis, który m ... 3])
In [3]: type(df.loc[3])
Out[3]: pandas.core.frame.DataFrame
In [4]: type(df.loc[1])
Out[4]: pandas.core.series.Series
Przenieś kolumnę według nazwy na początek tabeli w pandach
Oto mój df:
Net Upper Lower Mid Zsore
Answer option ... 0% 1% 65
Mój obecny kod przesuwa kolumnę po indeksie używając df.columns.tolist() ale chciałbym zmienić ją po nazwie.
Jak zastąpić wartości NA w tabeli dla wybranych kolumn
Istnieje wiele postów o zastąpieniu wartości NA. Zdaję sobie sprawę, że można zastąpić NAs w poniższej tabeli / ramce następu ... nna logiczna. Mam kilka kolumn, więc nie chcę tego robić o jeden. I chciałbym wiedzieć, jak to zrobić.
Masz jakieś sugestie?
Replikuj każdy wiersz danych.ramka i określ liczbę replik dla każdego wiersza
df <- data.frame(var1=c('a', 'b', 'c'), var2=c('d', 'e', 'f'), freq=1:3)
Jaki jest najprostszy sposób na rozwinięcie dwó ... c f 3
Do tego:
df.expanded
var1 var2
1 a d
2 b e
3 b e
4 c f
5 c f
6 c f
Jak utworzyć pustą ramkę danych z nazwami kolumn podanymi w R? [duplikat]
Możliwy duplikat:Utwórz puste dane.Frame
Muszę utworzyć pustą ramkę danych w R z podanymi nazwami kolumn. Jakiś najprostszy sposób ?
Jak zapisać dane.ramka w R?
Zrobiłem dane.rama W R, która nie jest zbyt duża, ale jej budowa zajmuje sporo czasu. Chciałbym zapisać go jako plik, który mogę ponownie otworzyć W R?