dataframe
Powtórz każdy wiersz danych.ramka ilość razy określona w kolumnie
df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'),
freq = 1:3)
Jaki jest najprostszy sp ... c f 3
Do tego:
df.expanded
var1 var2
1 a d
2 b e
3 b e
4 c f
5 c f
6 c f
Jak zwięźle napisać formułę z wieloma zmiennymi z ramki danych?
Załóżmy, że mam zmienną odpowiedzi i dane zawierające trzy kowarianty (jako przykład zabawkowy):
y = c(1,4,6)
d = data.fram ... ramce danych była kowariantną.) Pytam, bo w ramce danych Mam 50 zmiennych, więc chcę uniknąć wypisywania x1 + x2 + x3 + etc.
Zapytania Spark SQL DataFrame ze złożonymi typami
Jak mogę odpytywać RDD o złożone typy, takie jak mapy/tablice?
na przykład, kiedy pisałem ten kod testowy:
case class Test( ... tringType,true)
I
Org.Apacz.Iskra.sql.katalizator.błędy.pakiet$TreeNodeException: Unresolved atrybuty
Odpowiednio.
Jak szybko tworzyć grupy (kwartyle, decyle itp.), zamawiając kolumny w ramce danych
Widzę wiele pytań i odpowiedzi re order i sort. Czy jest coś, co sortuje wektory lub ramki danych w grupy (jak kwartyle lub d ... 0.05146856 2
# 12 l -0.12310229 1
Czy istnieje lepsze (czystsze/szybsze/jednoliniowe) podejście? Dzięki!
Wartość prawdy szeregu jest niejednoznaczna. Użyj. empty, a.bool(), a.item(), A.any() lub A. all()
Problem z filtrowaniem wynikowej ramki danych z warunkiem or. Chcę, aby mój wynik df wyodrębnił wszystkie wartości kolumny {[ ... ego a.empty(), a.bool(), a.item(),a.any() or a.all().
result = result[(result['var']>0.25) or (result['var']<-0.25)]
Przypisz wiele kolumn używając: = in data.tabela z podziałem na grupy
Jaki jest najlepszy sposób przypisania do wielu kolumn za pomocą data.table? Na przykład:
f <- function(x) {c("hi", "hel ... ym zrobić:
x[ , col_names := another_f(), by = "id", with = FALSE]
Jaki jest prawidłowy sposób, aby zrobić coś takiego?
wyodrębnij wartość kolumny na podstawie innej kolumny
Utknąłem na wyciąganiu wartości jednej zmiennej warunkującej na inną zmienną. Na przykład, następujący dataframe:
A B
p1 1 ...
Jak mogę uzyskać wartość A Kiedy B=3? Za każdym razem, gdy wyodrębniałem wartość A, otrzymywałem obiekt, a nie ciąg znaków.
Jak wykreślić wszystkie kolumny ramki danych w R
Ramka danych ma n kolumn i chciałbym uzyskać N Wykresów, po jednym wykresie dla każdej kolumny.
Jestem początkujący i nie je ... gth( data ),1) ) plot(data[,i],ylab=names(data[i]),type="l")
Czy są jakieś lepsze (z punktu widzenia języka R) rozwiązania?
Wywołanie funkcji apply-like w każdym wierszu ramki danych z wieloma argumentami z każdego wiersza
Mam ramkę danych z wieloma kolumnami. Dla każdego wiersza w ramce danych chcę wywołać funkcję w wierszu, a wejście funkcji w ... sig.level_from_each_row_of_df
))
Gdzie wynikiem jest wektor wyjścia dla mocy.t. test dla każdego rzędu df.
Split (explode) wejście łańcucha danych do oddzielnych wierszy
Mam pandas dataframe, w którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde ... np.array([row] * len(letters))
out['var1'] = letters
a['idx'] = range(a.shape[0])
z = a.groupby('idx')
z.transform(fun)
Łączenie dwóch serii w ramkę danych w pandy
Mam dwie serie s1 i s2 z tymi samymi (nie kolejnymi) indeksami. Jak połączyć s1 i s2 z dwoma kolumnami w ramce danych i zachować jeden z indeksów jako trzecią kolumnę?
Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów
Bez użycia groupby Jak odfiltrować dane bez NaN?
Powiedzmy, że mam macierz, w której klienci wypełnią {[5] } lub którąkolwiek ... g John 3
3 mol Graham NaN
Zgaduję, że potrzebuję czegoś takiego ~np.isnan, ale tilda nie działa ze strunami.
Jak uzyskać wartość z komórki ramki danych?
Skonstruowałem warunek, który wydobywa dokładnie jeden wiersz z mojej ramki danych:
d2 = df[(df['l_ext']==l_ext) & (df[ ... lumnę (tj. jedna komórka). Nie tego potrzebuję. Potrzebuję jednej wartości (jeden numer float). Jak mogę to zrobić w pandach?
pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X
Mam DataFrame:
import pandas as pd
import numpy as np
df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8],
... NaN 1 0 1
5 6.8 6.8 1 0 5 0 0
[4 rows x 7 columns]
Tworzenie ramki danych r wiersz po wierszu
Chciałbym skonstruować ramkę danych wiersz po wierszu w R. zrobiłem kilka przeszukiwań i wszystko, co wymyśliłem, to sugestia ... nych wiersz po wierszu. Przynajmniej, czy istnieje sposób na push na końcu listy zamiast jawnie śledzić ostatni użyty indeks?
Dynamicznie zaznaczaj kolumny ramki danych używając $ i wartości znakowej
Mam wektor o różnych nazwach kolumn i chcę być w stanie zapętlić każdą z nich, aby wyodrębnić tę kolumnę z danych.rama. Na pr ... w cols aby uzyskać wartości w jakiejś pętli.
for(x in seq_along(cols)) {
value <- mtcars[ order(mtcars$cols[x]), ]
}
Konwertuj listę słowników do Dataframe
Mam listę takich słowników:
[{'points': 50, 'time': '5:00', 'year': 2010},
{'points': 25, 'time': '6:00', 'month': "februa ... najlepszym rozwiązaniem, jakie mogłem znaleźć. Jak mogę zamienić listę słowników w ramkę danych pandy, jak pokazano powyżej?
Konwertuj typ kolumny DataFrame z string na datetime
Jak skonwertować kolumnę DataFrame ciągów znaków (w formacie dd / mm / RRRR) na datetimes?
Filtruj dane.wiersze ramek według warunku logicznego
Chcę filtrować wiersze z data.frame na podstawie warunku logicznego. Załóżmy, że mam ramkę danych jak
expr_value cel ... "hesc" "hesc"
Jeśli oryginalna ramka danych jest wywołana "expr" , ale daje wyniki w złym formacie, jak widać.
Podaj dane.nazwa kolumny ramki do funkcji
Próbuję napisać funkcję akceptującą dane.frame (x) i column z niego. Funkcja wykonuje pewne obliczenia na x i później zwraca ... j formula() i match.call(), z którymi nie mam dużego doświadczenia.
Subquestion : czy do.call() jest preferowane nad eval()?