dataframe

Powtórz każdy wiersz danych.ramka ilość razy określona w kolumnie

df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) Jaki jest najprostszy sp ... c f 3 Do tego: df.expanded var1 var2 1 a d 2 b e 3 b e 4 c f 5 c f 6 c f

Jak zwięźle napisać formułę z wieloma zmiennymi z ramki danych?

Załóżmy, że mam zmienną odpowiedzi i dane zawierające trzy kowarianty (jako przykład zabawkowy): y = c(1,4,6) d = data.fram ... ramce danych była kowariantną.) Pytam, bo w ramce danych Mam 50 zmiennych, więc chcę uniknąć wypisywania x1 + x2 + x3 + etc.

Zapytania Spark SQL DataFrame ze złożonymi typami

Jak mogę odpytywać RDD o złożone typy, takie jak mapy/tablice? na przykład, kiedy pisałem ten kod testowy: case class Test( ... tringType,true) I Org.Apacz.Iskra.sql.katalizator.błędy.pakiet$TreeNodeException: Unresolved atrybuty Odpowiednio.

Jak szybko tworzyć grupy (kwartyle, decyle itp.), zamawiając kolumny w ramce danych

Widzę wiele pytań i odpowiedzi re order i sort. Czy jest coś, co sortuje wektory lub ramki danych w grupy (jak kwartyle lub d ... 0.05146856 2 # 12 l -0.12310229 1 Czy istnieje lepsze (czystsze/szybsze/jednoliniowe) podejście? Dzięki!

Wartość prawdy szeregu jest niejednoznaczna. Użyj. empty, a.bool(), a.item(), A.any() lub A. all()

Problem z filtrowaniem wynikowej ramki danych z warunkiem or. Chcę, aby mój wynik df wyodrębnił wszystkie wartości kolumny {[ ... ego a.empty(), a.bool(), a.item(),a.any() or a.all(). result = result[(result['var']>0.25) or (result['var']<-0.25)]

Przypisz wiele kolumn używając: = in data.tabela z podziałem na grupy

Jaki jest najlepszy sposób przypisania do wielu kolumn za pomocą data.table? Na przykład: f <- function(x) {c("hi", "hel ... ym zrobić: x[ , col_names := another_f(), by = "id", with = FALSE] Jaki jest prawidłowy sposób, aby zrobić coś takiego?

wyodrębnij wartość kolumny na podstawie innej kolumny

Utknąłem na wyciąganiu wartości jednej zmiennej warunkującej na inną zmienną. Na przykład, następujący dataframe: A B p1 1 ... Jak mogę uzyskać wartość A Kiedy B=3? Za każdym razem, gdy wyodrębniałem wartość A, otrzymywałem obiekt, a nie ciąg znaków.

Jak wykreślić wszystkie kolumny ramki danych w R

Ramka danych ma n kolumn i chciałbym uzyskać N Wykresów, po jednym wykresie dla każdej kolumny. Jestem początkujący i nie je ... gth( data ),1) ) plot(data[,i],ylab=names(data[i]),type="l") Czy są jakieś lepsze (z punktu widzenia języka R) rozwiązania?

Wywołanie funkcji apply-like w każdym wierszu ramki danych z wieloma argumentami z każdego wiersza

Mam ramkę danych z wieloma kolumnami. Dla każdego wiersza w ramce danych chcę wywołać funkcję w wierszu, a wejście funkcji w ... sig.level_from_each_row_of_df )) Gdzie wynikiem jest wektor wyjścia dla mocy.t. test dla każdego rzędu df.

Split (explode) wejście łańcucha danych do oddzielnych wierszy

Mam pandas dataframe, w którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde ... np.array([row] * len(letters)) out['var1'] = letters a['idx'] = range(a.shape[0]) z = a.groupby('idx') z.transform(fun)

Łączenie dwóch serii w ramkę danych w pandy

Mam dwie serie s1 i s2 z tymi samymi (nie kolejnymi) indeksami. Jak połączyć s1 i s2 z dwoma kolumnami w ramce danych i zachować jeden z indeksów jako trzecią kolumnę?

Pandy Pythona filtrujące nan z wyboru danych kolumny ciągów

Bez użycia groupby Jak odfiltrować dane bez NaN? Powiedzmy, że mam macierz, w której klienci wypełnią {[5] } lub którąkolwiek ... g John 3 3 mol Graham NaN Zgaduję, że potrzebuję czegoś takiego ~np.isnan, ale tilda nie działa ze strunami.

Jak uzyskać wartość z komórki ramki danych?

Skonstruowałem warunek, który wydobywa dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df[ ... lumnę (tj. jedna komórka). Nie tego potrzebuję. Potrzebuję jednej wartości (jeden numer float). Jak mogę to zrobić w pandach?

pandy: najlepszy sposób na wybranie wszystkich kolumn, których nazwy zaczynają się od X

Mam DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], ... NaN 1 0 1 5 6.8 6.8 1 0 5 0 0 [4 rows x 7 columns]

Tworzenie ramki danych r wiersz po wierszu

Chciałbym skonstruować ramkę danych wiersz po wierszu w R. zrobiłem kilka przeszukiwań i wszystko, co wymyśliłem, to sugestia ... nych wiersz po wierszu. Przynajmniej, czy istnieje sposób na push na końcu listy zamiast jawnie śledzić ostatni użyty indeks?

Dynamicznie zaznaczaj kolumny ramki danych używając $ i wartości znakowej

Mam wektor o różnych nazwach kolumn i chcę być w stanie zapętlić każdą z nich, aby wyodrębnić tę kolumnę z danych.rama. Na pr ... w cols aby uzyskać wartości w jakiejś pętli. for(x in seq_along(cols)) { value <- mtcars[ order(mtcars$cols[x]), ] }

Konwertuj listę słowników do Dataframe

Mam listę takich słowników: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "februa ... najlepszym rozwiązaniem, jakie mogłem znaleźć. Jak mogę zamienić listę słowników w ramkę danych pandy, jak pokazano powyżej?

Konwertuj typ kolumny DataFrame z string na datetime

Jak skonwertować kolumnę DataFrame ciągów znaków (w formacie dd / mm / RRRR) na datetimes?

Filtruj dane.wiersze ramek według warunku logicznego

Chcę filtrować wiersze z data.frame na podstawie warunku logicznego. Załóżmy, że mam ramkę danych jak expr_value cel ... "hesc" "hesc" Jeśli oryginalna ramka danych jest wywołana "expr" , ale daje wyniki w złym formacie, jak widać.

Podaj dane.nazwa kolumny ramki do funkcji

Próbuję napisać funkcję akceptującą dane.frame (x) i column z niego. Funkcja wykonuje pewne obliczenia na x i później zwraca ... j formula() i match.call(), z którymi nie mam dużego doświadczenia. Subquestion : czy do.call() jest preferowane nad eval()?