dataframe

Porównaj dwa dane.ramki do znajdowania wierszy w danych.ramka 1, która nie występuje w danych.ramka 2

Mam następujące 2 Dane.ramki: a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) C ... a1.without.a2.rows <- a1[!a1.vec %in% a2.vec,] return(a1.without.a2.rows) } rows.in.a1.that.are.not.in.a2(a1,a2)

pandy otrzymują wiersze, których nie ma w innych dataframe

Mam dwie ramki danych pandy, które mają kilka wspólnych wierszy. Załóżmy, że dataframe2 jest podzbiorem dataframe1. Jak mogę ... Df2 col1 col2 0 1 10 1 2 11 2 3 12 Oczekiwany wynik: col1 col2 3 4 13 4 5 14

Konwertuj typ kolumny DataFrame z string na datetime, format dd / mm / RRRR

Jak mogę przekonwertować kolumnę DataFrame łańcuchów (w dd / mm / RRRR format) do dat?

Wyodrębnianie określonych kolumn z ramki danych

Mam ramkę danych R z 6 kolumnami i chcę utworzyć nową ramkę danych, która ma tylko trzy kolumny. Zakładając, że moja ramka d ... E, jest to jedyne polecenie, jakie mogę rozgryźć: data.frame(df$A,df$B,df$E) Czy jest na to sposób bardziej kompaktowy?

Operatory logiczne do indeksowania boolowskiego w Pandzie

Pracuję z indeksem boolean w pandach. Pytanie, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_othe ... ['y']==10)] Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

Czy pandy mogą automatycznie rozpoznawać daty?

Dzisiaj pozytywnie zaskoczył mnie fakt, że podczas odczytu danych z pliku danych (np.) pandy jest w stanie rozpoznać typy war ... były rozpoznawane jako ciągi znaków (nie jako python date-objects). Czy jest sposób na" nauczenie się " pand rozpoznane daty?

Zmiana kolejności kolumn w ramce danych pandy na podstawie nazwy kolumny [duplikat]

to pytanie ma już odpowiedzi tutaj : ... w następujący sposób: ['Q1.1','Q1.2','Q1.3',.....'Q6.1',......] Czy Jest jakiś sposób dla mnie, aby to zrobić w Pythonie?

Przekształć trzy kolumny ramki danych do macierzy ("długi" do "Szeroki" format) [duplikat]

to pytanie ma już odpowiedzi tutaj : ... akietu reshape i próbowałem napisać ręczną funkcję, aby to zrobić, ale wydaje się, że nie jestem w stanie zrobić tego dobrze.

Podziel kolumnę łańcucha ramki danych na wiele kolumn

Chciałbym pobrać dane z formularza before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr ... r_2" [[3]] [1] "foo" "bar" [[4]] [1] "foo" "bar_2" Dzięki za wskazówki. Nie do końca wygrzebałem listy R TYLKO jeszcze.

Jak przechowywać ramkę danych za pomocą Pandy

W tej chwili importuję dość duży CSV jako ramkę danych za każdym razem, gdy uruchamiam skrypt. Czy istnieje dobre rozwiązanie ... tego dataframe stale dostępne między uruchomieniami, więc nie muszę spędzać cały ten czas czekając na skrypt do uruchomienia?

Niejednoznaczność w definicji Pandy Dataframe / Numpy Array" axis"

Byłem bardzo zdezorientowany tym, jak definiowane są osie Pythona i czy odnoszą się one do wierszy lub kolumn ramki danych. R ... iniowana. Informatyka mówi w dokumentacji dla DataFrame.mean to axis=1 ma oznaczać średnicę nad kolumnami, a nie wierszami...

pandy: jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv i obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić przez określony ograniczn ... chcę wziąć płyty takie jak John Lennon ' s i utworzyć wiele linii, z informacjami z każdego zestawu miejsc na osobnej linii.

Usuń niechciane części z łańcuchów w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z łańcuchów w kolumnie DataFrame. Dane wyglądają następująco: ... cC'), ale mam błąd: TypeError: wrapper() takes exactly 1 argument (2 given) Wszelkie wskazówki będą bardzo mile widziane!

Jak stworzyć próbki testowe i treningowe z jednej ramki danych za pomocą pandy?

Mam dość duży zestaw danych w postaci ramki danych i zastanawiałem się, jak byłbym w stanie podzielić ramkę danych na dwie losowe próbki (80% i 20%) do treningu i testów. Dzięki!

Utworzenie pustej ramki danych pandy, a następnie jej wypełnienie?

Zaczynam od pandy Data Frame docs tutaj: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Chciałbym iteracyjnie w ... symb in valdict: valdict[symb][thedate] = 1+valdict[symb][thedate - dt.timedelta(days=1)] print valdict

Usuń całą kolumnę z danych.ramka w R

Czy ktoś wie jak usunąć całą kolumnę z danych.ramka w R? Na przykład, jeśli otrzymam te dane.frame: > head(data) chr ... efGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon I chcę usunąć drugą kolumnę.

Najszybszy sposób na zastąpienie NAs dużymi danymi.tabela

Mam duże Dane.tabela , z wieloma brakującymi wartościami rozrzuconymi po ~200k wierszach i 200 kolumnach. Chciałbym ponownie ... y z dość wydajnego rozwiązania typu 1. Konwersja na dane.Klatka, a następnie z powrotem do danych.tabela nie bierze za długo.

Przykładowe losowe wiersze w ramce danych

Mam problem ze znalezieniem odpowiedniej funkcji, która zwróci określoną liczbę wierszy pobranych losowo bez zastępowania z ramki danych w języku R? Czy ktoś może mi pomóc?

Łączenie dwóch ramek danych według wierszy (rbind), gdy mają różne zestawy kolumn

Czy jest możliwe row bind dwie ramki danych, które nie mają tego samego zestawu kolumn? Mam nadzieję zachować kolumny, które nie pasują po bind.

Konwertuj Python dict na ramkę danych

Mam Słownik Pythona jak poniżej: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'201 ... t w obiekt szeregowy, ale to nie wydaje się utrzymywać relacji między kolumnami: s = Series(my_dict,index=my_dict.keys())