dataframe

Jak wybrać wiersze z ramki danych na podstawie wartości kolumn

Jak mogę wybrać wiersze z DataFrame na podstawie wartości w jakiejś kolumnie w Pandzie? W SQL użyłbym: SELECT * FROM table WHERE colume_name = some_value Próbowałem zajrzeć do dokumentacji Pandy, ale nie od razu znalazłem odpowiedź.

Jak iterować wiersze w ramce danych w pandach

Mam DataFrame od Pandy: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.Dat ... ow in df.T.iteritems(): Lub for row in df.iterrows(): Ale nie rozumiem, czym jest obiekt row i jak mogę z nim pracować.

Jak łączyć (scalać) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)

Podane dwie ramki danych: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data ... wszystkie wiersze z pasującymi klawiszami z lewej tabeli. Dodatkowy kredyt: Jak mogę wykonać polecenie SQL style select?

Jak sortować ramkę danych według wielu kolumn)

Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 3 Hi A 9 1 4 Low C 9 2

Jak połączyć (scalić) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)?

Podane dwie ramki danych: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data ... i wszystkie wiersze z pasującymi klawiszami z lewej tabeli. Dodatkowy kredyt: Jak mogę wykonać polecenie SQL style select?

Jak sortować ramkę danych według wielu kolumn?

Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 3 Hi A 9 1 4 Low C 9 2

Zmień typ kolumny w pandy

Chcę przekonwertować tabelę, reprezentowaną jako lista list, na Pandas DataFrame. Jako niezwykle uproszczony przykład: a = ... ślać, które kolumny są tego typu. Wszystko, co mogę zagwarantować, to to, że każda kolumna zawiera wartości tego samego typu.

Usuń kolumnę z ramki danych pandy

Podczas usuwania kolumny w ramce danych używam: del df['column_name'] I to działa świetnie. Dlaczego nie mogę użyć następ ... del df.column_name Ponieważ można uzyskać dostęp do kolumny / serii jako df.column_name, spodziewałem się, że to zadziała.

Czym różnią się iloc i loc?

Czy ktoś może wyjaśnić, czym różnią się te dwie metody krojenia? I ' ve seen the docs , i widziałem te odpowiedzi , ale nad ... również wiedzieć, jak te dwie funkcje różnią się od df.ix[:5], ale {[3] } została usunięta z pandas 1.0, więc mam to gdzieś.

Szybkie odczytywanie bardzo dużych tabel jako ramek danych

Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować jako ramki danych w R. read.table() ma wiele wygodnyc ... list(url='',popularity=0,mintime=0,maxtime=0)))) Czy jest na to lepszy sposób? A może zupełnie inne podejście do problemu?

Zmiana nazwy kolumn w pandach

Mam ramkę danych używającą pand i etykiet kolumn, które muszę edytować, aby zastąpić oryginalne etykiety kolumn. Chciałbym ... Do ['a', 'b', 'c', 'd', 'e']. Mam edytowane nazwy kolumn zapisane na liście, ale nie wiem, jak zastąpić nazwy kolumn.

Jak upuścić wiersze ramki danych Pandy, których wartością w określonej kolumnie jest NaN

Mam to DataFrame i chcę tylko te rekordy, których EPS kolumna nie jest NaN: >>> df STK_ID EPS c ... STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN Jak mam to zrobić?

Usuń wiersze z wszystkimi lub niektórymi serwerami NAs (brakującymi wartościami) w danych.ramka

Chciałbym usunąć linie w tej ramce danych, które: A) zawiera NAs we wszystkich kolumnach. poniżej znajduje się moja przykła ... ENSG00000199674 0 2 2 2 2 4 ENSG00000207604 0 NA NA 1 2 6 ENSG00000221312 0 1 2 3 2

Tworzenie ramki danych pandy poprzez dołączanie jednego wiersza na raz

Rozumiem, że pandy są przeznaczone do ładowania w pełni wypełnionych DataFrame, ale muszę utworzyć pustą ramkę danych, a nas ... się bardzo dziwne : - / (nie dodaje wartości ciągu) Jak mogę dodać nowy wiersz do ramki danych (z różnymi typami kolumn) ?

Jak radzić sobie z SettingWithCopyWarning w Pandy

Tło Właśnie uaktualniłem moje pandy z 0.11 do 0.13. 0rc1. Teraz aplikacja wyskakuje wiele nowych ostrzeżeń. Jeden z nich tak ... using .loc[row_index,col_indexer] = value instead quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])

Upuść kolumny ramki danych według nazwy

Mam kilka kolumn, które chciałbym usunąć z ramki danych. Wiem, że możemy je usuwać pojedynczo używając czegoś takiego: df$x ... ąc pod uwagę, jak potężne jest R, pomyślałem, że może być lepszy sposób niż opuszczanie każdej kolumny po jednej przez jeden.

Pandy warunkowe utworzenie kolumny serii / ramki danych

Mam ramkę danych zgodnie z poniższymi wersjami: Type Set 1 A Z 2 B Z 3 B ... tóra ustawi kolor 'green' if Set == 'Z' i 'red' if Set równa się cokolwiek innego. Jaki jest najlepszy sposób, aby to zrobić?

Jak iterować wiersze w ramce danych w pandach?

Mam DataFrame od pandy: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.Dat ... w in df.T.iteritems(): Lub for row in df.iterrows(): Ale ja nie zrozum, czym jest obiekt row i jak mogę z nim pracować.

Usuń kolumnę z ramki danych pandy za pomocą del df.nazwa kolumny

Podczas usuwania kolumny w ramce danych używam: del df['column_name'] I to działa świetnie. Dlaczego nie mogę użyć następ ... ementów? del df.column_name ponieważ możesz uzyskać dostęp do kolumny/serii jako df.column_name, oczekuję, że to zadziała.

Konwertuj listę na ramkę danych

Mam zagnieżdżoną listę danych. Jego długość wynosi 132, a każdy element jest listą długości 20. Czy istnieje Szybki sposób n ... olumn danych? Oto przykładowe dane do pracy: l <- replicate( 132, as.list(sample(letters, 20)), simplify = FALSE )