dataframe
Jak wybrać wiersze z ramki danych na podstawie wartości kolumn
Jak mogę wybrać wiersze z DataFrame na podstawie wartości w jakiejś kolumnie w Pandzie?
W SQL użyłbym:
SELECT *
FROM table
WHERE colume_name = some_value
Próbowałem zajrzeć do dokumentacji Pandy, ale nie od razu znalazłem odpowiedź.
Jak iterować wiersze w ramce danych w pandach
Mam DataFrame od Pandy:
import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.Dat ... ow in df.T.iteritems():
Lub
for row in df.iterrows():
Ale nie rozumiem, czym jest obiekt row i jak mogę z nim pracować.
Jak łączyć (scalać) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)
Podane dwie ramki danych:
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data ... wszystkie wiersze z pasującymi klawiszami z lewej tabeli.
Dodatkowy kredyt:
Jak mogę wykonać polecenie SQL style select?
Jak sortować ramkę danych według wielu kolumn)
Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
Jak połączyć (scalić) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)?
Podane dwie ramki danych:
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data ... i wszystkie wiersze z pasującymi klawiszami z lewej tabeli.
Dodatkowy kredyt:
Jak mogę wykonać polecenie SQL style select?
Jak sortować ramkę danych według wielu kolumn?
Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
Zmień typ kolumny w pandy
Chcę przekonwertować tabelę, reprezentowaną jako lista list, na Pandas DataFrame. Jako niezwykle uproszczony przykład:
a = ... ślać, które kolumny są tego typu. Wszystko, co mogę zagwarantować, to to, że każda kolumna zawiera wartości tego samego typu.
Usuń kolumnę z ramki danych pandy
Podczas usuwania kolumny w ramce danych używam:
del df['column_name']
I to działa świetnie. Dlaczego nie mogę użyć następ ...
del df.column_name
Ponieważ można uzyskać dostęp do kolumny / serii jako df.column_name, spodziewałem się, że to zadziała.
Czym różnią się iloc i loc?
Czy ktoś może wyjaśnić, czym różnią się te dwie metody krojenia?
I ' ve seen the docs ,
i widziałem te odpowiedzi , ale nad ... również wiedzieć, jak te dwie funkcje różnią się od df.ix[:5], ale {[3] } została usunięta z pandas 1.0, więc mam to gdzieś.
Szybkie odczytywanie bardzo dużych tabel jako ramek danych
Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować jako ramki danych w R. read.table() ma wiele wygodnyc ... list(url='',popularity=0,mintime=0,maxtime=0))))
Czy jest na to lepszy sposób? A może zupełnie inne podejście do problemu?
Zmiana nazwy kolumn w pandach
Mam ramkę danych używającą pand i etykiet kolumn, które muszę edytować, aby zastąpić oryginalne etykiety kolumn.
Chciałbym ...
Do
['a', 'b', 'c', 'd', 'e'].
Mam edytowane nazwy kolumn zapisane na liście, ale nie wiem, jak zastąpić nazwy kolumn.
Jak upuścić wiersze ramki danych Pandy, których wartością w określonej kolumnie jest NaN
Mam to DataFrame i chcę tylko te rekordy, których EPS kolumna nie jest NaN:
>>> df
STK_ID EPS c ... STK_ID RPT_Date
600016 20111231 600016 4.3 NaN
601939 20111231 601939 2.5 NaN
Jak mam to zrobić?
Usuń wiersze z wszystkimi lub niektórymi serwerami NAs (brakującymi wartościami) w danych.ramka
Chciałbym usunąć linie w tej ramce danych, które:
A) zawiera NAs we wszystkich kolumnach. poniżej znajduje się moja przykła ... ENSG00000199674 0 2 2 2 2
4 ENSG00000207604 0 NA NA 1 2
6 ENSG00000221312 0 1 2 3 2
Tworzenie ramki danych pandy poprzez dołączanie jednego wiersza na raz
Rozumiem, że pandy są przeznaczone do ładowania w pełni wypełnionych DataFrame, ale muszę utworzyć pustą ramkę danych, a nas ... się bardzo dziwne : - / (nie dodaje wartości ciągu)
Jak mogę dodać nowy wiersz do ramki danych (z różnymi typami kolumn) ?
Jak radzić sobie z SettingWithCopyWarning w Pandy
Tło
Właśnie uaktualniłem moje pandy z 0.11 do 0.13. 0rc1. Teraz aplikacja wyskakuje wiele nowych ostrzeżeń. Jeden z nich tak ... using .loc[row_index,col_indexer] = value instead
quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])
Upuść kolumny ramki danych według nazwy
Mam kilka kolumn, które chciałbym usunąć z ramki danych. Wiem, że możemy je usuwać pojedynczo używając czegoś takiego:
df$x ... ąc pod uwagę, jak potężne jest R, pomyślałem, że może być lepszy sposób niż opuszczanie każdej kolumny po jednej przez jeden.
Pandy warunkowe utworzenie kolumny serii / ramki danych
Mam ramkę danych zgodnie z poniższymi wersjami:
Type Set
1 A Z
2 B Z
3 B ... tóra ustawi kolor 'green' if Set == 'Z' i 'red' if Set równa się cokolwiek innego.
Jaki jest najlepszy sposób, aby to zrobić?
Jak iterować wiersze w ramce danych w pandach?
Mam DataFrame od pandy:
import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.Dat ... w in df.T.iteritems():
Lub
for row in df.iterrows():
Ale ja nie zrozum, czym jest obiekt row i jak mogę z nim pracować.
Usuń kolumnę z ramki danych pandy za pomocą del df.nazwa kolumny
Podczas usuwania kolumny w ramce danych używam:
del df['column_name']
I to działa świetnie. Dlaczego nie mogę użyć następ ... ementów?
del df.column_name
ponieważ możesz uzyskać dostęp do kolumny/serii jako df.column_name, oczekuję, że to zadziała.
Konwertuj listę na ramkę danych
Mam zagnieżdżoną listę danych. Jego długość wynosi 132, a każdy element jest listą długości 20. Czy istnieje Szybki sposób n ... olumn danych?
Oto przykładowe dane do pracy:
l <- replicate(
132,
as.list(sample(letters, 20)),
simplify = FALSE
)