pandas
Normalizacja kolumn ramki danych pandy
Mam ramkę danych w Pandzie, gdzie każda kolumna ma inny zakres wartości. Na przykład:
Df:
A B C
1000 10 0.5
765 ... jest między 0 a 1?
Moje pożądane wyjście to:
A B C
1 1 1
0.765 0.5 0.7
0.8 0.7 0.18(which is 0.09/0.5)
Pandy kolumna list, Utwórz wiersz dla każdego elementu listy
Mam ramkę danych, gdzie niektóre komórki zawierają listy wielu wartości. Zamiast przechowywania wielu
wartości w komórce, chc ... 0
# etc.
Indeks nie jest ważny, można ustawić istniejący
kolumny jako indeks i ostateczna kolejność nie jest
ważne.
Jak policzyć liczbę wierszy na grupę (i inne statystyki) w grupie pandy według?
Mam ramkę danych df i używam kilku kolumn od niej do groupby:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... e liczba została użyta do uzyskania tych środków. Na przykład w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej.
Jak wziąć kolumnę-plastry dataframe w pandy
Ładuję dane uczenia maszynowego z pliku csv. Pierwsze 2 kolumny to obserwacje, a pozostałe kolumny to cechy.
Obecnie wykonuj ... praktyczny powód? Jest to naprawdę mylące, jeśli kolumny są indeksowane przez Int, biorąc pod uwagę, że data[0] != data[0:1]
pandy otrzymują wiersze, których nie ma w innych dataframe
Mam dwie ramki danych pandy, które mają kilka wspólnych wierszy.
Załóżmy, że dataframe2 jest podzbiorem dataframe1.
Jak mogę ...
Df2
col1 col2
0 1 10
1 2 11
2 3 12
Oczekiwany wynik:
col1 col2
3 4 13
4 5 14
Konwertuj typ kolumny DataFrame z string na datetime, format dd / mm / RRRR
Jak mogę przekonwertować kolumnę DataFrame łańcuchów (w dd / mm / RRRR format) do dat?
pandy: filtruj wiersze ramki danych z łańcuchem operatora
Większość operacji w pandas może być wykonana za pomocą łańcucha operatora(groupby, aggregate, apply, itd), ale jedynym sposo ... ędzie można filtrować jej wartości. Czy jest coś więcej jak poniżej?
df_filtered = df.mask(lambda x: x['column'] == value)
Jak wybrać wszystkie kolumny, z wyjątkiem jednej kolumny w pandach?
Mam ramkę danych wyglądającą TAK:
import pandas
import numpy as np
df = DataFrame(np.random.rand(4,4), columns = list('abcd ... 0.259811 0.396664 0.894202
3 0.726168 0.139531 0.324932 0.906575
Jak mogę uzyskać wszystkie kolumny oprócz column b?
Operatory logiczne do indeksowania boolowskiego w Pandzie
Pracuję z indeksem boolean w pandach.
Pytanie, dlaczego stwierdzenie:
a[(a['some_column']==some_number) & (a['some_othe ... ['y']==10)]
Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
Czy pandy mogą automatycznie rozpoznawać daty?
Dzisiaj pozytywnie zaskoczył mnie fakt, że podczas odczytu danych z pliku danych (np.) pandy jest w stanie rozpoznać typy war ... były rozpoznawane jako ciągi znaków (nie jako python date-objects). Czy jest sposób na" nauczenie się " pand rozpoznane daty?
Zmiana kolejności kolumn w ramce danych pandy na podstawie nazwy kolumny [duplikat]
to pytanie ma już odpowiedzi tutaj :
... w następujący sposób:
['Q1.1','Q1.2','Q1.3',.....'Q6.1',......]
Czy Jest jakiś sposób dla mnie, aby to zrobić w Pythonie?
Jakie są argumenty' poziomów',' kluczy ' i nazw w funkcji concat Pandy?
Pytania
Jak używać pd.concat?
do czego służy argument levels?
do czego służy argument keys?
czy istnieje kilka przykła ... dtype='object')
Więc jaki jest sens argumentu level i czy powinienem używać keys inaczej?
Używam Pythona 3.6 i Pandy 0.22
Jak przechowywać ramkę danych za pomocą Pandy
W tej chwili importuję dość duży CSV jako ramkę danych za każdym razem, gdy uruchamiam skrypt. Czy istnieje dobre rozwiązanie ... tego dataframe stale dostępne między uruchomieniami, więc nie muszę spędzać cały ten czas czekając na skrypt do uruchomienia?
Niejednoznaczność w definicji Pandy Dataframe / Numpy Array" axis"
Byłem bardzo zdezorientowany tym, jak definiowane są osie Pythona i czy odnoszą się one do wierszy lub kolumn ramki danych. R ... iniowana. Informatyka mówi w dokumentacji dla DataFrame.mean to axis=1 ma oznaczać średnicę nad kolumnami, a nie wierszami...
Python Pandas - jak spłaszczyć indeks hierarchiczny w kolumnach
Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z groupby."AGG"): {]}
USAF WBAN year month day s_P ... 9999999969,
3: 3.9199999999999982,
4: 10.940000000000001},
('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}
pandy: jak podzielić tekst w kolumnie na wiele wierszy?
Pracuję z dużym plikiem csv i obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić przez określony ograniczn ... chcę wziąć płyty takie jak John Lennon ' s i utworzyć wiele linii, z informacjami z każdego zestawu miejsc na osobnej linii.
pandy tworzą nową kolumnę na podstawie wartości z innych kolumn
Próbowałem różnych metod od innych pytań, ale nadal nie mogę znaleźć właściwej odpowiedzi na mój problem. Krytycznym element ... WOOD CLINT E 0 0 0 0 0 1 White
Jak posortować dataFrame w Pythonie według dwóch lub więcej kolumn?
Załóżmy, że mam ramkę danych z kolumnami a, b i c, chcę posortować ramkę danych po kolumnie b w porządku rosnącym, a po kolumnie c w porządku malejącym, jak to zrobić?
Usuń niechciane części z łańcuchów w kolumnie
Szukam skutecznego sposobu na usunięcie niechcianych części z łańcuchów w kolumnie DataFrame.
Dane wyglądają następująco:
... cC'), ale mam błąd:
TypeError: wrapper() takes exactly 1 argument (2 given)
Wszelkie wskazówki będą bardzo mile widziane!
Jak stworzyć próbki testowe i treningowe z jednej ramki danych za pomocą pandy?
Mam dość duży zestaw danych w postaci ramki danych i zastanawiałem się, jak byłbym w stanie podzielić ramkę danych na dwie losowe próbki (80% i 20%) do treningu i testów.
Dzięki!