pandas

Normalizacja kolumn ramki danych pandy

Mam ramkę danych w Pandzie, gdzie każda kolumna ma inny zakres wartości. Na przykład: Df: A B C 1000 10 0.5 765 ... jest między 0 a 1? Moje pożądane wyjście to: A B C 1 1 1 0.765 0.5 0.7 0.8 0.7 0.18(which is 0.09/0.5)

Pandy kolumna list, Utwórz wiersz dla każdego elementu listy

Mam ramkę danych, gdzie niektóre komórki zawierają listy wielu wartości. Zamiast przechowywania wielu wartości w komórce, chc ... 0 # etc. Indeks nie jest ważny, można ustawić istniejący kolumny jako indeks i ostateczna kolejność nie jest ważne.

Jak policzyć liczbę wierszy na grupę (i inne statystyki) w grupie pandy według?

Mam ramkę danych df i używam kilku kolumn od niej do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... e liczba została użyta do uzyskania tych środków. Na przykład w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej.

Jak wziąć kolumnę-plastry dataframe w pandy

Ładuję dane uczenia maszynowego z pliku csv. Pierwsze 2 kolumny to obserwacje, a pozostałe kolumny to cechy. Obecnie wykonuj ... praktyczny powód? Jest to naprawdę mylące, jeśli kolumny są indeksowane przez Int, biorąc pod uwagę, że data[0] != data[0:1]

pandy otrzymują wiersze, których nie ma w innych dataframe

Mam dwie ramki danych pandy, które mają kilka wspólnych wierszy. Załóżmy, że dataframe2 jest podzbiorem dataframe1. Jak mogę ... Df2 col1 col2 0 1 10 1 2 11 2 3 12 Oczekiwany wynik: col1 col2 3 4 13 4 5 14

Konwertuj typ kolumny DataFrame z string na datetime, format dd / mm / RRRR

Jak mogę przekonwertować kolumnę DataFrame łańcuchów (w dd / mm / RRRR format) do dat?

pandy: filtruj wiersze ramki danych z łańcuchem operatora

Większość operacji w pandas może być wykonana za pomocą łańcucha operatora(groupby, aggregate, apply, itd), ale jedynym sposo ... ędzie można filtrować jej wartości. Czy jest coś więcej jak poniżej? df_filtered = df.mask(lambda x: x['column'] == value)

Jak wybrać wszystkie kolumny, z wyjątkiem jednej kolumny w pandach?

Mam ramkę danych wyglądającą TAK: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd ... 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 Jak mogę uzyskać wszystkie kolumny oprócz column b?

Operatory logiczne do indeksowania boolowskiego w Pandzie

Pracuję z indeksem boolean w pandach. Pytanie, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_othe ... ['y']==10)] Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

Czy pandy mogą automatycznie rozpoznawać daty?

Dzisiaj pozytywnie zaskoczył mnie fakt, że podczas odczytu danych z pliku danych (np.) pandy jest w stanie rozpoznać typy war ... były rozpoznawane jako ciągi znaków (nie jako python date-objects). Czy jest sposób na" nauczenie się " pand rozpoznane daty?

Zmiana kolejności kolumn w ramce danych pandy na podstawie nazwy kolumny [duplikat]

to pytanie ma już odpowiedzi tutaj : ... w następujący sposób: ['Q1.1','Q1.2','Q1.3',.....'Q6.1',......] Czy Jest jakiś sposób dla mnie, aby to zrobić w Pythonie?

Jakie są argumenty' poziomów',' kluczy ' i nazw w funkcji concat Pandy?

Pytania Jak używać pd.concat? do czego służy argument levels? do czego służy argument keys? czy istnieje kilka przykła ... dtype='object') Więc jaki jest sens argumentu level i czy powinienem używać keys inaczej? Używam Pythona 3.6 i Pandy 0.22

Jak przechowywać ramkę danych za pomocą Pandy

W tej chwili importuję dość duży CSV jako ramkę danych za każdym razem, gdy uruchamiam skrypt. Czy istnieje dobre rozwiązanie ... tego dataframe stale dostępne między uruchomieniami, więc nie muszę spędzać cały ten czas czekając na skrypt do uruchomienia?

Niejednoznaczność w definicji Pandy Dataframe / Numpy Array" axis"

Byłem bardzo zdezorientowany tym, jak definiowane są osie Pythona i czy odnoszą się one do wierszy lub kolumn ramki danych. R ... iniowana. Informatyka mówi w dokumentacji dla DataFrame.mean to axis=1 ma oznaczać średnicę nad kolumnami, a nie wierszami...

Python Pandas - jak spłaszczyć indeks hierarchiczny w kolumnach

Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z groupby."AGG"): {]} USAF WBAN year month day s_P ... 9999999969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}

pandy: jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv i obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić przez określony ograniczn ... chcę wziąć płyty takie jak John Lennon ' s i utworzyć wiele linii, z informacjami z każdego zestawu miejsc na osobnej linii.

pandy tworzą nową kolumnę na podstawie wartości z innych kolumn

Próbowałem różnych metod od innych pytań, ale nadal nie mogę znaleźć właściwej odpowiedzi na mój problem. Krytycznym element ... WOOD CLINT E 0 0 0 0 0 1 White

Jak posortować dataFrame w Pythonie według dwóch lub więcej kolumn?

Załóżmy, że mam ramkę danych z kolumnami a, b i c, chcę posortować ramkę danych po kolumnie b w porządku rosnącym, a po kolumnie c w porządku malejącym, jak to zrobić?

Usuń niechciane części z łańcuchów w kolumnie

Szukam skutecznego sposobu na usunięcie niechcianych części z łańcuchów w kolumnie DataFrame. Dane wyglądają następująco: ... cC'), ale mam błąd: TypeError: wrapper() takes exactly 1 argument (2 given) Wszelkie wskazówki będą bardzo mile widziane!

Jak stworzyć próbki testowe i treningowe z jednej ramki danych za pomocą pandy?

Mam dość duży zestaw danych w postaci ramki danych i zastanawiałem się, jak byłbym w stanie podzielić ramkę danych na dwie losowe próbki (80% i 20%) do treningu i testów. Dzięki!