pandas pg. 4

Normalizacja kolumn ramki danych pandy

Mam ramkę danych w Pandzie, gdzie każda kolumna ma inny zakres wartości. Na przykład: Df: A B C 1000 10 0.5 765 ... jest między 0 a 1? Moje pożądane wyjście to: A B C 1 1 1 0.765 0.5 0.7 0.8 0.7 0.18(which is 0.09/0.5)

Pandy kolumna list, Utwórz wiersz dla każdego elementu listy

Mam ramkę danych, gdzie niektóre komórki zawierają listy wielu wartości. Zamiast przechowywania wielu wartości w komórce, chc ... 0 # etc. Indeks nie jest ważny, można ustawić istniejący kolumny jako indeks i ostateczna kolejność nie jest ważne.

python list pandas

Jak policzyć liczbę wierszy na grupę (i inne statystyki) w grupie pandy według?

Mam ramkę danych df i używam kilku kolumn od niej do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean ... e liczba została użyta do uzyskania tych środków. Na przykład w pierwszej grupie jest 8 wartości, a w drugiej 10 i tak dalej.

python pandas group-by distinct

Jak wziąć kolumnę-plastry dataframe w pandy

Ładuję dane uczenia maszynowego z pliku csv. Pierwsze 2 kolumny to obserwacje, a pozostałe kolumny to cechy. Obecnie wykonuj ... praktyczny powód? Jest to naprawdę mylące, jeśli kolumny są indeksowane przez Int, biorąc pod uwagę, że data[0] != data[0:1]

python slice pandas numpy

pandy otrzymują wiersze, których nie ma w innych dataframe

Mam dwie ramki danych pandy, które mają kilka wspólnych wierszy. Załóżmy, że dataframe2 jest podzbiorem dataframe1. Jak mogę ... Df2 col1 col2 0 1 10 1 2 11 2 3 12 Oczekiwany wynik: col1 col2 3 4 13 4 5 14

python pandas dataframe

Konwertuj typ kolumny DataFrame z string na datetime, format dd / mm / RRRR

Jak mogę przekonwertować kolumnę DataFrame łańcuchów (w dd / mm / RRRR format) do dat?

python pandas dataframe datetime-format python-datetime

pandy: filtruj wiersze ramki danych z łańcuchem operatora

Większość operacji w pandas może być wykonana za pomocą łańcucha operatora(groupby, aggregate, apply, itd), ale jedynym sposo ... ędzie można filtrować jej wartości. Czy jest coś więcej jak poniżej? df_filtered = df.mask(lambda x: x['column'] == value)

python pandas

Jak wybrać wszystkie kolumny, z wyjątkiem jednej kolumny w pandach?

Mam ramkę danych wyglądającą TAK: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd ... 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 Jak mogę uzyskać wszystkie kolumny oprócz column b?

python pandas

Operatory logiczne do indeksowania boolowskiego w Pandzie

Pracuję z indeksem boolean w pandach. Pytanie, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_othe ... ['y']==10)] Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

python pandas dataframe filtering boolean

Czy pandy mogą automatycznie rozpoznawać daty?

Dzisiaj pozytywnie zaskoczył mnie fakt, że podczas odczytu danych z pliku danych (np.) pandy jest w stanie rozpoznać typy war ... były rozpoznawane jako ciągi znaków (nie jako python date-objects). Czy jest sposób na" nauczenie się " pand rozpoznane daty?

python date pandas dataframe types

Zmiana kolejności kolumn w ramce danych pandy na podstawie nazwy kolumny [duplikat]

to pytanie ma już odpowiedzi tutaj : ... w następujący sposób: ['Q1.1','Q1.2','Q1.3',.....'Q6.1',......] Czy Jest jakiś sposób dla mnie, aby to zrobić w Pythonie?

python pandas dataframe

Jakie są argumenty' poziomów',' kluczy ' i nazw w funkcji concat Pandy?

Pytania Jak używać pd.concat? do czego służy argument levels? do czego służy argument keys? czy istnieje kilka przykła ... dtype='object') Więc jaki jest sens argumentu level i czy powinienem używać keys inaczej? Używam Pythona 3.6 i Pandy 0.22

python pandas

Jak przechowywać ramkę danych za pomocą Pandy

W tej chwili importuję dość duży CSV jako ramkę danych za każdym razem, gdy uruchamiam skrypt. Czy istnieje dobre rozwiązanie ... tego dataframe stale dostępne między uruchomieniami, więc nie muszę spędzać cały ten czas czekając na skrypt do uruchomienia?

python pandas dataframe

Niejednoznaczność w definicji Pandy Dataframe / Numpy Array" axis"

Byłem bardzo zdezorientowany tym, jak definiowane są osie Pythona i czy odnoszą się one do wierszy lub kolumn ramki danych. R ... iniowana. Informatyka mówi w dokumentacji dla DataFrame.mean to axis=1 ma oznaczać średnicę nad kolumnami, a nie wierszami...

python arrays pandas dataframe numpy

Python Pandas - jak spłaszczyć indeks hierarchiczny w kolumnach

Mam ramkę danych z hierarchicznym indeksem w osi 1 (kolumny) (z groupby."AGG"): {]} USAF WBAN year month day s_P ... 9999999969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}

python pandas

pandy: jak podzielić tekst w kolumnie na wiele wierszy?

Pracuję z dużym plikiem csv i obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić przez określony ograniczn ... chcę wziąć płyty takie jak John Lennon ' s i utworzyć wiele linii, z informacjami z każdego zestawu miejsc na osobnej linii.

python pandas dataframe

pandas

Normalizacja kolumn ramki danych pandy

Pandy kolumna list, Utwórz wiersz dla każdego elementu listy

Jak policzyć liczbę wierszy na grupę (i inne statystyki) w grupie pandy według?

Jak wziąć kolumnę-plastry dataframe w pandy

pandy otrzymują wiersze, których nie ma w innych dataframe

Konwertuj typ kolumny DataFrame z string na datetime, format dd / mm / RRRR

pandy: filtruj wiersze ramki danych z łańcuchem operatora

Jak wybrać wszystkie kolumny, z wyjątkiem jednej kolumny w pandach?

Operatory logiczne do indeksowania boolowskiego w Pandzie

Czy pandy mogą automatycznie rozpoznawać daty?

Zmiana kolejności kolumn w ramce danych pandy na podstawie nazwy kolumny [duplikat]

Jakie są argumenty' poziomów',' kluczy ' i nazw w funkcji concat Pandy?

Jak przechowywać ramkę danych za pomocą Pandy

Niejednoznaczność w definicji Pandy Dataframe / Numpy Array" axis"

Python Pandas - jak spłaszczyć indeks hierarchiczny w kolumnach

pandy: jak podzielić tekst w kolumnie na wiele wierszy?

pandy tworzą nową kolumnę na podstawie wartości z innych kolumn

Jak posortować dataFrame w Pythonie według dwóch lub więcej kolumn?

Usuń niechciane części z łańcuchów w kolumnie

Jak stworzyć próbki testowe i treningowe z jednej ramki danych za pomocą pandy?