dataframe pg. 9

python pandy wyodrębniają rok z datetime: df ['year'] = df ['date'].rok nie działa

Importuję ramkę danych przez read_csv, ale z jakiegoś powodu nie mogę wyodrębnić roku lub miesiąca z serii df['date'], staraj ... adni. Używam Pythona 3.4.1 64bit. conda update pandas conda install pandas==0.15.2 conda install -f pandas Jakieś pomysły?

Python pandas dataframe: pobieranie liczby kolumn

Jak programowo pobrać liczbę kolumn w ramce danych pandy? Liczyłem na coś w stylu: df.num_columns

python pandas dataframe

Jak stworzyć ramkę danych losowych liczb całkowitych z pand?

Wiem, że jeśli używam randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list( ... danie zakresu, ale nie tablicy, jak robi to randn. Więc jak to zrobić z losowymi liczbami całkowitymi między pewnym zakresem?

python pandas dataframe size shapes

Warunkowe zastąpienie wartości w danych.ramka

Próbuję zrozumieć, jak warunkowo zastąpić wartości w ramce danych bez użycia pętli. Moja ramka danych ma następującą struktur ... o replace is not a multiple of replacement length Czy jest sposób, w jaki mogę przekazać odpowiednią komórkę, a nie wektor?

dataframe r

Dodaj brakujące daty do ramki danych pandy

Moje dane mogą mieć wiele zdarzeń w danej dacie lub żadnych zdarzeń w danej dacie. Biorę te wydarzenia, policzę po dacie i sp ... leDate']).size() ), ogłoszenie brak wpisów Dla 04 I 05. 09-02-2013 2 09-03-2013 10 09-06-2013 5 09-07-2013 1

python date pandas dataframe plot

Pandy Sortuj według grupy Agregaty i kolumny

Biorąc pod uwagę następujący dataframe In [31]: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'b ... r -0.611756 True 4 bar 0.865408 False 3 foo -1.072969 True 0 foo 1.624345 False Jak można to zrobić?

python sorting pandas dataframe group-by

Znajdź indeksy zduplikowanych wierszy [duplicate]

To pytanie ma już odpowiedź tutaj: znajdowanie wszystkich zduplikowanych wierszy, w tym "elementów o mni ... wiersz jest identyczny? Mógłbym zrobić pętlę na danych.ramka, ale myślę, że jest bardziej elegancka odpowiedź na to pytanie.

dataframe r duplicates

Jak zastąpić Nan przez poprzednie wartości w ramce danych Panda?

Załóżmy, że mam ramkę danych z niektórymi NaN s: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3] ... ement po elemencie i ustawić wartości bezpośrednio, ale czy istnieje łatwy (optymalnie wolny od pętli) sposób osiągnięcia to?

python pandas dataframe python-3.x nan

Zmień wartość zmiennej za pomocą dplyr [duplikat]

To pytanie ma już odpowiedź tutaj: Ustaw pewne wartości na Na za pomocą dplyr ... ale nie udało się: mtcars %>% mutate(mpg = mpg == NA[cyl == 4]) %>% as.data.frame() Jak mógłbym to zrobić z dplyr?

dataframe r dplyr plyr

Wyhodowanie danych.kadrowanie w sposób efektywny pamięciowo

Zgodnie z tworzeniem ramki danych r wiersz po wierszu , nie jest idealnym rozwiązaniem dołączanie do data.frame za pomocą rbi ... za każdym razem. Jak gromadzić dane w R w wyniku data.frame bez ponoszenia tej kary? Format pośredni nie musi być data.frame.

memory dataframe r

Jak sortować ramkę danych według daty

Muszę posortować ramkę danych według daty w R. wszystkie daty są w formie "dd / mm / RRRR". Daty są w trzeciej kolumnie. Nag ... działem, jak przekonwertować łańcuch na wartość daty. Nie mogę połączyć tych dwóch, aby posortować ramkę danych według daty.

date sorting dataframe r

Jaki jest najszybszy sposób przesłania dużego pliku csv do notebooka do pracy z Pythonem?

[1]} próbuję wgrać plik csv, który ma 250MB. Zasadniczo 4 miliony wierszy i 6 kolumn danych szeregów czasowych(1min). Typowa ... ęcej) i jest wyraźny zwycięzca. Jeśli nikt nie odpowie, w przyszłości opublikuję swoje wyniki. Po prostu nie mam teraz czasu.

python pandas dataframe csv

data.wiersze ramek do listy

Mam dane.ramka, którą chciałbym przekonwertować na listę według wierszy, co oznacza, że każdy wiersz będzie odpowiadał swoim ... fill it with a loop xy.list <- vector("list", nrow(xy.df)) for (i in 1:nrow(xy.df)) { xy.list[[i]] <- xy.df[i,] }

list dataframe r

Pomiń wiersze zawierające określoną kolumnę NA

Chcę wiedzieć, jak pominąć wartości NA w ramce danych, ale tylko w niektórych kolumnach, które mnie interesują. Na przykład, ... 2, 3,NA), y = c(1,0, 10, NA), z=c(43,NA, 33, NA)) Jeśli chcę pominąć tylko x=na lub z=na, gdzie mogę umieścić | w funkcji?

dataframe r na

dataframe