dataframe

Jak uelastycznić separator w Pandzie odczyt csv dla nieregularnych separatorów wrt?

Muszę utworzyć ramkę danych poprzez odczyt danych z pliku, przy użyciu metody read_csv. Jednak separatory nie są zbyt regular ... polami są 2 lub 3 spacje. Nawet kombinacje spacji i tabulatorów nie powodują żadnego problemu. Czy pandy mogą zrobić to samo?

Wybierz tylko pierwsze wiersze dla każdej unikalnej wartości kolumny w R

From a dataframe like this test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ... zwalające utworzyć nową kolumnę jak test$row <- rownames(test) I uruchomienie tego samego zapytania sqldf z min (row)?

Python pandas Dodaj kolumnę w dataframe z listy

[EDIT: zły temat/tytuł postu poprawiony] Mam ramkę danych z kilkoma kolumnami jak Ta: A B C 0 4 5 6 7 7 6 5 ... pcji. Ale mogę również rozmieścić elementy w 'List' w dowolnej innej strukturze danych, takiej jak dict, jeśli to konieczne)

Scalanie dwóch ramek danych przy zachowaniu oryginalnej kolejności wierszy

Chcę połączyć dwie ramki danych zachowując oryginalną kolejność wierszy jednej z nich (df.2 w przykładzie poniżej). Oto przy ... class object prob 1 2 A 0.7 2 1 B 0.5 3 2 D 0.7 4 3 F 0.3 5 1 C 0.5

Jak przekształcić dane XML w dane.rama?

Próbuję nauczyć się pakietu R XML. Próbuję stworzyć dane.ramka z książek.przykładowy plik danych XML. Oto co dostaję: libra ... ych xpathSApply nie przybliża mnie nawet do moich intencji. Jak należy postępować w kierunku dobrze uformowanych danych.rama?

Pyspark: podziel wiele kolumn tablicy na wiersze

Mam ramkę danych, która ma jeden wiersz i kilka kolumn. Niektóre kolumny są pojedynczymi wartościami, a inne są listami. Wszy ... olumnach w ramce danych, ale to też nie działa: df_split = df.rdd.map(lambda col: df.withColumn(col, explode(col))).toDF()

Jak załączyć proste dane.ramka do SpatialPolygonDataFrame w R?

Mam (znowu) problem z połączeniem ramek danych w R. ale tym razem jedna to SpatialPolygonDataFrame (SPDF), a druga to zwykłe ... , co robić w takim case (musi coś zrobić z kolumnami ID, merge uses) Oooh takie trudne pytanie, odpuszczam... Dzięki! Jens

Elegancki sposób tworzenia pustych ramek danych z NaN typu float

Chcę stworzyć ramkę danych Pandy wypełnioną Nan. Podczas moich badań znalazłem ODPOWIEDŹ : import pandas as pd df = pd.Da ... ", więc można ją później wykorzystać z interpolate(). Czy istnieje bardziej elegancki sposób na uzyskanie tego samego wyniku?

Jak Mogę wybrać wiersze z ramki danych, które nie pasują?

Próbuję zidentyfikować wartości w ramce danych, które nie pasują, ale nie mogę dowiedzieć się, jak to zrobić. # make data fr ... ak staram się po prostu wybrać wszystkie wartości z ramki danych y, których nie ma w x, i nie rozumiem, jakiej funkcji użyć.

Szybkie zastępowanie wartości w dataframe w R

Mam ramkę danych 150 000 wierszy z 2000 kolumnami zawierającymi wartości, niektóre są negatywami. Zamieniam te wartości ujem ... yspieszenie takiego procesu, np. sposób, w jaki to robię, jest całkowicie powolny i jest szybsze podejście do tego ? Dzięki.

Jak odczytać csv do dataframe w Google Colab

Próbuję odczytać plik csv, który zapisałem lokalnie na moim komputerze. (Dla dodatkowej informacji są to dane Titanica z Kagg ... brzmi: Jak przekonwertować plik csv przechowywany lokalnie w moich plikach na pandy dataframe w Google Colaboratory?

Jak sprawdzić, czy wartość znajduje się na liście w selection from pandas data frame?

Wygląda brzydko: df_cut = df_new[ ( (df_new['l_ext']==31) | (df_new['l_ext']==22) | ... = df_new[(df_new['l_ext'] in [31, 22, 30, 25, 64])] Czy istnieje eleganckie i działające rozwiązanie powyższego "problemu"?

Jak sprawdzić czy w pandach istnieje kolumna

Czy istnieje sposób, aby sprawdzić, czy kolumna istnieje w ramce danych Pandy? Załóżmy, że mam następujący DataFrame: > ... ] Ale najpierw chcę sprawdzić, czy df['A'] istnieje, a jeśli nie, chcę zamiast tego obliczyć df['sum'] = df['B'] + df['C'].

Jak uformować kolumnę krotki z dwóch kolumn w pandach

Mam ramkę danych Pandy i chcę połączyć kolumny ' lat ' i 'long', aby utworzyć krotkę. <class 'pandas.core.frame.DataFrame ... rge_two_cols, axis=1) 5 ... AssertionError: Block shape incompatible with manager Jak mogę rozwiązać ten problem?

Funkcja R Apply() na określonych kolumnach ramki danych

Chcę użyć funkcji apply na ramce danych, ale zastosuj ją tylko do ostatnich 5 kolumn. B<- by(wifi,(wifi$Room),FUN=functio ... ze 3 kolumny... Nadal je chcę, ale nie chcę ich stosować. wifi[,1:3]+B Również nie robi tego, czego oczekiwałem/chciałem.

Znajdź nazwę kolumny, która ma maksymalną wartość dla każdego wiersza

Mam taki DataFrame: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 ... 0 0.410256 0.153846 Communications 0 0.358974 0.076923 0.410256 0.153846 Business

Powtórz wiersze danych.ramka

Chcę powtórzyć wiersze danych.frame, każdy N razy. Wynikiem powinno być nowe data.frame (z nrow(new.df) == nrow(old.df) * N) ... tości na znaki i otrzymuję: A B C [1,] "j" "i" "100" [2,] "j" "i" "100" [3,] "K" "P" "101" [4,] "K" "P" "101"

Jak sprawdzić, czy łańcuch zawiera jeden z podłańcuchów na liście? [duplikat]

To pytanie ma już odpowiedź tutaj: filtrowanie pand dla wielu podciągów szeregowych ... at'] found = [s.str.contains(x) for x in searchfor] result = pd.DataFrame[found] result.any() Czy jest na to lepszy sposób?

dplyr:: select one column and output as vector [duplicate]

To pytanie ma już odpowiedź tutaj: Wyodrębnij kolumnę dplyr tbl jako wektor ... as.character res # This gives strange output [1] "c(\"F\", \"G\", \"H\", \"I\", \"J\")" # I need: # [1] "F" "G" "H" "I" "J"

Znajdź unikalne wartości w ramce danych Panda, niezależnie od położenia wiersza lub kolumny

Mam ramkę danych Pandy i chcę znaleźć wszystkie unikalne wartości w tej ramce danych...niezależnie od wiersza/kolumny. Jeśli ... efektywne (nie może tego usprawiedliwić). Czy istnieje skuteczny sposób, aby go znaleźć? Czy istnieje predefiniowana funkcja?