dataframe pg. 14

Jak uelastycznić separator w Pandzie odczyt csv dla nieregularnych separatorów wrt?

Muszę utworzyć ramkę danych poprzez odczyt danych z pliku, przy użyciu metody read_csv. Jednak separatory nie są zbyt regular ... polami są 2 lub 3 spacje. Nawet kombinacje spacji i tabulatorów nie powodują żadnego problemu. Czy pandy mogą zrobić to samo?

Wybierz tylko pierwsze wiersze dla każdej unikalnej wartości kolumny w R

From a dataframe like this test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ... zwalające utworzyć nową kolumnę jak test$row <- rownames(test) I uruchomienie tego samego zapytania sqldf z min (row)?

dataframe r sqldf

Python pandas Dodaj kolumnę w dataframe z listy

[EDIT: zły temat/tytuł postu poprawiony] Mam ramkę danych z kilkoma kolumnami jak Ta: A B C 0 4 5 6 7 7 6 5 ... pcji. Ale mogę również rozmieścić elementy w 'List' w dowolnej innej strukturze danych, takiej jak dict, jeśli to konieczne)

python pandas dataframe

Scalanie dwóch ramek danych przy zachowaniu oryginalnej kolejności wierszy

Chcę połączyć dwie ramki danych zachowując oryginalną kolejność wierszy jednej z nich (df.2 w przykładzie poniżej). Oto przy ... class object prob 1 2 A 0.7 2 1 B 0.5 3 2 D 0.7 4 3 F 0.3 5 1 C 0.5

sorting dataframe merge r order

Jak przekształcić dane XML w dane.rama?

Próbuję nauczyć się pakietu R XML. Próbuję stworzyć dane.ramka z książek.przykładowy plik danych XML. Oto co dostaję: libra ... ych xpathSApply nie przybliża mnie nawet do moich intencji. Jak należy postępować w kierunku dobrze uformowanych danych.rama?

dataframe r xml

Pyspark: podziel wiele kolumn tablicy na wiersze

Mam ramkę danych, która ma jeden wiersz i kilka kolumn. Niektóre kolumny są pojedynczymi wartościami, a inne są listami. Wszy ... olumnach w ramce danych, ale to też nie działa: df_split = df.rdd.map(lambda col: df.withColumn(col, explode(col))).toDF()

python dataframe apache-spark apache-spark-sql pyspark

Jak załączyć proste dane.ramka do SpatialPolygonDataFrame w R?

Mam (znowu) problem z połączeniem ramek danych w R. ale tym razem jedna to SpatialPolygonDataFrame (SPDF), a druga to zwykłe ... , co robić w takim case (musi coś zrobić z kolumnami ID, merge uses) Oooh takie trudne pytanie, odpuszczam... Dzięki! Jens

dataframe merge r polygon spatial

Elegancki sposób tworzenia pustych ramek danych z NaN typu float

Chcę stworzyć ramkę danych Pandy wypełnioną Nan. Podczas moich badań znalazłem ODPOWIEDŹ : import pandas as pd df = pd.Da ... ", więc można ją później wykorzystać z interpolate(). Czy istnieje bardziej elegancki sposób na uzyskanie tego samego wyniku?

python pandas dataframe nan numpy

Jak Mogę wybrać wiersze z ramki danych, które nie pasują?

Próbuję zidentyfikować wartości w ramce danych, które nie pasują, ale nie mogę dowiedzieć się, jak to zrobić. # make data fr ... ak staram się po prostu wybrać wszystkie wartości z ramki danych y, których nie ma w x, i nie rozumiem, jakiej funkcji użyć.

dataframe r

Szybkie zastępowanie wartości w dataframe w R

Mam ramkę danych 150 000 wierszy z 2000 kolumnami zawierającymi wartości, niektóre są negatywami. Zamieniam te wartości ujem ... yspieszenie takiego procesu, np. sposób, w jaki to robię, jest całkowicie powolny i jest szybsze podejście do tego ? Dzięki.

dataframe r replace

Jak odczytać csv do dataframe w Google Colab

Próbuję odczytać plik csv, który zapisałem lokalnie na moim komputerze. (Dla dodatkowej informacji są to dane Titanica z Kagg ... brzmi: Jak przekonwertować plik csv przechowywany lokalnie w moich plikach na pandy dataframe w Google Colaboratory?

python dataframe csv google-colaboratory

Jak sprawdzić, czy wartość znajduje się na liście w selection from pandas data frame?

Wygląda brzydko: df_cut = df_new[ ( (df_new['l_ext']==31) | (df_new['l_ext']==22) | ... = df_new[(df_new['l_ext'] in [31, 22, 30, 25, 64])] Czy istnieje eleganckie i działające rozwiązanie powyższego "problemu"?

python pandas dataframe select numpy

Jak sprawdzić czy w pandach istnieje kolumna

Czy istnieje sposób, aby sprawdzić, czy kolumna istnieje w ramce danych Pandy? Załóżmy, że mam następujący DataFrame: > ... ] Ale najpierw chcę sprawdzić, czy df['A'] istnieje, a jeśli nie, chcę zamiast tego obliczyć df['sum'] = df['B'] + df['C'].

python pandas dataframe

Jak uformować kolumnę krotki z dwóch kolumn w pandach

Mam ramkę danych Pandy i chcę połączyć kolumny ' lat ' i 'long', aby utworzyć krotkę. <class 'pandas.core.frame.DataFrame ... rge_two_cols, axis=1) 5 ... AssertionError: Block shape incompatible with manager Jak mogę rozwiązać ten problem?

python pandas dataframe tuples

Funkcja R Apply() na określonych kolumnach ramki danych

Chcę użyć funkcji apply na ramce danych, ale zastosuj ją tylko do ostatnich 5 kolumn. B<- by(wifi,(wifi$Room),FUN=functio ... ze 3 kolumny... Nadal je chcę, ale nie chcę ich stosować. wifi[,1:3]+B Również nie robi tego, czego oczekiwałem/chciałem.

dataframe r apply

Znajdź nazwę kolumny, która ma maksymalną wartość dla każdego wiersza

Mam taki DataFrame: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 ... 0 0.410256 0.153846 Communications 0 0.358974 0.076923 0.410256 0.153846 Business

python pandas dataframe max

Powtórz wiersze danych.ramka

Chcę powtórzyć wiersze danych.frame, każdy N razy. Wynikiem powinno być nowe data.frame (z nrow(new.df) == nrow(old.df) * N) ... tości na znaki i otrzymuję: A B C [1,] "j" "i" "100" [2,] "j" "i" "100" [3,] "K" "P" "101" [4,] "K" "P" "101"

dataframe r rows repeat

Jak sprawdzić, czy łańcuch zawiera jeden z podłańcuchów na liście? [duplikat]

To pytanie ma już odpowiedź tutaj: filtrowanie pand dla wielu podciągów szeregowych ... at'] found = [s.str.contains(x) for x in searchfor] result = pd.DataFrame[found] result.any() Czy jest na to lepszy sposób?

python pandas dataframe string match

dplyr:: select one column and output as vector [duplicate]

To pytanie ma już odpowiedź tutaj: Wyodrębnij kolumnę dplyr tbl jako wektor ... as.character res # This gives strange output [1] "c(\"F\", \"G\", \"H\", \"I\", \"J\")" # I need: # [1] "F" "G" "H" "I" "J"

dataframe r select dplyr vector

Znajdź unikalne wartości w ramce danych Panda, niezależnie od położenia wiersza lub kolumny

Mam ramkę danych Pandy i chcę znaleźć wszystkie unikalne wartości w tej ramce danych...niezależnie od wiersza/kolumny. Jeśli ... efektywne (nie może tego usprawiedliwić). Czy istnieje skuteczny sposób, aby go znaleźć? Czy istnieje predefiniowana funkcja?

python pandas dataframe