dataframe
Jak uelastycznić separator w Pandzie odczyt csv dla nieregularnych separatorów wrt?
Muszę utworzyć ramkę danych poprzez odczyt danych z pliku, przy użyciu metody read_csv. Jednak separatory nie są zbyt regular ... polami są 2 lub 3 spacje. Nawet kombinacje spacji i tabulatorów nie powodują żadnego problemu. Czy pandy mogą zrobić to samo?
Wybierz tylko pierwsze wiersze dla każdej unikalnej wartości kolumny w R
From a dataframe like this
test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10])
test <- test[order(test$id), ... zwalające utworzyć nową kolumnę jak
test$row <- rownames(test)
I uruchomienie tego samego zapytania sqldf z min (row)?
Python pandas Dodaj kolumnę w dataframe z listy
[EDIT: zły temat/tytuł postu poprawiony]
Mam ramkę danych z kilkoma kolumnami jak Ta:
A B C
0
4
5
6
7
7
6
5
... pcji. Ale mogę również rozmieścić elementy w 'List' w dowolnej innej strukturze danych, takiej jak dict, jeśli to konieczne)
Scalanie dwóch ramek danych przy zachowaniu oryginalnej kolejności wierszy
Chcę połączyć dwie ramki danych zachowując oryginalną kolejność wierszy jednej z nich (df.2 w przykładzie poniżej).
Oto przy ...
class object prob
1 2 A 0.7
2 1 B 0.5
3 2 D 0.7
4 3 F 0.3
5 1 C 0.5
Jak przekształcić dane XML w dane.rama?
Próbuję nauczyć się pakietu R XML. Próbuję stworzyć dane.ramka z książek.przykładowy plik danych XML. Oto co dostaję:
libra ... ych xpathSApply nie przybliża mnie nawet do moich intencji. Jak należy postępować w kierunku dobrze uformowanych danych.rama?
Pyspark: podziel wiele kolumn tablicy na wiersze
Mam ramkę danych, która ma jeden wiersz i kilka kolumn. Niektóre kolumny są pojedynczymi wartościami, a inne są listami. Wszy ... olumnach w ramce danych, ale to też nie działa:
df_split = df.rdd.map(lambda col: df.withColumn(col, explode(col))).toDF()
Jak załączyć proste dane.ramka do SpatialPolygonDataFrame w R?
Mam (znowu) problem z połączeniem ramek danych w R. ale tym razem jedna to SpatialPolygonDataFrame (SPDF), a druga to zwykłe ... , co robić w takim case (musi coś zrobić z kolumnami ID, merge uses)
Oooh takie trudne pytanie, odpuszczam...
Dzięki!
Jens
Elegancki sposób tworzenia pustych ramek danych z NaN typu float
Chcę stworzyć ramkę danych Pandy wypełnioną Nan. Podczas moich badań znalazłem ODPOWIEDŹ :
import pandas as pd
df = pd.Da ... ", więc można ją później wykorzystać z interpolate(). Czy istnieje bardziej elegancki sposób na uzyskanie tego samego wyniku?
Jak Mogę wybrać wiersze z ramki danych, które nie pasują?
Próbuję zidentyfikować wartości w ramce danych, które nie pasują, ale nie mogę dowiedzieć się, jak to zrobić.
# make data fr ... ak staram się po prostu wybrać wszystkie wartości z ramki danych y, których nie ma w x, i nie rozumiem, jakiej funkcji użyć.
Szybkie zastępowanie wartości w dataframe w R
Mam ramkę danych 150 000 wierszy z 2000 kolumnami zawierającymi wartości, niektóre są negatywami.
Zamieniam te wartości ujem ... yspieszenie takiego procesu, np. sposób, w jaki to robię, jest całkowicie powolny i jest szybsze podejście do tego ?
Dzięki.
Jak odczytać csv do dataframe w Google Colab
Próbuję odczytać plik csv, który zapisałem lokalnie na moim komputerze. (Dla dodatkowej informacji są to dane Titanica z Kagg ... brzmi:
Jak przekonwertować plik csv przechowywany lokalnie w moich plikach na pandy
dataframe w Google Colaboratory?
Jak sprawdzić, czy wartość znajduje się na liście w selection from pandas data frame?
Wygląda brzydko:
df_cut = df_new[
(
(df_new['l_ext']==31) |
(df_new['l_ext']==22) |
... = df_new[(df_new['l_ext'] in [31, 22, 30, 25, 64])]
Czy istnieje eleganckie i działające rozwiązanie powyższego "problemu"?
Jak sprawdzić czy w pandach istnieje kolumna
Czy istnieje sposób, aby sprawdzić, czy kolumna istnieje w ramce danych Pandy?
Załóżmy, że mam następujący DataFrame:
> ... ]
Ale najpierw chcę sprawdzić, czy df['A'] istnieje, a jeśli nie, chcę zamiast tego obliczyć df['sum'] = df['B'] + df['C'].
Jak uformować kolumnę krotki z dwóch kolumn w pandach
Mam ramkę danych Pandy i chcę połączyć kolumny ' lat ' i 'long', aby utworzyć krotkę.
<class 'pandas.core.frame.DataFrame ... rge_two_cols, axis=1)
5
...
AssertionError: Block shape incompatible with manager
Jak mogę rozwiązać ten problem?
Funkcja R Apply() na określonych kolumnach ramki danych
Chcę użyć funkcji apply na ramce danych, ale zastosuj ją tylko do ostatnich 5 kolumn.
B<- by(wifi,(wifi$Room),FUN=functio ... ze 3 kolumny... Nadal je chcę, ale nie chcę ich stosować.
wifi[,1:3]+B
Również nie robi tego, czego oczekiwałem/chciałem.
Znajdź nazwę kolumny, która ma maksymalną wartość dla każdego wiersza
Mam taki DataFrame:
In [7]:
frame.head()
Out[7]:
Communications and Search Business General Lifestyle
0 0.745763 ... 0 0.410256 0.153846 Communications
0 0.358974 0.076923 0.410256 0.153846 Business
Powtórz wiersze danych.ramka
Chcę powtórzyć wiersze danych.frame, każdy N razy. Wynikiem powinno być nowe data.frame (z nrow(new.df) == nrow(old.df) * N) ... tości na znaki i otrzymuję:
A B C
[1,] "j" "i" "100"
[2,] "j" "i" "100"
[3,] "K" "P" "101"
[4,] "K" "P" "101"
Jak sprawdzić, czy łańcuch zawiera jeden z podłańcuchów na liście? [duplikat]
To pytanie ma już odpowiedź tutaj:
filtrowanie pand dla wielu podciągów szeregowych
... at']
found = [s.str.contains(x) for x in searchfor]
result = pd.DataFrame[found]
result.any()
Czy jest na to lepszy sposób?
dplyr:: select one column and output as vector [duplicate]
To pytanie ma już odpowiedź tutaj:
Wyodrębnij kolumnę dplyr tbl jako wektor
... as.character
res
# This gives strange output
[1] "c(\"F\", \"G\", \"H\", \"I\", \"J\")"
# I need:
# [1] "F" "G" "H" "I" "J"
Znajdź unikalne wartości w ramce danych Panda, niezależnie od położenia wiersza lub kolumny
Mam ramkę danych Pandy i chcę znaleźć wszystkie unikalne wartości w tej ramce danych...niezależnie od wiersza/kolumny. Jeśli ... efektywne (nie może tego usprawiedliwić). Czy istnieje skuteczny sposób, aby go znaleźć? Czy istnieje predefiniowana funkcja?