r-faq
Grupowanie funkcji (tapply, by, aggregate) i rodziny * apply
Kiedy chcę zrobić coś "map"py w R, zwykle staram się użyć funkcji z rodziny apply.
Jednak nigdy do końca nie rozumiałem róż ... ytanie poboczne: nadal nie nauczyłam się plyra czy przeformułowania -- czy plyr czy reshape zastąpić te wszystkie całkowicie?
Jak zrobić świetny przykład R
Podczas omawiania wydajności ze współpracownikami, nauczania, wysyłania raportu o błędzie lub szukania wskazówek na listach d ... Oświadczenia? Jakich słów zastrzeżonych należy unikać, oprócz c, df, data, itd.?
Jak zrobić wielki r powtarzalny przykład?
Jak łączyć (scalać) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)
Podane dwie ramki danych:
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data ... wszystkie wiersze z pasującymi klawiszami z lewej tabeli.
Dodatkowy kredyt:
Jak mogę wykonać polecenie SQL style select?
Jak sortować ramkę danych według wielu kolumn)
Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
Jak połączyć (scalić) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)?
Podane dwie ramki danych:
df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3)))
df2 = data ... i wszystkie wiersze z pasującymi klawiszami z lewej tabeli.
Dodatkowy kredyt:
Jak mogę wykonać polecenie SQL style select?
Jak sortować ramkę danych według wielu kolumn?
Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
Szybkie odczytywanie bardzo dużych tabel jako ramek danych
Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować jako ramki danych w R. read.table() ma wiele wygodnyc ... list(url='',popularity=0,mintime=0,maxtime=0))))
Czy jest na to lepszy sposób? A może zupełnie inne podejście do problemu?
Usuń wiersze z wszystkimi lub niektórymi serwerami NAs (brakującymi wartościami) w danych.ramka
Chciałbym usunąć linie w tej ramce danych, które:
A) zawiera NAs we wszystkich kolumnach. poniżej znajduje się moja przykła ... ENSG00000199674 0 2 2 2 2
4 ENSG00000207604 0 NA NA 1 2
6 ENSG00000221312 0 1 2 3 2
Jak przekonwertować czynnik na liczbę całkowitą\liczbową bez utraty informacji?
Kiedy przekonwertuję czynnik na liczbę lub liczbę całkowitą, otrzymuję podstawowe kody poziomów, a nie wartości jako liczby.
... 364493 0.24970435 0.36364493
## [19] 0.17968483 0.02840901
Czy istnieje lepszy sposób na konwersję współczynnika na liczbę?
Jak mam poradzić sobie z ostrzeżeniem "pakiet 'xxx' nie jest dostępny (dla wersji R X.y.z)"?
Próbowałem zainstalować pakiet, używając
install.packages("foobarbaz")
Ale otrzymał ostrzeżenie
Warning message:
packag ... est dostępny"pakiet "dataset" nie jest dostępny (dla wersji R 3.1.1)"pakiet" rhipe " nie jest dostępny (dla wersji R 3.1.2)"
Jak mogę wyświetlić kod źródłowy funkcji?
Chcę spojrzeć na kod źródłowy funkcji, aby zobaczyć, jak to działa. Wiem, że mogę wydrukować funkcję wpisując jej nazwę w wie ... ? Podobnie niektóre funkcje wywołują .C, .Call, .Fortran, .External, lub .Internal. Jak mogę znaleźć dla nich kod źródłowy?
Upuść kolumny ramki danych według nazwy
Mam kilka kolumn, które chciałbym usunąć z ramki danych. Wiem, że możemy je usuwać pojedynczo używając czegoś takiego:
df$x ... ąc pod uwagę, jak potężne jest R, pomyślałem, że może być lepszy sposób niż opuszczanie każdej kolumny po jednej przez jeden.
Jakie są różnice między operatorami " = " i "< - " w R?
Jakie są różnice między operatorami przypisania = i <- W R?
Wiem, że operatory są nieco inne, jak pokazuje ten przykład ... 5
x = y <- 5
x <- y = 5
# Error in (x <- y) = 5 : could not find function "<-<-"
Ale czy to jedyna różnica?
Jak przekonwertować czynnik na liczbę całkowitą umeric bez utraty informacji?
Kiedy przekonwertuję czynnik na liczbę lub liczbę całkowitą, otrzymuję podstawowe kody poziomów, a nie wartości jako liczby.
... 364493 0.24970435 0.36364493
## [19] 0.17968483 0.02840901
Czy istnieje lepszy sposób na konwersję współczynnika na liczbę?
Różnica między wspornikiem [] i wspornikiem podwójnym []] dla dostępu do elementów listy lub ramki danych
R udostępnia dwie różne metody dostępu do elementów listy lub danych.frame: [] i [[]].
Jaka jest różnica między tymi dwoma i kiedy powinienem użyć jednego nad drugim?
Ogólne sugestie dotyczące debugowania w R
Pojawia się błąd podczas używania funkcji R, którą napisałem:
Warning messages:
1: glm.fit: algorithm did not converge
2: ... hodzi ten błąd w kodzie. Nie jestem nawet pewien, które funkcje w kodzie zależą od glm.fit. Jak mam diagnozować ten problem?
Dlaczego ` ["jest lepsze niż "podzbiór"?
Kiedy muszę filtrować dane.frame, czyli wyodrębnianie wierszy spełniających określone warunki, wolę użyć funkcji subset:
su ... dy, może Proszę wyjaśnić "niestandardową ocenę podzbioru argumentów " i dlaczego jest to niebezpieczne, może podać przykład?
Spadek nieużywanych poziomów współczynnika w podgrupie danych
Mam ramkę danych zawierającą factor. Kiedy tworzę podzbiór tej ramki danych za pomocą subset lub innej funkcji indeksującej, ... # 2 b 2
## 3 c 3
# all levels are still there!
levels(subdf$letters)
## [1] "a" "b" "c" "d" "e"
Różnica między wspornikiem [] a wspornikiem podwójnym [[]] dla dostępu do elementów listy lub ramki danych
R udostępnia dwie różne metody dostępu do elementów listy lub danych.frame-operatory [] i [[]].
Jaka jest różnica między nimi? W jakich sytuacjach powinienem używać jednego nad drugim?
Jak zaimportować wiele.pliki csv na raz?
Załóżmy, że mamy folder zawierający wiele danych.pliki csv, każdy zawierający tę samą liczbę zmiennych, ale każdy z różnych c ... muszę importować je pojedynczo za pomocą kodu:
read.delim(file="filename", header=TRUE, sep="\t")
Nie jest zbyt wydajny.