r-faq

Grupowanie funkcji (tapply, by, aggregate) i rodziny * apply

Kiedy chcę zrobić coś "map"py w R, zwykle staram się użyć funkcji z rodziny apply. Jednak nigdy do końca nie rozumiałem róż ... ytanie poboczne: nadal nie nauczyłam się plyra czy przeformułowania -- czy plyr czy reshape zastąpić te wszystkie całkowicie?

Jak zrobić świetny przykład R

Podczas omawiania wydajności ze współpracownikami, nauczania, wysyłania raportu o błędzie lub szukania wskazówek na listach d ... Oświadczenia? Jakich słów zastrzeżonych należy unikać, oprócz c, df, data, itd.? Jak zrobić wielki r powtarzalny przykład?

Jak łączyć (scalać) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)

Podane dwie ramki danych: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data ... wszystkie wiersze z pasującymi klawiszami z lewej tabeli. Dodatkowy kredyt: Jak mogę wykonać polecenie SQL style select?

Jak sortować ramkę danych według wielu kolumn)

Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 3 Hi A 9 1 4 Low C 9 2

Jak połączyć (scalić) ramki danych (wewnętrzne, zewnętrzne, lewe, prawe)?

Podane dwie ramki danych: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data ... i wszystkie wiersze z pasującymi klawiszami z lewej tabeli. Dodatkowy kredyt: Jak mogę wykonać polecenie SQL style select?

Jak sortować ramkę danych według wielu kolumn?

Chcę sortować dane.ramka z wieloma kolumnami. Na przykład z danymi.ramka poniżej chciałbym posortować po kolumnie z (malejąco ... , "D", "A", "C"), y = c(8, 3, 9, 9), z = c(1, 1, 1, 2)) dd b x y z 1 Hi A 8 1 2 Med D 3 1 3 Hi A 9 1 4 Low C 9 2

Szybkie odczytywanie bardzo dużych tabel jako ramek danych

Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować jako ramki danych w R. read.table() ma wiele wygodnyc ... list(url='',popularity=0,mintime=0,maxtime=0)))) Czy jest na to lepszy sposób? A może zupełnie inne podejście do problemu?

Usuń wiersze z wszystkimi lub niektórymi serwerami NAs (brakującymi wartościami) w danych.ramka

Chciałbym usunąć linie w tej ramce danych, które: A) zawiera NAs we wszystkich kolumnach. poniżej znajduje się moja przykła ... ENSG00000199674 0 2 2 2 2 4 ENSG00000207604 0 NA NA 1 2 6 ENSG00000221312 0 1 2 3 2

Jak przekonwertować czynnik na liczbę całkowitą\liczbową bez utraty informacji?

Kiedy przekonwertuję czynnik na liczbę lub liczbę całkowitą, otrzymuję podstawowe kody poziomów, a nie wartości jako liczby. ... 364493 0.24970435 0.36364493 ## [19] 0.17968483 0.02840901 Czy istnieje lepszy sposób na konwersję współczynnika na liczbę?

Jak mam poradzić sobie z ostrzeżeniem "pakiet 'xxx' nie jest dostępny (dla wersji R X.y.z)"?

Próbowałem zainstalować pakiet, używając install.packages("foobarbaz") Ale otrzymał ostrzeżenie Warning message: packag ... est dostępny"pakiet "dataset" nie jest dostępny (dla wersji R 3.1.1)"pakiet" rhipe " nie jest dostępny (dla wersji R 3.1.2)"

Jak mogę wyświetlić kod źródłowy funkcji?

Chcę spojrzeć na kod źródłowy funkcji, aby zobaczyć, jak to działa. Wiem, że mogę wydrukować funkcję wpisując jej nazwę w wie ... ? Podobnie niektóre funkcje wywołują .C, .Call, .Fortran, .External, lub .Internal. Jak mogę znaleźć dla nich kod źródłowy?

Upuść kolumny ramki danych według nazwy

Mam kilka kolumn, które chciałbym usunąć z ramki danych. Wiem, że możemy je usuwać pojedynczo używając czegoś takiego: df$x ... ąc pod uwagę, jak potężne jest R, pomyślałem, że może być lepszy sposób niż opuszczanie każdej kolumny po jednej przez jeden.

Jakie są różnice między operatorami " = " i "< - " w R?

Jakie są różnice między operatorami przypisania = i <- W R? Wiem, że operatory są nieco inne, jak pokazuje ten przykład ... 5 x = y <- 5 x <- y = 5 # Error in (x <- y) = 5 : could not find function "<-<-" Ale czy to jedyna różnica?

Jak przekonwertować czynnik na liczbę całkowitą umeric bez utraty informacji?

Kiedy przekonwertuję czynnik na liczbę lub liczbę całkowitą, otrzymuję podstawowe kody poziomów, a nie wartości jako liczby. ... 364493 0.24970435 0.36364493 ## [19] 0.17968483 0.02840901 Czy istnieje lepszy sposób na konwersję współczynnika na liczbę?

Różnica między wspornikiem [] i wspornikiem podwójnym []] dla dostępu do elementów listy lub ramki danych

R udostępnia dwie różne metody dostępu do elementów listy lub danych.frame: [] i [[]]. Jaka jest różnica między tymi dwoma i kiedy powinienem użyć jednego nad drugim?

Ogólne sugestie dotyczące debugowania w R

Pojawia się błąd podczas używania funkcji R, którą napisałem: Warning messages: 1: glm.fit: algorithm did not converge 2: ... hodzi ten błąd w kodzie. Nie jestem nawet pewien, które funkcje w kodzie zależą od glm.fit. Jak mam diagnozować ten problem?

Dlaczego ` ["jest lepsze niż "podzbiór"?

Kiedy muszę filtrować dane.frame, czyli wyodrębnianie wierszy spełniających określone warunki, wolę użyć funkcji subset: su ... dy, może Proszę wyjaśnić "niestandardową ocenę podzbioru argumentów " i dlaczego jest to niebezpieczne, może podać przykład?

Spadek nieużywanych poziomów współczynnika w podgrupie danych

Mam ramkę danych zawierającą factor. Kiedy tworzę podzbiór tej ramki danych za pomocą subset lub innej funkcji indeksującej, ... # 2 b 2 ## 3 c 3 # all levels are still there! levels(subdf$letters) ## [1] "a" "b" "c" "d" "e"

Różnica między wspornikiem [] a wspornikiem podwójnym [[]] dla dostępu do elementów listy lub ramki danych

R udostępnia dwie różne metody dostępu do elementów listy lub danych.frame-operatory [] i [[]]. Jaka jest różnica między nimi? W jakich sytuacjach powinienem używać jednego nad drugim?

Jak zaimportować wiele.pliki csv na raz?

Załóżmy, że mamy folder zawierający wiele danych.pliki csv, każdy zawierający tę samą liczbę zmiennych, ale każdy z różnych c ... muszę importować je pojedynczo za pomocą kodu: read.delim(file="filename", header=TRUE, sep="\t") Nie jest zbyt wydajny.