r-faq

Zliczanie unikalnych / odrębnych wartości według grup w ramce danych

Załóżmy, że mam następującą ramkę danych: > myvec name order_no 1 Amy 12 2 Jack 14 3 Jack 1 ... astępujący wynik: name number_of_distinct_orders Amy 2 Jack 3 Dave 1 Tom 2 Larry 1 Jak mogę to zrobić?

Jak skutecznie filtrować ramkę danych?

Mam ramkę danych i próbowałem wybrać tylko obserwacje, które mnie interesują: data[data["Var1"]>10] Niestety, poleceni ... ne.struktura ramki i zwraca długi wektor. Chcę zdobyć dane.ramka skrócona o obserwacje, które nie spełniają moich kryteriów.

Jak odjąć lata?

Mam datę w R, np.: dt = as.Date('2010/03/17') Chciałbym odjąć 2 lata od tej daty, nie martwiąc się o lata przestępne i tego typu problemy, otrzymując as.Date('2010-03-17'). Jak miałbym to zrobić?

Wybierz wiersze z ramki danych na podstawie wartości wektora

Mam dane podobne do tego: dt <- structure(list(fct = structure(c(1L, 2L, 3L, 4L, 3L, 4L, 1L, 2L, 3L, 1L, 2L, 3L, 2L, 3L, ... eję, że jest bardziej elegancki sposób. Więc jak mogę filtrować / podzestawiać moje dane na podstawie zawartości wektora vc?

Dlaczego nie zaleca się używania attach() w R i czego powinienem użyć zamiast tego?

Załóżmy, że mamy ramkę danych x zawierającą Kolumny job i income. Odwołanie się do danych w ramce zwykle wymaga poleceń x$job ... radzi, aby nie używać komendy attach() podczas kodowania w R. Jaki jest tego główny powód? Co powinno być używane zamiast?

Jak wywołać obiekt ze zmienną znakową o tej samej nazwie

Próbuję napisać funkcję w R do analizy wsadowej wielu plików w podobny sposób. Pliki należą do klasy ExpressionSetIllumina. M ... miennej zapisaną jako łańcuch znaków w wektorze znaków. Jak mogę użyć nazwy obiektu łańcuchowego, aby zrobić coś z obiektem?

Ustaw domyślne lustro Cran permanent w R

Jak mogę ustawić konkretne lustro CRAN na stałe w R? Chcę ustawić go na stałe w laptopie, aby kiedy to zrobię install.packages(), nie spytał mnie ponownie, które lustro wybrać.

Jak podgrupować macierz do jednej kolumny, utrzymywać typ danych macierzy, utrzymywać nazwy wierszy / kolumn?

Gdy podzbiór macierzy do pojedynczej kolumny, wynikiem jest klasa numeric, a nie matrix (tj. myMatrix [, 5 ] do podzbioru do ... komplikowanego, takiego jak: matrix( myMatrix[ , 5 ] , dimnames = list( rownames( myMatrix ) , colnames( myMatrix )[ 5 ] )

/ Align = "left" / 5

Tak Wiem, dlaczego zawsze zaokrąglamy do najbliższej parzystej liczby, jeśli jesteśmy dokładnie pośrodku (tzn. 2.5 staje się ... ..,10 a nie 0,2,2,4,4,...,10. Edit: aby wyczyścić: 1.4999 powinno być 1 po zaokrągleniu. (Myślałem, że to będzie oczywiste)

Zwiń / połącz / agreguj kolumnę do pojedynczego łańcucha oddzielonego przecinkami w każdej grupie

Chcę zagregować jedną kolumnę w ramce danych według dwóch zmiennych grupujących i oddzielić poszczególne wartości przecinkiem ... ogę zachować format character i oddzielić je przecinkiem? Na przykład, wiersz 1 powinien być tylko "5,7", a nie jako c (5,7).

Jak mogę usunąć wszystkie duplikaty, aby żaden nie pozostał w ramce danych?

Jest podobne pytanie dla PHP, ale pracuję z R i nie jestem w stanie przetłumaczyć rozwiązania mojego problemu. Mam ramkę da ... uporządkować ręcznie, ale mam większe ramki danych niż wspomniane powyżej (do 100 wierszy), gdzie robi się to trochę trudne.

Jak mogę odczytać kod summary () dla ramki danych?

Mam ramkę danych i chcę się dowiedzieć, jak podsumowanie generuje informacje. W szczególności, w jaki sposób summary generuj ... Kiedy próbuję ?podsumowanie, po prostu dostaję ogólne informacje. Czy jest to niemożliwe, ponieważ jest w bajtowym kodzie?

Gdzie mogę znaleźć przydatne tutoriale R z różnymi implementacjami?

Używam R Język i podręczniki na stronie R są naprawdę pouczające. Chciałbym jednak zobaczyć więcej przykładów i implementacji z R, które mogą pomóc mi szybciej rozwijać moją wiedzę. Jakieś sugestie?

Przechowywanie obiektów R w relacyjnej bazie danych

Często tworzę nieparametryczne statystyki (loess, gęstości jądra itp.) na danych, które wyciągam z relacyjnej bazy danych. Ab ... Teraz pracuję nad tym przez zapisywanie obiektów R na dysku sieciowym, aby inni mogli załadować obiekty w razie potrzeby.

Znajdowanie wszystkich pozycji dla wielu elementów w wektorze

Załóżmy, że mam następujący wektor: x <- c(8, 6, 9, 9, 7, 3, 2, 5, 5, 1, 6, 8, 5, 2, 9, 3, 5, 10, 8, 2) Jak mogę znaleźć, które elementy są albo 8 lub 9?

Jak utworzyć kolejny indeks na podstawie zmiennej grupującej w ramce danych

Mam ramkę danych (all_data), w której mam listę stron (1... do n) i ich wyniki np. site score 1 10 1 11 ... 3 8 8 3 8 7 3 Jestem pewien, że to musi być łatwo rozwiązane, ale nie znalazłem jeszcze sposobu.

Konwertuj ciągłe wartości liczbowe na kategorie dyskretne zdefiniowane przez przedziały

Mam ramkę danych z ciągłą zmienną liczbową, wiek w miesiącach (age_mnths). Chcę stworzyć nową zmienną dyskretną, z kategoriam ... lt"))))) Wiem, że istnieje cut funkcja, ale nie mogłem sobie z nią poradzić w moim celu, aby dyskretyzować / kategoryzować.

Jak odjąć / dodać dni od / do daty?

Próbuję zbudować foldery do przechowywania ściągnięć danych. Chcę oznaczyć foldery datą tych danych w pull. Ex. Wyciągam 5 d ... ią liczbę sekund w POSIXct, a następnie przekonwertować do POSIXlt, aby nazwać folder MM_DD_YYYY? A może jest lepszy sposób?

Radzenie sobie z prawdą, fałszem, NA i NaN

Oto wektor a <- c(TRUE, FALSE, FALSE, NA, FALSE, TRUE, NA, FALSE, TRUE) Chciałbym prostej funkcji, która zwraca TRUE z ... FALSE, NA, NaN? Jakie są różnice między NA i NaN? Czy są inne "logiczne rzeczy" niż TRUE, FALSE, NA i NaN? Wielkie dzięki !

Jak zainstalować pakiet, który został zarchiwizowany z CRAN?

W wierszu poleceń R wpisałem: install.packages("RecordLinkage") Mam następujący błąd: Warning in install.packages : ... to udało mi się pomyślnie zainstalować inne pakiety. Wiesz, dlaczego to nie działa? Każda pomoc będzie bardzo mile widziana.