Kolejka priorytetów, która umożliwia sprawną aktualizację priorytetów?

Question

Kolejka priorytetów, która umożliwia sprawną aktualizację priorytetów?

UPDATE: Oto moja implementacja Zahaszowanych kół rozrządu . Proszę dać mi znać, jeśli masz pomysł, aby poprawić wydajność i współbieżność. (20-Jan-2009)

// Sample usage:
public static void main(String[] args) throws Exception {
    Timer timer = new HashedWheelTimer();
    for (int i = 0; i < 100000; i ++) {
        timer.newTimeout(new TimerTask() {
            public void run(Timeout timeout) throws Exception {
                // Extend another second.
                timeout.extend();
            }
        }, 1000, TimeUnit.MILLISECONDS);
    }
}

UPDATE : rozwiązałem ten problem używając hierarchicznych i Haszowanych kół rozrządu . (19-Jan-2009)

Próbuję zaimplementować timer specjalnego przeznaczenia w Javie, który jest zoptymalizowany do obsługi limitu czasu. Na przykład użytkownik może zarejestrować zadanie z martwą linią i timerem może powiadomić metodę wywołania zwrotnego użytkownika po zakończeniu martwej linii. W większości przypadków zarejestrowane zadanie zostanie wykonane w bardzo krótkim czasie, więc większość zadań zostanie anulowana(np. zadanie.cancel ()) lub przesunięty na przyszłość (np. zadanie.resouletolater (1, TimeUnit.Drugi)).

Chcę użyć tego timera, aby wykryć bezczynne połączenie z gniazdem (np. zamknąć połączenie, gdy nie zostanie odebrana wiadomość w ciągu 10 sekund) i zapisać timeout (np. podnieść wyjątek, gdy operacja zapisu nie jest ukończone w 30 sekund.) W większości przypadków limit czasu nie nastąpi, klient wyśle wiadomość, a odpowiedź zostanie wysłana, chyba że wystąpi dziwny problem z siecią..

Nie mogę używać Javy.util.Timer lub java.util./ align = "left" / ScheduledThreadPoolExecutor, ponieważ zakładają, że większość zadań ma być timed out. Jeśli zadanie jest anulowane, anulowane zadanie jest przechowywane w jego wewnętrznej stercie do ScheduledThreadPoolExecutor.nazywa się purge () i jest to bardzo kosztowna operacja. (O (NlogN) może?)

W tradycyjnych stosach lub kolejkach priorytetów, których nauczyłem się w klasach CS, aktualizacja priorytetu elementu była kosztowną operacją (o(logN) w wielu przypadkach, ponieważ można ją osiągnąć tylko poprzez usunięcie elementu i ponowne wstawienie go z nową wartością priorytetu. Niektóre stosy, takie jak stosy Fibonacciego, mają o(1) Czas działania decreaseKey() i min (), ale potrzebuję przynajmniej szybkiego increaseKey () i min () (lub decreaseKey () i max()).

Czy znasz jakąś strukturę danych który jest wysoce zoptymalizowany dla tego konkretnego przypadku użycia? Jedną ze strategii, o której myślę, jest przechowywanie wszystkich zadań w tabeli hash i powtarzanie wszystkich zadań co sekundę, ale to nie jest takie piękne.

22

data-structures timeout queue priority-queue scheduling

Author: trustin, 2009-01-16

Source

9 answers

Zgodnie z moją najlepszą wiedzą (napisałem artykuł o nowej kolejce priorytetów, w którym również przeanalizowałem wyniki z przeszłości), Żadna implementacja kolejki priorytetów nie pobiera granic stosów Fibonacciego, a także stałego-time increase-key.

Jest mały problem z otrzymaniem tego dosłownie. Jeśli możesz uzyskać increase-key W O(1), to możesz uzyskać delete w O(1) -- po prostu zwiększ klucz do +nieskończoności (możesz obsłużyć kolejkę pełną mnóstwa + nieskończoności używając standardowej amortyzacji sztuczki). Ale jeśli find-min jest również O (1), oznacza to, że delete-min = find-min + delete staje się O(1). Jest to niemożliwe w kolejce priorytetów opartej na porównaniu, ponieważ sortowanie wiązane implikuje (Wstaw wszystko, a następnie usuń jeden po drugim), że

N * insert + n * delete-min > n log N.

Punkt jest taki, że jeśli chcesz, aby Kolejka priorytetów wspierała increase-key W O(1), Musisz zaakceptować jedną z następujących Kar:

Not be comparison na podstawie. Właściwie to całkiem dobry sposób na obejście rzeczy, np. VEB trees.
Accept O (log n) dla wstawek oraz o(n log n) Dla make-heap (podane n wartości początkowe). Do bani.
Accept O (log n) Dla find-min. Jest to całkowicie dopuszczalne, jeśli nigdy nie wykonasz find-min (bez dołączonego delete).

Ale, z tego co wiem, nikt nie zrobił ostatniej opcji. Zawsze postrzegałem to jako szansę na nowe daje to dość podstawowy obszar struktur danych.

11

Author: A. Rex,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-19 06:51:06

Użyj Haszowane koła rozrządu - Google 'Haszowane hierarchiczne koła rozrządu', aby uzyskać więcej informacji. To uogólnienie odpowiedzi udzielanych przez ludzi. Ja bym wolał zahaczone Koło rozrządu o dużym rozmiarze koła od kół zębatych.

6

Author: trustin,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-19 06:23:35

Niektóre kombinacje hashów i struktur o (logN) powinny zrobić to, o co prosisz.

Kusi mnie, by się pokłócić ze sposobem, w jaki analizujesz problem. W komentarzu powyżej piszesz

Ponieważ aktualizacja będzie się pojawiać bardzo często. Załóżmy, że wysyłamy wiadomości M na połączenie, a ogólny czas staje się O (MNlogN), co jest dość duże. - Trustin Lee (6 godzin temu)

Co jest absolutnie poprawne, jeśli chodzi o to. Ale większość ludzi, których znam, skoncentruj się na kosztach za wiadomość , na teorii, że jak aplikacja ma coraz więcej pracy, oczywiście będzie wymagać więcej zasobów.

Więc jeśli Twoja aplikacja ma miliard otwartych gniazd jednocześnie (czy to naprawdę prawdopodobne?) koszt Wstawienia to tylko około 60 porównań za wiadomość.

Założę się, że to przedwczesna optymalizacja: nie mierzyłeś wąskich gardeł w swoim systemie za pomocą narzędzia do analizy wydajności, takiego jak CodeAnalyst lub VTune.

W Każdym Razie, prawdopodobnie istnieje nieskończona liczba sposobów robienia tego, o co prosisz, gdy tylko zdecydujesz, że żadna pojedyncza struktura nie zrobi tego, co chcesz, i chcesz jakąś kombinację mocnych i słabych stron różnych algorytmów.

Jedną z możliwości jest podzielenie domeny gniazda N na pewną liczbę kubełków o rozmiarze B, a następnie skrócenie każdego gniazda do jednego z tych (N/B) kubełków. W tym wiadrze znajduje się sterta (lub cokolwiek) z czasem aktualizacji o (log B). Jeśli górna granica na N nie jest ustalona z góry, ale może się różnić, wtedy można tworzyć więcej wiadra dynamicznie, co dodaje trochę komplikacji, ale z pewnością jest wykonalne.

W najgorszym przypadku, zegar watchdog musi szukać (N/B) kolejek wygasania, ale zakładam, że Zegar watchdog nie jest wymagany do zabicia gniazd bezczynności w żadnej konkretnej kolejności! Oznacza to, że jeśli 10 gniazd poszło bezczynnie w ostatnim czasie, to nie musi przeszukiwać tej domeny dla tego, że czas-out pierwszy, radzić sobie z to, a następnie znaleźć ten, który timed-out sekund, itp. Wystarczy zeskanować (N/B) Zestaw wiaderek i wyliczyć wszystkie przerwy czasowe.

Jeśli nie jesteś zadowolony z liniowej tablicy wiadrów, możesz użyć priorytetowej kolejki kolejek, ale chcesz uniknąć aktualizowania tej kolejki przy każdej wiadomości, albo wrócisz do punktu wyjścia. Zamiast tego zdefiniuj pewien czas, który jest krótszy niż rzeczywisty czas. (Powiedzmy, 3/4 lub 7/8 tego) i wstawiasz kolejkę niskiego poziomu do kolejki wysokiego poziomu tylko wtedy, gdy jest najdłuższy czas przekracza to.

I ryzykując stwierdzenie oczywistego, nie chcesz, aby Twoje kolejki były ustawione naupłynął Czas. Klucze powinny być start time. Dla każdego rekordu w kolejkach, upłynął czas musi być stale aktualizowany, ale czas rozpoczęcia każdego rekordu nie zmienia się.

5

Author: Die in Sente,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-18 03:01:13

Istnieje bardzo prosty sposób na wykonanie wszystkich wstawiania i usuwania w O(1), korzystając z faktu, że 1) priorytet opiera się na czasie i 2) prawdopodobnie masz małą, ustaloną liczbę czasu trwania limitu.

Utwórz regularną kolejkę FIFO, aby trzymać wszystkie zadania, które timeout w 10 sekund. Ponieważ wszystkie zadania mają identyczny czas trwania, możesz po prostu wstawić do końca i usunąć Od początku, aby uporządkować kolejkę.
tworzenie kolejnej kolejki FIFO Dla zadań z 30-sekundowym czas trwania limitu. Utwórz więcej kolejek dla innych okresów czasu.
aby anulować, Usuń element z kolejki. Jest to O (1), jeśli kolejka jest zaimplementowana jako lista połączona.
Zmiana harmonogramu może być wykonana jako cancel-insert, ponieważ obie operacje są O (1). Należy pamiętać, że zadania mogą być przenoszone do różnych kolejek.
wreszcie, aby połączyć wszystkie kolejki FIFO w jedną ogólną kolejkę priorytetową, niech Głowa każdej kolejki FIFO uczestniczy w regularnym stercie. Głowa tej sterty będzie to zadanie z najwcześniejszym upływem czasu ze wszystkich zadań.

Jeśli masz m liczbę różnych czasów trwania, złożoność dla każdej operacji ogólnej struktury wynosi O (log m). Wstawianie to o (log m) ze względu na konieczność wyszukania kolejki do której ma zostać wstawiona. Remove-min jest O (log m) dla przywrócenia sterty. Anulowanie to O (1), ale najgorszy przypadek O (log m), jeśli anulujesz początek kolejki. Ponieważ m jest małą, stałą liczbą, o (log m) jest zasadniczo O (1). Tak. nie skaluj z liczbą zadań.

3

Author: RaynQuist,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-03-22 03:23:54

Twój konkretny scenariusz sugeruje mi okrągły bufor. Jeśli max. timeout wynosi 30 sekund i chcemy zbierać gniazda co najmniej co dziesiątą sekundę, a następnie użyć bufora 300 podwójnie połączonych list, po jednej na każdą dziesiątą sekundę w tym okresie. Aby "increaseTime" na wpisie, usuń go z listy, w której się znajduje i dodaj go do nowego okresu dziesiątego sekundy (obie operacje w czasie stałym). Kiedy kończy się okres, zbieraj wszystko, co pozostało na bieżącej liście (może karmiąc go do reaper thread) i przesunąć wskaźnik bieżącej listy.

2

Author: Darius Bacon,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-17 23:28:57

Masz hard-limit na liczbę pozycji w kolejce - jest limit dla gniazd TCP.

Dlatego problem jest ograniczony. Podejrzewam, że każda sprytna struktura danych będzie wolniejsza niż używanie typów wbudowanych.

0

Author: Douglas Leeder,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-16 13:25:26

Czy istnieje dobry powód, aby nie używać Javy.lang.PriorityQueue? Czy funkcja remove() nie obsługuje operacji anulowania w czasie log (N)? Następnie zaimplementuj własne oczekiwanie w oparciu o czas do pozycji na początku kolejki.

0

Author: Nick Fortescue,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-16 15:14:18

Myślę, że przechowywanie wszystkich zadań na liście i przeglądanie ich byłoby najlepsze.

Musisz (zamierzasz) uruchomić serwer na jakiejś ładnej maszynie, aby dostać się do limitów, gdzie ten koszt będzie ważny?

0

Author: Douglas Leeder,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2009-01-17 09:14:04

score 13 · Accepted Answer

A może spróbujemy oddzielić zwykły przypadek, w którym sprawy kończą się szybko od przypadków błędów?

Używa zarówno tabeli hash, jak i kolejki priorytetów. Gdy zadanie zostanie uruchomione, zostanie umieszczone w tabeli hash i jeśli zakończy się szybko, zostanie usunięte w czasie O(1).

Co sekundę skanujesz tabelę hash i wszelkie zadania, które minęły już dawno, powiedzmy .75 sekund, przejdź do kolejki priorytetów. Kolejka priorytetów powinna być zawsze mała i łatwa w obsłudze. To zakłada, że jedna sekunda to znacznie mniej niż czas oczekiwania, którego szukasz.

Jeśli skanowanie tabeli skrótów jest zbyt wolne, możesz użyć dwóch tabel skrótów, zasadniczo jednej dla parzystych sekund i jednej dla nieparzystych sekund. Po uruchomieniu zadania jest ono umieszczane w bieżącej tabeli hash. Co sekundę Przenieś wszystkie zadania z bieżącej tabeli hash do kolejki priorytetów i zamień tabele hash tak, że bieżąca tabela hash jest teraz pusta, a tabela non-current zawiera zadania zaczęły się od jednej do dwóch sekund temu.

Tam opcje są o wiele bardziej skomplikowane niż tylko Korzystanie z kolejki priorytetów, ale są dość łatwo zaimplementowane powinny być stabilne.