similarity

Algorytmy podobieństwa tekstu

Robię projekt w Javie, w którym muszę zrobić program do podobieństwa tekstu. Chcę, aby wziąć 2 dokumenty tekstowe, a następni ... ć podatni na to, aby to wyjaśnić, więc nawet nowi początkujący w tej dziedzinie mogą dostać to. Dziękuję za poświęcony czas.

Podobieństwo kolorów/odległość w przestrzeni kolorów RGBA

Jak obliczyć podobieństwo między dwoma kolorami w przestrzeni kolorów RGBA? (gdzie kolor tła jest oczywiście nieznany) Muszę ... rów. Lekko powiązane: jeśli chcesz znaleźć najbliższy kolor w tej Nie euklidesowej przestrzeni RGBA, vp-trees są najlepsze.

Podobieństwo Cosinus

Obliczyłem wartości TF / idf dwóch dokumentów. Poniżej znajdują się wartości TF/idf: 1.txt 0.0 0.5 2.txt 0.0 0.5 Dokument ... obliczyć na podstawie moich wartości? Jeszcze jedno pytanie: czy ważne jest, aby oba dokumenty miały taką samą liczbę słów?

Algorytm porównywania słów

Robię narzędzie importu CSV dla projektu, nad którym pracuję. Klient musi być w stanie wprowadzić dane w Excelu, wyeksportowa ... y, którą najprawdopodobniej chciał wstawić. Czy istnieje znany algorytm, aby to zrobić, czy może możemy wymyślić jeden :) ?

jaka jest dobra metryka przy podejmowaniu decyzji, czy 2 ciągi są " wystarczająco podobne"

Pracuję nad bardzo szorstkim algorytmem pierwszego szkicu, aby określić, jak podobne są 2 ciągi. Używam również Levenshtein D ... tance / Math.max(length1, length2); return (difference < 0.25) ? true : false; // <- arbitrary threshold, yuck! }

Jak znaleźć podobne słowo dla błędnie napisanego w PHP?

Wyjaśnię mój problem: Mam tabelę bazy danych o nazwie country. Posiada dwie kolumny: ID i name. Kiedy chcę szukać 'paris', ... pomocy w pisaniu skryptu, który sprawia, że sugestie z DB, które zawierają podobne słowa, takie jak: Paryż, paredes, ... itd.

Jakie deskryptory FFT powinny być użyte do implementacji algorytmu klasyfikacji lub klastrowania?

Mam kilka trajektorii geograficznych pobranych do analizy, i obliczyłem histogram danych w wymiarze przestrzennym i czasowym, ... róbkowania, czy ta metoda jest równoznaczna z zastosowaniem funkcji okna, czy nadal muszę zastosować ją na danych histogramu?

Wspólne filtrowanie: Niepersonalizowane podobieństwo pozycji do pozycji

Próbuję obliczyć podobieństwo pozycji do pozycji zgodnie z zasadami Amazon "klienci, którzy oglądali/kupili X, również ogląda ... e. Edit: chociaż wymieniłem Pythona jako znacznik, wolałbym zachować logikę wewnątrz db, najlepiej używając Oracle PL / SQL.

Jak wykryć, że dwa zdania są podobne?

Chcę obliczyć, jak podobne są do siebie dwa dowolne zdania. Na przykład: Matematyk znalazł rozwiązanie problemu. Pro ... iązał Młody matematyk. Mogę używać taggera, stemmera i parsera, ale nie wiem jak to zrobić, żeby te zdania były podobne.

Algorytm podobieństwa tekstu

Mam dwa pliki z napisami. Potrzebuję funkcji, która mówi, czy reprezentują ten sam tekst, czy podobny tekst Czasami pojaw ... ukiwania-nie oczywiście Levenshtein, ale algorytm musi być zastosowany do pliku jako całości. To będzie bardzo długi sznurek.

Podobieństwo Użytkowników Na Podstawie Głosów

Powiedzmy, że mam zestaw użytkowników, zestaw piosenek i zestaw głosów na każdy utwór: =========== =========== ======= User ... ków na podstawie głosów piosenek? czy jest lepszy sposób niż ocenianie każdego użytkownika i każdego głosu na każdą piosenkę?