levenshtein-distance

Uzyskiwanie najbliższego dopasowania strun

Potrzebuję sposobu na porównanie wielu łańcuchów z testowym łańcuchem i zwrócenie łańcucha, który jest bardzo podobny do nieg ... tym momencie pseudo kod jest akceptowalny. Jeśli możesz podać przykład dla konkretnego języka, to również jest to doceniane!

Jaki algorytm daje sugestie w sprawdzaniu pisowni?

Jaki algorytm jest zwykle używany przy implementacji sprawdzania pisowni, któremu towarzyszą sugestie słowne? Na początku po ... Wydaje się jednak, że byłoby to wysoce nieefektywne, musielibyśmy wielokrotnie Oceniać cały słownik. Jak to zwykle gotowe?

Odległość Levenshteina w T-SQL

Interesuje mnie algorytm w T-SQL Obliczanie odległości Levenshteina.

Sortuj tablicę według "odległości Levenshteina" z najlepszą wydajnością w Javascript

Więc mam losową tablicę nazw javascript... [[10]}[@larry,@nicholas,@notch] itd. Wszystkie zaczynają się od symbolu@. Chciał ... chy) }); Moim problemem jest teraz ogólne zrozumienie stosowania metody .sort(). Pomoc jest mile widziana, dzięki. Dzięki!

Jak obliczyć miarę podobieństwa odległości podanych 2 ciągów?

Muszę obliczyć podobieństwo między dwoma łańcuchami. Więc co dokładnie mam na myśli? Pozwól, że wyjaśnię na przykładzie: p ... go słowa Zawsze. Więc staje się 2 / 8 = 25% więc te 2 podane ciągi są 75%. Jak mogę to osiągnąć, biorąc pod uwagę wydajność?

Metryki podobieństwa łańcuchów w Pythonie

Chcę znaleźć podobieństwo łańcuchów między dwoma łańcuchami. Ta strona zawiera przykłady niektórych z nich. Python ma imple ... ielu słów. Czy coś innego niż odległość Levenshteina (lub stosunek Levenshteina) byłoby lepszym algorytmem w moim przypadku?

Levenshtein: MySQL + PHP

$word = strtolower($_GET['term']); $lev = 0; $q = mysql_query("SELECT `term` FROM `words`"); while($r = mysql_fetch_assoc ... ; } } Jak mogę przenieść to wszystko do jednego zapytania? Nie chcę przeszukiwać wszystkich terminów i filtrować w PHP.

Różnica między odległością Jaro-Winklera a Levenshteina? [zamknięte]

Mam przypadek użycia, w którym muszę zrobić rozmyte dopasowanie milionów rekordów z wielu plików. Zidentyfikowałem dwa algory ... . Nie rozumiałem algorytmu. As I need aby użyć jednego z tych algorytmów, muszę znać dokładne różnice w wydajności algorytmu.

Implementacja prostego Trie do efektywnego obliczania odległości Levenshteina-Java

UPDATE 3 Zrobione. Poniżej znajduje się kod, który w końcu przeszedł wszystkie moje testy. Ponownie jest to wzorowane na z ... erowano na blogu Nicka Johnsona, ale nie jest tak skuteczny, jak myślę, że może być... a może moja implementacja jest błędna.

Levenshtein odległość w VBA [zamknięty]

Mam arkusz Excela z danymi, które chcę uzyskać. Próbowałem już wyeksportować jako tekst, odczytać ze skryptu (php), uruchomić ... pisać go ponownie do Excela. Ale szukam sposobu aby programowo obliczyć odległość Levenshteina w VBA. Jak miałbym to zrobić?

Porównaj algorytmy podobieństwa

Chcę użyć funkcji podobieństwa łańcuchów, aby znaleźć uszkodzone dane w mojej bazie danych. Natknąłem się na kilka z nich: ... uklidesowe i Q-gram, Chciałam się dowiedzieć jaka jest różnica między nimi i w jakich sytuacjach najlepiej się sprawdzają?

Algorytm odległości Levenshteina lepszy od O (n*m)?

Szukałem zaawansowanego algorytmu odległości Levenshteina i najlepszy jaki do tej pory znalazłem to O(n*m) gdzie n I m są d ... tive-c , ale przy ograniczonej ilości pamięci na iPodach i iPhone ' ach, chciałbym znaleźć lepszy algorytm, jeśli to możliwe.

Odległość Levenshtein: jak lepiej radzić sobie z pozycjami wymiany słów?

Udało mi się porównać ciągi za pomocą funkcji PHP levenshtein. Jednak dla dwóch łańcuchów zawierających podłańcuchy, które z ... bardzo słabo, jeśli zmienisz kolejność słów, wokół których wydaje się powszechne w szkole: "xxx college" vs "college of xxx".

Jak porównać prawie podobne ciągi w Javie? (String distance measure)

Chciałbym porównać dwa ciągi i uzyskać jakiś wynik, jak bardzo te wyglądają podobnie. Na przykład "zdanie jest prawie podobne ... e jestem zaznajomiony z istniejącymi metodami w Javie, ale dla PHP znam funkcję Levenshteina. Czy są lepsze metody w Javie?

Grupowanie tekstu z odległości Levenshtein

Mam zestaw (2k - 4K) małych łańcuchów (3-6 znaków) i chcę je zgrupować. Ponieważ używam ciągów, poprzednie odpowiedzi na Jak ... Was może mi pokazać drogę do implementacji hierarchicznego klastrowania w Matlabie lub R za pomocą niestandardowej funkcji?

Porównaj 5000 ciągów z PHP Levenshtein

Mam 5000, czasami więcej, ciągów adresów ulic w tablicy. Chciałbym porównać je wszystkie z levenshtein, aby znaleźć podobne d ... lem jest znalezienie podobnych wpisów (i wyeliminowanie duplikatów) na podstawie zgłoszonych przez użytkowników Adresów Ulic.

Java fuzzy String matching with names

Mam autonomiczny proces ładowania danych CSV, który zakodowałem w Javie, który musi użyć jakiegoś rozmytego dopasowania łańcu ... z podstawowy do ładowanego pliku, czy ktoś widzi sposób, aby poprawić ten proces? Jakieś inne algorytmy, które mogłyby pomóc?

Jak zoptymalizować ten kod Pythona, aby wygenerować wszystkie słowa z word-distance 1?

Profilowanie pokazuje, że jest to najwolniejszy segment mojego kodu do małej gry słownej, którą napisałem: def distance(wor ... różnymi maszynami, więc jeśli ktoś kończy się próbując to dać porównanie wyników programu, jak jest, jak również z modułem C.

Najlepsza technika uczenia maszynowego do dopasowywania ciągów produktów

Oto zagadka... Mam dwie bazy danych tych samych 50000 + produktów elektronicznych i chcę dopasować produkty w jednej bazie d ... CD HDTV -LG 50 Inch 1080p LCD HDTV Są różne produkty o bardzo podobnych nazwach produktów. Jak mam rozwiązać ten problem?

Poprawa wyników wyszukiwania za pomocą Levenshtein distance w Javie

Mam następujący działający kod Javy do wyszukiwania słowa na liście słów i działa idealnie i zgodnie z oczekiwaniami: publi ... to nie znaczy, że inne odpowiedzi nie są ważne, ale to tylko oznacza, że konkretna odpowiedź wybrałem był przydatny dla mnie.