fuzzy-comparison

Techniki znajdowania niemal zduplikowanych rekordów

[7]}próbuję wyczyścić bazę danych, która na przestrzeni lat zdobyła wiele zduplikowanych rekordów, o nieco innych nazwach. N ... być zrobione bezpośrednio w bazie danych? (Jest to baza danych dostępu, więc raczej unikać dotykania go, jeśli to możliwe.)

Rozmyte Wyrażenia Regularne

W mojej pracy z doskonałymi wynikami wykorzystałem przybliżone algorytmy dopasowywania łańcuchów, takie jak odległość Damerau ... ku 100x12) i znalezienie najlepszego dopasowania, ale to nie szwy praktyczne. Masz jakieś pomysły, jak to zrobić skutecznie?

Porównywanie (podobnych) obrazów z Pythonem/PIL

Próbuję obliczyć podobieństwo (Czytaj: Odległość Levenshteina ) dwóch obrazów, używając Pythona 2.6 i PIL. Planuję do nas e ... ozpoznawania kształtów itp. W każdym razie, dzięki za wszystkie linki, a także za wskazanie kierunku w kierunku NumPy/SciPy.

Jak rozpoznać lekko zmodyfikowane obrazy?

Mam bardzo dużą bazę obrazów jpeg, około 2 milionów. Chciałbym zrobić rozmyte wyszukiwanie duplikatów wśród tych obrazów. Z ... ęć, które muszę porównać do zaledwie 100, byłbym w świetnej formie, aby porównać 1 do 100. Jaki byłby dobry algorytm dla to?

Jak zastosować uczenie maszynowe do dopasowywania rozmytego

Powiedzmy, że mam system MDM (Master Data Management), którego głównym zastosowaniem jest wykrywanie i zapobieganie powielani ... rytmu ML. Więc Nie jestem pewien, czy dodanie ML stanowiłoby znaczącą propozycję wartościową. Wszelkie myśli są doceniane.