Daitch–Mokotoff Soundex
Daitch–Mokotoff Soundex (D–M Soundex) är en fonetisk algoritm som uppfanns 1985 av de judiska släktforskarna Gary Mokotoff och Randy Daitch. Det är en förfining av Russell och amerikanska Soundex -algoritmerna utformade för att möjliggöra större noggrannhet i matchningen av slaviska och jiddiska efternamn med liknande uttal men skillnader i stavning.
Daitch–Mokotoff Soundex kallas ibland för "Jewish Soundex" och "Eastern European Soundex", även om författarna avråder från att använda dessa smeknamn för algoritmen eftersom själva algoritmen är oberoende av det faktum att motivet för att skapa det nya systemet var dåligt resultat av föregångare när det gäller slaviska och jiddiska efternamn.
Förbättringar
Förbättringar jämfört med de äldre Soundex-algoritmerna inkluderar:
- Kodade namn är sexsiffriga, vilket resulterar i större sökprecision (traditionell Soundex använder fyra tecken)
- Det första tecknet i namnet är kodat.
- Flera regler i algoritmen kodar n-gram med flera tecken som ensiffriga siffror (American och Russell Soundex hanterar inte n-gram med flera tecken)
- Flera möjliga kodningar kan returneras för ett enda namn (traditionell Soundex returnerar endast en kodning, även om stavningen av ett namn potentiellt kan ha flera uttal)
Exempel
Några exempel:
Efternamn | Amerikanska Soundex | D–M Soundex |
---|---|---|
Peters | P362 | 739400, 734000 |
Peterson | P362 | 739460, 734600 |
Moskowitz | M232 | 645740 |
Moskovitz | M213 | 645740 |
Auerbach | A612 | 097500, 097400 |
Uhrbach | U612 | 097500, 097400 |
Jackson | J250 | 154600, 454600, 145460, 445460 |
Jackson-Jackson | J252 | 154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464 |
Beider–Morse fonetisk namnmatchningsalgoritm
För att ta itu med det stora antalet falskt positiva resultat som genererats av D–M Soundex, skapade Stephen P. Morse och Alexander Beider Beider–Morse Phonetic Name Matching-algoritmen. Den här nya algoritmen minskar antalet falska positiva på bekostnad av några falska negativa. Ett antal sajter erbjuder B–M soundex utöver DM soundex.
Anteckningar
externa länkar
- Mokotoff, Gary. "Soundexing och genealogi." Beskriver historien och motiven bakom D–M Soundex.
- JewishGen. "Soundex Coding." Beskriver både Russel och D–M Soundex.
- Coles, Michael. "SQL 2000 DBA Toolkit, Del 3: Phonetic Matching" SQL Server-baserad implementering av D–M Soundex-algoritmen med källa.