Distance de Levenshtein – le moyen pour faire un correcteur orthographique
par Rom's le 17 avr 2008 (Développement Web)
Connaissez-vous la distance de Levenshtein ? Elle permet de calculer la différence entre deux mots en nombre de lettres à changer pour aller de l’un à l’autre.
Ex. :
* Distance de levenshtein entre « hélicoptaire » et « hélicoptère » : 2
* Distance de levenshtein entre « hélicotpère » et « hélicoptère » : 2
Vous l’avez compris par l’exemple, cela peut permettre de faire entre autres un correcteur orthographique. Il s’agit pour ce faire de constituer une base de mots clés que l’on parcoure et que l’on compare à un terme. Si la distance de levenshtein est inférieure ou égale à 2, on peut en déduire qu’il s’agit d’un mot relativement proche au niveau de l’orthographe. Au delà, ça devient plus fouillis.
En PHP, une fonction existe : levenshtein(). Les deux paramètres à remplir sont pour les deux mots à comparer et la fonction retourne la distance (int).
Suivre @RomainBOYER sur Twitter
» Flux RSS du blog
janvier 13th, 2009 on 11:20
[...] “es sources d’erreur dans la recherche d’un article ou d’un produit sont multiples (faute d’orthographe, recherche de référence mal saisie…) et leurs effets sur l’acte d’achat sont en général rédhibitoires” (lire à ce sujet notre article sur la distance de levenshtein) [...]