Vous devez être membre et vous identifier pour publier un article.
Les visiteurs peuvent toutefois commenter chaque article par une réponse.

SQL-PHP les soundex, ou booster votre recherche

Astuces de l’Infobrol (Développement)Article publié le 18/01/2006 08:13:42


Très pratique pour la recherche phonétique dans les tables de la DB.
Je conseille d'ailleurs de lire l'article dont est tirée cette astuce (voir le lien source).

  1. function soundex2( $sIn )
  2. {
  3. // Si il n'y a pas de mot, on sort immédiatement
  4. if ( $sIn === '' ) return ' ';
  5. // On met tout en minuscule
  6. $sIn = strtoupper( $sIn );
  7. // On supprime les accents
  8. $sIn = strtr( $sIn, 'ÂÄÀÇÈÉÊËŒÎÏÔÖÙÛÜ', 'AAASEEEEEIIOOUUU' );
  9. // On supprime tout ce qui n'est pas une lettre
  10. $sIn = preg_replace( '`[^A-Z]`', '', $sIn );
  11. // Si la chaîne ne fait qu'un seul caractère, on sort avec.
  12. if ( strlen( $sIn ) === 1 ) return $sIn . ' ';
  13. // on remplace les consonnances primaires
  14. $convIn = array( 'GUI', 'GUE', 'GA', 'GO', 'GU', 'CA', 'CO', 'CU', 'Q', 'CC', 'CK' );
  15. $convOut = array( 'KI', 'KE', 'KA', 'KO', 'K', 'KA', 'KO', 'KU', 'K','K', 'K' );
  16. $sIn = str_replace( $convIn, $convOut, $sIn );
  17. // on remplace les voyelles sauf le Y et sauf la première par A
  18. $sIn = preg_replace( '`(?‹!^)[EIOU]`', 'A', $sIn );
  19. // on remplace les préfixes puis on conserve la première lettre
  20. // et on fait les remplacements complémentaires
  21. $convIn = array( '`^KN`', '`^(PH|PF)`', '`^MAC`', '`^SCH`', '`^ASA`', '`(?‹!^)KN`', '`(?‹!^)(PH|PF)`', '`(?‹!^)MAC`',
  22. '`(?‹!^)SCH`','`(?‹!^)ASA`' );
  23. $convOut = array( 'NN', 'FF', 'MCC', 'SSS', 'AZA', 'NN', 'FF', 'MCC', 'SSS', 'AZA' );
  24. $sIn = preg_replace( $convIn, $convOut, $sIn );
  25. // suppression des H sauf CH ou SH
  26. $sIn = preg_replace( '`(?‹![CS])H`', '', $sIn );
  27. // suppression des Y sauf précédés d'un A
  28. $sIn = preg_replace( '`(?‹!A)Y`', '', $sIn );
  29. // on supprime les terminaisons A, T, D, S
  30. $sIn = preg_replace( '`[ATDS]$`', '', $sIn );
  31. // suppression de tous les A sauf en tête
  32. $sIn = preg_replace( '`(?!^)A`', '', $sIn );
  33. // on supprime les lettres répétitives
  34. $sIn = preg_replace( '`(.)\1`', '$1', $sIn );
  35. // on ne retient que 4 caractères ou on complète avec des blancs
  36. return substr( $sIn . ' ', 0, 4);
  37. }


Avatar :: adenine Un article de Adenine

Source : sqlpro.developpez.com


Sélection, tri et recherche d'articles
FILTRER :
TRIER :1er critère : 2e critère :
CHERCHER : Dans les titres Dans le contenu


[Afficher les liens en fonction des critères du formulaire ci-dessus]

Version en cache

22/12/2024 02:32:50 Cette version de la page est en cache (à la date du 22/12/2024 02:32:50) afin d'accélérer le traitement. Vous pouvez activer le mode utilisateur dans le menu en haut pour afficher la dernère version de la page.

Document créé le 13/09/2004, dernière modification le 26/10/2018
Source du document imprimé : https://www.gaudry.be/ast-rf-258.html

L'infobrol est un site personnel dont le contenu n'engage que moi. Le texte est mis à disposition sous licence CreativeCommons(BY-NC-SA). Plus d'info sur les conditions d'utilisation et sur l'auteur.