Google : L’Unicode (UTF-8) utilisé sur presque 50% du Web !

Par Vincent Ballut - @Kaayru

Passionné de Google et de toute l'actu du Web en général, j'ai créé ce site en 2008 pour traduire les nombreux articles que Google publie sur ses divers blogs officiels.

You may also like...

7 Responses

  1. Patrick dit :

    Traduction non automatique (y compris graphique) :

    http://hapax.qc.ca/Unicode-quasi-majoritaire.html

  2. Cyril dit :

    Salut Vincent ! C’est Cyril d’Image. Comment vas-tu ???

    Je recherchais une info sur le Ï trema majuscule. Quelle différence entre UTF8_unicode_ci et UTF8_general_ci

    Lequel des deux prends le Ï ???

    Je suppose que c’est le UTF8_unicode_ci mais je veux en être sûr !

    Bonne journée ;)
    Cyril

  3. Vincent dit :

    Hello Cyril :)

    Je prends toujours le general, mais je ne connais pas vraiment la différence…

    Peut-être plus d’infos pour toi ici : http://www.davidtan.org/differences-between-utf8_unicode_ci-and-utf8_general_ci/

  4. Cyril dit :

    Merci beaucoup ! Au fait, certains disent que la requête “$req = mysql_query(“SET NAMES ‘UTF8′”);”
    ne sert à rien. Et bien je peux t’assurer qu’elle sert !!!!
    ça ne mange pas de pain et c’est toujours plus prudent ! Qu’en penses tu???

  5. Cyril dit :

    Et t’as vu un peu la nouvelle page d’accueil de Google??? J’adore !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

    Google : c’est plus fort que toi ;)

  6. Yves Gingras dit :

    Que signifie « prendre » dans « Lequel des deux prends le Ï ??? »

    Le ï est toujours codé dans Unicode…

    Pour ce qui est du tri (et de la comparaison) car c’est ce que détermine cette valeur, utf8_general_ci est la version la plus rapide et la plus simple (elle replie toutes les formes accentuées vers le caractère de base : Ï devient identique à I).

    utf8_unicode_ci, pour sa part, va distinguer le Ï du I quand les deux lettres sont présentes dans une liste (ou même un couple) de mots. Il va également distinguer les é des è ou des e mais uniquement comme différences de second ordre (quand deux mots ne se distinguent que par les accents : côté et cote, élève et élevé) et les trier dans un ordre déterminé.

    Contrairement à ce que dit la documentation de MySQL utf8_unicode_ci n’est pas suffisant pour trier parfaitement le français (les accents se trient en considérant d’abord les derniers accents d’un mot dans les dictionnaires ce qui n’est pas le défaut), bien que pour l’immense majorité des applications ceci est une subtilité sans importance.

    Pour plus de détails voir la très bonne introduction sur le sujet dans le livre de référence en français sur Unicode :

    Unicode 5.0 de P. Andries

    http://www.amazon.fr/Unicode-5-0-pratique-Patrick-Andries/dp/2100511408/ref=sr_1_2?ie=UTF8&s=books&qid=1276175813&sr=8-2