Normalisation Unicode
Un article de Wikipédia, l'encyclopédie libre.
Unicode |
---|
Jeux de caractères |
Équivalences normalisées |
Propriétés et algorithmes
|
Codage |
Autres transformations |
Applications d'échanges de données |
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
Sommaire |
[modifier] NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
- Exemples
caractères | forme normalisée |
||
---|---|---|---|
à | a + ̀ | = | a + ̀ |
ẹ́ | e + ́ + ̣ | → | e + ̣ + ́ |
ñ | ñ | → | n + ̃ |
Ω (ohm) | Ω | → | Ω (omega) |
fi (ligature) | fi | = | fi |
² | ² | = | ² |
[modifier] NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
- Exemples
caractères | forme normalisée |
||
---|---|---|---|
à | a + ̀ | → | à |
ẹ́ | e + ́ + ̣ | → | ẹ + ́ |
ñ | ñ | → | ñ |
Ω (ohm) | Ω | → | Ω (omega) |
fi (ligature) | fi | = | fi |
² | ² | = | ² |
[modifier] NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
- Exemples
caractères | forme normalisée |
||
---|---|---|---|
à | a + ̀ | = | a + ̀ |
ẹ́ | e + ́ + ̣ | → | e + ̣ + ́ |
ñ | ñ | → | n + ̃ |
Ω (ohm) | Ω | → | Ω (omega) |
fi (ligature) | fi | = | f + i |
² | ² | → | 2 |
[modifier] NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
- Exemples
caractères | forme normalisée |
||
---|---|---|---|
à | a + ̀ | → | à |
ẹ́ | e + ́ + ̣ | → | ẹ + ́ |
ñ | ñ | = | ñ |
Ω (ohm) | Ω | → | Ω (omega) |
fi (ligature) | fi | → | f + i |
² | ² | → | 2 |
[modifier] Voir aussi
- Unicode
- Équivalence Unicode