Unicode

Article

February 2, 2023

Unicode (inglese: Unicode) è uno standard industriale progettato per consentire ai computer di rappresentare e gestire in modo coerente tutti i caratteri del mondo. Unicode è istituito dal Consorzio Unicode. Questo standard include anche il set di caratteri ISO 10646, la codifica dei caratteri, il database delle informazioni sui caratteri e gli algoritmi per la gestione dei caratteri. Inoltre, lo scopo di Unicode è sostituire tutti i metodi di codifica dei caratteri esistenti con Unicode. Le codifiche esistenti sono limitate in scala e portata e c'è un problema in quanto non sono compatibili tra loro in un ambiente multilingue. Poiché Unicode è riuscito a unificare vari set di caratteri, Unicode è diventato ampiamente utilizzato per l'internazionalizzazione e la localizzazione di software per computer ed è supportato da tecnologie relativamente recenti come XML, Java e i più recenti sistemi operativi. Quando si esprime la pronuncia coreana in Unicode, viene utilizzata la ISO/TR 11941, una variante della romanizzazione di Yale.

Origine e sviluppo

Le origini di Unicode risalgono al 1987, quando Joe Becker di Xerox e Lee Collins e Mark Davis di Apple iniziarono a esplorare la creazione di un set di caratteri unificato. Nel 1988 Joe Becker ha pubblicato una bozza per un sistema di codifica dei caratteri di testo internazionale/multilingue, chiamato provvisoriamente Unicode.

Versione

Elenco Unicode

Formato di conversione Unicode e set di caratteri internazionali

Unicode ha due schemi di mappatura: la codifica Unicode Transformation Format (UTF) e la codifica Universal Coded Character Set (UCS). La codifica UTF include: UTF-1 UTF-7 UTF-8 UTF-EBCDIC UTF-16 UTF-32

Note a piè di pagina

Collegamenti esterni

Associazione Unicode Domande frequenti su Unicode UTF-8 per utenti Unix/Linux DecodeUnicode - Wiki di Unicode graphemica: dettagli del personaggio