Unicode
Article
February 2, 2023

Unicode (inglese: Unicode) è uno standard industriale progettato per consentire ai computer di rappresentare e gestire in modo coerente tutti i caratteri del mondo. Unicode è istituito dal Consorzio Unicode. Questo standard include anche il set di caratteri ISO 10646, la codifica dei caratteri, il database delle informazioni sui caratteri e gli algoritmi per la gestione dei caratteri. Inoltre, lo scopo di Unicode è sostituire tutti i metodi di codifica dei caratteri esistenti con Unicode. Le codifiche esistenti sono limitate in scala e portata e c'è un problema in quanto non sono compatibili tra loro in un ambiente multilingue. Poiché Unicode è riuscito a unificare vari set di caratteri, Unicode è diventato ampiamente utilizzato per l'internazionalizzazione e la localizzazione di software per computer ed è supportato da tecnologie relativamente recenti come XML, Java e i più recenti sistemi operativi. Quando si esprime la pronuncia coreana in Unicode, viene utilizzata la ISO/TR 11941, una variante della romanizzazione di Yale.
Origine e sviluppo
Le origini di Unicode risalgono al 1987, quando Joe Becker di Xerox e Lee Collins e Mark Davis di Apple iniziarono a esplorare la creazione di un set di caratteri unificato. Nel 1988 Joe Becker ha pubblicato una bozza per un sistema di codifica dei caratteri di testo internazionale/multilingue, chiamato provvisoriamente Unicode.Versione
Elenco Unicode
Formato di conversione Unicode e set di caratteri internazionali
Unicode ha due schemi di mappatura: la codifica Unicode Transformation Format (UTF) e la codifica Universal Coded Character Set (UCS). La codifica UTF include: UTF-1 UTF-7 UTF-8 UTF-EBCDIC UTF-16 UTF-32Note a piè di pagina
Collegamenti esterni
Associazione Unicode Domande frequenti su Unicode UTF-8 per utenti Unix/Linux DecodeUnicode - Wiki di Unicode graphemica: dettagli del personaggioTitoli di articoli correlati
U;Nee Code
영어
컴퓨터
표준
문자 집합
문자 인코딩
유니코드 컨소시엄
국제 문자 세트
UTF-8
UTF-16
UTF-32
UTF-7
ISO 8859
부호화
UTF-7
UTF-8
UTF-16
UTF-32
UTF-EBCDIC
퓨니코드
UCS
BOM
한중일 통합 한자
유니코드 범위 목록
유니코드 등가성
문자 인코딩
컴퓨터 소프트웨어
국제화와 지역화
XML
자바
운영 체제
예일 로마자 표기법
ISO/TR 11941
제록스
애플
ISO/IEC 10646
ISBN
가타카나
구르무키 문자
구자라트 문자
그리스 문자
데바나가리
라오 문자
라틴 문자
말라얄람 문자
벵골 문자
아랍 문자
아르메니아 문자
오리야 문자
조지아 문자
주음부호
칸나다 문자
키릴 문자
타밀 문자
타이 문자
텔루구 문자
티베트 문자
한글
히라가나
히브리 문자
ISBN
한중일 통합 한자
한글
티베트 문자
ISBN
한글
티베트 문자
유로 기호
ISBN
룬 문자
몽골 문자
버마 문자
시리아 문자
신할라 문자
에티오피아 문자
오검
이 문자
점자
체로키 문자
캐나다 원주민 음절 문자
크메르 문자
타나 문자
고대 이탈리아 문자
고트 문자
데저렛 문자
한중일 통합 한자
타갈로그 문자
ISBN
키프로스 문자
선형 B 문자
오스마냐 문자
우가리트 문자
64괘
부기 문자
글라골 문자
카로슈티 문자
티피나그
콥트 문자
ISBN
쐐기 문자
응코 문자
파스파 문자
페니키아 문자
리키아 문자
올치키 문자
파이스토스 원반
마작
도미노
대문자 ß
ISBN
한중일 통합 한자
옛 한글
ISBN
플레잉카드
이모티콘
에모지
한중일 통합 한자
ISBN
ISBN
ISBN
ISBN
ISBN
한중일 통합 한자
한중일 통합 한자
체로키 소문자
ISBN
서하 문자
ISBN
헨타이가나
한중일 통합 한자
에모지
한중일 통합 한자
ISBN
한중일 통합 한자
에모지
ISBN
히라가나
가타카나
ISBN
레이와
ISBN
거란 문자
한중일 통합 한자
ISBN
라틴 문자
ISBN
아랍 문자
데바나가리 문자
한중일 통합 한자
범위 목록
다국어 기본 평면
다국어 보충 평면
상형 문자 보충 평면
상형 문자 제3 평면
특수 목적 보충 평면
U+0000
U+1000
U+2000
U+3000
U+4000
U+5000
U+6000
U+7000
U+8000
U+9000
U+A000
U+B000
U+C000
U+D000
U+E000
U+F000
U+10000
U+11000
U+12000
U+13000
U+14000
U+16000
U+17000
U+18000
U+1B000
U+1D000
U+1E000
U+1F000
U+20000
U+21000
U+22000
U+23000
U+24000
U+25000
U+26000
U+27000
U+28000
U+29000
U+2A000
U+2B000
U+2C000
U+2D000
U+2E000
U+2F000
U+30000
U+31000
U+E0000
국제 문자 세트
UTF-1
UTF-7
UTF-8
UTF-EBCDIC
UTF-16
UTF-32
위키미디어 공용