ISO 639

Article

August 17, 2022

ISO 639 è uno standard internazionale di tipologia linguistica, emesso dall'International Organization for Standardization (ISO), per la codifica delle lingue in codici a due e tre lettere. La ISO 639 esiste da molto tempo in due versioni di base, ISO 639-1 e ISO 639-2. Una terza versione, ISO 639-3, è stata approvata dall'ISO il 5 febbraio 2007. In tutta la ISO 639, l'ortografia preferita dei codici delle lingue è completamente in minuscolo, ma si afferma espressamente che nei sistemi di elaborazione la distinzione tra minuscolo e maiuscolo non è obbligatoria. Il codice della lingua non deve essere confuso con i codici dei paesi, come ISO 3166-1. Ad esempio, be è il codice della lingua per il bielorusso (Bielorussia), ma BE è il codice del paese per il Belgio.

ISO 639-1

La variante più vecchia ISO 639-1 specifica codici di lingua a due lettere per un numero abbastanza limitato di lingue comunemente usate. Per distinguere visivamente tra i codici lingua e paese, specialmente quando i codici paese e lingua sono la stessa combinazione di lettere, si consiglia di scrivere i codici lingua ISO 639 in minuscolo e i codici paese ISO 3166 in maiuscolo. Le lingue che hanno un codice ISO 639-1, per definizione, hanno anche un codice ISO 639-2. La conversione è facile tramite la ricerca sul sito SIL.

ISO 639-2

La ISO 639-2 è stata creata principalmente riunendo i codici linguistici della ISO 639-1 con i codici linguistici MARC, una raccolta di codici a tre lettere sviluppata per applicazioni bibliografiche che era già stata resa standard nel 1987 come ANSI Z39.53. Tuttavia, a causa delle diverse preferenze e della storia di entrambi gli standard, ci sono sottili differenze nelle "lingue" incluse e nei codici utilizzati. Per compensare in qualche modo ciò, la ISO 639-2 a volte contiene due codici per una lingua, suddivisi in due sovversioni dello standard. La versione ISO 639-2/B è utilizzata per la bibliografia e la ISO 639-2/T per la terminologia. Sebbene siano in gran parte uguali, potrebbero esserci differenze tra loro. Attualmente, i codici /B e /T sono diversi per 23 lingue, incluso l'olandese (/Tnld, /Bdut). ISO 639-2/B (Bibliografia) si basa sulla preferenza MARC: preferenza dei paesi che utilizzano la lingua codici esistenti in banche dati bibliografiche nazionali e internazionali il nome della lingua nella lingua stessa o in inglese ISO 639-2/T (Terminologia) si basa sulla preferenza ISO: il nome della lingua nella lingua stessa preferenza dei paesi che utilizzano la lingua

ISO 639-3

ISO 639-1 e -2 hanno avuto origine principalmente da organizzazioni tecniche e non coprono tutte le lingue conosciute - anche la ISO 639-2 inizialmente includeva solo circa 400 lingue. Istituzioni specializzate in linguistica come SIL International in particolare avevano le proprie codifiche con migliaia di "lingue" (come i codici SIL dell'Ethnologue), che non corrispondevano affatto alla ISO 639. Con ISO 639-3, questi mondi sono ora riuniti nel tentativo di accogliere tutte le "lingue" conosciute in un sistema di codifica con tre lettere per lingua, comprese anche le codifiche per le lingue storiche/morte e costruite. I codici ISO 639-2 sono stati fusi con i codici dell'Ethnologue (più di 6900 lingue viventi) e della Linguist List (per le lingue storiche/morte e costruite e simili). SIL è stata designata come autorità di registrazione per il progetto.

RFC 3066BIS

Da allora RFC 3066 è stato sostituito da RFC 3066BIS. Tuttavia, si basa ancora su ISO 639-1 e -2 e segue in gran parte le stesse regole della vecchia RFC 3066. Uno sviluppo importante è che IANA e ISO hanno concordato che la ISO 639 sarà ulteriormente sviluppata in modo tale che la RFC già esistente Le codifiche del linguaggio basate su 3066bis non saranno più non valide e che IANA integra anche nei commenti RFC 3066bis per escludere o accogliere la creazione di nuovi codici ISO 639. Quindi lo standard è diventato più robusto. È sorprendente che la versione attuale si basi ancora sul numero limitato di IA