Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Unicode 9.0: 7.500 nuovi caratteri, 72 emoji e 19 simboli per il 4K

Link copiato negli appunti

Unicode 9.0, nuova versione del noto sistema per la codifica dei caratteri, è stato ufficializzato dal consorzio che si occupa di implementarne le specifiche; con questa nuova major release vengono aggiunti 7.500 nuovi caratteri per un totale di oltre 128 mila unità tra le quali anche simboli, ideogrammi ed entità alfabetiche. 72 i nuovi emoji ora inclusi nello standard, ben 19 i simboli dedicati al 4K e ai contenuti televisivi ad alta definizione.

Unicode prevede la definizione di un identificativo specifico associato a ciascun simbolo supportato, quando vengono realizzate le specifiche per questo sistema uno degli obbiettivi principali è infatti quello di eliminare le ambiguità, ciò consente di scongiurare le problematiche derivanti dall'omografia, cioè l'uguaglianza nella grafia di due parole che hanno significato e etimologia differenti.

Una volta standardizzati, i caratteri Unicode hanno la peculiarità di funzionare indipendentemente dalla piattaforma in cui vengono utilizzati, dalle applicazioni che li supportano e dai linguaggi con cui esse vengono sviluppate. Il fatto che al consorzio Unicode partecipino alcune delle più importanti aziende High Tech (Redmond, Cupertino, Oracle..) permette un'adozione sufficientemente rapida delle nuove release; già comunicata l'integrazione con Android N e iOS 10, mentre quella in Windows 10 dovrebbe arrivare con l'imminente Anniversary Update.

Per il rilascio di Unicode 9.0 sono stati operati degli interventi finalizzati ad offrire un supporto più completo a lingue in alcuni casi tuttora utilizzate ma meno diffuse, come per esempio il Bravanese, che è un dialetto della lingua bantu Swahili ancora parlato in alcune zone della Somalia, il Bhasa, lingua nepalese, la lingua degli Osage, una popolazione composta da nativi Americani, la lingua Fula dell'Africa occidentale (e alcune altre lingue africane), il Warsh, una delle ortografie arabe, e la scrittura tanguta, sistema logografico estinto ma del quale esistono testimonianze consultabili.

Tra le specifiche Unicode ora aggiornate vi sono UTS #10, l'Unicode Collation Algorith che riguarda l'ordinamento del testo Unicode, UTS #39 per l'Unicode Security Mechanisms che limita i rischi derivanti dall'Unicode spoofing, e UTS #46 per l'Unicode IDNA Compatibility Processing relativo all'elaborazione delle URL non-ASCII.

Via The Unicode Consortium Blog

Ti consigliamo anche