Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Apple AI: modelli linguistici più veloci, modulari e multilingue

Apple presenta il suo lavoro sui modelli AI avanzati: architettura modulare, risposta rapida, maggiore supporto multilingue e privacy.
Apple AI: modelli linguistici più veloci, modulari e multilingue
Apple presenta il suo lavoro sui modelli AI avanzati: architettura modulare, risposta rapida, maggiore supporto multilingue e privacy.
Link copiato negli appunti

La strategia sull'AI di Apple si sviluppa su due livelli fortemente integrati e complementari. Sul versante locale, i nuovi modelli linguistici sono stati completamente riprogettati: la suddivisione in due blocchi distinti, con quasi due terzi dei livelli transformer concentrati nel primo e la parte rimanente nel secondo (priva delle proiezioni key e value), ha permesso di ottenere risultati notevoli.

Questa architettura, infatti, consente una riduzione del consumo di memoria del 37,5%, una maggiore velocità di risposta e il mantenimento della qualità delle risposte generate. L’ottimizzazione per i dispositivi mobili non è più un semplice adattamento, ma diventa una caratteristica strutturale, in grado di garantire performance elevate anche su hardware meno performante.

Sul fronte cloud

Sul fronte cloud, la vera svolta arriva con l’introduzione dell’architettura Parallel Track Mixture of Experts (PT-MoE). A differenza dei tradizionali sistemi monolitici, questa soluzione suddivide il carico computazionale tra diverse sottoreti specializzate, attivate solo quando richiesto dal tipo di input.

Si tratta di un modello che può essere paragonato a una squadra di consulenti esperti: se l’utente pone una domanda relativa alla cucina, solo gli “esperti” di quell’ambito vengono coinvolti nell’elaborazione. Questo approccio permette di ottimizzare l’uso delle risorse, aumentare la precisione delle risposte e ridurre i tempi di latenza, portando la scalabilità dei sistemi AI a un nuovo livello.

Parallel Track Transforme

Il cuore tecnologico di questa architettura è rappresentato dal Parallel Track Transformer, che si distingue dalle architetture convenzionali per la capacità di elaborare i token su percorsi paralleli.

Questi percorsi, sincronizzati in modo strategico, alternano livelli transformer standard a strati di “esperti”, selezionati dinamicamente in base alla natura dei dati in ingresso. In questo modo si evita la formazione di colli di bottiglia e si garantisce un’efficienza senza precedenti, soprattutto quando si gestiscono compiti complessi e multiformi.

Potenziamento delle capacità multilingue

Un altro aspetto di grande rilievo è il significativo potenziamento delle capacità multilingue dei nuovi modelli. Apple ha quasi quadruplicato la percentuale di dati multilingue utilizzati durante la fase di training, passando dall’8% al 30%.

Parallelamente, il vocabolario di token è stato ampliato del 50%, consentendo ai modelli di comprendere e generare risposte sempre più naturali e articolate in lingue diverse dall’inglese. Questo rappresenta un passo fondamentale verso una vera inclusività digitale, abbattendo le barriere linguistiche e rendendo l’intelligenza artificiale più accessibile a livello globale.

Raccolta dei dati tramite Applebot

La raccolta dei dati per l’addestramento dei modelli avviene principalmente tramite Applebot, il crawler proprietario che si occupa di reperire informazioni pubbliche rispettando rigorosamente le direttive dei siti web.

A questi dati si aggiungono contenuti concessi in licenza da editori selezionati e dati sintetici generati da modelli più piccoli, particolarmente efficaci per specifici ambiti come la matematica e la programmazione. La componente multimodale è arricchita da oltre 10 miliardi di coppie immagine-didascalia, che consentono una comprensione più profonda e sfaccettata delle informazioni visive.

Tema privacy

L’infrastruttura Private Cloud Compute rappresenta la risposta di Apple alle crescenti esigenze di protezione dei dati personali: progettata specificamente per garantire la massima riservatezza, questa soluzione consente di elaborare le informazioni degli utenti nel cloud senza comprometterne la sicurezza.

Se vuoi aggiornamenti su AI inserisci la tua email nel box qui sotto:

Compilando il presente form acconsento a ricevere le informazioni relative ai servizi di cui alla presente pagina ai sensi dell'informativa sulla privacy.

Ti consigliamo anche