Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Linux: creiamo immagini con DALL·E sul nostro server

Generiamo immagini con l'AI di DALL·E sul nostro server Linux sfruttando le API messe a disposizione da OpenAI
Generiamo immagini con l'AI di DALL·E sul nostro server Linux sfruttando le API messe a disposizione da OpenAI
Link copiato negli appunti

Le intelligenze artificiali e tutte le tecnologie a loro legate sono molto maturate in questi anni, permettendo di automatizzare una serie di operazioni che prima richiedevano un intenso, e spesso ripetitivo, lavoro manuale da parte di un operatore umano. Le AI (Artificial Intelligence) si apprestano dunque a diventare uno strumento per migliorare e rendere più snello il workflow di migliaia di figure professionali.

Non si tratta quindi di una sostituzione completa dell'uomo. Le AI saranno sempre più integrate in una serie di tool ed utility in modo tale da rendere il nostro lavoro più efficiente e produttivo.

Nella guida di oggi vogliamo parlarvi di una AI e di come sia possibile realizzare delle immagini direttamente dal proprio server Linux. La AI a cui ci affideremo si chiama DALL·E, sviluppata dal team di coder OpenAI.

Cosa è DALL·E

DALL·E è sostanzialmente una AI sviluppata per generare immagini partendo da una descrizione testuale. La sua implementazione all'interno di un server Linux non è a costo zero ma può rilevarsi utile in ambiti aziendali dove è necessario generale al volo degli asset da utilizzare all'interno di un progetto grafico, magari per una campagna di marketing.

Le applicazioni di DALL·E sono quindi molteplici. Inoltre l'utente non deve necessariamente utilizzarlo con una configurazione hardware molto prestante, tramite GPU potenti e costose, gran parte delle operazioni vengono eseguite e gestite tramite un set apposito di API sul Cloud di OpenAI.

È quindi possibile sfruttare DALL·E anche su una piccola board ARM, come Raspberry Pi, o su di un NAS.

Ottenere la OpenAI API Key per usare DALL·E

Prima di iniziare a configurare il nostro server Linux per DALL·E è necessario ottenere la OpenAI API Key cosi da poter interagire con il Cloud di OpenAI e accedere alla generazione delle immagini. Senza questa key la nostra configurazione non funzionerebbe.

Prima di tutto registratevi sul sito di OpenAI. Dopo il primo login con le credenziali appena generate avremo accesso alla sezione del portale chiamata "API". Clicchiamo su di essa e poi spostiamoci nella sezione denominata "API keys", rappresentata dall'icona stilizzata di un lucchetto, presente nella sidebar a sinistra.

api key openai

Adesso cliccate sul tasto "Create a new Secret key", date un nome alla nuova key e poi pigiate sul tasto verde "Create secret key". Copiate la stringa di testo appena generata in un blocco note, vi servirà successivamente per completare lo script necessario alla creazione delle immagini con DALL·E.

OpenAI AP Ikey

Configurare il proprio server Linux per generare immagini con DALL·E

Adesso siamo pronti per configurare il nostro server Linux in modo tale che generi delle immagini sfruttando l'algoritmo di intelligenza artificiale di DALL·E. In questa guida utilizzeremo Debian ma ovviamente gli step successivi sono applicabili anche ad altre distribuzioni.

Dunque verifichiamo di avere tutti i pacchetti aggiornati alle ultime release tramite la CLI del package manager APT:

sudo apt update && sudo apt upgrade -y

In questo caso con l'opzione -y abbiamo indicato al sistema di rispondere affermativamente a tutte le domande del gestore di pacchetti. Ovviamente facciamo sempre attenzione ai pacchetti aggiornati in questo modo. Dopo l'upgrade, infatti, potrebbe venire disinstallato qualche pacchetto, perché deprecato, utile al nostro workflow.

Adesso procediamo all'installazione dei pacchetti del linguaggio Python e del gestore di pacchetti Pip:

sudo apt install python3 python3-venv python3-pip

Impostazione del Python Virtual Environment

Ora dobbiamo configurare il nostro python virtual environment per lavorare con DALL·E , quindi torniamo in bash e generiamo una directory apposita:

mkdir ~/dalle

Spostiamoci al suo interno:

cd ~/dalle

e generiamo il python virtual environment con il comando:

python3 -m venv env

Adesso, restando sempre all'interno della directory dalle, indichiamo alla shell di utilizzare tale virtual environment:

source env/bin/activate

Procediamo andando ad installare le librerie Python create da OpenAI per DALL·E:

python3 -m pip install openai

Creare uno script python per generare delle immagini con DALL·E sul nostro server Linux

A questo punto siamo pronti per generare uno script Python che genera l'immagine desiderata:

nano generate.py

Ecco uno script d'esempio con cui popolare il file:

from openai import OpenAI
import urllib.request
client = OpenAI(
    api_key='LANOSTRAKEYGENERATAPRIMA'
)
generation_prompt = "A dark cat"
response = client.images.generate(
    model="dall-e-3",
    prompt=generation_prompt,
    size="1024x1024",
    quality="standard",
    n=1
)
image_url = response.data[0].url
urllib.request.urlretrieve(image_url, "gattonero.png")

Salviamo le modifiche con CTRL+O e chiudiamo l'editor di testo nano con CTRL+X. Ora analizziamo questo script. Partiamo dalla prima parte:

from openai import OpenAI
import urllib.request

Queste prime due righe indicano al sistema quali librerie utilizzare. Mentre la parte successiva:

client = OpenAI(
    api_key='LANOSTRAKEYGENERATAPRIMA'
)

serve ad impostare la OpenAI API Key generata in precedenza. Successivamente troviamo la parte chiamata generation_prompt:

generation_prompt="A dark cat"

In questo caso abbiamo scelto di  generare l'immagine di un gatto nero. Dopo aver scelto l'immagine da creare abbiamo anche impostato una serie di specifiche, ovvero il tipo di modello da usare, in questo caso DALL·E 3, la risoluzione e la qualità dell'immagine:

response = client.images.generate(
    model="dall-e-3",
    prompt=generation_prompt,
    size="1024x1024",
    quality="standard",
    n=1
)

La parte finale dello script si occupa di generare l'URL dove reperire l'immagine che, ricordiamo, viene elaborata nei sistemi Cloud di OpenAI, ed il nome con cui salvare il file:

urllib.request.urlretrieve(image_url, "gattonero.png")

Ora che abbiamo capito come funziona lo script generato possiamo eseguirlo sempre dal terminale:

python3 generate.py

Dopo qualche minuto si può dunque trovare dentro la directory ~/dalle un'immagine in formato PNG chiamata gattonero.

Come potrete notare, questo script è davvero semplice da comprendere e da utilizzare. In base alle vostre necessità potete generare l'immagine che preferite con le caratteristiche desiderate.

Questa guida dimostra come sia semplice utilizzare DALL·E ed implementare tale tecnologia all'interno del nostro workflow senza dover studiare nel dettaglio il suo funzionamento.

Ti consigliamo anche