Dinobase è una piattaforma dati pensata per workflow agent-first, con l'obiettivo di risolvere un limite che risulta essere sempre più evidente negli stack basati sugli agenti AI: la difficoltà di interrogare fonti eterogenee come se fossero un unico sistema coerente. Il progetto viene presentato come una sorta di layer in grado di sincronizzare oltre 100 sorgenti tra API SaaS, database, file e server MCP, annotando i dati e rendendoli interrogabili via SQL dagli agenti.
L'idea di fondo è quella di evitare che un agente debba concatenare chiamate isolate a singoli connettori, ricevendo JSON paginati e poco collegabili tra loro, per offrirgli invece una vista relazionale unificata.
Architettura e modello operativo di Dinobase
Un aspetto interessante di questa proposta è il framing del problema. Si parte infatti dalla constatazione che molte difficoltà attribuite ai modelli dipendano in realtà dall'architettura di accesso ai dati. Una domanda business che incrocia CRM, billing e supporto, per esempio, richiede join, contesto semantico sui campi e una rappresentazione compatta dei risultati.
Proprio per questa ragione Dinobase converte ogni connettore in uno schema interrogabile e lascia all'agente il compito di produrre una singola query SQL cross-source. Il risultato è un approccio più vicino a un motore federato per agenti che a una semplice collezione di integrazioni.
Per il quick start si ha a disposizione una CLI installabile via script, uv, pip o pipx.
# installazione raccomandata
curl -fsSL https://dinobase.ai/install.sh | bash
# con uv
uv tool install dinobase
# via pip
pip install dinobase
# o in alternativa pipx
pipx install dinobase
Una volta installato, Dinobase consente di collegare servizi come Stripe, HubSpot, Linear, file Parquet, database PostgreSQL e persino server MCP
In pratica, un server MCP read-only può essere scoperto automaticamente e tradotto in tabelle su cui eseguire query standard, abbassando la complessità per gli agenti che devono correlare informazioni distribuite.
Si ha inoltre a disposizione un'integrazione esplicita con diversi ambienti agentici. La CLI può configurare Dinobase per Claude Code, Claude Desktop, Cursor e Codex, mentre la modalità server permette l'esposizione via MCP su stdio. Invece di imporre una nuova interfaccia utente, il progetto tenta di inserirsi nei flussi già usati dagli sviluppatori, scrivendo istruzioni e configurazioni necessarie per consentire agli agenti di usare comandi come info, describe e query.
Reverse ETL, semantic layer e stack tecnico
Uno dei punti di forza del progetto Dinobase è il supporto alla scrittura sui sistemi upstream tramite mutazioni SQL con meccanismo preview/confirm. In altri termini, l'agente può proporre un aggiornamento verso un'API esterna, ma l'esecuzione effettiva avviene solo dopo conferma. È una scelta importante per la governance e la sicurezza, perché riduce il rischio di azioni irreversibili generate automaticamente.
Accanto a questo compare anche un layer semantico opzionale. Dopo ogni sync, Dinobase può annotare tabelle e colonne, segnalare PII e costruire grafi di relazione, così da fornire agli agenti più contesto durante la fase di reasoning sui dati.
Il progetto si basa sul linguaggi Python richiede almeno Python 3.10, adotta licenza MIT e necessita di dipendenze come DuckDB, dlt e mcp per via di una base tecnica orientata alla federazione, alla sincronizzazione e all'interoperabilità.
Nel README vengono citati anche dei benchmark interni su 75 domande e 11 LLM. Dinobase riporta il 91% di accuratezza contro il 35% di approcci per-connettore, con latenza media di 34 secondi contro 106 e un costo per risposta corretta sensibilmente inferiore.
Si tratta in ogni caso di dati da leggere con prudenza. Descrivono però molto bene la tesi del progetto: per gli agenti, il vero vantaggio potrebbe non nascere dal solo modello di riferimento ma dal modo in cui i dati vengono organizzati, descritti e resi interrogabili.