AI che fa qualcosa di utile — non un chatbot con il cilindro.
Non ti serve un altro abbonamento a ChatGPT. Ti serve AI che gestisce le cose specifiche che ti mangiano la settimana — scrivere preventivi, rispondere per la 40ª volta oggi alla stessa domanda del cliente, riassumere la storia di un cliente prima di alzare la cornetta. Integrata negli strumenti che usi già, basata sui tuoi dati, con un prezzo tale che i conti tornano davvero. Da 500 $.
L'AI ti conviene davvero per la tua attività?
Parliamo chiaro, subito.
L'AI si ripaga se…
- Fai lo stesso compito ripetutamente — scrivere preventivi, rispondere alla stessa domanda, smistare fatture — e ti mangia ore ogni settimana.
- Hai una montagna di dati (ordini, ticket, email, PDF, note di chiamata) che nessuno ha tempo di leggere, ma con risposte seppellite dentro.
- Il tuo team risponde alle stesse 10 domande dei clienti ogni giorno, e il tuo sito potrebbe risolverle se sapesse come.
- Vuoi accettare più lavoro senza assumere un'altra persona per gestire l'admin che arriva dietro.
- Hai smanettato con ChatGPT e hai pensato "deve esserci un modo per collegarlo alla mia attività vera, non a una tab separata".
Meglio aspettare se…
- Il vero problema è che non hai ancora i dati. AI senza dati è una macchina di allucinazioni — prima sistemiamo i dati, poi parliamo.
- Vuoi "un'AI" ma non sai indicare un compito preciso che dovrebbe fare. Torna con una cosa vera sul tavolo e costruiamo una buona risposta a quella.
- Il tuo team ha già risolto il processo con un foglio di calcolo e funziona bene. Risparmia i soldi — te lo dirò io durante la call.
- Stai inseguendo l'AI perché è di moda. Ai clienti non importa cosa c'è sotto — a loro importa se rispondi al telefono.
Se non sei sicuro da che parte stai, la call gratuita serve esattamente a questo.
Cosa ottiene di default ogni funzionalità AI che costruisco.
Non sono extra. È come tengo onesta l'AI.
- Ancorata ai tuoi dati reali
- Costi monitorati dal primo giorno
- Risposte in meno di 3 secondi
- Puoi vedere cosa sta facendo
- Piano di riserva se si rompe
- Approvazione umana sulle cose a rischio
- Prompt e dati sono tuoi
Come costruisco davvero le funzionalità AI.
Scelta per ogni compito. Integrata dove il lavoro si fa già. Misurata prima di essere promossa.
Lo strumento giusto per il compito
Claude per il lavoro di ragionamento, OpenAI per classificazione ed estrazione veloci, modelli più piccoli ed economici per il grunt work ad alto volume. Mescolati e abbinati, non sposati con un vendor — così quando il mese prossimo esce un modello migliore, aggiorni con un cambio di configurazione, non con una riscrittura.
Legge la tua roba prima di rispondere
L'AI pesca dai tuoi documenti, PDF, ordini, email passate dei clienti — qualunque cosa sia rilevante — e cita le fonti. È gran parte della differenza tra "utile" e "imbarazzante". Basta prezzi inventati, policy inventate, cognomi inventati.
Testata prima del rilascio
Prima che qualcosa vada live, la provo contro 30–100 esempi reali dalla tua attività e le do un punteggio. Accuratezza, costo-per-risposta, quanto spesso rifiuta. Se i numeri non superano l'asticella, la tuniamo o la chiudiamo — non paghi codice di produzione che fallisce il test.
Integrata dove già lavori
L'AI compare dentro il tuo sito, la tua app, le tue bozze email, il tuo flusso Power Automate — non come un'altra tab da ricordare. La miglior funzionalità AI è quella in cui nessuno deve fare login.
Spedisco AI ogni giorno — la mia e quella dei clienti.
Scrivo codice di produzione con Claude ogni giorno, faccio girare workflow AI multi-step dentro la mia app Rec Soccer, e ho sostituito circa 40.000 $/anno di reporting da fornitori in un ruolo precedente con automazione assistita da AI. Non sto vendendo qualcosa di cui ho letto — sto vendendo ciò che gira già sulle mie macchine.
I modelli AI che alimentano il tuo progetto.
Non sono sposato con un solo vendor. Scelgo il modello che vince sul tuo compito — accuratezza, costo e velocità — e lo sostituisco quando ne esce uno migliore. L'utilizzo è addebitato sul tuo account, non sul mio, così non paghi mai un ricarico sui token.
Claude
AnthropicIl mio default per ragionamento, contesti lunghi, scrittura attenta e uso di tool. Claude Sonnet per la maggior parte dei compiti, Opus per quelli tosti.
GPT
OpenAIClassificazione ed estrazione strutturata economiche e veloci. Il mio go-to quando ti serve "leggi questa email e tira fuori il numero fattura" su larga scala.
Gemini
GoogleFinestre di contesto enormi e forte multimodalità — leggere PDF interi, lunghe trascrizioni di riunioni, o intere codebase in un colpo. Va d'accordo con i dati di Google Workspace.
Llama
MetaModelli a peso aperto per quando devi girarlo in casa — sui tuoi server, in settori regolamentati, o per tenere i dati completamente fuori da una API di terze parti.
ElevenLabs
VoceLa miglior voce che abbia sentito — voci clonate, multilingua, agenti conversazionali. Quando l'AI deve suonare come una persona, è questa.
Sora + Nano Banana
OpenAI · GoogleVideo da Sora, immagini da Nano Banana (il Gemini 2.5 Flash Image di Google). Per asset di marketing, demo reel, creatività pubblicitarie, mockup di prodotto e post social — quando non hai una troupe o un designer a budget.
sora.com deepmind.googlePiù servizi di specialità quando se lo guadagnano — Whisper e Deepgram per lo speech-to-text, Azure OpenAI o Amazon Bedrock per contratti regolamentati o enterprise, Hugging Face per la coda lunga dei modelli open. Quello che vince sul tuo compito.
Tre modi per iniziare. Scegli la forma giusta.
Ogni pacchetto è ancorato ai tuoi dati, valutato prima del lancio e tuo da possedere. I range sono tipici — ti mando un preventivo fisso in una pagina dopo una call di discovery.
Spark
- Tempistica
- 1–2 settimane
- Scope
- Singola funzionalità
- Lingue
- Inglese
- Discovery sul compito vero — cosa c'è, cosa funziona, cosa è rotto
- Modello + prompt scelti e tunati contro 30+ esempi reali
- Output strutturato (schema JSON) così i tool a valle possono usarlo
- Collegato alla tua inbox, CRM, foglio o workflow esistente
Stack
- Tempistica
- 3–5 settimane
- Scope
- Workflow multi-step
- Lingue
- Inglese + 1
- Tutto quello dello Spark
- Pipeline RAG sui tuoi documenti, PDF, fogli, export Notion o Slack
- Vector store + strategia di chunking tunata per i tuoi contenuti
- Citazione delle fonti su ogni risposta — niente risposte da "fidati"
Suite
- Tempistica
- 6–12 settimane
- Scope
- Multi-funzionalità, integrata nell'app
- Lingue
- 2–12 lingue
- Tutto quello dello Stack
- Tool use — AI che chiama le tue API, CRM, calendario, ERP o endpoint custom
- Loop di agenti multi-step con retry, fallback e passaggi di approvazione umana
- Multimodale quando si ripaga — voce (STT/TTS), immagini, PDF
Extra, quando se li guadagnano.
Aggiungili a qualsiasi pacchetto, o più avanti man mano che il caso d'uso cresce.
Corpus RAG / vector store
800–2.500 $Ingestione, chunking, embedding e indicizzazione dei tuoi documenti — più un job di re-ingest per quando i contenuti cambiano. Firestore vector, Pinecone o pgvector.
Voce (STT + TTS)
1.000–3.000 $Whisper o Deepgram per lo speech-to-text, ElevenLabs o voci OpenAI per le risposte. Telefono, browser o in-app.
Visione / comprensione immagini
800–2.000 $Legge ricevute, documenti, moduli, screenshot, foto di prodotto. Estrae dati strutturati o risponde a domande su cosa c'è nell'immagine.
Eval harness
600–1.500 $Un set di test, una rubrica di scoring e un runner a un comando così puoi vedere l'impatto di ogni cambio di prompt o modello prima di rilasciarlo.
UI di versioning dei prompt
1.000–2.500 $Un piccolo pannello admin dove puoi modificare i prompt, fare A/B test sulle varianti e rollback — senza ridistribuire l'app.
Retainer AI mensile
300–1.000 $ / meseTuning dei prompt, monitoraggio dei costi, upgrade dei modelli quando ne escono di nuovi, e indagini "perché l'ha fatto?" — su chiamata.
Come va davvero un progetto AI.
Niente demo con la bacchetta magica. Una call, un pilota scoped, misurazione vera, poi produzione — o uno stop onesto.
Call di discovery da 20 minuti
Ti chiedo quale compito vuoi sistemare, chi lo fa oggi, come appare "buono" e dove vivono i dati. Se l'AI non è lo strumento giusto lo dico — a volte la risposta è un flusso Power Automate o una view SQL.
Pilota scoped
Entro 48 ore hai un preventivo fisso — una funzionalità, un modello, una metrica di successo. Costruiamo contro 30–100 esempi reali dai tuoi dati, non inventati.
Misura con le eval
Prima che qualcosa vada live le diamo un punteggio. Accuratezza, costo per chiamata, latenza p95, tasso di rifiuto. Se i numeri non superano l'asticella, tuniamo, cambiamo modello o chiudiamo — non paghi codice di produzione che fallisce il test.
Rilascia e itera
Live nella tua app, monitorata in tempo reale, con log che puoi vedere. La maggior parte dei clienti mi tiene su un piccolo retainer per tunare i prompt e cavalcare gli upgrade di modello; alcuni no. Entrambe le cose vanno bene.
Le cose che di solito chiedono.
Meno delle demo che hai visto, ma mai zero — per questo ogni build è ancorato ai tuoi dati con retrieval, validato con output strutturati e misurato contro esempi reali prima di andare live. Per i compiti ad alto rischio aggiungo un passaggio di approvazione umana. La risposta onesta è: l'AI sbaglia, e l'ingegneria sta nel beccarlo prima dell'utente.
La tua, addebitata direttamente sul tuo account OpenAI / Anthropic. Non rivendo token né ci metto un ricarico sull'uso. Vedi esattamente quanto costa ogni chiamata, e se ci separiamo chiavi (e spesa) restano con te.
Per una funzionalità Spark, spesso 5–50 $/mese in chiamate API. Per un assistente Stack con RAG, tipicamente 30–300 $/mese a seconda del traffico. Con il prompt caching attivo, le query ripetute possono calare del 50–80%. Ti mostro la dashboard dal primo giorno, così non ci sono sorprese.
OpenAI e Anthropic non addestrano contrattualmente sul traffico API di default. I tuoi dati vivono nei tuoi account (Firestore, Pinecone, S3 — qualunque tu usi), le chiamate AI partono lato server dalla tua infrastruttura, e nulla viene loggato in un SaaS di terze parti a meno che tu non lo chieda. Per lavori regolamentati posso usare anche Azure OpenAI o Bedrock per coperture contrattuali aggiuntive.
Tutti, scelti per compito. Claude (Sonnet/Opus) è il mio default per ragionamento, scrittura attenta e uso di tool. OpenAI GPT è ottimo per classificazione ed estrazione strutturata economiche e veloci su volume. Google Gemini vince quando il contesto è enorme — PDF interi, lunghe trascrizioni di riunioni, intere codebase — o quando i dati già vivono in Google Workspace. Meta Llama è la scelta quando devi girare il modello sui tuoi server, in un settore regolamentato, o per tenere i dati completamente fuori da una API di terze parti. Per la voce mi appoggio a ElevenLabs; per video e immagini, Sora e Nano Banana (il Gemini 2.5 Flash Image di Google). Stessa codebase, cambio con una configurazione — così quando esce il prossimo modello, aggiorni senza una riscrittura.
Dimmi il compito che sei stanco di fare. Ti dico io se l'AI è la soluzione giusta.
Le prime call durano circa 20 minuti. Esci con un piano più chiaro — un pilota scoped, un consiglio o un onesto "questo è un problema da foglio di calcolo, non da AI". Succedono tutti e tre.