Risorse · AI per le imprese

Glossario AI. 34 termini, zero gergo.

L'AI aziendale spiegata in modo chiaro: cosa significa, perché conta per la tua impresa. Aggiornato a giugno 2026.

Fondamenta AI

Cos'è un LLM (Large Language Model)?

Un LLM è un modello di intelligenza artificiale addestrato su grandi quantità di testo per comprendere e generare linguaggio naturale. È la tecnologia alla base di strumenti come ChatGPT e dei sistemi AI aziendali: riceve una richiesta in linguaggio comune e produce una risposta coerente.

Per un'impresa la differenza la fa dove gira il modello: un LLM open source eseguito on-premise tiene dati e prompt dentro il perimetro aziendale, un servizio cloud li porta fuori. Non serve il modello più grande sul mercato: per rispondere su documenti interni, contratti o procedure, un modello medio ben istruito sul contesto giusto dà risposte più utili di un colosso generico, a una frazione del costo.

Cos'è un token nell'intelligenza artificiale?

Il token è l'unità minima di testo che un modello di linguaggio elabora: una parola breve, una parte di parola o un segno di punteggiatura. Ogni richiesta e ogni risposta vengono scomposte in token, e la loro quantità misura quanto testo il modello legge e produce.

Il token è anche l'unità di fatturazione dei servizi AI in cloud: ogni documento analizzato e ogni risposta generata si pagano a consumo, e i costi crescono con l'uso. Per una PMI che elabora migliaia di pagine al mese la bolletta diventa difficile da prevedere. Un'infrastruttura on-premise ribalta la logica: l'inferenza gira su hardware proprio, senza contatori a token, con un costo noto in anticipo e indipendente dai volumi.

Cosa sono il prompt e il prompt engineering?

Il prompt è l'istruzione in linguaggio naturale che si dà a un modello AI: una domanda, un comando, un documento da analizzare. Il prompt engineering è la disciplina di scrivere prompt efficaci, strutturando richieste e contesto perché il modello produca risposte precise, ripetibili e nel formato desiderato.

Nei prompt aziendali finiscono dati tutt'altro che banali: contratti, anagrafiche clienti, bilanci, cartelle cliniche. La domanda che ogni impresa dovrebbe farsi è dove finiscono quei prompt: con un servizio cloud escono dal perimetro aziendale e possono essere conservati dal fornitore, anche all'estero. Con un sistema on-premise restano su server propri, una condizione concreta di sovranità del dato e un punto chiave per la conformità GDPR.

Cos'è l'inferenza nell'intelligenza artificiale?

L'inferenza è l'esecuzione di un modello AI già addestrato per ottenere risposte: ogni domanda posta a un sistema di intelligenza artificiale è un'operazione di inferenza. Si distingue dall'addestramento, che crea il modello una volta sola, mentre l'inferenza avviene ogni giorno, a ogni utilizzo.

L'inferenza è il costo operativo ricorrente dell'AI: l'addestramento lo paga chi sviluppa il modello, l'inferenza la paga l'azienda che lo usa, ogni giorno. Nei servizi cloud si traduce in fatturazione a token, che cresce con l'adozione; su infrastruttura propria diventa un investimento in GPU dimensionate sul carico reale. Per una PMI la scelta tra i due modelli decide se il costo dell'AI è variabile e imprevedibile oppure fisso e pianificabile.

Scopri l'infrastruttura TuxWeb →

Cos'è il fine-tuning?

Il fine-tuning è il processo che specializza un modello AI già addestrato su dati specifici di un'azienda o di un settore: terminologia interna, stile dei documenti, casi reali. Il risultato è un modello che risponde con maggiore precisione nel dominio per cui è stato raffinato.

Il fine-tuning richiede dati preparati con cura, competenze specialistiche e ore di calcolo: per molte imprese è un investimento sproporzionato rispetto al bisogno reale. Nella maggior parte dei casi aziendali — rispondere su documenti, procedure, contratti — esiste un'alternativa più leggera: il RAG, che non modifica il modello ma gli fornisce i documenti giusti al momento della domanda. Il fine-tuning resta la scelta giusta quando serve uno stile o un linguaggio di settore molto specifico.

Leggi: AI privata per le aziende italiane →

Cos'è un embedding?

L'embedding è la rappresentazione di un testo come vettore numerico che ne cattura il significato: frasi con senso simile producono vettori vicini, anche se usano parole diverse. È il meccanismo che permette a un sistema AI di confrontare contenuti per significato e non per semplice corrispondenza di parole.

Gli embedding sono le fondamenta della ricerca semantica: chi cerca «recesso anticipato» trova anche il contratto che parla di «risoluzione prima della scadenza». Per un'azienda significa ritrovare informazioni nei propri archivi senza dover indovinare le parole esatte usate anni prima. I vettori vengono conservati in un database vettoriale, che può girare interamente su server aziendali: i documenti non devono uscire dal perimetro per diventare ricercabili.

Cos'è la finestra di contesto?

La finestra di contesto è la quantità massima di testo che un modello AI può considerare in una singola elaborazione: comprende la domanda, i documenti forniti e la conversazione precedente. Si misura in token e ciò che ne resta fuori semplicemente non esiste per il modello.

Per le imprese è un limite molto concreto: un contratto quadro, un bilancio o un manuale tecnico superano facilmente la finestra disponibile, e ampliarla fa crescere costi e tempi di risposta. La soluzione non è un modello più grande, ma una preparazione intelligente dei documenti: il chunking li spezza in porzioni indicizzabili e il RAG porta nella finestra solo i passaggi pertinenti alla domanda, invece dell'intero archivio.

Cos'è un'allucinazione nell'intelligenza artificiale?

L'allucinazione è una risposta inventata ma plausibile prodotta da un modello AI: dati, citazioni o riferimenti che non esistono, presentati con lo stesso tono sicuro delle informazioni corrette. Nasce dal funzionamento statistico del modello, che completa il testo nel modo più probabile, non nel più vero.

In azienda un'allucinazione non è un difetto curioso: è un preventivo sbagliato, una clausola contrattuale inesistente, una norma citata male. La mitigazione più efficace non è sperare in un modello migliore, ma ancorare le risposte ai documenti aziendali con il RAG e imporre la citazione delle fonti: ogni affermazione rimanda al documento da cui proviene, così l'utente può verificare invece di fidarsi alla cieca.

Leggi: perché l'AI deve citare le fonti →

RAG e conoscenza aziendale

Cos'è il RAG (Retrieval-Augmented Generation)?

Il RAG (Retrieval-Augmented Generation) è la tecnica che fa cercare al modello AI i documenti aziendali pertinenti prima di rispondere, ancorando ogni risposta a fonti reali e citabili. Invece di affidarsi solo a ciò che ha memorizzato in addestramento, il modello legge i passaggi recuperati e risponde sulla base di quelli.

Per un'impresa il RAG è la via più diretta per avere un'AI che conosce contratti, manuali e procedure interne senza addestrare nulla: basta indicizzare la base di conoscenza e il sistema risponde su quei contenuti, aggiornandosi quando i documenti cambiano. Eseguito on-premise, l'intero ciclo — indicizzazione, ricerca, risposta — avviene su server aziendali: i documenti non escono mai dal perimetro. È l'approccio di Celeris, il RAG privato di TuxWeb.

Scopri Celeris, il RAG on-premise di TuxWeb →

Cos'è una base di conoscenza (knowledge base)?

La base di conoscenza è l'insieme organizzato dei documenti aziendali resi ricercabili da un sistema AI: manuali, contratti, procedure, wiki interne, verbali. È il corpus su cui un sistema RAG costruisce le risposte, e la sua qualità determina direttamente la qualità di ciò che l'AI restituisce.

Ogni azienda possiede già una base di conoscenza, solo che è dispersa: cartelle condivise, gestionali, caselle email, archivi cartacei digitalizzati. Il valore di un sistema RAG dipende da quanto bene quel patrimonio viene raccolto e indicizzato: documenti obsoleti o duplicati producono risposte obsolete o contraddittorie. Per questo un progetto AI serio parte dalla governance documentale, non dal modello. E se la base contiene dati sensibili, l'accesso va filtrato con gli stessi permessi dei sistemi di origine.

Scopri Celeris →

Cos'è la citazione delle fonti (grounding)?

La citazione delle fonti, o grounding, è la pratica per cui ogni risposta di un sistema AI indica il documento, la pagina o il passaggio da cui proviene l'informazione. Trasforma la risposta da affermazione da prendere sulla fiducia a contenuto verificabile in pochi secondi dall'utente.

È l'antidoto più concreto alle allucinazioni: se il sistema deve indicare la fonte, una risposta inventata si smaschera subito, perché la fonte non c'è o non dice quello che la risposta afferma. Per un'impresa la verificabilità è ciò che rende l'AI utilizzabile in processi reali — offerte, pareri, assistenza clienti — dove un errore costa. Un RAG ben costruito cita per impostazione predefinita: la risposta senza fonte dovrebbe essere l'eccezione che insospettisce, non la norma.

Leggi: perché l'AI deve citare le fonti →

Cos'è il chunking?

Il chunking è la suddivisione dei documenti in blocchi di testo più piccoli, i chunk, che vengono indicizzati e recuperati singolarmente da un sistema RAG. Ogni blocco deve restare comprensibile da solo: è il chunk, non l'intero documento, l'unità che il sistema ritrova e passa al modello.

Sembra un dettaglio tecnico, ma decide la precisione del RAG: chunk troppo grandi diluiscono l'informazione e sprecano finestra di contesto, chunk troppo piccoli spezzano clausole e tabelle a metà, producendo risposte monche. Documenti aziendali reali — contratti con rimandi, manuali con schemi, bilanci con note — richiedono strategie di suddivisione studiate sul formato, non un taglio meccanico ogni tot caratteri. Per ogni chunk viene calcolato un embedding: la qualità del taglio determina la qualità di ciò che la ricerca ritroverà.

Cos'è un database vettoriale?

Un database vettoriale è un archivio specializzato nel conservare e confrontare embedding, le rappresentazioni numeriche del significato dei testi. Data una domanda, trova in millisecondi i contenuti con il significato più vicino, anche tra milioni di blocchi: è il motore di ricerca interno di un sistema RAG.

È il componente infrastrutturale del RAG: ogni blocco di documento, trasformato in embedding, finisce qui, e ogni domanda lo interroga. Il punto spesso trascurato è che il database vettoriale contiene di fatto una copia della conoscenza aziendale: affidarlo a un servizio cloud significa replicare contratti e documenti riservati fuori dal perimetro. Le alternative open source mature permettono di farlo girare interamente su server aziendali, con prestazioni adeguate ai volumi tipici di una PMI.

Cos'è la ricerca semantica?

La ricerca semantica trova i contenuti in base al significato della richiesta, non alla corrispondenza esatta delle parole. Chi cerca «ferie non godute» trova anche il documento che parla di «residuo ferie»: il sistema confronta concetti, tramite embedding, invece di contare quante parole coincidono.

La ricerca per parole chiave funziona solo se si conoscono i termini esatti usati anni prima da chi ha scritto il documento — condizione rara negli archivi aziendali, dove la stessa cosa si chiama in tre modi diversi a seconda dell'ufficio. La ricerca semantica, basata sugli embedding, supera il problema confrontando i significati. È il passaggio che rende davvero interrogabile la base di conoscenza: si chiede in linguaggio naturale e si ottiene il documento giusto, comunque sia stato scritto.

Cosa sono le ACL e i permessi nei sistemi RAG?

Le ACL (Access Control List) sono le regole che stabiliscono chi può accedere a quali documenti. In un sistema RAG devono valere anche per le risposte dell'AI: chi non ha il permesso di aprire un file non deve poterne leggere il contenuto attraverso una risposta generata.

È il rischio più sottovalutato dei progetti RAG: indicizzare tutto in un unico indice senza filtri trasforma l'AI in una scorciatoia per aggirare i permessi — stipendi, contenziosi, trattative riservate emergono a chi pone la domanda giusta. La soluzione è il security trimming: i permessi dei sistemi di origine vengono applicati durante il recupero, prima che i documenti arrivino al modello. Un audit log completa il quadro, registrando chi ha chiesto cosa e quali fonti ha ricevuto.

Leggi: RAG aziendale e permessi →

Infrastruttura e sovranità

Cos'è l'on-premise?

On-premise indica software ed elaborazione che girano su server di proprietà dell'azienda, installati nella sua sede o sala server. Applicato all'intelligenza artificiale, significa che modelli, documenti e prompt vengono elaborati interamente su hardware proprio: i dati non lasciano mai il perimetro aziendale e nessun fornitore esterno vi ha accesso.

Per una PMI l'on-premise risolve due problemi insieme: i dati riservati — contratti, anagrafiche, cartelle cliniche — restano sotto controllo fisico e giuridico diretto, e i costi diventano fissi, legati all'hardware e non al consumo. Richiede però un investimento iniziale in GPU e qualcuno che gestisca le macchine: per chi non ha un reparto IT, il private cloud offre garanzie simili delegando la gestione. È la forma più piena di sovranità del dato.

Leggi la guida: AI on-premise per PMI →

Cos'è un private cloud?

Il private cloud è un'infrastruttura dedicata a una singola azienda, gestita da un fornitore in datacenter noti e regolata da un contratto che definisce dove risiedono i dati e chi vi accede. A differenza del cloud pubblico, le risorse non sono condivise con altri clienti e il perimetro è conosciuto e verificabile.

Per una PMI senza reparto IT è spesso il compromesso giusto: garanzie vicine all'on-premise — perimetro noto, giurisdizione chiara — senza dover comprare e gestire hardware. Attenzione però alle etichette: molti «private cloud» sono in realtà istanze rivendute su hyperscaler extra-UE, con tutte le esposizioni del cloud pubblico. La differenza la fanno i contratti diretti con i datacenter e la sovranità effettiva: chiedere sempre dove stanno fisicamente le macchine.

Scopri il private cloud TuxWeb →

Che differenza c'è tra on-premise e private cloud?

Con l'on-premise l'azienda possiede e gestisce i server nella propria sede; con il private cloud usa un'infrastruttura dedicata gestita da un fornitore in datacenter noti. Cambiano il controllo fisico, le competenze richieste e la natura del costo: investimento in conto capitale nel primo caso, canone ricorrente nel secondo.

La scelta dipende da vincoli e risorse: l'on-premise conviene a chi ha requisiti di isolamento totale, un reparto IT e volumi stabili da ammortizzare; il private cloud a chi vuole partire in fretta senza toccare hardware, mantenendo i dati in un perimetro noto. Esistono anche formule intermedie, come macchine di proprietà del cliente collocate nei datacenter del fornitore. In tutti i casi la domanda decisiva resta la stessa: dove stanno i dati e quale legge li governa.

Leggi: perché l'on-premise conviene alle PMI →

Cos'è la sovranità del dato?

La sovranità del dato è la capacità di un'azienda di sapere con certezza dove risiedono fisicamente i propri dati, quale legge li governa e chi può accedervi. Non è uno slogan ma una condizione verificabile: datacenter identificabili, giurisdizione chiara, contratti che escludono trasferimenti fuori dal perimetro scelto.

Per un'impresa italiana che adotta l'AI la questione è ormai materia da consiglio di amministrazione: i meccanismi giuridici che legittimano i trasferimenti di dati UE-USA sono di nuovo sotto giudizio, decine di paesi impongono obblighi di localizzazione e leggi come il Cloud Act espongono i dati affidati a provider americani. Tenere modelli e documenti su infrastruttura on-premise o in un private cloud europeo trasforma la sovranità da rischio da monitorare a proprietà dell'architettura.

Leggi: cloud, AI e sovranità dei dati →

Cos'è il Cloud Act?

Il Cloud Act è una legge statunitense del 2018 che consente alle autorità americane di richiedere a un provider USA i dati che gestisce, anche quando sono conservati su server in Europa. Conta la nazionalità del fornitore, non la posizione fisica del dato: il datacenter europeo, da solo, non basta.

Per le imprese italiane è l'esempio più concreto di quanto la residenza dei dati non coincida con la giurisdizione: affidare documenti riservati a un hyperscaler americano, anche nella regione di Francoforte o di Milano, li lascia esposti a normative extra-UE. È uno dei motivi per cui la sovranità del dato richiede fornitori soggetti solo al diritto europeo. La risposta strutturale è tenere l'AI nel perimetro UE, su infrastruttura on-premise o private cloud europeo.

Leggi: GDPR e dati AI fuori dall'UE →

Cos'è un modello open source (a pesi aperti)?

Un modello open source, o a pesi aperti, è un modello AI i cui parametri sono pubblicati e scaricabili: chiunque può installarlo ed eseguirlo sulla propria infrastruttura. Si distingue dai modelli proprietari, accessibili solo tramite le API del fornitore, che restano una scatola chiusa eseguita su server altrui.

Per un'azienda i pesi aperti significano due cose: l'inferenza può girare su server propri, così documenti e prompt non escono dal perimetro, e non c'è vendor lock-in — se il fornitore cambia prezzi o condizioni, il modello resta. I modelli aperti di ultima generazione hanno raggiunto una qualità adeguata alla gran parte dei casi d'uso aziendali: rispondere su documenti, classificare, riassumere. Sono il presupposto tecnico di qualsiasi AI davvero on-premise.

Leggi: AI privata per le aziende italiane →

Cosa sono le GPU e gli acceleratori AI?

Le GPU sono processori specializzati nel calcolo parallelo, l'hardware su cui girano i modelli di intelligenza artificiale: le risposte dei sistemi AI vengono calcolate, nella quasi totalità dei casi, da questi acceleratori. La loro disponibilità e il loro dimensionamento determinano velocità, capacità e costi dell'intero sistema.

La differenza economica sta nel modo in cui si pagano: noleggiarle a ore nel cloud significa costi variabili che crescono con l'adozione e si impennano nei picchi; acquistarle — o usarle con un canone su infrastruttura dedicata — trasforma l'inferenza in un costo fisso e pianificabile. Per i carichi tipici di una PMI bastano spesso una o poche GPU ben scelte: il dimensionamento sul carico reale, non sul picco teorico, è dove si gioca il conto economico dell'AI.

Scopri l'infrastruttura TuxWeb →

Cosa significano IaaS, PaaS e SaaS per l'AI?

IaaS, PaaS e SaaS sono i tre livelli di servizio del cloud: infrastruttura (server e GPU da gestire in proprio), piattaforma (ambiente pronto su cui sviluppare) e software finito da usare. Applicati all'AI, indicano quanto si delega al fornitore: solo l'hardware, l'intera piattaforma o tutta l'applicazione.

Per una PMI il livello giusto dipende dalle competenze interne: con lo IaaS si controlla tutto ma serve un team che gestisca sistemi e modelli; con il SaaS si parte subito ma si delega anche la custodia dei dati. Il punto spesso trascurato è che il livello di servizio non decide la sovranità: anche un SaaS può essere sovrano, se gira su un private cloud europeo con perimetro e contratti verificabili.

Leggi: IaaS, PaaS e SaaS per l'AI →

Cos'è l'air gap?

L'air gap è l'isolamento fisico di un sistema informatico da qualsiasi rete esterna, internet compresa: nessun collegamento, nemmeno indiretto. Applicato all'AI, significa modelli e dati che vivono su macchine raggiungibili solo dall'interno dell'organizzazione. È il livello massimo di protezione per i dati critici o classificati.

È la scelta di infrastrutture critiche, difesa, realtà con dati classificati: l'AI installata on-premise nella sala server del cliente, isolata anche dalla rete del fornitore, con manutenzione in sede o su canali dedicati. Il prezzo è operativo — niente aggiornamenti automatici, niente assistenza remota standard — e va giustificato dal valore del dato protetto. Per la maggior parte delle PMI è una garanzia sovradimensionata: un private cloud ben gestito copre già i requisiti reali.

Agenti e automazione

Cos'è un agente AI?

Un agente AI è un sistema di intelligenza artificiale che esegue compiti in più passaggi usando strumenti esterni: legge un'email, interroga il gestionale, aggiorna un ticket, invia una risposta. A differenza di un chatbot, che si limita a rispondere, l'agente pianifica le azioni necessarie e le porta a termine.

Per una PMI gli agenti AI sono il passo successivo al chatbot: non rispondono soltanto, lavorano. Smistare ticket, qualificare lead, processare documenti ripetitivi sono compiti che un agente ben configurato esegue in autonomia, collegandosi ai sistemi esistenti tramite il tool use senza cambiarli. La condizione per fidarsi è la supervisione: sulle azioni critiche l'agente si ferma e chiede conferma a una persona, secondo il principio dello human-in-the-loop. È l'approccio di Vigil, gli agenti operativi di TuxWeb.

Scopri Vigil, gli agenti AI di TuxWeb →

Cosa significa human-in-the-loop?

Human-in-the-loop indica un sistema AI in cui una persona approva i passaggi critici prima che vengano eseguiti: l'agente propone, l'umano decide. Il sistema lavora in autonomia sui compiti di routine, ma si ferma davanti alle azioni irreversibili o delicate e attende una conferma esplicita.

È il meccanismo che rende adottabile un agente AI nei processi aziendali reali: la responsabilità delle decisioni resta a una persona identificabile, condizione che conta per la conformità — l'AI Act richiede supervisione umana per i sistemi a rischio più alto — e per la fiducia del team. In pratica l'agente smista, classifica e prepara; l'invio di un'offerta, un rimborso o una cancellazione passano da un clic di approvazione. La produttività cresce senza che nessuna azione irreversibile avvenga senza un ok umano.

Scopri Vigil →

Cosa sono l'orchestrazione e i workflow AI?

L'orchestrazione è il coordinamento di più passaggi automatici — e di più agenti AI — in un processo aziendale ripetibile. Arriva una fattura: il sistema estrae i dati, li verifica, chiede approvazione e aggiorna il gestionale. Definisce l'ordine, le condizioni e i punti di controllo di ogni flusso.

Il valore per una PMI sta nel passare da automazioni isolate a processi interi che girano da soli: fatturazione passiva, approvazioni, gestione ordini, onboarding. Il workflow collega i sistemi esistenti — ERP, CRM, email — e inserisce l'AI solo dove serve una decisione: classificare, estrarre dati da un PDF, instradare un'approvazione. I punti critici restano sotto supervisione umana e ogni passaggio è tracciato. Costruito su piattaforme open source, il workflow gira on-premise: i dati operativi non escono dalla rete aziendale.

Scopri Automata, l'automazione AI di TuxWeb →

Cos'è l'MCP (Model Context Protocol)?

L'MCP (Model Context Protocol) è uno standard aperto che definisce come un modello AI si collega a sistemi e dati aziendali: gestionali, database, archivi documentali. Funziona come una presa universale — l'«USB dell'AI» — per cui ogni sistema esposto via MCP diventa utilizzabile da qualsiasi modello compatibile.

Prima dell'MCP ogni integrazione tra AI e sistemi aziendali era un connettore su misura, da riscrivere a ogni cambio di modello o fornitore. Con uno standard condiviso l'investimento si protegge: il connettore verso il gestionale si scrive una volta e funziona con modelli diversi, riducendo il vendor lock-in. Per un'impresa è la base tecnica che rende pratici gli agenti AI: il tool use dell'agente passa sempre più spesso da server MCP, anche installati interamente nel perimetro aziendale.

Cos'è il tool use (function calling)?

Il tool use, o function calling, è la capacità di un modello AI di invocare funzioni e sistemi esterni durante l'elaborazione: interrogare il CRM, creare un record nel gestionale, inviare un'email. Il modello non si limita a generare testo, ma compie azioni concrete attraverso strumenti definiti.

È il confine tra un'AI che parla e un'AI che lavora: senza tool use il modello può solo suggerire, con il tool use diventa un agente che smista ticket, aggiorna anagrafiche, prepara ordini. Per un'impresa il punto delicato è il controllo: ogni strumento esposto al modello è un'azione che l'AI può compiere sui sistemi reali, quindi va definito con permessi chiari e, sui passaggi critici, con conferma umana. Strumenti ben perimetrati, tracciati e revocabili sono la differenza tra automazione e rischio.

Normativa e sicurezza

Cos'è l'AI Act?

L'AI Act è il regolamento europeo sull'intelligenza artificiale, che classifica i sistemi AI per livello di rischio e impone obblighi proporzionati: pratiche vietate, requisiti stringenti per l'alto rischio, trasparenza per il resto. Riguarda anche le aziende che usano l'AI, non solo chi la sviluppa, con sanzioni fino al 7% del fatturato mondiale.

Con l'accordo sul Digital Omnibus di maggio 2026 gli obblighi sui sistemi ad alto rischio slittano al 2 dicembre 2027 (2028 per l'AI nei prodotti regolati), ma pratiche vietate e obbligo di formazione del personale valgono già da febbraio 2025. Per una PMI il tempo extra serve a prepararsi: inventario dei sistemi AI in uso, classificazione del rischio, supervisione umana sui processi critici. Tenere l'AI on-premise semplifica la dimostrazione di dove e come i dati vengono elaborati.

Leggi: AI Act, cosa cambia col rinvio →

Il GDPR si applica all'intelligenza artificiale ogni volta che dati personali entrano in un prompt o in un set di addestramento. Servono una base giuridica, un'informativa agli interessati e, se il provider elabora i dati fuori dall'UE, le garanzie sui trasferimenti previste dal capo V del regolamento.

Inviare dati personali a un provider AI con server negli USA è un trasferimento extra-UE: oggi lo copre il Data Privacy Framework, un meccanismo già sotto ricorso, e per i dati sensibili il Garante richiede garanzie supplementari. Le sanzioni dei garanti europei tra 2024 e 2026 mostrano che il rischio è concreto. L'alternativa strutturale è tenere l'AI nel perimetro UE, su infrastruttura on-premise o in un private cloud europeo: il trasferimento, semplicemente, non avviene.

Leggi: GDPR e dati AI fuori dall'UE →

Cosa sono la de-identificazione e l'anonimizzazione?

La de-identificazione è la rimozione o mascheratura dei dati identificativi — nomi, codici fiscali, date di nascita, indirizzi — da un testo prima che venga elaborato da un sistema AI. L'anonimizzazione è la forma più radicale: rende impossibile risalire alla persona, sottraendo il dato all'ambito del GDPR.

Il caso più delicato è quello clinico: referti e cartelle contengono dati sanitari, la categoria che il GDPR protegge di più. De-identificare il testo prima che raggiunga il modello permette di usare l'AI su documenti medici senza esporre l'identità dei pazienti: il modello lavora sul contenuto clinico, non sui nomi. Consilium, l'AI clinica di TuxWeb, lavora esattamente così. Lo stesso principio vale per studi legali e HR: meno dati identificativi entrano nel prompt, minore è la superficie di rischio GDPR.

Scopri Consilium, l'AI clinica di TuxWeb →

Cos'è un audit log?

L'audit log è il registro immutabile delle interazioni con un sistema AI: chi ha posto quale domanda, quando, quali documenti il sistema ha consultato e cosa ha risposto. Immutabile significa che le voci non possono essere modificate o cancellate a posteriori: il registro fa fede.

Per un'impresa l'audit log serve a due cose: conformità e diagnosi. Sul fronte normativo, dimostrare chi ha avuto accesso a quali informazioni è un requisito ricorrente — dal GDPR alla supervisione richiesta dall'AI Act. Sul fronte operativo, quando il sistema dà una risposta sbagliata il log permette di ricostruire cosa è successo: quale domanda, quali fonti, quale risposta. Completa i permessi di un sistema RAG: le ACL stabiliscono chi può vedere cosa, il log dimostra cosa è stato visto davvero.

Leggi: RAG aziendale e permessi →

Cos'è il penetration testing AI?

Il penetration testing AI è la verifica di sicurezza dei sistemi informatici condotta con l'assistenza dell'intelligenza artificiale, in un contesto autorizzato. L'AI esplora l'infrastruttura, individua le vulnerabilità e le documenta sotto la guida di un operatore, ampliando copertura e frequenza dei test rispetto al solo lavoro manuale.

Un pen test tradizionale si fa una volta l'anno, perché costa: nel frattempo l'infrastruttura cambia e le vulnerabilità nuove restano scoperte per mesi. L'AI abbassa quel costo e rende il test ripetibile con continuità, alla portata anche di una PMI. Il perimetro è la condizione che distingue lo strumento dall'abuso: si testa solo ciò che si è autorizzati a testare, con un agente tracciato e sotto supervisione umana. Su questo principio è costruito Intrusio, il pen testing AI di TuxWeb.

Scopri Intrusio, il pen testing AI di TuxWeb →

Fondamenta AI

Cos'è un LLM (Large Language Model)?

Cos'è un token nell'intelligenza artificiale?

Cosa sono il prompt e il prompt engineering?

Cos'è l'inferenza nell'intelligenza artificiale?

Cos'è il fine-tuning?

Cos'è un embedding?

Cos'è la finestra di contesto?

Cos'è un'allucinazione nell'intelligenza artificiale?

RAG e conoscenza aziendale

Cos'è il RAG (Retrieval-Augmented Generation)?

Cos'è una base di conoscenza (knowledge base)?

Cos'è la citazione delle fonti (grounding)?

Cos'è il chunking?

Cos'è un database vettoriale?

Cos'è la ricerca semantica?

Cosa sono le ACL e i permessi nei sistemi RAG?

Infrastruttura e sovranità

Cos'è l'on-premise?

Cos'è un private cloud?

Che differenza c'è tra on-premise e private cloud?

Cos'è la sovranità del dato?

Cos'è il Cloud Act?

Cos'è un modello open source (a pesi aperti)?

Cosa sono le GPU e gli acceleratori AI?

Cosa significano IaaS, PaaS e SaaS per l'AI?

Cos'è l'air gap?

Agenti e automazione

Cos'è un agente AI?

Cosa significa human-in-the-loop?

Cosa sono l'orchestrazione e i workflow AI?

Cos'è l'MCP (Model Context Protocol)?

Cos'è il tool use (function calling)?

Normativa e sicurezza

Cos'è l'AI Act?

Come si applica il GDPR all'AI?

Cosa sono la de-identificazione e l'anonimizzazione?

Cos'è un audit log?

Cos'è il penetration testing AI?