Deepfake e disinformazione: minacce cyber-fisiche

16 Gennaio 2026

Indice dei contenuti

Come funzionano i deepfake: generative AI, modelli, dataset e pipeline
Tecniche di rilevazione: watermark, analisi forense, behavioural-analysis
Guida pratica: libreria open-source per riconoscere deepfake (audio e video) con codice di esempio
Programma di awareness e simulazioni: dal “vedere” al “riconoscere”

I deepfake non sono più curiosità da laboratorio: sono strumenti concreti e alla portata di molti, capaci di creare video, audio e immagini generate che imitano voci e volti con una fedeltà tale da ingannare dipendenti, clienti, fornitori, giornalisti e persino sistemi di autenticazione.

Nell’ecosistema della disinformazione, queste tecniche agiscono come amplificatore di inganni, accelerando attacchi di social engineering, frodi economiche e crisi reputazionali che si propagano dall’ambiente digitale fino a quello fisico (interruzioni operative, panico, danni materiali). In questo articolo esploriamo in profondità come funzionano i deepfake (modelli, generative AI, dataset, pipeline), come vengono impiegati in ambito commerciale e illecito, i vettori di attacco più frequenti (dallo spear-phishing alla CEO fraud), gli impatti su reputazione, operazioni e crisi aziendali, e soprattutto le tecniche di rilevazione e mitigazione: watermark, analisi forense, behavioural-analysis, programmi di awareness.

Chiudiamo con una guida pratica: come mettere in produzione una libreria open-source per riconoscere deepfake di audio o video, con esempi di codice chiari, e con un quadro di considerazioni etiche e regolamentari (responsabilità, norme, sensibilizzazione).

Come funzionano i deepfake: generative AI, modelli, dataset e pipeline

Gli attacchi deepfake si poggiano su tre pilastri: generative AI, modelli specializzati (diffusion, encoder-decoder, voice conversion) e dataset che catturano voce, volto e movimenti di un soggetto.

Architetture comuni

Autoencoder/Encoder-Decoder
Comprimono un volto/voce in uno “spazio latente” e poi lo ricostruiscono sul video o audio target.
GAN (Generative Adversarial Networks)
Generatori che creano contenuti convincenti “allenandosi” contro discriminator che tentano di smascherarli.
Modelli di Diffusione
Oggi dominanti nelle immagini generate e, sempre più, nel video; partono da rumore e lo “denoising” progressivo guidato dal prompt produce un contenuto coerente.
Text-to-Speech (TTS) e Voice Conversion
Clonano timbro e prosodia per sintetizzare audio realistici con pochi minuti (a volte secondi) di registrazione sorgente.
NeRF/GAIT/Body models
Per ricostruire pose e movimenti, utili in falsificazioni a figura intera.

Dataset e sourcing dei dati

Per addestrare o “adattare” un modello bastano dataset spesso generati raschiando contenuti pubblici: interviste, webinar, podcast, social video. Poche decine di clip pulite a volte sono sufficienti a una voice clone credibile. La disponibilità “in chiaro” di dataset facilita sia l’uso commerciale lecito (doppiaggi, avatar) sia gli impieghi illeciti(truffe, impersonificazione).

Pipeline sintetica

Raccolta dati (estrazione tracce audio, volti da video HD).
Pre-processing (normalizzazione, rimozione rumore, allineamento labiale).
Addestramento/fine-tuning del modello.
Generazione (render di immagini generate/video, sintesi audio).
Post-produzione (sincronizzazione labiale, correzione colori, “room tone” sull’audio, compressione).
Distribuzione (social, messaggistica, email, telefonate VoIP) come parte di campagne di disinformazione o truffe mirate.

Esempio
Frodi, spear-phishing avanzato e social engineering di nuova generazione

CEO fraud 2.0

La CEO fraud classica sfrutta email falsificate; la versione 2.0 aggiunge audio o video deepfake del CEO che “ordina” un bonifico urgente o l’invio di dati sensibili. La forza persuasiva dell’elemento umano (voce/viso) abbatte le difese psicologiche, soprattutto se incastonata in uno spear-phishing con dettagli credibili (progetto, importo, “segretezza”).

Supply chain & procurement

Un fornitore “storico” chiama su Teams/Zoom: la “faccia” è familiare, la voce è quella giusta, lo sfondo riproduce l’ufficio. Chiede di cambiare IBAN “per problemi bancari”. Il deepfake può orchestrare conversazioni brevi ma decisive.

Estorsione e danneggiamento reputazionale

Brevi video “incriminanti” o immagini generate possono minacciare persone chiave (executive, figure pubbliche) per estorsione o per pilotare l’opinione pubblica. La disinformazione non mira solo alla menzogna, ma a seminare dubbio (“plausible deniability”) anche su contenuti autentici.

Truffe al customer care e KYC fraud

Audio deepfake sfruttano IVR/voice-bot o operatori umani per superare domande di sicurezza basate su “riconoscimento vocale”. La voice conversion può imitare un cliente premium e sbloccare operazioni.

Implicazioni: reputazione, operazioni, crisi aziendali

Reputazione
La diffusione virale di un video alterato può erodere la fiducia in minuti. La smentita corre più lenta del contenuto falso. Il costo di “bonifica” comunicativa e legale è elevato.
Operazioni
Frodi di pagamento, rilascio di credenziali, deviazioni di supply chain causano perdite dirette e interruzioni operative.
Crisi aziendali
Incidenti cyber-fisici (panic selling, corse agli sportelli, fughe di notizie) amplificati dalla disinformazione richiedono playbook specifici (decisioni rapide, norme interne, escalation chiare).

Tecniche di rilevazione: watermark, analisi forense, behavioural-analysis

Non esiste una bacchetta magica. Serve combinare segnali tecnici e behavioural-analysis, automation e awareness.

Watermark e firme di origine

Watermark a livello di pixel o latente (modello) indicano che un contenuto è synthetic-generated. Utili ma non onnipresenti (attaccanti non lo applicano).
In parallelo, standard di provenance (manifest di origine, catene C2PA) favoriscono la tracciabilità dei video/immagini generate.

Analisi forense (segnali media)

Incoerenze fotometriche
Riflessi oculari, ombre, specularità pelle.
Artefatti di compressione
Pattern non naturali nel DCT, banding.
Lip-sync
Micro-desincronizzazioni tra audio e movimento labiale.
Blink rate e micro-espressioni: frequenze non realistiche o ripetitive.
Audio:
Formanti vocali alterati, residui di vocoder, transienti innaturali.

Behavioural-analysis e corroborazione

Verifica di canale
Un ordine di pagamento via audio deve essere confermato su un canale diverso (approvazione su ERP, firma digitale).
Contesto e timing
Richieste fuori orario, pressioni di urgenza, cambiamento improvviso di IBAN, “segretezza” sono red flag.
Reputation signals
Profili social “nuovi”, cronologie povere, follower sospetti.

Mitigazione: dai controlli tecnici all’awareness

Policy di verifica (no-single-channel)
Niente approvazioni economiche o disclosure sensibili basate su un solo canale (specie audio o video).
Controlli finanziari
Segregazione funzioni, doppia firma, whitelist IBAN, limiti temporali.
Email & chat hardening
Banner di rischio, DMARC/DKIM/SPF, sandbox allegati.
Gate di identity
MFA forte, challenge “out-of-band”, passkey; nel fisico: callback a numeri ufficiali.
Tool di rilevazione
Integrare motori di analisi forense e modelli anti-deepfake nelle pipeline SOC (vedi guida pratica e codice).
Awareness
Programmi mirati su spear-phishing, CEO fraud, “urgent-secrecy trick”, con simulazioni periodiche.
Crisis playbook
Chi decide, quando bloccare pagamenti, come comunicare, come conservare evidenze.

Guida pratica: libreria open-source per riconoscere deepfake (audio e video) con codice di esempio

Di seguito una pipeline modulare, pensata per team SecOps/DFIR. Gli esempi usano Python e componenti open-source diffuse.

1) Rilevazione audio (voice clone / TTS)

Obiettivo: classificare clip audio come “genuino” vs “sintetico” usando spettrogrammi + un classificatore leggero; e in parallelo verificare l’identità vocale con speaker-verification (embeddings).

Step A — Estrazione features

import librosa, numpy as np

def log_mel_spectrogram(wav_path, sr=16000, n_mels=64):

    y, sr = librosa.load(wav_path, sr=sr, mono=True)

    # normalizzazione semplice

    y = librosa.util.normalize(y)

    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=n_mels, n_fft=1024, hop_length=256)

    S_db = librosa.power_to_db(S, ref=np.max)

    # ridimensiona a blocchi uniformi (es. 3s)

    target_frames = int(3 * sr / 256)

    if S_db.shape[1] < target_frames:

        # pad a destra

        pad = target_frames - S_db.shape[1]

        S_db = np.pad(S_db, ((0,0),(0,pad)), mode='constant')

    else:

        S_db = S_db[:, :target_frames]

    return (S_db - S_db.mean()) / (S_db.std() + 1e-6)

Step B — Classificatore CNN leggero (PyTorch)

import torch, torch.nn as nn, torch.nn.functional as F

class SmallCNN(nn.Module):

    def __init__(self):

        super().__init__()

        self.conv1 = nn.Conv2d(1, 16, 3, padding=1)

        self.conv2 = nn.Conv2d(16, 32, 3, padding=1)

        self.pool = nn.MaxPool2d(2,2)

        self.fc1 = nn.Linear(32*16*32, 64)  # dipende dalle dimensioni finali

        self.fc2 = nn.Linear(64, 2)

    def forward(self, x):

        x = self.pool(F.relu(self.conv1(x)))

        x = self.pool(F.relu(self.conv2(x)))

        x = x.view(x.size(0), -1)

        x = F.relu(self.fc1(x))

        return self.fc2(x)  # logits

def predict_audio(model, S_db):

    with torch.no_grad():

        x = torch.tensor(S_db, dtype=torch.float32).unsqueeze(0).unsqueeze(0)  # (1,1,mels,frames)

        logits = model(x)

        prob = torch.softmax(logits, dim=-1)[0,1].item()  # prob sintetico

        return prob

Step C — Speaker verification (embedding cosine)
Confronta la clip con una voce “di riferimento” del CEO (archiviata): se la similarità è bassa ma la clip “sembra” sintetica, probabile voice clone.

from sklearn.metrics.pairwise import cosine_similarity

def cosine(a, b):

    return float(cosine_similarity(a.reshape(1,-1), b.reshape(1,-1))[0,0])

# ipotizza funzioni get_speaker_embedding(...) basate su modelli open (es. x-vector/wav2vec)

emb_ref = get_speaker_embedding('/path/ceo_ref.wav')     # enrollment voce reale

emb_test = get_speaker_embedding('/path/suspect.wav')    # clip sospetta

sim = cosine(emb_ref, emb_test)

# regole semplici:

# se sim < 0.6 e prob_sintetico > 0.7  -> forte sospetto deepfake

Policy operativa audio

Soglia conservativa (es. prob_sintetico > 0.7 o sim < 0.6).
Se positivo, blocca la richiesta e innesca verifica out-of-band.

2) Rilevazione video (face-swap, lip-sync)

Step A — Estrazione frame + face crop
Usa FFmpeg per estrarre 8–16 frame uniformi; poi face detector (es. RetinaFace o mediapipe) per crop coerenti.

ffmpeg -i suspect.mp4 -vf "fps=4,scale=640:-1" frames/out_%03d.png -y

Step B — Feature e classificatore
Due strategie complesse ma efficaci insieme:

Lip-sync check: allinea audio → fonemi (forced alignment) e confronta con movimento labiale (landmarks).
Forensics CNN su patch volto (artefatti, blink rate, texture inconsistenze).

Pseudo-pipeline:

def extract_landmarks(img_path): ...

def forced_alignment(audio_path): ...

def lip_sync_score(landmarks_seq, phoneme_seq): ...

def forensic_cnn_score(face_crops): ...

# Output combinato con regole/ensemble

score = 0.6*forensic_cnn + 0.4*(1 - lip_sync_mismatch)

Step C — Corroborazione metadati

Lettura container: bitrate, GOP, watermark / manifest se presente.
Heuristiche: inconsistenti frequenze di blink, mismatch luce/ombre.

3) Orchestrazione, logging e MLOps “leggero”

Inference gateway
Microservizio che riceve media, produce punteggi “synthetic-prob”.
Logging (JSON)
Punteggi, soglie, motivi (trasparenza per audit).
Feedback loop
Incidenti confermati alimentano retraining (hard negatives).
Privacy
Anonimizza dataset interni, applichi norme di retention.

4) Decisioni e flussi SOC/IT

Block/Allow/Review
Tre stati. Se alto rischio, blocca e avvisa.
Ticketing
Allega evidenze (frame, spettrogrammi) a Jira/ServiceNow.
Awareness
Notifichi al reparto target una pillola formativa mirata (pattern dell’inganno appena visto).

Programma di awareness e simulazioni: dal “vedere” al “riconoscere”

L’awareness funziona quando è concreta:

Galleria comparata
Clip autentiche vs deepfake con indicazione dei segnali (occhi, labbra, rumore di fondo).
Simulazioni
Campagne di spear-phishing che includano audio e video; misurare tasso di segnalazione.
Regola delle due conferme
Nessun pagamento o dato sensibile su input ricevuti solo via audio/video.
Playbook “CEO non raggiungibile”
Cosa fare quando l’attaccante invoca urgenza/segretezza.

Incident response per deepfake & disinformazione

Triage
Isolare la fonte, conservare originale (hash), copiare contesto (URL, data/ora).
Forense media
Punteggi, frame chiave, spettrogrammi.
Containment
Disabilitare canali compromessi, bloccare transazioni, revocare accessi.
Comunicazione
Dichiarazioni brevi, fattuali; evitare amplificazioni.
Legale e PR
Notifiche a piattaforme, richiesta rimozione, tutela marchio/persona.
Lezioni apprese
Aggiornare policy, migliorare modelli e controlli.

Considerazioni etiche e regolamentari: responsabilità, norme, sensibilizzazione

Responsabilità
Chi sviluppa e distribuisce generatori dovrebbe prevedere watermark robusti e opzioni di tracciabilità; chi impiega generative AI in azienda deve governare i rischi (model card, risk assessment).
Norme
I quadri regolatori evolvono (trasparenza dei contenuti sintetici, requisiti di provenance, responsabilità editoriale di piattaforme). Tenere policy interne allineate è fondamentale.
Sensibilizzazione
Etica della comunicazione: dichiarare contenuti immagini generate/video sintetici quando usati per marketing/HR; educare gli utenti per evitare “over-trust” nella multimedialità.
Equità
I detector non devono discriminare (dataset bilanciati per genere/etnia/lingua).

Checklist operativa (rapida)

Whitelist IBAN + doppia firma.
Policy no-single-channel per ordini sensibili.
Introduzione watermark/provenance su creativi interni.
Deploy detector audio/video con soglie chiare.
Programma awareness trimestrale (spear-phishing, CEO fraud).
Playbook crisi disinformazione e linee PR/legali.
Audit periodico modelli e dataset.
Telemetria e behavioural-analysis integrata (anomalie).

Integrazione in architetture Zero Trust e Identity-First

Verifiche continue
Il contenuto multimediale non è identità. Usa MFA, segnali di device posture, risk-based policies.
Sessioni ad alto rischio
Quando un’azione è richiesta tramite audio/video, spingere challenge aggiuntivo (firma digitale).
Privilegi minimi
Limiti e tempi ridotti riducono l’impatto di un ordine fraudolento.
Telemetria correlata
Collega indicatori media con anomalia di account, geolocalizzazione, orari inconsueti.

Architetture di riferimento e design pattern

Media Vetting Service
Microservizio centralizzato per analisi forense e watermark.
Content Provenance Gateway
Verifica manifest dove disponibili e marca i contenuti in ingresso.
Trust Labels
UI/UX che mostra indicatori (es. “sorgente verificata”, “immagini generate”).
Grafi di contesto
Correlano mittente, canali, orari, pattern di invio.

KPI e metriche

Tasso di intercettazione deepfake prima dell’azione (block rate).
Tempo medio di verifica multi-canale.
Tasso di segnalazione nelle simulazioni di spear-phishing.
Riduzione perdite da CEO fraud.
Copertura dei contenuti con watermark/provenance.

Esempio end-to-end: validazione pagamento urgente

Arriva chiamata con audio del “CFO” che chiede bonifico.
Gateway audio calcola prob_sintetico=0.81, similarità voce sim=0.55.
ERP blocca richiesta e lancia verifica out-of-band su app approvazioni.
L’utente rifiuta → ticket SOC con allegati analisi forense; training post-evento per il team finance.

In conclusione

I deepfake e la disinformazione sono ormai un vettore ibrido cyber-fisico: partono da bit manipolati ma producono danni tangibili a reputazione, operazioni e persone. La risposta efficace non è un singolo “silver bullet”, bensì un sistema: watermark e analisi forense sui contenuti; behavioural-analysis e regole no-single-channel sui processi critici; awareness continua affinché impiegati e dirigenti riconoscano segnali d’allarme; e infine una pipeline tecnica con libreria open-source per riconoscere deepfake (sia audio sia video) illustrata con esempi di codice. Su questo impianto si innesta una governance etica che rispetta responsabilità, norme e sensibilizzazione del pubblico interno ed esterno.

Solo combinando tecnologia, processi e cultura possiamo ridurre drasticamente la superficie d’attacco di spear-phishing, CEO fraud e campagne di disinformazione, riportando le decisioni critiche fuori dal regno dell’urgenza manipolata e dentro quello della verifica.

Domande frequenti

Cos’è un deepfake?
Un media sintetico (video, audio, immagini generate) prodotto con generative AI per imitare persone reali.
Come fanno i deepfake a essere così convincenti?
Usano modelli avanzati (GAN/diffusion) addestrati su dataset ricchi di voce/volto/pose.
Qual è il rischio principale per un’azienda?
Frodi (es. CEO fraud), spear-phishing mirato, danni a reputazione e operazioni.
Il watermark risolve tutto?
No. Watermark e provenance aiutano, ma gli attaccanti possono non usarli o rimuoverli.
Si può rilevare un deepfake solo guardando il video?
A volte sì (artefatti), ma è meglio unire analisi forense e behavioural-analysis.
Che ruolo ha l’awareness?
Centrale: senza awareness i dipendenti restano vulnerabili a social engineering persuasivo.
Quali controlli finanziari aiutano?
Whitelist IBAN, doppia firma, canale di conferma separato, limiti e tempi.
Possiamo automatizzare il rilevamento?
Sì, con librerie open-source integrate in un gateway di verifica e con codice di classificazione.
Come gestire una crisi da disinformazione?
Conservare evidenze, attivare playbook, comunicare in modo sintetico, coinvolgere legale/PR.
Quali sono le responsabilità etiche?
Trasparenza su contenuti sintetici, tutela degli individui, policy e norme interne aggiornate.