Era il 2006 quando Clive Humby disse una frase destinata a passare alla storia e a diventare sempre più vera col trascorrere degli anni: Data is the new oil (i dati sono il nuovo petrolio). Sono passati solo 17 anni da quell'affermazione, ma in termini di progresso tecnologico sembrano essere trascorsi dei secoli. Humby, a questo proposito, si è rivelato profetico, come profetica vuole essere la nuova tecnologia basata sui dati. Cosimo Accoto, nel suo saggio Il mondo dato: Cinque brevi lezioni di filosofia digitale edito da Egea nel 2017, ha sottolineato il passaggio da una società archiviale, che basa la comprensione del presente sull'apprendimento dal passato, ad una società oracolare, che osserva il presente per predire il futuro. Ma come si osserva il presente in quest'ottica? Studiando i dati.
Come devono essere questi dati?
E se non lo fossero? La soluzione sta (forse, e non completamente) nei dati sintetici.
I dati sintetici sono dati creati artificialmente da appositi algoritmi, che imitano (quasi) alla perfezione i dati normalmente provenienti dal mondo reale.
Com'è possibile che ci sia bisogno di creare altri dati in un periodo storico in cui la sovrabbondanza di informazioni dilaga e l'information overload rischia di diventare una vera e propria patologia? I due fenomeni non vanno in contrasto tra loro, come potrebbe sembrare in prima battuta. Vediamo perché.
Le stime della Commissione Europea per il 2025 relative alla quantità di dati prodotta a livello globale sono impressionanti: dal 2018, in cui venivano prodotti 33 zettabytes di dati, si va verso i 175 zettabytes del 2025, un incremento pari al 530%. Per capire di che cifre stiamo parlando, basti pensare che uno zettabyte corrisponde a 1.000.000.000.000.000.000.000 (un triliardo) di byte, nel sistema binario 1.180.591.620.717.411.303.424 byte. C'è però il problema dei limiti tecnologici, organizzativi e culturali che ancora aziende ed enti hanno nell'utilizzare questi dati. Senza contare che una grandissima parte di questi dati risultano sporchi o scadenti, essendo incompleti, parziali o falsati da pregiudizi ed errori. Il loro utilizzo non risulta dunque utile ma in certi casi addirittura dannoso.
Di fronte a questa sovrabbondanza di dati molte volte inutilizzabili, si è resa necessaria la produzione di dati puliti, omogenei e soprattutto chiaramente leggibili. Ciò che però ha reso indispensabile un investimento massiccio nella generazione di dati sintetici è stata la vera e propria esplosione dell'utilizzo dell'intelligenza artificiale. Non c'è azienda tecnologica che possa ignorare l'importanza sempre crescente dell'intelligenza artificiale o che possa decidere di non investire in essa. Lo confermano i dati della Computing Technology Industry Association (CompTIA) americana, secondo cui il 91,5% delle aziende leader nei rispettivi mercati sta concretamente investendo in AI.
Ad avere più fame di dati è l'intelligenza artificiale generativa, che si basa su algoritmi di machine learning i quali necessitano di una quantità enorme di dati il più possibile coerenti con lo scenario e le funzionalità da generare. Questi dati, quindi, non devono essere solo numerosi, ma anche ordinati ed analizzabili con il minor dispendio possibile di tempo e risorse.
Come sottolineato da Agenda Digitale, "negli ultimi anni, gli esperti di intelligenza artificiale hanno imparato che i dati di buona qualità (Good Data) sono più importanti dei dati “di grande quantità” (Big Data). In soldoni, piccole quantità di dati esatti, etichettati nel modo giusto, possono migliorare le prestazioni di un sistema di intelligenza artificiale fino a dieci volte di più che con l’utilizzo di una maggiore quantità di dati inesatti".
Delineato questo scenario, diventa assai facile comprendere come i dati sintetici si renderanno sempre più necessari con il passare degli anni e con i progressi dell'intelligenza artificiale. Secondo uno studio condotto da Grand View Research, ilmercato globale deidati sintetici nel 2030 arriverà a 1,79 miliardi, mentre bisogna aspettare solo il prossimo anno per arrivare al punto in cui il 60% dei dati utilizzati per lo sviluppo di progetti di AI e di analisi sarà generato sinteticamente, stando alle stime di Gartner. Un balzo incredibile se pensiamo che ad oggi i dati sintetici rappresentano solo l’1% dei dati digitali.
Le possibilità relative alla creazione di dati sintetici utilizzabili nel training dei modelli di machine learning sono praticamente infinite. Le tipologie di dati creati, però, possono essere categorizzate facilmente in base alla loro natura, struttura e al loro campo di applicazione. I dati sintetici possono essere:
Sono moltissimi i possibili campi di applicazione dei dati sintetici, siano essi multimediali o testuali, strutturati o non strutturati. Vediamone solo alcuni, consapevoli del fatto che in realtà qualsiasi ambito può trarre beneficio dalla generazione di dati creati appositamente per capire il presente e prevedere il futuro in base ai propri interessi specifici:
Sono molti i benefici derivanti dalla generazione di dati sintetici, come era possibile intuire dai massicci investimenti che le principali corporation stanno destinando a questo tipo di tecnologia futuristica e futuribile. Eccone alcuni:
Non è tutto oro ciò che luccica, e anche i dati sintetici, come moltissime nuove tecnologie (prima fra tutte l'intelligenza artificiale, che dei dati sintetici è la maggiore causa, generatrice ed utilizzatrice) hanno il loro lato oscuro, svantaggi che non possono essere ignorati e che in molti casi danno molti grattacapi prima del loro utilizzo. Tra i limiti dei dati sintetici ci sono tre o quattro questioni che elenchiamo a titolo esemplificativo:
Per quanto gli esiti di nuove tecnologie così invasive siano imprevedibili, è ancora troppo presto per dire che la generazione di dati sintetici manderà in pensione la raccolta e l'analisi di dati reali da parte degli istituti di ricerca tradizionali.
I motivi per sostenerlo sono diversi, e tutti si evincono facilmente dal contenuto dell'articolo. Vediamone solo qualcuno a titolo di esempio:
Alle macchine stiamo affidando dati, impulsi, gli stiamo delegando letteralmente il nostro futuro. Ma nel momento in cui scriviamo il cervello è ancora il più potente computer esistente. Per quanto questo assunto varrà ancora? Come si dice dalla notte dei tempi, ai posteri l'ardua sentenza.
Indagini di mercato, Ricerche sociali, Insight per le decisioni
Via del cinema, 5 - 61122 Pesaro
+39 0721 415210
info@sigmaconsulting.biz
Sigma Consulting srls unipersonale – P. Iva 02625560418 - Capitale sociale € 2.000,00 i.v. - REA PS 196812 - Privacy Policy - Cookie Policy -
INFORMATIVA SUL TRATTAMENTO DEI DATI PERSONALI
Ai sensi degli articoli 13 e 14 del Regolamento 679/2016/UE e della normativa italiana applicabile in materia di trattamento dei dati personali, La informo che i dati personali da Lei forniti nel corso di questa intervista telefonica, condotta da parte di Sigma Consulting S.r.l.s. o di soggetti dalla stessa incaricati, formeranno oggetto di trattamento nel rispetto della normativa richiamata e degli obblighi di riservatezza a cui è ispirata l’attività di Sigma Consulting S.r.l.s.
In particolare:
ORIGINE DEI DATI
Il Suo nominativo e il Suo recapito telefonico sono stati selezionati da banche dati di società terze. Il trattamento si riferisce ai seguenti dati: nome, cognome, indirizzo e numero di telefono.
Tali dati possono essere forniti al momento del primo contatto telefonico, ovvero al momento della sottoposizione al sondaggio di opinione e/o alla ricerca di mercato, in ogni caso previa prestazione del Suo consenso.
FINALITÁ E MODALITA’ DEL TRATTAMENTO
I dati da Lei forniti o altrimenti acquisiti da Sigma Consulting S.r.l.s. saranno trattati per le finalità di seguito elencate: effettuazione di sondaggi di opinione e effettuazione di ricerche di mercato.
Il trattamento dei Suoi dati avverrà, in ogni caso, mediante modalità, procedure e strumenti cartacei ed elettronici idonei a garantirne la sicurezza, pertinenza, integrità, disponibilità, completezza, non eccedenza e riservatezza.
NATURA DEL CONFERIMENTO DEI DATI
Il conferimento, da parte Sua, del consenso al trattamento dei dati per le finalità anzidette è facoltativo. In caso di rifiuto a fornire i Suoi dati o in mancanza di consenso al loro trattamento Sigma Consulting S.r.l.s. non potrà utilizzare i dati personali e, dunque, non potrà svolgere il sondaggio e/o la ricerca di mercato.
TITOLARE DEL TRATTAMENTO E SOGGETTI AI QUALI I DATI POSSONO ESSERE COMUNICATI O CHE POSSONO VENIRNE A CONOSCENZA, E AMBITO DI DIFFUSIONE DEI DATI
Il titolare del trattamento è Sigma Consulting S.r.l.s. (P.IVA 02625560418), con sede legale in Pesaro, Via del Cinema n. 5, CAP 61122, email: sigmaconsulting@gigapec.it
D.P.O. Email: privacy@sigmaconsulting.biz Pec: privacysigmaconsulting@gigapec.it
I Suoi dati personali saranno trattati da dipendenti, collaboratori, consulenti e professionisti incaricati da Sigma Consulting S.r.l.s. di svolgere specifiche attività in relazione alle suddette finalità di trattamento o per adempiere ad un obbligo di legge. I dati personali da Lei forniti a Sigma Consulting S.r.l.s. potranno essere in alcuni casi e temporaneamente trasferiti in un paese Extra UE nel rispetto delle disposizioni di cui agli artt. 44 e ss. del Regolamento (UE) 679/2016.
DURATA DEL TRATTAMENTO
I Suoi dati saranno trattati per tutto il periodo di svolgimento del sondaggio o della ricerca di mercato. Al termine del sondaggio o della ricerca di mercato, i Suoi dati verranno anonimizzati o trattati esclusivamente in forma aggregata, in modo tale che li stessi non siano identificabili e che non si possa risalire alle Sue risposte .
DIRITTI DELL’INTERESSATO
Relativamente ai Suoi dati personali, Lei potrà in ogni momento, mediante semplice richiesta scritta indirizzata al Titolare e/o D.P.O., anche a mezzo email o tramite soggetto delegato (i) ottenere l'accesso ai dati personali per conoscere origine dei dati, finalità del trattamento, logica applicata al trattamento con uso di strumenti elettronici, categorie di dati, destinatari (o categorie di destinatari) ai quali gli stessi saranno comunicati, periodo di conservazione, e la loro comunicazione in una forma intellegibile; (ii) ottenere la rettifica, l’integrazione, la cancellazione dei dati o la limitazione del trattamento; (iii) opporsi al trattamento dei dati personali; (iv) ottenere la portabilità dei dati, ove pertinente; (v) revocare il consenso in qualsiasi momento; (vi) proporre reclamo ad un'autorità di controllo.
Per l’esercizio di tali diritti potrà contattare, telefonicamente e/o per iscritto, Sigma Consulting S.r.l.s. ai seguenti recapiti: Sigma Consulting S.r.l.s., sede legale Pesaro (PU), Via del Cinema n. 5, c.a.p. 61122; Tel.: 0721.415210 Fax: 0721.1622038 E-mail: community@sigmaconsulting.biz P.E.C.: sigmaconsulting@gigapec.it
D.P.O. Email: privacy@sigmaconsulting.biz Pec: privacysigmaconsulting@gigapec.it