Data
Data management: cos’è, best practice e piattaforme utilizzate
Quando si parla di business nell’era del digitale, l’importanza dei dati cresce di giorno in giorno, costituendo un asset nodale per le sorti delle aziende. A prescindere dalla loro dimensione e tipologia di attività, le imprese hanno ogni giorno a che fare con una crescente quantità e varietà di dati provenienti da una tipologia di fonti sempre più complessa.
Il valore informativo dei dati costituisce un potenziale enorme per l’azienda, ma va estratto a partire da una base grezza, preparato e reso disponibile per le applicazioni analitiche, che grazie al machine learning e ad altre tecniche di intelligenza artificiale riescono a produrre risultati senza precedenti dal punto di vista descrittivo, predittivo e generativo.
Per gestire i dati e sfruttarli in maniera efficiente non è più sufficiente il know-how e l’esperienza dei singoli individui. La manualità delle operazioni non riesce più a stare al passo con le numeriche e la complessità dei dati, soprattutto considerata l’esigenza di analizzarli in tempo reale. Occorre pertanto strutturare una strategia di data management che sappia tenere conto di tutti gli aspetti relativi ai dati, in un contesto sempre più data-driven e customer-centric.
Per certi versi, il data management rappresenta una risposta pratica e coerente con la cultura del dato aziendale. Per molti si tratta di una novità nell’era del digitale, ma parliamo di un processo che ha fatto la propria comparsa già negli anni Sessanta, con la diffusione dei primi database mainframe, sistemi capaci di gestire i dati secondo una gerarchia prestabilita.
Erano gli antenati dei database relazionali, che hanno visto il loro esordio negli anni Sessanta e che si sarebbero diffusi in maniera proficua a cominciare dagli anni Ottanta, fino ad arrivare, negli anni Novanta, all’arrivo sul mercato dei moderni data warehouse, sistemi capaci di garantire end-to-end la data quality necessaria per le applicazioni analitiche.
Gli anni più recenti hanno visto la comparsa dei database NoSQL, capaci di gestire anche i dati non strutturati, oltre a sistemi come i data lake, in grado di archiviare enormi quantità di dati anche in forma grezza, senza doverli trasformare a priori, ma soltanto quando si rivelano utili alle applicazioni analitiche.
Oggi, con la diffusione del cloud, si configura una dimensione sempre più ibrida dei sistemi IT aziendali, e vengono introdotti nuovi concetti, stavolta focalizzati sulla visibilità dei dati, come data fabric e data observability, le cui applicazioni consentono di avere una visione unitaria a prescindere dalla loro collocazione, per poterli gestire in un unico luogo virtuale.
Vediamo in cosa consiste il data management, cosa fa il data manager e quali sono le best practice e le sfide più significative legate alla gestione dei dati in azienda.
Cosa si intende per data management
Secondo la definizione offerta da DAMA (Data Management Assocition), il data management consiste nello: “Sviluppo e l’esecuzione di architetture, policy, pratiche e procedure che gestiscono correttamente le esigenze dell’intero ciclo di vita dei dati di un’azienda” e “La pianificazione, l’esecuzione e la supervisione di policy, pratiche e progetti che acquisiscono, controllano, proteggono, consegnano e aumentano il valore dei dati e delle risorse informative”.
In altri termini, Il data management consiste nell’insieme di tutte le attività associate alla gestione e alla governance dei dati aziendali.
Il data management assume in prima istanza una connotazione di carattere strategico per generare valore aggiunto grazie ai dati di cui le aziende dispongono. Affinché la loro analisi avvenga in maniera efficiente, è necessario gestirli in maniera organizzata, affrontando una serie di sfide e rischi che comprendono anche gli aspetti relativi alla cybersecurity e alla privacy dei dati stessi, secondo quanto disposto dal GDPR e dalle principali normative di settore.
Il proliferare dei sistemi IoT ha recentemente reso ancora più eterogeneo lo scenario relativo all’acquisizione dei dati, attraverso la sensoristica dedicata, i dispositivi smart, e i contenuti audio-video continuamente trasmessi in streaming multimediale.
Ad esempio, considerando le relazioni con i clienti, non è più possibile considerare soltanto i dati strutturati in un CRM. Per conoscerli meglio occorre fare tesoro di tutti i dati di interazione con i canali di comunicazione aziendali: sito internet, e-commerce, social media, exhibit in store e tutti gli altri touchpoint previsti dalla strategia omnichannel.
La complessità degli scenari attuali rende necessaria una gestione del dato assolutamente rigorosa, finalizzata a supportare le applicazioni analitiche con una integrità ed una qualità utile ad ottenere risposte utili alle esigenze di business senza rischiare di incorrere in errori e problematiche che vanificherebbero gli sforzi e gli investimenti effettuati.
In definitiva, il data management diventa l’attività imprescindibile per le aziende che intendono acquisire, integrare, pulire, governare, archiviare e preparare nel modo migliore i contenuti digitali provenienti da tutte le fonti con cui il business è connesso.
Perché è importante
Per comprendere come una corretta e consapevole gestione dei dati possa contribuire a generare valore aggiunto nel contesto enterprise, è sufficiente pensare come discipline come business intelligence e business analytics siano in grado di supportare decisioni più informate in molti ambiti, in qualsiasi contesto laddove si renda necessario prevedere andamenti di mercato, gestire le supply chain e ottimizzare tempi/costi di tutti i processi coinvolti dalle varie attività.
Il data management consente, senza mezzi termini, di incrementare i ricavi e i profitti delle organizzazioni, ottimizzando le risorse necessarie e rendendo più efficienti le varie attività di business.
Una oculata strategia di data management garantisce, sia nel breve che nel lungo periodo, risposte pratiche per raggiungere gli obiettivi aziendali, grazie all’abbattimento dei tradizionali data silos, favorendo pertanto le sinergie tra le varie linee di business.
Un’elevata visibilità dei dati garantisce agli utenti e ai dispositivi informatici che vi accedono un livello di fruibilità adeguato per soddisfare qualsiasi esigenza operativa, oltre a facilitare il raggiungimento della data quality richiesta dalle applicazioni analitiche per supportare le decisioni aziendali.
Il data management inoltre favorisce l’innovazione, in quanto “obbliga” le organizzazioni a rivedere la propria strategia sui dati, integrando sistemi tecnologici e metodologie consolidate, fondate su piattaforme software di moderna concezione, capaci di lavorare sui dati in tempo reale.
Un altro aspetto per cui una strategia di data management risulta ormai indifferibile è legato agli aspetti normativi, per soddisfare le prescrizioni del GDPR e di tutti i dispositivi che regolano la conservazione e il trattamento dei dati, così come la loro protezione e gli argomenti inerenti alla cybersecurity dell’azienda.
Le tipologie di gestione dei dati
Il data management è un processo estremamente multidisciplinare, in cui concorrono vari elementi di carattere tecnico, come la gestione e l’interoperabilità dei file, oltre al soddisfacimento di requisiti funzionali come quelli legati all’archiviazione, a partire dalla scelta dei sistemi di storage e di gestione dei dati.
Non è un caso che, quando si parla di data management, il primo step da affrontare coincida molto spesso con la definizione della data architecture. L’architettura dei dati è fondamentale per gestire i dati in grandi numeriche e al variare nel tempo delle complessità che li caratterizza, grazie ad un blueprint che contempla la disponibilità di sistemi di gestione come i database, i data lake e i data warehouse, a prescindere dalla loro collocazione on-premise o nei servizi disponibili in cloud.
Una delle tipologie di data management più comuni è rappresentata dall’amministrazione dei database (database administration), sistemi che prevedono l’organizzazione dei dati in maniera da renderli facilmente aggiornabili e fruibili da tutte le applicazioni aziendali.
L’amministrazione dei database comprende vari step:
- Design
- Configurazione
- Installazione
- Aggiornamento
- Manutenzione
- Sicurezza
- backup / ripristino
- monitoraggio delle performance
Tra le altre attività che rientrano sotto il cappello del data management ritroviamo:
- Data governance: definisce policy e procedure condivise a livello aziendale, per garantire la coerenza dei dati in tutte le operazioni previste
- Data quality: riconducibile alle attività di data preparation, che hanno l’obiettivo di pulire i dati, eliminare errori e duplicati, oltre ad assicurare il corretto formato per tutti gli utilizzi di carattere applicativo
- Data observability: ha l’obiettivo di incrementare l’efficienza della data governance e della data quality attraverso una miglior visibilità della data pipeline, ottenibile mediante soluzioni di monitoraggio automatizzate.
- Data integration: ha scopo di raccogliere e combinare i dati provenienti dalle differenti fonti con cui i sistemi aziendali sono connessi, ai fini di renderle disponibili per le applicazioni analitiche
- Data modeling: descrive le relazioni tra i dati e il modo in cui questi vengono gestiti nei vari sistemi di gestione e le applicazioni analitiche
- Data fabric: rappresenta un’architettura che facilita l’integrazione end-to-end di varie pipeline di dati e di vari ambienti cloud, mediante l’utilizzo di piattaforme dotate di funzioni di automatizzazione.
La figura del data manager
Il principale obiettivo del data manager consiste nell’aiutare le aziende per cui lavorano ad ottimizzare l’utilizzo in senso ampio dei dati, nel rispetto di policy e regolamenti condivisi, consentendo di prendere decisioni e intraprendere azioni utili a massimizzare i vantaggi che derivano dalla loro fruizione.
Tre le principali responsabilità del data manager figurano:
- gestione dei dati relativi alle attività dei clienti e del personale;
- creazione degli account e assegnazione delle autorizzazioni di accesso ai database;
- manutenzione dei database e dei sistemi di gestione dei dati;
- semplificazione delle procedure di raccolta, preparazione e analisi dei dati;
- creazione e revisione della documentazione per tutte le modifiche del database;
- risoluzione di eventuali incongruenze o anomalie che potrebbero distorcere i risultati analitici;
- configurazione dell’infrastruttura IT: software, hardware e di archiviazione dati;
- comunicazione con i dirigenti e gli stakeholder non tecnici su temi inerenti i dati aziendali.
I requisiti per soddisfare questa ampia gamma di esigenze sono molteplici. Il data manager è un professionista che deve coniugare competenze gestionali con conoscenze tecniche nel mondo dei dati, oltre a disporre di spiccate soft skill.
Il data manager deve assicurare un approccio aziendale di tipo data-driven, diffondendo la cultura del dato all’interno dell’organizzazione, Oltre agli aspetti tecnologici, il data manager deve infatti saper comunicare con tutti gli stakeholder, tecnici e non, per evidenziare tutti i problemi e facilitare la loro soluzione, sollecitando i vari responsabili aziendali.
Dal punto di vista della formazione, il data manager proviene da una laurea inerente alla disciplina dei dati, come informatica, statistica o specializzazioni della data science. In ogni caso, il titolo di studio costituisce soltanto una base di partenza, che va arricchita da una solida esperienza sul campo, affrontata con crescenti responsabilità in un contesto aziendale, sviluppando una concreta attitudine al problem solving.
Il data manager non va inoltre confuso con il data protection officer (DPO), una figura che le aziende hanno dovuto individuare per soddisfare i disposti del GDPR. Il data manager si focalizza nello specifico nella cura dell’intero ciclo di vita dei dati nei processi aziendali, dove l’osservanza del GDPR, per quanto di cruciale importanza, costituisce soltanto uno degli aspetti da tenere in considerazione. Parimenti, il data manager non andrebbe mai confuso con l’IT manager e il privacy manager.
Alcune best practice del data management
Il data management è un’attività che richiede molto impegno soprattutto nelle fasi di adozione, e può essere facilitata grazie ad una serie di best practice. Esistono infatti vari framework che consentono di strutturare il data management nel contesto aziendale, come quelli definiti dalla già citata DAMA o dalla Data Governance Professionals Organization.
Un lavoro celebre in questo ambito è costituito dal DAMA-DMBOK (Data Management Body of Knoweledge), un testo che si propone di definire una visione standard delle funzioni e dei metodi che fanno capo alla gestione dei dati. Dopo la prima edizione (2009), la reference guide è stata più recentemente rivisitata nel contesto di una seconda edizione, il DMBOK2 (2017)
Per quanto identificate in maniera puntuale nel DMBOK e in strumenti analoghi, le best practice prevedono solitamente consulenze specializzate, capaci di lavorare sia sugli aspetti culturali che su quelli tipicamente metodologici. A livello di best practice è auspicabile fare riferimento alle seguenti attività.
- Database con prestazioni funzionali alle esigenze di business: in particolare, attraverso l’implementazione di database scalabili, capaci di ottimizzare il dispendio di risorse dovuto alle applicazioni analitiche, eliminando sia i costosi sprechi che i colli di bottiglia sul piano della performance.
- Favorire l’automazione e il riutilizzo dei dati: in questo contesto, il data manager deve sceglie piattaforme software in grado di automatizzare la trasformazione dei dati, favorendo al tempo stesso sia la data quality e che il riutilizzo stesso dei dati in più applicazioni.
- Favorire l’adozione di strumenti AI e ML: le applicazioni basate su tecniche di machine learning consentono di portare il monitoraggio dei sistemi di gestione dei dati verso livelli nemmeno ipotizzabili con i sistemi tradizionali, garantendo elevati di livelli di performance ed una comprensione esaustiva di quanto accade sui sistemi stessi in tempo reale.
- Utilizzo di database convergenti: si tratta di database di moderna concezione, dotati di supporto nativo per tutti i dati, strutturati e non, facilitandone l’impiego nelle varie applicazioni. I database convergenti favoriscono l’integrazione nei processi aziendali di molte tecnologie emergenti. Oltre al citato machine learning, non è possibile trascurare il contribuito di IoT e blockchain.
- Implementazione di un livello di discovery per identificare i dati: consente agli analisti e ai data scientist di individuare in maniera efficiente i dataset e renderli disponibili per le loro applicazioni di business intelligence e business analytics
- Predisposizione di livelli di query comuni per gestire lo storage dei dati: le piattaforme di data management dispongono di strumenti che fanno interagire vari sistemi di storage in maniera trasparente per l’utente finale, a prescindere dalla loro collocazione fisica.
Le piattaforme utilizzate
Nel contesto della gestione dei dati aziendale vengono di consueto utilizzate le data management platform (DMP), applicazioni software che hanno lo scopo di raccogliere, organizzare e analizzare i dati per generare valore attraverso la loro fruizione.
Come accennato in sede di premessa, la raccolta dei dati fa riferimento a molti canali: siti web, social media, e-mail, cronologia delle vendite, ecc. Il loro utilizzo è diventato noto soprattutto nell’ambito del marketing, dove si è assistito alla loro prima implementazione, attualmente evoluta nel customer data platform (CDP).
Tra le principali DMP ritroviamo:
- Microsoft Customer Insights and Marketing
- SAS Data Management
- Snowflake
- Oracle Advertising and Customer Experience
- Adobe Audience Manager
- Google Audience Center
Sfide e rischi del data management
Quando si ci ritrova a definire una strategia per i dati, ci si scontra inevitabilmente con serie di problemi che deriva in gran parte dall’eterogeneità dei dati stessi: strutturati, semistrutturati e non strutturati. Quando si decide di implementare una strategia di gestione dei dati, si ereditano spesso architetture fragili, risultato di successive stratificazioni di servizi e soluzioni, che hanno prodotto una serie di data silos che rendono problematica la comunicazione tra i vari reparti aziendali.
La prima sfida nel contesto del data management coincide nel garantire che i set di dati siano accurati e coerenti su tutti i sistemi di gestione, cercando di migliorare soprattutto gli aspetti legati alla visibilità.
Uno degli aspetti più complessi del data management è conoscere cosa è disponibile e dove è disponibile. Una problematica resa ancora più complessa dal cloud computing, che consente di ricorre a servizi gestiti offerti da provider differenti, su sistemi differenti. Per agevolare tale mansione, le piattaforme di data management dispongono di strumenti in grado di utilizzare i metadati per la catalogazione.
La stessa migrazione in cloud di un database on-premise comporta l’adozione di tecnologie di nuova generazione, non sempre compatibili con i sistemi tradizionali. Occorre dunque valutare caso per caso le soluzioni più indicate, senza voler necessariamente migrare tutto a priori.
Se vuoi farti guidare da noi, scopri i nostri servizi