Da quando l’informatica è entrata prepotentemente in tutti i settori della nostra vita, notevoli quantità di dati sono raccolti in formato digitale. Per convertire questa enorme mole di dati in conoscenza gli esperti informatici hanno elaborato nuove tecniche di analisi. Una di queste va sotto il nome di Big Data.
Questo termine indica grandi aggregazioni di dati, la cui mole richiede l’intervento di strumenti differenti da quelli tradizionali, in tutte le fasi del processo (gestione, condivisione, analisi e visualizzazione). A differenza dei database relazionali (caratterizzati dalla strutturazione, e quindi codifica, dei dati), nei Big Data i dati provengono da fonti eterogenee che comprendono, oltre ai database strutturati, file binari, immagini e file di testo. È proprio su quest’ultima categoria di dati che in molte aree, compresa quella medica, si concentra la maggior parte dei contenuti informativi che però risulta complicato estrapolare. Attraverso l’analisi computazionale e l’applicazione di strumenti di intelligenza artificiale per estrarre contenuti dal linguaggio naturale propri dei Big Data, si può invece dare un significato al contenuto testuale e trasformare così i dati in informazioni su cui si possono prendere delle decisioni.
L’articolo [PDF: 106 Kb]
Da CARE 4, 2013
Fonte: Murdoch TB, Detsky AS. JAMA 2013; 309: 1351-1352