Dal Nexa Center del Politecnico di Torino, il 33° Nexa Lunch Seminar

Data Curation @ SpazioDati, Mercoledì 22 luglio 2015, ore 13-14

Vai allo streaming

Nel mondo dei Big Data l’integrazione dati pone le aziende di fronte a nuove sfide, che necessitano di nuovi strumenti e di nuove competenze per essere vinte. Ecco perché l’utilizzo a livello enterprise delle tecnologie Linked Data rappresenta una delle migliori ricette per rispondere a queste necessità. Di questo tema, in occasione del 33° Nexa Lunch Seminar, discuterà il Community Manager di SpazioDati, Matteo Brunati.
SpazioDati, azienda trentina che opera nel segmento dei Big Data, del Machine Learning e dei Linked Open Data, utilizza internamente diverse ontologie per costruire e mantenere coerente un immenso knowledge graph di dati di alta qualità. Attraverso un processo di data curation che si appoggia su diversi strumenti open source, tra cui OpenRefine configurato con l’estensione NER (Named Entity Recognition) e la sua versione batch, gli standard aperti del Web dei Dati, ed altri strumenti del mondo Big Data, si possono vincere nuove sfide di aggregazione semantica, riuscendo a valorizzare al massimo il proprio patrimonio informativo.
Nel caso specifico di SpazioDati la sfida è duplice: da un lato occorre una gestione ottimale dei dati strutturati provenienti dal mondo corporate italiano, che sono il cuore del nuovo servizio di Sales Intelligence Atoka. Dall’altro è necessaria una gestione intelligente dei dati non strutturati in progressivo aumento, considerando in particolare il mondo dei social media. A tal proposito, usando il grafo costruito sulla conoscenza condivisa di Wikipedia, è stato possibile creare Dandelion API, una serie di API di analisi semantica del testo.
Questi strumenti si basano sulla flessibilità del knowledge graph che rappresenta un elemento dirompente per rendere accessibile conoscenza aggregata in modo semplice e veloce.


CONTATTI

Nexa center for Internet & Society

In this article