Archive for the ‘R’ Tag

R vs Knime vs Azure Machine Learning

Pubblicato il 16/05/2016 da Stefano Cazzella in Analytics,Business Intelligence

I processi di digital transformation in atto in molti (tutti) settori di mercato stanno facendo crescere la febbre per il così detto “new oil”: i big data. Nell’ambito di tali processi di digitalizzazione svolge un ruolo sempre più centrale l’adozione di tecniche e tecnologie di machine learning per trasformare in business value la sempre crescente molte di dati a disposizione di imprese e istituzioni (argomento che merita maggiori approfondimenti; in tanto può valere la pena leggere questo best seller).

Prova ne è il proliferare di soluzioni di machine learning (molte offerte in modalità PaaS) che contribuiscono a “democratizzare” l’uso di tali tecnologie, ampliando la platea degli addetti ai lavori e aspiranti data scientist.

È quindi interessante mettere a confronto approcci tradizionali basati sull’utilizzo di ambienti di programmazione statistica come R (che richiede skill tecnici di tipo specialistico) con soluzioni di più immediato utilizzo, come Knime o Azure Machine Learning (la piattaforma cloud di ML targata Microsoft), che presentano una barriera all’ingresso decisamente inferiore (non fosse altro per gli ambienti visuali con cui si opera).

R Studio

R Studio

Knime

Knime

Azure Machine Learning Studio

Azure ML Studio

Seguono risultati del confronto

 

Visualizing communities in dynamic networks

Pubblicato il 20/10/2013 da Stefano Cazzella in Analytics,Business Intelligence

Con il solito gruppo di amici abbiamo fatto qualche esperimento con le streaming api di Twitter per realizzare real-time analytics, utilizzando tecnologie on-the-edge quali MongoDB, Redis, Node.js, vari framework come Socket.IO o Bootstrap per creare single page application, l’immancabile R, d3.js e vari altri.

Il target dell’analisi erano le conversazioni generate su Twitter durante i talk show televisivi. Fra le questioni da affrontare è emersa la necessità di visualizzare in modo sintetico, immediato e dinamico i diversi gruppi di utenti/telespettatori che si aggregano intorno a temi comuni di discussione.

La soluzione individuata prevede di rappresentare graficamente ogni gruppo come un insieme di keyword (i principali temi discussi che caratterizzano la community) con ampiezza proporzionale al numero di utenti coinvolti nell’intervallo temporale di osservazione (numero riportato anche in alto, sopra le keyword).

La versione animata realizzata con D3.js non è supportata da Internet Explorer