Swivel: lo “YouTube” dei Dati

Pubblicato il 11/12/2006 da Stefano Cazzella in Business Intelligence,Marketing,Web 2.0

SwivelDopo un anno di sviluppo vede la luce il progetto di Dmitry Dimov e Brian Mulloy: realizzare lo “YouTube” dei dati. Sotto l’attenta supervisione di Minor Ventures (giovane e abile venture capital della valley con all’attivo già importanti successi quali il co-finanziamento di Salesforce.com) Dimov, Mulloy & co. hanno realizzato una Web App 2.0 per la condivisione, l’esplorazione e la re-distribuzione di dati. Il modello di business è fra i più sfidanti nell’era 2.0: nessun costo per chi condivide dati e risultati, un canone per chi vuole usufruire del servizio in maniera riservata. Come si affronta una sfida così ardua?

Il servizio

L’idea centrale del progetto è quella di realizzare un repository di dati di varia natura, alimentato e gestito dagli utenti stessi via web; i dati raccolti possono essere visualizzati (creando dei grafici) e comparati fra loro alla ricerca di correlazioni interessanti o stravaganti. Attraverso un’interfaccia abbastanza semplice da usare, il sistema assiste gli utenti segnalando fra i data set disponibili quelli maggiormente correlati con i dati che si stanno analizzando; inoltre vengono calcolati alcuni indici numerici che consentono di misurare il livello di correlazione presente fra i dati comparati.

I grafici che riassumono i risultati delle analisi possono poi facilmente essere pubblicati in blog esterni con un semplice copy&paste di codice HTML. I dati e i risultati pubblicati liberamente su Swivel appartengono alla comunità (anzi a tutti, poiché per visualizzarli e manipolarli non è neanche necessario essere registrati come utenti): chiunque può effettuare ulteriori speculazioni a partire dai risultati raggiunti da altri in piena logica collaborativa. Swivel integra inoltre un sistema di valutazione della popolarità di un grafico o di un data set con due indicatori distinti: il voto degli altri utenti e il numero di volte che il grafico/data set è stato visto. Inoltre è prevista la possibilità di commentare un grafico consentendo di gestire discussioni verticali sul tema proposto dal grafico stesso.

Così, ad esempio, nei primi giorni di “apertura” al pubblico di Swivel è emerso, incrociando due data set forniti da due utenti differenti, una curiosa correlazione inversa fra “crimini violenti” e “consumo di vino” negli stati uniti.

http://swivel.com/graphs/show/1169349

Una di quelle correlazioni che ci si aspetterebbe di trovare in Freakonomics di Steven Levit (non a caso Dubner – il coautore del libro – ha recensito Swivel sul proprio Blog qualche giorno prima della sua apertura, ricevendo commenti ironici/increduli circa la realizzabilità del progetto stesso).

Il modello di business

Come guadagnare da un servizio di questo tipo senza ricorrere al classico inserimento di avvisi pubblicitari contestuali? La risposta è nell’individuazione di una serie di funzionalità PRO che giustifichino il pagamento di una fee senza penalizzare l’usabilità e il senso di quanto disponibile gratuitamente. Questa strada, seguita anche da Flickr e altri virtuosi servizi web 2.0, richiede una profonda convinzione nel valore che gli utenti PRO possono attribuire al servizio PRO.

Il servizio PRO offerto da Swivel consiste nel fornire agli utenti PRO la possibilità di incrociare in modo sicuro i loro dati riservati con quelli pubblici forniti dagli altri utenti: in cambio di una fee (ancora non nota) un utente PRO può importare in Swivel i propri dati riservati, che rimarranno naturalmente invisibili agli altri utenti, ed applicare gli algoritmi di Swivle incrociando tali dati con altri dati da lui forniti o pubblicati liberamente da altri utenti; i risultati della comparazione saranno naturalmente anch’essi riservati. La versione PRO del servizio sarà attivata al termine della fase di preview.

E’ interessante riflettere sulla reale natura del servizio PRO offerto: i dati di pubblico dominio possono essere scaricati da Swivel in formato CVS e quindi incrociati con i dati riservati senza bisogno di portare questi ultimi in Swivel; inoltre gli algoritmi di correlazione sono fra i più comuni e non sono presenti funzionalità di calcolo delle statistiche o di preparazione dei dati (fasi fondamentali in qualunque indagine di tipo statistico o semplicemente di analisi dei dati). Quale è allora il reale servizio su cui puntano Dimov e Mulloy per convincere gli utenti PRO a portare i loro dati in Swivel e pagare un canone per mantenerli riservati? A mio avviso tale servizio si basa su due caratteristiche del sistema (a regime):

  • l’ampia disponibilità di data set che spazino in diversi campi applicativi: dall’economia alla salute pubblica, dall’istruzione alle abitudini alimentari;
  • la possibilità di individuare, dato un data set (magari riservato), quelli che, fra tutti i data set pubblicamente disponibili, sono altamente correlati con il primo.

Il secondo punto vuole essere una risposta a domande del tipo: ok, i dati presenti nel mio database mi dicono che è in atto questo fenomeno, quali altri fenomeni correlati al mio sono in atto in contemporanea? Il che sottintende la domanda successiva: quali di questi sono in un possibile rapporto di causa-effetto con il fenomeno di interesse?. A questa seconda domanda sono chiamati a rispondere i business analyst (o analoghe figure professionali), ma la prima richiede spesso costose azioni di indagine all’esterno dell’azienda per raccogliere e/o acquisire i dati di confronto. Se si ha già un’idea della direzione in cui cercare, tali costi possono essere radicalmente ridotti

Tali considerazioni ci riportano al primo punto, come raccogliere informazioni con diverse profondità temporali e che spazino in campi diversi? La risposta Web 2.0 è offrire un servizio di condivisione di tali informazioni affinché tutti (tutti gli appassionati del genere) possano beneficiarne e siano incentivati a contribuire con i dati in loro possesso. Questo approccio al problema consente di offrire a ciascun interlocutore il servizio di cui ha bisogno nelle giuste modalità e in maniera sostenibile. Viene proposta una versione gratuita del servizio per chi usa lo strumento a fini hobbistici, soddisfacendo così un desiderio di informazioni ampiamente sentito in chi si diletta nella nobile arte di “incrociare e analizzare i dati” e che difficilmente sarebbe potuto essere soddisfatto diversamente. Parallelamente viene offerto uno strumento a pagamento per i professionisti che usufruiscono del contributo degli hobbisti pagando chi ha permesso che tutto ciò si realizzasse.

Uno degli elementi chiave di successo del progetto sarà l’attendibilità dei dati pubblici; in questo senso esperienze come Wikipedia possono essere di conforto circa la qualità dei contributi auto-gestiti dagli utenti e l’efficacia delle forme di controllo collettivo.

1 commento »

  1. Commento di Tommaso Tessarolo
    11 December 2006 @ 20:47

    Bel post! Mi ero naturalmente già iscritto al servizio, lo faccio con qualsiasi cosa segnali TechCrunch, ma non ci avevo capito un gran chè. I metodi di import mi son sembrati un po rozzi, e mi aspettavo qualche fuoco d’artificio in più.

    Ora l’idea generale mi è più chiare, e certo se cresceranno di molto le sorgenti pubblicamente disponibile potremmo scoprire cose che neanche immaginavamo.

RSS feed for comments on this post. TrackBack URL

Lascia un commento