MilanoR meeting: Why we ♡ R

by Carlo Bonini

facebooktwittergoogle_pluspinterestlinkedintumblr

IMG_0745Ieri sera, come avevo già scritto in questo articolo, abbiamo partecipato al convegno internazionale MilanoR per parlare di come MEC italy sta utilizzando R per analizzare la grande mole di dati dell’advertising online e offline. Un paio di precisazioni per chi non è del settore:MEC è un’agenzia media che si occupa di pianificare, strutturare e deliverare tutte le attività di comunicazione di alcuni fra i maggiori brands italiani.Questo comporta compravendita di spazi pubblicitari online (il classico video che parte su youtube “skippabile”) e offline (il 30% delle pubblicità che vedete in tv sono pianificate e deliverate dalla nostra agenzia).

Siamo e saremo sempre di più una società data-driven e che ha come centro focale per le decisioni l’analisi del dato.

In quest’ottica, quale miglior strumento di analisi dei dati se non R?

Venendo all’oggetto del convegno di ieri sera, ci è stato chiesto di mostrare come internamente utilizziamo il software R, e ci siamo prodigati nel mostrare alcuni momenti dello sviluppo di un applicazione Shiny combinata con Google Vis, che ha dato ad uno dei nostri clienti una visibilità suo i propri dati che vecchi e obsoleti strumenti come Excel non sono in grado di dare. Nei successivi posts vi mostreremo il codice che sta dietro questa applicazione.

In particolare, mi ha colpito una domanda che mi è stata posta, in qualità di Junior Data Scientist che vi riporto:

Cos’è un Data Scientist?

Sebbene abbia tentennato sul momento, perché preso da sgomento, sono in grado di poter dire ora che il ruolo del data scientist è il seguente:

“Il Data Scientist è migliore di uno statistico a programmare, e migliore di un programmatore a fare statistica”

In altre parole, è un buon statistico che sa programmare,e un buon programmatore che ne sa di statistica, non un rocket scientist come sembra dal nome.