Errori nella condivisione dei dati

Quali sono gli errori commessi dagli analisti quando distribuiscono il loro lavoro ai colleghi?

Risponde Ken Gross, Chief Data Scientist preso The Chartis Group:

Tutte le analisi cercano di rispondere a precise domande o gruppi di domande. Nel distribuire i risultati ai colleghi, gli analisti spesso dimenticano di specificare chiaramente quale era la domanda che ha guidato la loro analisi. Gli analisti dovrebbero sempre specificare chiaramente, prima dei risultati, a quali domande si sta cercando di rispondere.

Inoltre, il processo di analisi è spesso iterativo, dove un primo gruppo di domande porta a nuove o più precise domande. Nel presentare i risultati, gli analisti dovrebbero incoraggiare gli interessati a combinarli con le loro conoscenze ed esperienze, per fare in modo che il processo iterativo diventi anche collaborativo

(da distinct values)

In azienda le ciofeche costano carissime

Giro per le aziende insubriche e vedo gente capace, preparata e volenterosa, a cui vengono affidati compiti gravosi e importanti, che lavora ancora con PC di modernariato e software anziano.

“Lavora” è un eufemismo: in realtà dovrei dire “lotta, fatica, si dispera e si abbronza alla luce della clessidra”.

Faccio i conti della serva: metti che quel collaboratore costi almeno 50.000 €/anno, e che con meno di 2.000 € di hw/sw nuovo la sua produttività aumenti del 10% (e il suo stress diminuisca del 75%).

Penso quindi che queste aziende non sappiano far di conto, e che non dureranno a lungo.

(Più è grande l’azienda, più è grave è il problema)

(E non tocchiamo l’argomento “amministrazione pubblica”)

Comitato per la reintroduzione delle ordinate

Orrore: in meno di 24 ore mi sono passati in bacheca due grafici privi dell’asse delle y. Il primo del Post:

Il secondo di Oilproject (Marco per lo meno si scusa):

L’omissione dell’asse delle Y non è un errore, ma piuttosto un deliberato tentativo di nascondere la realtà. Sicuramente Il Post e Oilproject avranno i loro buoni motivi, che però mi addolorano e mi provocano cupa tristezza. Che direbbe Edward Tufte? Eh?

Le trendline sono invece perfettamente ammissibili senza ordinate, ed anzi chiarificatrici, se vengono mostrate assieme ai numeri, come in questo virtuoso esempio di sparklines con Excel 2016:

 

Il terremoto del 24 agosto 2016 non è ancora finito

Fino al 24 agosto 2016 in Italia c’erano da 20 a 60 eventi sismici al giorno. Da quel giorno in poi 10 volte di più, e non è ancora finita.

Qui sotto la geolocalizzazione con Excel degli ultimi 4 mesi dell’anno, riassunti in 3 minuti: