Diventa data scientist: tra hard e soft skill
Approfondire cosa sia il data scientist e le competenze richieste per questa nuova figura professionale, non vuol dire solo parlare di un argomento attualmente di moda, ma significa soprattutto comprendere la direzione verso la quale sta andando il mondo del lavoro.
Infatti, nella classifica 2019 dei lavori più promettenti stilata dal blog ufficiale di LinkedIn, il data scientist si trova in prima posizione.
Data scientist VS data engineer
È necessaria però effettuare una distinzione preliminare tra il data scientist e il data engineer, in quanto molte volte vengono confusi.
Il data scientist è colui che utilizza metodi computazionali per ottenere insight validi e azionabili da dataset grezzi, focalizzandosi sull’analisi, la predizione e la visualizzazione dei dati.
Il data engineer è colui che invece si occupa di risolvere i problemi delle applicazioni che utilizzano grandi volumi e varietà di dati.
Entrambi però hanno a che fare con diverse tipologie di dati ( dati strutturati, dati non strutturati e dati semi-strutturati) i quali stanno diventando sempre più centrali in qualsiasi tipo di attività. Le decisioni sono così sempre più data-driven e la loro correttezza deriva dalla capacità di saper governare questi enormi flussi di dati.
Le hard skill del Data Scientist
Il workflow del data scientist richiede l’adozione un approccio interdisciplinare dove diverse competenze si intrecciano tra loro in base al dominio di applicazione. Infatti le competenze tecniche che devono accomunare ogni data scientist (statistica, programmazione ecc.) devono essere sempre coniugate a quelle dello specifico campo di applicazione (ad esempio: social media, economia, medicina ecc.), perchè altrimenti si sarebbe solamente degli statistici o dei programmatori.
Lo scienziato dei dati si occupa di vari argomenti più o meno correlati tra loro in base alla tipologia di problema da risolvere. Ecco i principali:
– Come già accennato sopra, non importa come i dati saranno combinati e archiviati, quello che è certo è che questi dati dovranno essere interrogati effettuando delle query.
A tal fine, potremmo aver bisogno di utilizzare SQL (Structured Query Language) o se stiamo facendo un’analisi utilizzando un linguaggio di programmazione come R o Python (mettere link ad articolo su linguaggi di programmazione più utilizzati) si può scegliere tra dei formati di file standard (come CSV, Scripts, Application Files, Web Programming Files).
– Il data mining che ricerca schemi e relazioni tra le variabili e che ricomprende anche l’elaborazione delle serie temporali (molto importanti ad esempio per chi lavora nel mondo dell’economia e della finanza).
– L’elaborazione del linguaggio naturale (natural language processing, NLP) che trasforma gli elementi qualitativi di un testo in variabili quantitative permettendo di ottenere ad esempio la sentiment analysis .
– La network analysis che indaga le interconnessioni tra i diversi nodi e la loro rilevanza all’interno della rete stessa.
– La visualizzazione dei dati la quale può avvenire attraverso appositi pacchetti o moduli del linguaggio di programmazione utilizzato (ad esempio in R e Python) o tramite appositi software come Tableau o Power BI.
– Il Machine Learning che permette di effettuare delle previsioni in base a dei dati assunti come campione di riferimento.
Le soft skill
Stanno diventando sempre più importanti le cosiddette soft skill. A tal proposito, un recente studio di Linkedin ha ricordato come queste competenze diventeranno sempre più importanti, in quanto non automatizzatili dalle nuove tecnologie (a differenza delle hard skills che lo stanno diventando sempre di più).
La prima caratteristica del data scientist sarà sicuramente la curiosità e l’apertura alla novità. Infatti lo scienziato dei dati deve essere in grado di rimettere sempre in discussione le sue intuizioni iniziali in base alle risultati derivanti dall’analisi dei dati.
La capacità di lavorare in team, e soprattutto in team composti da persone con competenze diversificate, è essenziale.
Infine diventa imprescindibile la capacità di comunicare, in maniera creativa, i risultati del nostro lavoro, sottolineando quelli veramente utili per rispondere alle necessità del cliente.