Blogtega

la Bottega hi-tech per la data-driven strategy | trustworthy answers powered by Quaerys®

R vs Python: una scelta context-oriented

R e Python: le caratteristiche

R e Python sono tra i i linguaggi di programmazione attualmente più conosciuti e utilizzati nell’ambito della data science. Entrambi sono caratterizzati da punti di forza e di debolezza.

Questo breve post introduttivo non vuole essere un’analisi comparata delle loro caratteristiche, in quanto già in molti lo hanno fatto in maniera eccellente e per questo ci limitiamo a rimandarvi ad alcune di queste risorse (datacamp, data-driven science, KDnuggets ) e ai seguenti video.

La scelta del più adatto e non del migliore

Quello che vogliamo sottolineare qui è che a nostro parere non esiste “il linguaggio migliore”, ma esiste semmai il linguaggio più adatto agli obiettivi e dalle necessità dell’analista. 

Ecco un esempio che ripercorre le varie fasi del workflow del data scientist

Nella fase di raccolta dei dati potrebbero essere utile utilizzare entrambi i linguaggi. Infatti, se Python è particolarmente adatto nei casi in cui sia necessario il web scraping, alcune librerie di R potrebbero risultare più funzionali a scaricare dati in maniera strutturata (sotto forma di dataframe) da dei social (come ad esempio Reddit) tramite API.

In seguito nella fase di pulizia e di analisi entrambi i linguaggi implementano degli ottimi strumenti, che potranno essere valutati caso per caso in base alla necessità e alle competenze pregresse dell’analista.

Se si volesse effettuare delle visualizzazioni direttamente senza utilizzare ulteriori software, la libreria ggplot2 di R potrebbe essere una scelta azzeccata grazie alla varietà di opzioni di visualizzazione e di setting. 

In Quaerys siamo convinti che, nella scelta degli strumenti di lavoro, il tifo da stadio per una tecnologia piuttosto che per un’altra penalizzi profondamente la qualità del lavoro svolto, in quanto un vero data scientist deve essere sempre aggiornato sulle potenzialità e i limiti di ogni strumento in modo da poter indirizzare la sua scelta verso l’opzione più adatta al problema da risolvere, laddove quella utilizzata fino a quel momento risulti carente.

Segui la nostra raccolta di risorse gratuite per imparare le basi di R e Python.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *