Webtudordimatematica

Visualizzare struttura e contenuto di un dataset in R

Hai importato il tuo dataset in R ma non sai come fare per vedere la sua struttura o il suo contenuto in maniera chiara e facilmente leggibile? Continua a leggere per scoprirlo!

Struttura e dimensione di un dataset

Inizio spiegandoti come puoi visualizzare la struttura dei dati precedentemente importati in R. Innanzitutto, importa il tuo file in R. Qui ho importato un file Excel e l'ho memorizzato nell'oggetto data.

library(readxl)
data <- read_excel("il_tuo_dataset.xlsx")

Successivamente, ti consiglio di trasformalo nel formato "data frame", formato che si presta molto bene per molteplici scopi come manipolazione, pulizia e analisi dei dati.

data <- as.data.frame(data)

Sei pronto per visualizzare la struttura di data. Il comando R è str:

str(data)

Questo ti fornisce in console la struttura del dataset che contiene sostanzialmente due informazioni

  • le dimensioni del dataset e in particolare il numero di osservazioni e il numero di variabili, ossia il numero di righe e di colonne rispettivamente
  • l’elenco delle variabili contenute nel dataset. Per ciascuna variabile vengono indicati nome, tipo di dato (chr, num, int, ecc...) e una breve anteprima delle osservazioni che contiene.

Ecco il tipo di output che visualizzi in console:

Visualizzare variabili e contenuto dataset in R

In fondo alla pagina trovi il video di questa lezione che puoi guardare per una maggiore comprensione.

 

Visualizzazione dei dati contenuti in un dataset

Se vuoi visualizzare le osservazioni contenute all'interno del tuo dataset, esistono diverse possibilità. Ti elenco qui di seguito le più utilizzate:

  1. Scrivi il nome dell'oggetto in cui hai memorizzato il dataset e lo lanci. In console ti apparirà tutto il dataset ma, se esso contiene troppe righe e colonne sarà difficile avere una visualizzazione chiara.
  2. Usa il comando head per visualizzare in console solo le prime 6 righe del dataset. Questo comando produce un output simile al primo solo con meno righe. Anche in questo caso però, se hai troppe colonne non vedrai bene i dati.

    head(data)
  3. Infine il terzo e miglior modo per visualizzare i tuoi dati in R è lanciando il comando View.

    View(data)
    Questo crea una finestra nuova accanto a quella corrente in cui i dati vengono intabbellati proprio come in un foglio Excel.

Guarda il video qui sotto se non ti è chiaro qualche passaggio.

Il quaderno degli appunti
Statistica e Probabilità

Tavola della distribuzione normale standard: come leggerla

La tavola della distribuzione normale standard ti permette di calcolare la probabilità a sinistra di un dato quantile o viceversa trovare il valore d
Analisi matematica

Calcolo delle derivate

La teoria dell'analisi matematica ci dice che, a norma di definizione, il calcolo della derivata di una funzione equivale al calcolo del limite del ra
Trigonometria

Teorema della corda, teorema delle proiezioni, teorema dei seni e dei coseni

Teorema della corda La misura di una corda di una circonferenza è uguale al prodotto tra la misura del diametro ed il seno di uno qualunque degli ang