Estructuras de datos

Casi todo en R es un objeto, incluyendo funciones y estructuras de datos. Para saber los objetos que tenemos en el espacio de trabajo utilizaremos ls(). Además si escribimos el nombre de un objeto muestra su contenido (por ejemplo sd). Para guardar el contenido del espacio de trabajo se pueden utilizar las funciones save.image() y save(<objetos>,file="nombre.RData"). Si queremos trabajar con datos propios se pueden cargar con load() desde la carpeta de trabajo (o del camino que especifiquemos) o se pueden adjuntar con attach():

# primero borramos (remove) todos los objetos del entorno de trabajo
rm(list = ls())
# ahora cargamos algunos datos del paquete MASS
data(list = c("Animals", "crabs", "UScrime"), package = "MASS")
ls()
save("Animals", "crabs", "UScrime", file = "misdatos.RData")
rm(list = ls())
ls()
load("misdatos.RData")
ls()

Adjuntar los datos hará que podamos acceder a ellos de forma directa, unicamente indicando sus nombres. Observemos que los datos adjuntados ocupan la segunda posición en la 'search list'. Para 'desadjuntarlos' utilizaremos la función detach().

Puede que tu investigación involucre cargar archivos de grandes bases de datos. En ese caso deberías “perder” algo de tiempo buscando la mejor estrategía para cargarlos de forma eficiente. Echa un vistazo aquí y aquí, y luego echa un vistazo a este paquete dplyr.

Hay diferentes estructuras de datos y los siguientes enlaces profundizan lo suficiente para que tengas las destrezas básicas en su manejo. Si no puedes esperar … la siguiente sección te hace un resumen de dichas estructuras.

¡Para los impacientes!

Los datos pueden declararse a través de diferentes objetos dentro de R:

x <- c(1, 2, 3)
y <- c("a", "b", "c")
z <- c(TRUE, TRUE, FALSE)
array(x, c(2, 4))  # utilizamos el vector x definido anteriormente
dades <- data.frame(ID = c("gen0", "genB", "genZ"), subj1 = c(10, 25, 33), subj2 = c(NA, 
    34, 15), oncogen = c(TRUE, TRUE, FALSE), loc = c(1, 30, 125))
ff <- factor(c(1, 2, 2, 1, 1, 2, 1, 2, 1))
una.lista <- c(un.vector = 1:10, una.palabra = "hola", una.matriz = matrix(rnorm(20), 
    ncol = 5), lista2 = c(a = 5, b = factor(c("a", "b"))))