Básico Tutoriais de R

Variáveis e estruturas de dados no R

1-Variáveis-e-Estrutura-de-Dados.utf8.md

key words: Estrutura de Dados, Variáveis

O que são variáveis e como definí-las

As variáveis são o(s) objetos utilizados como insumo para análise estatística. São compostas por números, textos, matrizes, vetores, entre outros. Cada uma destas possui características próprias que definem regras de manuseio e podem impactar na performance das análises.

O objetivo desse tutorial compreende explorar os diferentes tipos de variáveis, suas propriedades e alguns comandos preliminares para manuseá-las.

No R, você pode definir variáveis de uma forma muito simples. Apenas utilizando o sinal de “=” ou “<-”. Veja o exemplo abaixo:

var1<-50
var2="Texto"

No exemplo duas variáveis são criadas. A primeira denominada var1 cujo valor é um número definido como 50. A segunda diz respeito a um texto (ou string) cujo valor é “Texto”. O R atribui automaticamente a classe que ele julga adequada para uma variável. Para consultar a classe estabelecida utilize o comando class().

class(var1) ; class(var2)
## [1] "numeric"
## [1] "character"

A tabela abaixo sumariza as principais classes de variáveis, suas propriedades e alguns exemplos de quando devem ser utilizadas.

Tipos de Variávels
Tipo Descrição Propriedades Exemplos
Texto (String) Variável formada por caracteres alfanuméricos Não permite operações matemáticas. Devem ser definidos usando aspas. Computador, céu, aaaa, bbbb, ccc
Numérico (Numeric) Variável formada por números Permite operações matemáticas 12.3, 4.3, 10, 21
Inteiro (Integer) Variável formada por números do conjuntos dos inteiros Não permite que hajam valores decimais. O R coloca o sulfixo L para diferenciar de uma variável numérica 12L, 10L, 3L
Lógico (Lógico) Variável formada pelas categorias TRUE ou FALSE Não são reconhecidos como textos. Não são definidos usando aspas. TRUE, FALSE

Algumas funções úteis na manipulação de variáveis são elencadas no código abaixo.

varstring="TRUE"; varnum=2.2; varint=10 ; varlog=TRUE

## Funções is._ (com sulfixos numeric, character, integer e logical)
is.numeric(varstring) ## Responde com uma variável lógica se o objeto é variável numérica
## [1] FALSE
is.character(varstring) ## Responde com uma variável lógica se o objeto é variável texto
## [1] TRUE
## Funções as._ (com sulfixos numeric, character, integer e logical)
as.logical(varstring) ## Força a transformação (se possíve) do objeto para o tipo lógico
## [1] TRUE
as.integer(varnum) ## Força a transformação (se possíve) do objeto para o tipo inteiro
## [1] 2

Estrutura de Dados

Um conjunto de variávels pode ser armazenado por uma Estrutura de Dados. De forma simples, podemos associá-las com uma planilha eletrônica, por exemplo. No entanto, estrutura de dados vão muito além e possuem propriedades diversas. A tabela a seguir resume os principais casos.

Tipos de Estrutura de Dados
Tipo Descrição Propriedades
Matriz (Matrix) Tabela. Variáveis organizadas em no máximo duas dimensões (linhas e colunas) Cada coluna contém uma variável com tipo único
Data Frame Tabela. Variáveis organizadas em no máximo duas dimensões (linhas e colunas) Cada coluna contém uma variável com tipo único
Vetor (Vector) Sequência de valores referentes a um tipo único variável Todos os elementos do vetor são de um mesmo tipo
Fatores (Factor) Sequência de valores referentes a mais de um tipo único variável Aceita tipos variádos, porém, deve possuir um universo de possibildades finito
Array (Arranjos) Bloco de informações. Variáveis organizadas em mais de duas dimensões Suas dimensões são compostas por matrizes. Cada camada comporta uma matriz.
Listas (Lists) Bloco de informações. Variáveis organizadas em três dimensões Suas dimensões são compostas por quaisquer outra estrutua de dados

Vamos criar alguns exemplos de estruturas de dados. Para buscar mais informações sobre cada uma delas, assim como exemplos, utilize a função help().

m<-matrix(c(2,4,5,3), nrow = 2, byrow = 2) ## Cria uma matriz numérica
v<-c("OLA", "HI", "HOLA")                  ## Cria um vetor com textos
l<-list(m, v)                              ## Cria uma lista com a matrix "m" e o vetor "v"
df<-as.data.frame(m)                       ## Converte a matriz "m" para um data frame
f<-factor(c(rep("M",7), rep("F",10)));f    ## Cria um fator com universo "M" ou "F"  
##  [1] M M M M M M M F F F F F F F F F F
## Levels: F M

Utilizando a função class() é possível verificar a classe da estrutura de dados. No entanto, com a função str() pode-se verificar, além da classe do próprio objeto analisado, a classe das variáveis que compõe essa estrutura de dados. Por exemplo:

str(m)
##  num [1:2, 1:2] 2 5 4 3
str(f)
##  Factor w/ 2 levels "F","M": 2 2 2 2 2 2 2 1 1 1 ...
str(l)
## List of 2
##  $ : num [1:2, 1:2] 2 5 4 3
##  $ : chr [1:3] "OLA" "HI" "HOLA"

Para se aprofundar no manuseio e entendimento das estruturas de dados clique aqui.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *