r_statistics
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
r_statistics [2018/11/16 19:46] – criada rtsaboya | r_statistics [2018/11/16 20:04] (atual) – [Subsetting] rtsaboya | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
- | ==== R Snippets ==== | + | ===== R Snippets |
- | === Subsetting === | + | ==== Subsetting |
- | < | + | < |
# Selecionar apenas as linhas com determinados valores (lidando com NA) | # Selecionar apenas as linhas com determinados valores (lidando com NA) | ||
dataset[which(dataset$variable> | dataset[which(dataset$variable> | ||
+ | |||
+ | # Remove rows with NA values | ||
+ | dataset< | ||
+ | |||
+ | # Subset com base em uma string contida num campo | ||
+ | subset< | ||
# Selecionar apenas as linhas com determinados valores | # Selecionar apenas as linhas com determinados valores | ||
Linha 19: | Linha 25: | ||
writeLines(c(" | writeLines(c(" | ||
close(fileConn) | close(fileConn) | ||
+ | </ | ||
+ | |||
+ | ====Dplyr==== | ||
+ | |||
+ | <code rsplus> | ||
+ | |||
+ | # selecionar apenas as linhas desejadas | ||
+ | newdataset< | ||
+ | |||
+ | # com mais de uma coluna como critério: | ||
+ | newdataset< | ||
+ | |||
+ | # Criar novo campo só quando uma condição for verdadeira | ||
+ | rawData< | ||
+ | |||
+ | # Sumarizar | ||
+ | dataset< | ||
+ | newdataset< | ||
+ | newVariable1=mean(variable1), | ||
+ | newVariable2=max(variable2), | ||
+ | newVariable3=median(variable3), | ||
+ | newVariable4=sum(NumJanelas[NumDoPavto< | ||
+ | HighVisibility=sum(Visibilidade==" | ||
+ | NumberPlots=n_distinct(Lote), | ||
+ | Quant=n(), # conta quantos elementos dentro de cada valor usado para agrupar | ||
+ | | ||
+ | # Testa duas condições. Se TRUE, atribui primeiro valor (poderia ser uma operação entre campos); se FALSE, atribui último valor: | ||
+ | residentialGround = ifelse((uso==" | ||
+ | | ||
+ | ) #vai usar os grupos indicados no comando anterior | ||
+ | |||
+ | # se houver valores nulos em alguma variável, pode dar erro. Solução: | ||
+ | newdataset< | ||
+ | |||
+ | # Criar uma nova coluna para realçar possíveis erros com base em uma combinação de valores de outras colunas | ||
+ | checa< | ||
+ | x=ifelse(pavtosBase == 0 & pavtosTorre != 0, 1, 0) # condição, valor caso TRUE, valor caso FALSE | ||
+ | ) | ||
</ | </ |
r_statistics.1542404803.txt.gz · Última modificação: 2018/11/16 19:46 por rtsaboya