r_statistics
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
| Próxima revisão | Revisão anterior | ||
| r_statistics [2018/11/16 21:46] – criada rtsaboya | r_statistics [2018/11/16 22:04] (atual) – [Subsetting] rtsaboya | ||
|---|---|---|---|
| Linha 1: | Linha 1: | ||
| - | ==== R Snippets ==== | + | ===== R Snippets |
| - | === Subsetting === | + | ==== Subsetting |
| - | < | + | < |
| # Selecionar apenas as linhas com determinados valores (lidando com NA) | # Selecionar apenas as linhas com determinados valores (lidando com NA) | ||
| dataset[which(dataset$variable> | dataset[which(dataset$variable> | ||
| + | |||
| + | # Remove rows with NA values | ||
| + | dataset< | ||
| + | |||
| + | # Subset com base em uma string contida num campo | ||
| + | subset< | ||
| # Selecionar apenas as linhas com determinados valores | # Selecionar apenas as linhas com determinados valores | ||
| Linha 19: | Linha 25: | ||
| writeLines(c(" | writeLines(c(" | ||
| close(fileConn) | close(fileConn) | ||
| + | </ | ||
| + | |||
| + | ====Dplyr==== | ||
| + | |||
| + | <code rsplus> | ||
| + | |||
| + | # selecionar apenas as linhas desejadas | ||
| + | newdataset< | ||
| + | |||
| + | # com mais de uma coluna como critério: | ||
| + | newdataset< | ||
| + | |||
| + | # Criar novo campo só quando uma condição for verdadeira | ||
| + | rawData< | ||
| + | |||
| + | # Sumarizar | ||
| + | dataset< | ||
| + | newdataset< | ||
| + | newVariable1=mean(variable1), | ||
| + | newVariable2=max(variable2), | ||
| + | newVariable3=median(variable3), | ||
| + | newVariable4=sum(NumJanelas[NumDoPavto< | ||
| + | HighVisibility=sum(Visibilidade==" | ||
| + | NumberPlots=n_distinct(Lote), | ||
| + | Quant=n(), # conta quantos elementos dentro de cada valor usado para agrupar | ||
| + | | ||
| + | # Testa duas condições. Se TRUE, atribui primeiro valor (poderia ser uma operação entre campos); se FALSE, atribui último valor: | ||
| + | residentialGround = ifelse((uso==" | ||
| + | | ||
| + | ) #vai usar os grupos indicados no comando anterior | ||
| + | |||
| + | # se houver valores nulos em alguma variável, pode dar erro. Solução: | ||
| + | newdataset< | ||
| + | |||
| + | # Criar uma nova coluna para realçar possíveis erros com base em uma combinação de valores de outras colunas | ||
| + | checa< | ||
| + | x=ifelse(pavtosBase == 0 & pavtosTorre != 0, 1, 0) # condição, valor caso TRUE, valor caso FALSE | ||
| + | ) | ||
| </ | </ | ||
r_statistics.1542404803.txt.gz · Última modificação: por rtsaboya
