A.5 dplyr e ggplot2 em conjunto

Durante uma análise exploratória de dados, muitas perguntas surgem com a análise de gráficos simples, que podemos criar com poucas linhas de comando. Com os comandos ensinados nos passos anteriores, e novamente utilizando o conjunto de dados iris, vamos fazer uma exploração muito breve nesses dados.

A.5.1 Gráfico de espalhamento

iris %>%
  select(Species, Sepal.Width, Sepal.Length) %>%
  ggplot(.) + # lembrem-se que o data.frame com colunas selecionadas acima aqui e representado por um `.`
  geom_point(aes(x = Sepal.Width, y = Sepal.Length, color = Species)) +
  xlab("Largura de sépala (cm)") +
  ylab("Comprimento de sépala (cm)")

A.5.2 Diagrama de caixas

iris %>%
  select(Species, Sepal.Length) %>%
  ggplot(.) +
  geom_boxplot(aes(x = Species, y = Sepal.Length, fill = Species)) +
  xlab("Espécies de Iris") +
  ylab("Comprimento de sépala (cm)")

A.5.3 Histograma

iris %>%
  select(Species, Sepal.Width) %>%
  ggplot(.) +
  geom_histogram(aes(x = Sepal.Width, fill = Species)) +
  xlab("Largura de sépala (cm)") +
  ylab("Frequência") +
  facet_wrap(~Species)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.