Transformação e Manipulação de Dados com a linguagem R
Bem-Vindo
Este livro eletrônico contém uma série de informações sobre transformação e manipulação de dados utilizando a linguagem R, mais especificamente o pacote tidyverse.
Estas são etapas muito importantes para quem trabalha com dados, como por exemplo uma área de negócio de uma organização, buscando tomar decisões com base em seus dados, ou até mesmo no ciclo de vida de um projeto de ciência de dados.
A comunidade R tem produzido ao longo dos anos uma série Folhas de Referências (cheatsheets) que fazem parte também da ferramenta de desenvolvimento RStudio.
Estas Folhas de Referências, são anotações de uma ou duas páginas que visam resumir as principais informações sobre determinado tema ou pacote do R. São uma espécie de “cola” para nos lembrarmos dos comandos e informações mais relevantes.
Este livro se baseia nestas folhas de referências, que apesar de extremamente úteis, podem ser de difícil interpretação para usuários iniciantes.
Outro motivador para este livro, foi a escassez de documentação sobre o tema em língua Portuguesa, que apesar dos grandes esforços da comunidade brasileira e voluntários, ainda sofre com falta de acesso para quem não domina o idioma inglês.
Para melhor utilizar o conteúdo deste livro, é importante que você já possua uma introdução à linguagem R e saiba carregar pacotes (packages) no R. Não iremos abortar comandos básicos da linguagem e nem mesmo instalação da ferramenta de desenvolvimento.
Para mais informações acesse:
Os temas abordados neste livro são:
Importação de Dados: Trata sobre importação de dados tabulados (.csv, .tsv, .txt), planilhas do Excel e Google Sheets, através do pacote tidyverse (readr, readxl and googlesheets4). Ver folha de referência: data-import cheatsheet.
Organização de Dados: Sobre organização de dados com o pacote tidyr. Mover colunas e linhas de forma a estruturar seus dados em tabelas organizadas. Ver folha de referência: tidyr cheatsheet.
Transformação de dados : Apresenta a transformação de dados com o pacote dplyr. Aplicação de filtros, sumarização, criação de colunas calculadas e muitas outras funções de transformação. Ver folha de referência: data transformation cheatsheet
Manipulação de strings: Fala sobre manipulação de strings (textos) com o pacote stringr. Apresenta também um bom conteúdo sobre expressões regulares (regex). Ver folha de referência: stringr cheatsheet
Fatores: Fala sobre manipulação de fatores (estruturas de dados para variáveis qualitativas) com o pacote forcats. Ver folha de referência: factors cheatsheet
Datas e horas: Sobre a formatação e cálculos de variáveis com datas e horas com o pacote lubridate. Ver folha da referência: lubridate cheatsheet.
Programação Funcional: Sobre programação funcional, listas e funções com o pacote purrr. Ver folha da referência: purrr cheatsheet.
Visualização de Dados: Traz uma introdução à criação de gráficos através do pacote ggplot2 e também uma introdução ao pacote gt para criação de tabelas de relatórios. Ver folha da referência: data visualization cheatsheet.
Conteúdo gerado à partir do sitema de publicação Quarto.
Licença
Este livro é uma pequena contribuição à comunidade de software livre. Ele é (e sempre será) livre, e está licenciado sob a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 License.
Se você quiser contribuir, por favor, considere em reportar algum erro ou sugestão em github.com/scopinho/Livro_Transform_Dados_R.