diff --git a/.Rbuildignore b/.Rbuildignore index 362fb74..7ff7397 100644 --- a/.Rbuildignore +++ b/.Rbuildignore @@ -9,3 +9,4 @@ ^cran-comments\.md$ ^codemeta\.json$ ^CRAN-RELEASE$ +^data-raw$ diff --git a/DESCRIPTION b/DESCRIPTION index 7b6e875..c8b28ae 100644 --- a/DESCRIPTION +++ b/DESCRIPTION @@ -70,7 +70,7 @@ License: GPL-3 Encoding: UTF-8 LazyData: true Roxygen: list(markdown = TRUE) -RoxygenNote: 7.1.2 +RoxygenNote: 7.2.3 URL: https://github.com/cienciadedatos/dados BugReports: https://github.com/cienciadedatos/dados/issues Depends: diff --git a/R/stringr.R b/R/stringr.R new file mode 100644 index 0000000..3af6b68 --- /dev/null +++ b/R/stringr.R @@ -0,0 +1,31 @@ +#' Vetores de caracteres do pacote stringr +#' +#' Amostra de vetores de caracteres para praticar a manipulação de strings +#' +#' frases - é uma lista de frases escritas em português +#' +#' frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit. +#' +#' palavras - é uma lista de palavras frequentes usadas em português brasileiro +#' @format Um vetor +#' @name dados-stringr +#' @examples +#' +#' length(frases) +#' frases[1:5] +#' +#' length(frutas) +#' frutas[1:5] +#' +#' #' length(palavras) +#' palavras[1:5] +NULL + +#' @rdname dados-stringr +"frases" + +#' @rdname dados-stringr +"frutas" + +#' @rdname dados-stringr +"palavras" diff --git a/README.Rmd b/README.Rmd index 1476202..64b04a8 100644 --- a/README.Rmd +++ b/README.Rmd @@ -20,11 +20,12 @@ library(stringr) knitr::opts_chunk$set(echo = TRUE) ``` -# dados +# dados -[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) -[![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + +[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) [![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + Este pacote disponibiliza a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund, cuja [versão em português](https://altabooks.com.br/produto/r-para-data-science/) foi publicada por AltaBooks & O'Reilly. @@ -44,7 +45,6 @@ A versão de desenvolvimento pode ser instalada a partir do GitHub: remotes::install_github("cienciadedatos/dados") ``` - ## Traduções As traduções disponíveis dentro de `dados` são as seguintes: @@ -67,10 +67,11 @@ pkgs %>% knitr::kable() ``` +Os dados para praticar a manipulação de strings são `frases`, `palavras` e `frutas`. ## Uso -O pacote `dados` pode ser carregado como qualquer outro pacote de R: +O pacote `dados` pode ser carregado como qualquer outro pacote de R: ```{r, message = FALSE} library(dados) @@ -78,7 +79,7 @@ library(ggplot2) library(dplyr) ``` -Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no _workspace_ do R no momento em que o chamamos pela primeira vez em português: +Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no *workspace* do R no momento em que o chamamos pela primeira vez em português: ```{r} glimpse(diamante) @@ -97,8 +98,7 @@ diamante %>% ``` - - + ## Funções internas de `dados` diff --git a/README.md b/README.md index 64b2d21..fab34fa 100644 --- a/README.md +++ b/README.md @@ -1,13 +1,14 @@ -# dados +# dados [![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) [![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + Este pacote disponibiliza a tradução de conjuntos de dados em inglês @@ -84,6 +85,9 @@ As traduções disponíveis dentro de `dados` são as seguintes: | dados_oms | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who | | dados_oms2 | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who2 | +Os dados para praticar a manipulação de strings são `frases`, `palavras` +e `frutas`. + ## Uso O pacote `dados` pode ser carregado como qualquer outro pacote de R: @@ -128,7 +132,7 @@ diamante %>% labs(title = "Diamantes", subtitle = "Preço e transparência", y = "Preço", x = "Transparência") ``` - + ## Funções internas de `dados` diff --git a/data-raw/frases.R b/data-raw/frases.R new file mode 100644 index 0000000..f5d82c5 --- /dev/null +++ b/data-raw/frases.R @@ -0,0 +1,43 @@ +# Vetor de frases, criado com o ChatGPT +# Solicitei que adicionasse frases de livros do Machado de Assis +frases <- c( + "Ao verme que primeiro roeu as frias carnes do meu cad\u00E1ver dedico como saudosa lembran\u00E7a estas Mem\u00F3rias P\u00F3stumas.", + "N\u00E3o tive filhos, n\u00E3o transmiti a nenhuma criatura o legado da nossa mis\u00E9ria.", + "Ao vencedor, as batatas.", + "Marcela amou-me durante quinze meses e onze contos de r\u00E9is.", + "Aos quarenta e cinco anos estava ainda mo\u00E7o, e para a minha cura n\u00E3o havia outro rem\u00E9dio sen\u00E3o um enterro.", + "Olhando bem para dentro de mim mesmo, verifiquei que a vida podia ser comparada a uma viagem de barco.", + "Eu sou um homem que carrega dentro de si muitos homens mortos.", + "Certo de que a fortuna n\u00E3o \u00E9 sen\u00E3o uma grande roleta, em que uns poucos ganham e muitos perdem.", + "A verdadeira filosofia \u00E9 a que nos ensina a viver sem morrer de medo.", + "O tempo \u00E9 um rato roedor das coisas, que as diminui ou altera no sentido de torn\u00E1-las rid\u00EDculas.", + "Nunca conheci quem tivesse levado porrada. Todos os meus conhecidos t\u00EAm sido campe\u00F5es em tudo.", + "N\u00E3o \u00E9 o sentimento que nos atrapalha, mas sim a tentativa de entend\u00EA-lo.", + "O destino \u00E9 um ca\u00E7ador furtivo.", + "A loucura, objeto de meus estudos, \u00E9 um enigma que s\u00F3 a morte resolver\u00E1.", + "Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.", + "A dor \u00E9 um rem\u00E9dio indispens\u00E1vel ao ser humano.", + "Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.", + "A diferen\u00E7a entre a paisagem e o homem \u00E9 que a paisagem n\u00E3o muda nunca.", + "A desconfian\u00E7a \u00E9 a m\u00E3e da seguran\u00E7a.", + "A vida sem luta \u00E9 um mar morto no centro do organismo universal.", + "A melhor defini\u00E7\u00E3o do amor n\u00E3o vale um beijo de mo\u00E7a namorada.", + "A d\u00FAvida \u00E9 o privil\u00E9gio dos s\u00E1bios.", + "A eternidade \u00E9 um rel\u00F3gio de areia.", + "A esperan\u00E7a \u00E9 um empr\u00E9stimo que se pede \u00E0 felicidade.", + "A humildade \u00E9 o \u00FAnico escudo contra a vaidade.", + "A ironia \u00E9 a chave do esp\u00EDrito.", + "A maior parte das pessoas que falam das belezas da virtude n\u00E3o a praticam.", + "A mentira \u00E9 muitas vezes t\u00E3o involunt\u00E1ria como a respira\u00E7\u00E3o.", + "A morte \u00E9 um sono sem sonhos.", + "A saudade \u00E9 o remorso de n\u00E3o termos aproveitado cada instante.", + "A virtude \u00E9 o brilho do esp\u00EDrito.", + "As feridas da alma s\u00E3o curadas com carinho, aten\u00E7\u00E3o e paz.", + "Calar \u00E9 o segredo dos fortes.", + "O passado \u00E9 um pr\u00F3logo.", + "Os olhos s\u00E3o o espelho da alma.", + "A vida \u00E9 uma com\u00E9dia para os que pensam e uma trag\u00E9dia para os que sentem.", + "Viver \u00E9 a coisa mais rara do mundo. A maioria das pessoas apenas existe." +) + +usethis::use_data(frases, overwrite = TRUE) diff --git a/data-raw/frutas.R b/data-raw/frutas.R new file mode 100644 index 0000000..2a3b2c5 --- /dev/null +++ b/data-raw/frutas.R @@ -0,0 +1,171 @@ +# Vetor de frutas +frutas_chatgpt <- c( + "Abacate", + "Abacaxi", + "A\u00E7a\u00ED", + "Acerola", + "Ameixa", + "Amora", + "Banana", + "Caju", + "Cacau", + "Camu-camu", + "Caqui", + "Carambola", + "Cereja", + "Coco", + "Cupua\u00E7u", + "Damasco", + "Framboesa", + "Figo", + "Goiaba", + "Graviola", + "Jabuticaba", + "Jaca", + "Jambo", + "Kiwi", + "Laranja", + "Lichia", + "Lim\u00E3o", + "Ma\u00E7\u00E3", + "Manga", + "Maracuj\u00E1", + "Melancia", + "Mel\u00E3o", + "Mirtilo", + "Morango", + "Nectarina", + "Noni", + "Papaya", + "P\u00EAssego", + "Pera", + "Pitanga", + "Pitaia", + "Rom\u00E3", + "Sapoti", + "Seriguela", + "Tamarindo", + "Tangerina", + "Tomate", + "Uva", + "Acerola", + "Ara\u00E7\u00E1", + "Atemoia", + "Baru", + "Buti\u00E1", + "Cabeludinha", + "Cagaita", + "Camu-Camu", + "Camu\u00E7\u00E1", + "Castanha-do-Par\u00E1", + "Cupua\u00E7u", + "Groselha", + "Ing\u00E1", + "Jamel\u00E3o", + "Jenipapo", + "Juc\u00E1", + "Mangaba", + "Man\u00E1-Cubiu", + "Murici", + "Pequi", + "Pitanga", + "Pitomba", + "Pu\u00E7\u00E1", + "Quina", + "Sapoti", + "Seriguela", + "Umbu", + "Uvaia", + "Uvaporanga", + "Veludo", + "Xix\u00E1", + "Zabel\u00EA" +) + +# https://github.com/cienciadedatos/pt-r4ds/issues/21#issuecomment-1839200177 +frutas_sugestao <- c( + "ma\u00E7\u00E3", + "damasco", + "abacate", + "banana", + "piment\u00E3o", + "mirtilo", + "amora", + "groselha", + "laranja sangu\u00EDnea", + "blueberry", + "amoras silvestres", + "fruto-p\u00E3o", + "mel\u00E3o can\u00E1rio", + "mel\u00E3o cantalupo", + "cherimoya", + "cereja", + "pimenta chili", + "clementina", + "amora branca", + "coco", + "arando", + "pepino", + "groselha preta", + "ameixa damasco", + "t\u00E2mara", + "fruta do drag\u00E3o", + "durian", + "berinjela", + "sabugueiro", + "feijoa", + "figo", + "goji berry", + "groselha", + "uva", + "grapefruit", + "goiaba", + "mel\u00E3o verde", + "mirt\u00EDlo", + "jaca", + "jamel\u00E3o", + "jujuba", + "kiwi", + "kumquat", + "lim\u00E3o", + "lima", + "n\u00EAspera", + "lichia", + "mandarina", + "manga", + "amora", + "nectarina", + "noz", + "azeitona", + "laranja", + "pomelo", + "mam\u00E3o", + "maracuj\u00E1", + "p\u00EAssego", + "pera", + "caqui", + "fis\u00E1lis", + "abacaxi", + "ameixa", + "rom\u00E3", + "pomelo", + "mangostin roxo", + "marmelo", + "uva passa", + "rambutan", + "framboesa", + "groselha vermelha", + "mel\u00E3o", + "baga de salal", + "tangerina", + "carambola", + "morango", + "tomate de \u00E1rvore", + "tangerina", + "melancia" +) + +frutas <- unique(stringr::str_to_lower(c(frutas_chatgpt, frutas_sugestao))) + + +usethis::use_data(frutas, overwrite = TRUE) diff --git a/data-raw/palavras.R b/data-raw/palavras.R new file mode 100644 index 0000000..38af544 --- /dev/null +++ b/data-raw/palavras.R @@ -0,0 +1,1094 @@ +# Palavras mais frequentes no portugu\u00EAs Brasileiro +# https://www.academia.org.br/sites/default/files/relacao_das_palavras_mais_frequentes.pdf +# Vetor de verbos mais frequentes +verbos_frequentes <- c( + "ser", + "dizer", + "ter", + "ir", + "estar", + "fazer", + "haver", + "poder", + "ver", + "dar", + "saber", + "vir", + "querer", + "parecer", + "falar", + "ficar", + "ouvir", + "achar", + "deixar", + "sair", + "chegar", + "passar", + "pedir", + "ler", + "acabar" +) + +# Vetor de substantivos mais frequentes +substantivos_frequentes <- c( + "coisa", + "casa", + "tempo", + "vez", + "olho", + "dia", + "homem", + "mo\u00E7o", + "mo\u00E7a", + "senhor", + "senhora", + "ano", + "m\u00E3o", + "palavra", + "filho", + "filha", + "noite", + "carta", + "amigo", + "amiga", + "bem", + "rua", + "vida", + "hora", + "cora\u00E7\u00E3o", + "pai", + "pessoa", + "mulher", + "amor", + "verdade", + "ideia", + "m\u00E3e", + "marido", + "esp\u00EDrito", + "vi\u00FAvo", + "vi\u00FAva", + "alma", + "fim", + "cabe\u00E7a", + "nome", + "porta", + "p\u00E9", + "raz\u00E3o", + "parte", + "modo" +) + +# Vetor de adjetivos mais frequentes +adjetivos_frequentes <- c( + "bom", + "grande", + "melhor", + "pr\u00F3prio", + "velho", + "certo", + "\u00FAltimo", + "longo", + "novo", + "\u00FAnico", + "antigo", + "belo", + "seguinte", + "preciso", + "meio", + "natural", + "maior", + "triste", + "bonito", + "s\u00F3", + "simples", + "mau", + "verdadeiro", + "alegre", + "pol\u00EDtico", + "alto", + "p\u00FAblico", + "grave", + "vivo", + "cheio", + "feliz", + "poss\u00EDvel", + "raro", + "claro", + "necess\u00E1rio", + "pequeno", + "igual", + "fino", + "imposs\u00EDvel", + "pobre" +) + +# Lista criada com o ChatGPT: +palavras_frequentes <- c( + "a", + "o", + "e", + "de", + "do", + "da", + "em", + "um", + "para", + "\u00E9", + "com", + "n\u00E3o", + "uma", + "os", + "no", + "se", + "na", + "por", + "mais", + "as", + "dos", + "como", + "mas", + "foi", + "ao", + "ele", + "das", + "tem", + "\u00E0", + "seu", + "sua", + "ou", + "ser", + "quando", + "muito", + "h\u00E1", + "nos", + "j\u00E1", + "est\u00E1", + "eu", + "tamb\u00E9m", + "s\u00F3", + "pelo", + "pela", + "at\u00E9", + "isso", + "ela", + "entre", + "depois", + "sem", + "mesmo", + "aos", + "seus", + "quem", + "nas", + "me", + "esse", + "eles", + "est\u00E3o", + "voc\u00EA", + "tinha", + "foram", + "essa", + "num", + "nem", + "suas", + "meu", + "\u00E0s", + "minha", + "t\u00EAm", + "numa", + "pelos", + "elas", + "havia", + "seja", + "qual", + "ser\u00E1", + "n\u00F3s", + "tenho", + "lhe", + "deles", + "essas", + "esses", + "pelas", + "este", + "fosse", + "dele", + "tu", + "te", + "voc\u00EAs", + "vos", + "lhes", + "meus", + "minhas", + "teu", + "tua", + "teus", + "tuas", + "nosso", + "nossa", + "nossos", + "nossas", + "homem", + "mulher", + "tempo", + "dia", + "noite", + "ano", + "vida", + "casa", + "mundo", + "pa\u00EDs", + "cidade", + "pessoa", + "homens", + "mulheres", + "dias", + "noites", + "anos", + "vidas", + "casas", + "mundos", + "pa\u00EDses", + "cidades", + "pessoas", + "vez", + "vezes", + "parte", + "partes", + "forma", + "formas", + "coisa", + "coisas", + "n\u00FAmero", + "n\u00FAmeros", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos" +) + + +palavras <- unique( + c( + verbos_frequentes, + substantivos_frequentes, + adjetivos_frequentes, + palavras_frequentes + ) +) + +usethis::use_data(palavras, overwrite = TRUE) diff --git a/data/frases.rda b/data/frases.rda new file mode 100644 index 0000000..af65fb2 Binary files /dev/null and b/data/frases.rda differ diff --git a/data/frutas.rda b/data/frutas.rda new file mode 100644 index 0000000..9adb784 Binary files /dev/null and b/data/frutas.rda differ diff --git a/data/palavras.rda b/data/palavras.rda new file mode 100644 index 0000000..d339417 Binary files /dev/null and b/data/palavras.rda differ diff --git a/docs/authors.html b/docs/authors.html index de52a1c..3f66fe2 100644 --- a/docs/authors.html +++ b/docs/authors.html @@ -101,14 +101,14 @@

Citation

-

Quiroga R, Milz B, Mortara S, Sánchez-Tapia A, Tapia Silva A, Maurer Costa B, Prado J, Hirota R, Amorim W, Rodrigues Nunes E, Scopinho E (2023). +

Quiroga R, Milz B, Mortara S, Sánchez-Tapia A, Tapia Silva A, Maurer Costa B, Prado J, Hirota R, Amorim W, Rodrigues Nunes E, Scopinho E (2024). dados: Translate Datasets to Portuguese. R package version 0.1.9000, https://github.com/cienciadedatos/dados.

@Manual{,
   title = {dados: Translate Datasets to Portuguese},
   author = {Riva Quiroga and Beatriz Milz and Sara Mortara and Andrea Sánchez-Tapia and Alejandra Andrea {Tapia Silva} and Beatriz {Maurer Costa} and Jean Prado and Renata Hirota and William Amorim and Emmanuelle {Rodrigues Nunes} and Eric Scopinho},
-  year = {2023},
+  year = {2024},
   note = {R package version 0.1.9000},
   url = {https://github.com/cienciadedatos/dados},
 }
diff --git a/docs/index.html b/docs/index.html index 36b6f33..a6e72eb 100644 --- a/docs/index.html +++ b/docs/index.html @@ -77,6 +77,7 @@ +

Este pacote disponibiliza a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro R for Data Science de Hadley Wickham & Garrett Grolemund, cuja versão em português foi publicada por AltaBooks & O’Reilly.

Instalação @@ -373,6 +374,7 @@

Traduções

Uso diff --git a/docs/pkgdown.yml b/docs/pkgdown.yml index af5a440..943e0a7 100644 --- a/docs/pkgdown.yml +++ b/docs/pkgdown.yml @@ -1,6 +1,6 @@ -pandoc: 3.1.1 +pandoc: 3.1.11 pkgdown: 2.0.7 pkgdown_sha: ~ articles: {} -last_built: 2023-11-15T19:18Z +last_built: 2024-08-08T15:47Z diff --git a/docs/reference/Rplot001.png b/docs/reference/Rplot001.png new file mode 100644 index 0000000..17a3580 Binary files /dev/null and b/docs/reference/Rplot001.png differ diff --git a/docs/reference/dados-package.html b/docs/reference/dados-package.html index ed144fd..2260d07 100644 --- a/docs/reference/dados-package.html +++ b/docs/reference/dados-package.html @@ -62,8 +62,8 @@

See also

Author

Maintainer: Riva Quiroga riva.quiroga@uc.cl (ORCID)

-

Authors:

diff --git a/docs/reference/dados-stringr.html b/docs/reference/dados-stringr.html new file mode 100644 index 0000000..c8f0aef --- /dev/null +++ b/docs/reference/dados-stringr.html @@ -0,0 +1,122 @@ + +Vetores de caracteres do pacote stringr — dados-stringr • dados + + +
+
+ + + +
+
+ + +
+

Amostra de vetores de caracteres para praticar a manipulação de strings

+
+ +
+
frases
+
+frutas
+
+palavras
+
+ +
+

Format

+

Um vetor

+

An object of class character of length 37.

+

An object of class character of length 116.

+

An object of class character of length 267.

+
+
+

Details

+

frases - é uma lista de frases escritas em português

+

frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit.

+

palavras - é uma lista de palavras frequentes usadas em português brasileiro

+
+ +
+

Examples

+

+length(frases)
+#> [1] 37
+frases[1:5]
+#> [1] "Ao verme que primeiro roeu as frias carnes do meu cadáver dedico como saudosa lembrança estas Memórias Póstumas."
+#> [2] "Não tive filhos, não transmiti a nenhuma criatura o legado da nossa miséria."                                    
+#> [3] "Ao vencedor, as batatas."                                                                                        
+#> [4] "Marcela amou-me durante quinze meses e onze contos de réis."                                                     
+#> [5] "Aos quarenta e cinco anos estava ainda moço, e para a minha cura não havia outro remédio senão um enterro."      
+
+length(frutas)
+#> [1] 116
+frutas[1:5]
+#> [1] "abacate" "abacaxi" "açaí"    "acerola" "ameixa" 
+
+#' length(palavras)
+palavras[1:5]
+#> [1] "ser"   "dizer" "ter"   "ir"    "estar"
+
+
+
+ +
+ + +
+ + + + + + + + diff --git a/docs/reference/index.html b/docs/reference/index.html index 2700b3b..3964946 100644 --- a/docs/reference/index.html +++ b/docs/reference/index.html @@ -90,6 +90,10 @@

All functions comuns

Modelos comuns de carros

+ +

frases frutas palavras

+ +

Vetores de caracteres do pacote stringr

dados_atmosfera

diff --git a/docs/reference/jardineiros.hththtml b/docs/reference/jardineiros.hththtml deleted file mode 100644 index cdc5dfa..0000000 --- a/docs/reference/jardineiros.hththtml +++ /dev/null @@ -1,142 +0,0 @@ - -Tabela de estatísticas do jardineiro — jardineiros • dados - - -
-
- - - -
-
- - -
-

Estatísticas de defesa

-
- - -
-

Format

-

Um data frame com 140.921 linhas e 18 colunas

id_jogador
-

ID do jogador

- -
id_ano
-

Ano

- -
ordem_equipe
-

Ordem em que o jogador se moveu entre as equipes na mesma temporada

- -
id_equipe
-

ID da equipe (fator)

- -
id_liga
-

ID da liga (fator com níveis AA, AL, FL, NL, PL, UA)

- -
posicao
-

Posição do jogador defensivo

- -
jogos
-

Jogos

- -
jogos_iniciados
-

Jogos iniciados

- -
inn_outs
-

Tempo jogado pelo jogador expresso em outs

- -
outs_feitos
-

Outs feitas pelo jogador

- -
assistencias
-

Assistências realizadas pelo jogador

- -
erros
-

Erros cometidos pelo jogador

- -
eliminacao_dupla
-

Eliminação dupla em que o jogador esteve envolvido defensivamente

- -
bolas_passadas
-

Bolas passadas (aplicável a receptores)

- -
lancamentos_desviados
-

Wild pitches - arremessos ruins que permitem o avanço de corredores adversários (aplicável a arremessadores)

- -
bases_roubadas
-

Bases roubadas pelo oponente (aplicável aos receptor)

- -
capturado_roubando
-

Opositores apanhados em tentativa de roubo (aplicável a receptores)

- -
taxa_zona
-

Porcentagem de bolas capturadas por um defensor, em sua zona defensiva típica

- - -
-
-

See also

- -
- -
- -
- - -
- -
-

Site built with pkgdown 2.0.7.

-
- -
- - - - - - - - diff --git a/docs/reference/jardineiros.hthtml b/docs/reference/jardineiros.hthtml deleted file mode 100644 index e734c61..0000000 --- a/docs/reference/jardineiros.hthtml +++ /dev/null @@ -1,142 +0,0 @@ - -Tabela de estatísticas do jardineiro — jardineiros • dados - - -
-
- - - -
-
- - -
-

Estatísticas de defesa

-
- - -
-

Format

-

Um data frame com 140.921 linhas e 18 colunas

id_jogador
-

ID do jogador

- -
id_ano
-

Ano

- -
ordem_equipe
-

Ordem em que o jogador se moveu entre as equipes na mesma temporada

- -
id_equipe
-

ID da equipe (fator)

- -
id_liga
-

ID da liga (fator com níveis AA, AL, FL, NL, PL, UA)

- -
posicao
-

Posição do jogador defensivo

- -
jogos
-

Jogos

- -
jogos_iniciados
-

Jogos iniciados

- -
inn_outs
-

Tempo jogado pelo jogador expresso em outs

- -
outs_feitos
-

Outs feitas pelo jogador

- -
assistencias
-

Assistências realizadas pelo jogador

- -
erros
-

Erros cometidos pelo jogador

- -
eliminacao_dupla
-

Eliminação dupla em que o jogador esteve envolvido defensivamente

- -
bolas_passadas
-

Bolas passadas (aplicável a receptores)

- -
lancamentos_desviados
-

Wild pitches - arremessos ruins que permitem o avanço de corredores adversários (aplicável a arremessadores)

- -
bases_roubadas
-

Bases roubadas pelo oponente (aplicável aos receptor)

- -
capturado_roubando
-

Opositores apanhados em tentativa de roubo (aplicável a receptores)

- -
taxa_zona
-

Porcentagem de bolas capturadas por um defensor, em sua zona defensiva típica

- - -
-
-

See also

- -
- -
- -
- - -
- - - - - - - - diff --git a/docs/reference/voos.html b/docs/reference/voos.html index c605a5b..c2b5227 100644 --- a/docs/reference/voos.html +++ b/docs/reference/voos.html @@ -91,8 +91,8 @@

Format

voo

Número do voo

-
cauda
-

Número da cauda do avião

+
codigo_cauda
+

Código da cauda do avião (empenagem)

origem

Origem do voo. Ver `aeroportos` para metadados adicionais

diff --git a/docs/sitemap.xml b/docs/sitemap.xml index 843489a..d248c88 100644 --- a/docs/sitemap.xml +++ b/docs/sitemap.xml @@ -48,6 +48,9 @@ /reference/dados-package.html + + /reference/dados-stringr.html + /reference/dados_atmosfera.html diff --git a/man/dados-package.Rd b/man/dados-package.Rd index 45bdbfd..c5bcf74 100644 --- a/man/dados-package.Rd +++ b/man/dados-package.Rd @@ -21,8 +21,8 @@ Useful links: Authors: \itemize{ + \item Beatriz Milz \email{milz.bea@gmail.com} (\href{https://orcid.org/0000-0002-3064-4486}{ORCID}) \item Sara Mortara \email{saramortara@gmail.com} (\href{https://orcid.org/0000-0001-6221-7537}{ORCID}) - \item Beatriz Milz \email{beatriz.milz@usp.br} (\href{https://orcid.org/0000-0002-3064-4486}{ORCID}) \item Andrea Sánchez-Tapia \email{andreasancheztapia@gmail.com} (\href{https://orcid.org/0000-0002-3521-4338}{ORCID}) \item Alejandra Andrea Tapia Silva \email{alejandraandreatapiasilva@gmail.com} (\href{https://orcid.org/0000-0003-0762-7618}{ORCID}) \item Beatriz Maurer Costa \email{beatrizmcosta@me.com} @@ -30,6 +30,7 @@ Authors: \item Renata Hirota \email{re.hirota@gmail.com} (\href{https://orcid.org/0000-0002-3589-3246}{ORCID}) \item William Amorim \email{wamorim@curso-r.com} (\href{https://orcid.org/0000-0003-0543-3473}{ORCID}) \item Emmanuelle Rodrigues Nunes \email{emmanuellernunes@gmail.com} (\href{https://orcid.org/0000-0001-5994-352X}{ORCID}) + \item Eric Scopinho \email{eric.scopinho@gmail.com} } } diff --git a/man/dados-stringr.Rd b/man/dados-stringr.Rd new file mode 100644 index 0000000..fe4362e --- /dev/null +++ b/man/dados-stringr.Rd @@ -0,0 +1,47 @@ +% Generated by roxygen2: do not edit by hand +% Please edit documentation in R/stringr.R +\docType{data} +\name{dados-stringr} +\alias{dados-stringr} +\alias{frases} +\alias{frutas} +\alias{palavras} +\title{Vetores de caracteres do pacote stringr} +\format{ +Um vetor + +An object of class \code{character} of length 37. + +An object of class \code{character} of length 116. + +An object of class \code{character} of length 267. +} +\usage{ +frases + +frutas + +palavras +} +\description{ +Amostra de vetores de caracteres para praticar a manipulação de strings +} +\details{ +frases - é uma lista de frases escritas em português + +frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit. + +palavras - é uma lista de palavras frequentes usadas em português brasileiro +} +\examples{ + +length(frases) +frases[1:5] + +length(frutas) +frutas[1:5] + +#' length(palavras) +palavras[1:5] +} +\keyword{datasets} diff --git a/man/voos.rd b/man/voos.rd index f2c7c90..833230e 100644 --- a/man/voos.rd +++ b/man/voos.rd @@ -15,7 +15,7 @@ \item{atraso_chegada}{Atraso de chegada em minutos. Valores negativos indicam chegada adiantada} \item{companhia_aerea}{Abreviação de dois dígitos da companhia aérea. Ver `companhias_aereas` para obter o nome da companhia aérea} \item{voo}{Número do voo} -\item{cauda}{Número da cauda do avião} +\item{codigo_cauda}{Código da cauda do avião (empenagem)} \item{origem}{Origem do voo. Ver `aeroportos` para metadados adicionais} \item{destino}{Destino do voo. Ver `aeroportos` para metadados adicionais} \item{tempo_voo}{Quantidade de tempo no ar, em minutos}