diff --git a/.Rbuildignore b/.Rbuildignore index 362fb74..7ff7397 100644 --- a/.Rbuildignore +++ b/.Rbuildignore @@ -9,3 +9,4 @@ ^cran-comments\.md$ ^codemeta\.json$ ^CRAN-RELEASE$ +^data-raw$ diff --git a/DESCRIPTION b/DESCRIPTION index 7b6e875..c8b28ae 100644 --- a/DESCRIPTION +++ b/DESCRIPTION @@ -70,7 +70,7 @@ License: GPL-3 Encoding: UTF-8 LazyData: true Roxygen: list(markdown = TRUE) -RoxygenNote: 7.1.2 +RoxygenNote: 7.2.3 URL: https://github.com/cienciadedatos/dados BugReports: https://github.com/cienciadedatos/dados/issues Depends: diff --git a/R/stringr.R b/R/stringr.R new file mode 100644 index 0000000..3af6b68 --- /dev/null +++ b/R/stringr.R @@ -0,0 +1,31 @@ +#' Vetores de caracteres do pacote stringr +#' +#' Amostra de vetores de caracteres para praticar a manipulação de strings +#' +#' frases - é uma lista de frases escritas em português +#' +#' frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit. +#' +#' palavras - é uma lista de palavras frequentes usadas em português brasileiro +#' @format Um vetor +#' @name dados-stringr +#' @examples +#' +#' length(frases) +#' frases[1:5] +#' +#' length(frutas) +#' frutas[1:5] +#' +#' #' length(palavras) +#' palavras[1:5] +NULL + +#' @rdname dados-stringr +"frases" + +#' @rdname dados-stringr +"frutas" + +#' @rdname dados-stringr +"palavras" diff --git a/README.Rmd b/README.Rmd index 1476202..64b04a8 100644 --- a/README.Rmd +++ b/README.Rmd @@ -20,11 +20,12 @@ library(stringr) knitr::opts_chunk$set(echo = TRUE) ``` -# dados +# dados -[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) -[![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + +[![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) [![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + Este pacote disponibiliza a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund, cuja [versão em português](https://altabooks.com.br/produto/r-para-data-science/) foi publicada por AltaBooks & O'Reilly. @@ -44,7 +45,6 @@ A versão de desenvolvimento pode ser instalada a partir do GitHub: remotes::install_github("cienciadedatos/dados") ``` - ## Traduções As traduções disponíveis dentro de `dados` são as seguintes: @@ -67,10 +67,11 @@ pkgs %>% knitr::kable() ``` +Os dados para praticar a manipulação de strings são `frases`, `palavras` e `frutas`. ## Uso -O pacote `dados` pode ser carregado como qualquer outro pacote de R: +O pacote `dados` pode ser carregado como qualquer outro pacote de R: ```{r, message = FALSE} library(dados) @@ -78,7 +79,7 @@ library(ggplot2) library(dplyr) ``` -Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no _workspace_ do R no momento em que o chamamos pela primeira vez em português: +Ao carregar o pacote, as variáveis que contêm os dados estarão disponíveis imediatamente para uso. Porém, os dados não serão traduzidos até que a variável seja "chamada" explicitamente por um comando. Neste exemplo, o conjunto de dados `diamante`, que provém de `ggplot2::diamonds`, é carregado no *workspace* do R no momento em que o chamamos pela primeira vez em português: ```{r} glimpse(diamante) @@ -97,8 +98,7 @@ diamante %>% ``` - - + ## Funções internas de `dados` diff --git a/README.md b/README.md index 64b2d21..fab34fa 100644 --- a/README.md +++ b/README.md @@ -1,13 +1,14 @@ -# dados +# dados [![CRAN status](https://www.r-pkg.org/badges/version/dados)](https://cran.r-project.org/package=dados) [![R-CMD-check](https://github.com/cienciadedatos/dados/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/dados/actions) + Este pacote disponibiliza a tradução de conjuntos de dados em inglês @@ -84,6 +85,9 @@ As traduções disponíveis dentro de `dados` são as seguintes: | dados_oms | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who | | dados_oms2 | Dados de tuberculose da Organização Mundial da Saúde | tidyr | who2 | +Os dados para praticar a manipulação de strings são `frases`, `palavras` +e `frutas`. + ## Uso O pacote `dados` pode ser carregado como qualquer outro pacote de R: @@ -128,7 +132,7 @@ diamante %>% labs(title = "Diamantes", subtitle = "Preço e transparência", y = "Preço", x = "Transparência") ``` - + ## Funções internas de `dados` diff --git a/data-raw/frases.R b/data-raw/frases.R new file mode 100644 index 0000000..f5d82c5 --- /dev/null +++ b/data-raw/frases.R @@ -0,0 +1,43 @@ +# Vetor de frases, criado com o ChatGPT +# Solicitei que adicionasse frases de livros do Machado de Assis +frases <- c( + "Ao verme que primeiro roeu as frias carnes do meu cad\u00E1ver dedico como saudosa lembran\u00E7a estas Mem\u00F3rias P\u00F3stumas.", + "N\u00E3o tive filhos, n\u00E3o transmiti a nenhuma criatura o legado da nossa mis\u00E9ria.", + "Ao vencedor, as batatas.", + "Marcela amou-me durante quinze meses e onze contos de r\u00E9is.", + "Aos quarenta e cinco anos estava ainda mo\u00E7o, e para a minha cura n\u00E3o havia outro rem\u00E9dio sen\u00E3o um enterro.", + "Olhando bem para dentro de mim mesmo, verifiquei que a vida podia ser comparada a uma viagem de barco.", + "Eu sou um homem que carrega dentro de si muitos homens mortos.", + "Certo de que a fortuna n\u00E3o \u00E9 sen\u00E3o uma grande roleta, em que uns poucos ganham e muitos perdem.", + "A verdadeira filosofia \u00E9 a que nos ensina a viver sem morrer de medo.", + "O tempo \u00E9 um rato roedor das coisas, que as diminui ou altera no sentido de torn\u00E1-las rid\u00EDculas.", + "Nunca conheci quem tivesse levado porrada. Todos os meus conhecidos t\u00EAm sido campe\u00F5es em tudo.", + "N\u00E3o \u00E9 o sentimento que nos atrapalha, mas sim a tentativa de entend\u00EA-lo.", + "O destino \u00E9 um ca\u00E7ador furtivo.", + "A loucura, objeto de meus estudos, \u00E9 um enigma que s\u00F3 a morte resolver\u00E1.", + "Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.", + "A dor \u00E9 um rem\u00E9dio indispens\u00E1vel ao ser humano.", + "Cada qual sabe amar a seu modo; o modo pouco importa; o essencial \u00E9 que saiba amar.", + "A diferen\u00E7a entre a paisagem e o homem \u00E9 que a paisagem n\u00E3o muda nunca.", + "A desconfian\u00E7a \u00E9 a m\u00E3e da seguran\u00E7a.", + "A vida sem luta \u00E9 um mar morto no centro do organismo universal.", + "A melhor defini\u00E7\u00E3o do amor n\u00E3o vale um beijo de mo\u00E7a namorada.", + "A d\u00FAvida \u00E9 o privil\u00E9gio dos s\u00E1bios.", + "A eternidade \u00E9 um rel\u00F3gio de areia.", + "A esperan\u00E7a \u00E9 um empr\u00E9stimo que se pede \u00E0 felicidade.", + "A humildade \u00E9 o \u00FAnico escudo contra a vaidade.", + "A ironia \u00E9 a chave do esp\u00EDrito.", + "A maior parte das pessoas que falam das belezas da virtude n\u00E3o a praticam.", + "A mentira \u00E9 muitas vezes t\u00E3o involunt\u00E1ria como a respira\u00E7\u00E3o.", + "A morte \u00E9 um sono sem sonhos.", + "A saudade \u00E9 o remorso de n\u00E3o termos aproveitado cada instante.", + "A virtude \u00E9 o brilho do esp\u00EDrito.", + "As feridas da alma s\u00E3o curadas com carinho, aten\u00E7\u00E3o e paz.", + "Calar \u00E9 o segredo dos fortes.", + "O passado \u00E9 um pr\u00F3logo.", + "Os olhos s\u00E3o o espelho da alma.", + "A vida \u00E9 uma com\u00E9dia para os que pensam e uma trag\u00E9dia para os que sentem.", + "Viver \u00E9 a coisa mais rara do mundo. A maioria das pessoas apenas existe." +) + +usethis::use_data(frases, overwrite = TRUE) diff --git a/data-raw/frutas.R b/data-raw/frutas.R new file mode 100644 index 0000000..2a3b2c5 --- /dev/null +++ b/data-raw/frutas.R @@ -0,0 +1,171 @@ +# Vetor de frutas +frutas_chatgpt <- c( + "Abacate", + "Abacaxi", + "A\u00E7a\u00ED", + "Acerola", + "Ameixa", + "Amora", + "Banana", + "Caju", + "Cacau", + "Camu-camu", + "Caqui", + "Carambola", + "Cereja", + "Coco", + "Cupua\u00E7u", + "Damasco", + "Framboesa", + "Figo", + "Goiaba", + "Graviola", + "Jabuticaba", + "Jaca", + "Jambo", + "Kiwi", + "Laranja", + "Lichia", + "Lim\u00E3o", + "Ma\u00E7\u00E3", + "Manga", + "Maracuj\u00E1", + "Melancia", + "Mel\u00E3o", + "Mirtilo", + "Morango", + "Nectarina", + "Noni", + "Papaya", + "P\u00EAssego", + "Pera", + "Pitanga", + "Pitaia", + "Rom\u00E3", + "Sapoti", + "Seriguela", + "Tamarindo", + "Tangerina", + "Tomate", + "Uva", + "Acerola", + "Ara\u00E7\u00E1", + "Atemoia", + "Baru", + "Buti\u00E1", + "Cabeludinha", + "Cagaita", + "Camu-Camu", + "Camu\u00E7\u00E1", + "Castanha-do-Par\u00E1", + "Cupua\u00E7u", + "Groselha", + "Ing\u00E1", + "Jamel\u00E3o", + "Jenipapo", + "Juc\u00E1", + "Mangaba", + "Man\u00E1-Cubiu", + "Murici", + "Pequi", + "Pitanga", + "Pitomba", + "Pu\u00E7\u00E1", + "Quina", + "Sapoti", + "Seriguela", + "Umbu", + "Uvaia", + "Uvaporanga", + "Veludo", + "Xix\u00E1", + "Zabel\u00EA" +) + +# https://github.com/cienciadedatos/pt-r4ds/issues/21#issuecomment-1839200177 +frutas_sugestao <- c( + "ma\u00E7\u00E3", + "damasco", + "abacate", + "banana", + "piment\u00E3o", + "mirtilo", + "amora", + "groselha", + "laranja sangu\u00EDnea", + "blueberry", + "amoras silvestres", + "fruto-p\u00E3o", + "mel\u00E3o can\u00E1rio", + "mel\u00E3o cantalupo", + "cherimoya", + "cereja", + "pimenta chili", + "clementina", + "amora branca", + "coco", + "arando", + "pepino", + "groselha preta", + "ameixa damasco", + "t\u00E2mara", + "fruta do drag\u00E3o", + "durian", + "berinjela", + "sabugueiro", + "feijoa", + "figo", + "goji berry", + "groselha", + "uva", + "grapefruit", + "goiaba", + "mel\u00E3o verde", + "mirt\u00EDlo", + "jaca", + "jamel\u00E3o", + "jujuba", + "kiwi", + "kumquat", + "lim\u00E3o", + "lima", + "n\u00EAspera", + "lichia", + "mandarina", + "manga", + "amora", + "nectarina", + "noz", + "azeitona", + "laranja", + "pomelo", + "mam\u00E3o", + "maracuj\u00E1", + "p\u00EAssego", + "pera", + "caqui", + "fis\u00E1lis", + "abacaxi", + "ameixa", + "rom\u00E3", + "pomelo", + "mangostin roxo", + "marmelo", + "uva passa", + "rambutan", + "framboesa", + "groselha vermelha", + "mel\u00E3o", + "baga de salal", + "tangerina", + "carambola", + "morango", + "tomate de \u00E1rvore", + "tangerina", + "melancia" +) + +frutas <- unique(stringr::str_to_lower(c(frutas_chatgpt, frutas_sugestao))) + + +usethis::use_data(frutas, overwrite = TRUE) diff --git a/data-raw/palavras.R b/data-raw/palavras.R new file mode 100644 index 0000000..38af544 --- /dev/null +++ b/data-raw/palavras.R @@ -0,0 +1,1094 @@ +# Palavras mais frequentes no portugu\u00EAs Brasileiro +# https://www.academia.org.br/sites/default/files/relacao_das_palavras_mais_frequentes.pdf +# Vetor de verbos mais frequentes +verbos_frequentes <- c( + "ser", + "dizer", + "ter", + "ir", + "estar", + "fazer", + "haver", + "poder", + "ver", + "dar", + "saber", + "vir", + "querer", + "parecer", + "falar", + "ficar", + "ouvir", + "achar", + "deixar", + "sair", + "chegar", + "passar", + "pedir", + "ler", + "acabar" +) + +# Vetor de substantivos mais frequentes +substantivos_frequentes <- c( + "coisa", + "casa", + "tempo", + "vez", + "olho", + "dia", + "homem", + "mo\u00E7o", + "mo\u00E7a", + "senhor", + "senhora", + "ano", + "m\u00E3o", + "palavra", + "filho", + "filha", + "noite", + "carta", + "amigo", + "amiga", + "bem", + "rua", + "vida", + "hora", + "cora\u00E7\u00E3o", + "pai", + "pessoa", + "mulher", + "amor", + "verdade", + "ideia", + "m\u00E3e", + "marido", + "esp\u00EDrito", + "vi\u00FAvo", + "vi\u00FAva", + "alma", + "fim", + "cabe\u00E7a", + "nome", + "porta", + "p\u00E9", + "raz\u00E3o", + "parte", + "modo" +) + +# Vetor de adjetivos mais frequentes +adjetivos_frequentes <- c( + "bom", + "grande", + "melhor", + "pr\u00F3prio", + "velho", + "certo", + "\u00FAltimo", + "longo", + "novo", + "\u00FAnico", + "antigo", + "belo", + "seguinte", + "preciso", + "meio", + "natural", + "maior", + "triste", + "bonito", + "s\u00F3", + "simples", + "mau", + "verdadeiro", + "alegre", + "pol\u00EDtico", + "alto", + "p\u00FAblico", + "grave", + "vivo", + "cheio", + "feliz", + "poss\u00EDvel", + "raro", + "claro", + "necess\u00E1rio", + "pequeno", + "igual", + "fino", + "imposs\u00EDvel", + "pobre" +) + +# Lista criada com o ChatGPT: +palavras_frequentes <- c( + "a", + "o", + "e", + "de", + "do", + "da", + "em", + "um", + "para", + "\u00E9", + "com", + "n\u00E3o", + "uma", + "os", + "no", + "se", + "na", + "por", + "mais", + "as", + "dos", + "como", + "mas", + "foi", + "ao", + "ele", + "das", + "tem", + "\u00E0", + "seu", + "sua", + "ou", + "ser", + "quando", + "muito", + "h\u00E1", + "nos", + "j\u00E1", + "est\u00E1", + "eu", + "tamb\u00E9m", + "s\u00F3", + "pelo", + "pela", + "at\u00E9", + "isso", + "ela", + "entre", + "depois", + "sem", + "mesmo", + "aos", + "seus", + "quem", + "nas", + "me", + "esse", + "eles", + "est\u00E3o", + "voc\u00EA", + "tinha", + "foram", + "essa", + "num", + "nem", + "suas", + "meu", + "\u00E0s", + "minha", + "t\u00EAm", + "numa", + "pelos", + "elas", + "havia", + "seja", + "qual", + "ser\u00E1", + "n\u00F3s", + "tenho", + "lhe", + "deles", + "essas", + "esses", + "pelas", + "este", + "fosse", + "dele", + "tu", + "te", + "voc\u00EAs", + "vos", + "lhes", + "meus", + "minhas", + "teu", + "tua", + "teus", + "tuas", + "nosso", + "nossa", + "nossos", + "nossas", + "homem", + "mulher", + "tempo", + "dia", + "noite", + "ano", + "vida", + "casa", + "mundo", + "pa\u00EDs", + "cidade", + "pessoa", + "homens", + "mulheres", + "dias", + "noites", + "anos", + "vidas", + "casas", + "mundos", + "pa\u00EDses", + "cidades", + "pessoas", + "vez", + "vezes", + "parte", + "partes", + "forma", + "formas", + "coisa", + "coisas", + "n\u00FAmero", + "n\u00FAmeros", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos", + "homem", + "homens", + "vida", + "vidas", + "homem", + "homens", + "tempo", + "tempos", + "pai", + "pais", + "m\u00E3e", + "m\u00E3es", + "filho", + "filhos", + "filha", + "filhas", + "irm\u00E3o", + "irm\u00E3os", + "irm\u00E3", + "irm\u00E3s", + "marido", + "maridos", + "esposa", + "esposas", + "amigo", + "amigos", + "amiga", + "amigas", + "casa", + "casas", + "coisa", + "coisas", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "homem", + "homens", + "mulher", + "mulheres", + "vida", + "vidas", + "tempo", + "tempos", + "mundo", + "mundos", + "pa\u00EDs", + "pa\u00EDses", + "cabe\u00E7a", + "cabe\u00E7as", + "m\u00E3o", + "m\u00E3os", + "olho", + "olhos", + "crian\u00E7a", + "crian\u00E7as", + "amigo", + "amigos", + "amiga", + "amigas", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "m\u00E3o", + "m\u00E3os", + "fim", + "fins", + "homem", + "mulher", + "gente", + "vez", + "vezes", + "cabe\u00E7a", + "cabe\u00E7as", + "trabalho", + "trabalhos", + "amigo", + "amigos", + "amiga", + "amigas", + "ano", + "anos", + "fim", + "fins", + "cora\u00E7\u00E3o", + "cora\u00E7\u00F5es", + "tempo", + "tempos", + "parte", + "partes", + "lugar", + "lugares", + "coisa", + "coisas", + "caso", + "casos", + "ponto", + "pontos", + "mundo", + "mundos", + "palavra", + "palavras", + "senhor", + "senhores", + "senhora", + "senhoras", + "momento", + "momentos", + "nome", + "nomes", + "pessoa", + "pessoas", + "trabalho", + "trabalhos", + "olho", + "olhos", + "gente", + "noite", + "noites", + "dia", + "dias", + "m\u00E3o", + "m\u00E3os", + "pa\u00EDs", + "pa\u00EDses", + "caso", + "casos" +) + + +palavras <- unique( + c( + verbos_frequentes, + substantivos_frequentes, + adjetivos_frequentes, + palavras_frequentes + ) +) + +usethis::use_data(palavras, overwrite = TRUE) diff --git a/data/frases.rda b/data/frases.rda new file mode 100644 index 0000000..af65fb2 Binary files /dev/null and b/data/frases.rda differ diff --git a/data/frutas.rda b/data/frutas.rda new file mode 100644 index 0000000..9adb784 Binary files /dev/null and b/data/frutas.rda differ diff --git a/data/palavras.rda b/data/palavras.rda new file mode 100644 index 0000000..d339417 Binary files /dev/null and b/data/palavras.rda differ diff --git a/docs/authors.html b/docs/authors.html index de52a1c..3f66fe2 100644 --- a/docs/authors.html +++ b/docs/authors.html @@ -101,14 +101,14 @@
Quiroga R, Milz B, Mortara S, Sánchez-Tapia A, Tapia Silva A, Maurer Costa B, Prado J, Hirota R, Amorim W, Rodrigues Nunes E, Scopinho E (2023). +
Quiroga R, Milz B, Mortara S, Sánchez-Tapia A, Tapia Silva A, Maurer Costa B, Prado J, Hirota R, Amorim W, Rodrigues Nunes E, Scopinho E (2024). dados: Translate Datasets to Portuguese. R package version 0.1.9000, https://github.com/cienciadedatos/dados.
@Manual{, title = {dados: Translate Datasets to Portuguese}, author = {Riva Quiroga and Beatriz Milz and Sara Mortara and Andrea Sánchez-Tapia and Alejandra Andrea {Tapia Silva} and Beatriz {Maurer Costa} and Jean Prado and Renata Hirota and William Amorim and Emmanuelle {Rodrigues Nunes} and Eric Scopinho}, - year = {2023}, + year = {2024}, note = {R package version 0.1.9000}, url = {https://github.com/cienciadedatos/dados}, }diff --git a/docs/index.html b/docs/index.html index 36b6f33..a6e72eb 100644 --- a/docs/index.html +++ b/docs/index.html @@ -77,6 +77,7 @@ +
Este pacote disponibiliza a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro R for Data Science de Hadley Wickham & Garrett Grolemund, cuja versão em português foi publicada por AltaBooks & O’Reilly.
Amostra de vetores de caracteres para praticar a manipulação de strings
+frases
+
+frutas
+
+palavras
Um vetor
+An object of class character
of length 37.
An object of class character
of length 116.
An object of class character
of length 267.
frases - é uma lista de frases escritas em português
+frutas - é uma seleção e adaptação ao português dos dados de prática contidos em stringr::fruit.
+palavras - é uma lista de palavras frequentes usadas em português brasileiro
+
+length(frases)
+#> [1] 37
+frases[1:5]
+#> [1] "Ao verme que primeiro roeu as frias carnes do meu cadáver dedico como saudosa lembrança estas Memórias Póstumas."
+#> [2] "Não tive filhos, não transmiti a nenhuma criatura o legado da nossa miséria."
+#> [3] "Ao vencedor, as batatas."
+#> [4] "Marcela amou-me durante quinze meses e onze contos de réis."
+#> [5] "Aos quarenta e cinco anos estava ainda moço, e para a minha cura não havia outro remédio senão um enterro."
+
+length(frutas)
+#> [1] 116
+frutas[1:5]
+#> [1] "abacate" "abacaxi" "açaí" "acerola" "ameixa"
+
+#' length(palavras)
+palavras[1:5]
+#> [1] "ser" "dizer" "ter" "ir" "estar"
+
comuns
Modelos comuns de carros
Vetores de caracteres do pacote stringr
jardineiros.rd
Estatísticas de defesa
-Um data frame com 140.921 linhas e 18 colunas
ID do jogador
Ano
Ordem em que o jogador se moveu entre as equipes na mesma temporada
ID da equipe (fator)
ID da liga (fator com níveis AA, AL, FL, NL, PL, UA)
Posição do jogador defensivo
Jogos
Jogos iniciados
Tempo jogado pelo jogador expresso em outs
Outs feitas pelo jogador
Assistências realizadas pelo jogador
Erros cometidos pelo jogador
Eliminação dupla em que o jogador esteve envolvido defensivamente
Bolas passadas (aplicável a receptores)
Wild pitches - arremessos ruins que permitem o avanço de corredores adversários (aplicável a arremessadores)
Bases roubadas pelo oponente (aplicável aos receptor)
Opositores apanhados em tentativa de roubo (aplicável a receptores)
Porcentagem de bolas capturadas por um defensor, em sua zona defensiva típica
jardineiros.rd
Estatísticas de defesa
-Um data frame com 140.921 linhas e 18 colunas
ID do jogador
Ano
Ordem em que o jogador se moveu entre as equipes na mesma temporada
ID da equipe (fator)
ID da liga (fator com níveis AA, AL, FL, NL, PL, UA)
Posição do jogador defensivo
Jogos
Jogos iniciados
Tempo jogado pelo jogador expresso em outs
Outs feitas pelo jogador
Assistências realizadas pelo jogador
Erros cometidos pelo jogador
Eliminação dupla em que o jogador esteve envolvido defensivamente
Bolas passadas (aplicável a receptores)
Wild pitches - arremessos ruins que permitem o avanço de corredores adversários (aplicável a arremessadores)
Bases roubadas pelo oponente (aplicável aos receptor)
Opositores apanhados em tentativa de roubo (aplicável a receptores)
Porcentagem de bolas capturadas por um defensor, em sua zona defensiva típica
Número do voo
Número da cauda do avião
Código da cauda do avião (empenagem)
Origem do voo. Ver `aeroportos` para metadados adicionais