O pacote sidra
fornece uma interface simples para
acessar a API de dados do SIDRA (Sistema IBGE de Recuperação
Automática), permitindo que você consulte dados do IBGE diretamente do
R, a partir da api rest tornada disponível em servicodados.ibge.gov.br.
Este documento fornece uma introdução ao pacote e apresenta exemplos básicos para ajudá-lo a começar.
Para instalar o pacote diretamente do GitHub, utilize o código abaixo:
# Instalar remotes, se necessário
# install.packages("remotes")
# Instalar o pacote sidra
remotes::install_github("rodrigoesborges/sidra")
Após a instalação, carregue o pacote com:
library(sidra)
O pacote sidra contém diversas funções para acessar diferentes seções da API SIDRA. Abaixo, uma descrição das funções principais.
Esta é a função principal do pacote, que permite fazer consultas gerais à API SIDRA com diversos parâmetros. Use esta função para acessar dados diretamente especificando a tabela, variáveis, classificadores, períodos e níveis geográficos.
sidra(tabela, classificador = "", filtro_cats = "", nivel = 1, filtro_niveis = "all", periodo = "all", variavel = "allxp", inicio = NULL, fim = NULL)
tabela: Número da tabela desejada.
classificador: Classificador a ser detalhado. O padrão retorna todos os classificadores disponíveis.
filtro_cats: Define subconjunto do classificador.
nivel: Define o nível geográfico, por exemplo, N1 para Brasil, N6 para Município.
filtro_niveis: Define um subconjunto do nível especificado.
periodo: Período dos dados; "all" para todos os períodos disponíveis.
variavel: Variáveis a serem retornadas; "allxp" exclui variáveis calculadas pela SIDRA.
inicio, fim: Início e fim do período desejado.
Essas funções retornam informações sobre classificações disponíveis para uma tabela específica, incluindo os códigos de classificadores.
tab_class(tabela): Retorna classificações disponíveis para uma tabela específica.
tabela: Número da tabela de interesse.
Essa função retorna a fonte dos dados, i.e. a Pesquisa primária fonte, para uma tabela específica, permitindo entender a origem e confiabilidade dos dados.
tab_fonte(tabela): Retorna a fonte de dados para a tabela especificada.
tabela: Número da tabela de interesse.
Essas funções fornecem metadados sobre uma tabela específica, oferecendo informações detalhadas sobre o conteúdo da tabela.
tab_meta(tabela): Retorna metadados para uma tabela específica.
tabela: Número da tabela de interesse.
Essas funções retornam informações sobre os níveis geográficos disponíveis para uma tabela, como Brasil, Região, Estado, ou Município.
tab_niveis(tabela): Retorna níveis geográficos disponíveis para a tabela especificada.
tabela: Número da tabela de interesse.
Essas funções permitem listar os períodos disponíveis para uma tabela, como anos ou meses, dependendo da periodicidade dos dados.
tab_periodos(tabela): Retorna os períodos disponíveis para a tabela especificada.
tabela: Número da tabela de interesse.
Essas funções listam as variáveis disponíveis em uma tabela específica, como diferentes métricas ou indicadores que podem ser selecionados.
tab_vars(tabela): Retorna variáveis disponíveis para a tabela especificada.
tabela: Número da tabela de interesse.
Aqui estão exemplos de como usar essas funções para consultar dados específicos na API SIDRA.
Para listar as classificações disponíveis para uma tabela específica, como a tabela 1612:
Para obter a fonte dos dados de uma tabela específica:
Para acessar os metadados de uma tabela específica, como a tabela 1612:
Para listar os níveis geográficos disponíveis para a tabela 1612:
Para listar os períodos disponíveis para a tabela 1612:
Para listar as variáveis disponíveis para uma tabela específica, como a tabela 1612:
Limites de consulta: Algumas consultas podem exceder o limite de 100.000 registros permitido pela API do IBGE. Nesse caso, por definição o pacote busca dividir a consulta em requisições menores a partir de segmentação dos períodos requisitados. Ainda que robusto, pode não funcionar para todos os casos, pelo qual sugerimos faça a segmentação manualmente da requisição se necessário.
Níveis e Classificadores: Ao utilizar filtro_niveis ou filtro_cats, certifique-se de que eles tenham o mesmo tamanho do argumento nivel ou classificador, respectivamente.
O pacote sidra facilita a consulta aos dados do IBGE, possibilitando um fluxo de trabalho mais ágil para análises de dados diretamente no R. Para maiores informações, visite a documentação da API SIDRA e explore as funções adicionais do pacote.
Esperamos que esta vignette ajude você a começar a usar o sidra e realizar análises com dados do IBGE.