Esse repositório contém códigos em linguagem Python utilizados para realizar a limpeza, pré-processamento e análise exploratória preliminar de uma base de dados obtida do Ministério da Saúde sobre intoxicações exógenas, analisando especificamente as intoxicações por agrotóxicos de uso agrícola. A base original e a pré-processada também são disponibilizadas.
A obtenção, análise e divulgação desses dados fazem parte da iniciativa Por Trás do Alimento: uma parceria entre as organizações jornalísticas Agência Pública e Repórter Brasil que vai investigar como são produzidos os alimentos que comemos e exportamos, além de outros produtos.
Os códigos desse repositório contribuiram para uma série de reportagens:
pre-processamento-agrotoxicos.ipynb: Jupyter Notebook com o código que realiza a limpeza e pré-processamento dos dados, corrigindo a falta de padronização dos nomes das substâncias que causam intoxicações (princípios ativos).
analise-exploratoria-agrotoxicos.ipynb: Jupyter Notebook com o código que realiza a análise exploratória preliminar dos dados padronizados.
bases: contém a base de dados original obtida do Sistema de Informação de Agravos de Notificação (SINAN) do Ministéro da Saúde obtida através da Lei de Acesso a Informação, além de bases de dados da Anvisa utilizadas para fazer a padronização da base do SINAN.
bases mapeadas: contém as bases pré-processadas em duas versões (especificadas no notebook pre-processamento-agrotoxicos.ipynb)
dicionarios: utilizados para realizar a padronização da base original para os nomes utilizados pela Anvisa.