Posts Tagged: estatística aplicada

Análise exploratória em um banco de dados dos beneficiários do Bolsa Família que possuem acompanhamento dos agentes de saúde

Um banco de dados precisa ser “explorado” minunciosamente antes de análises. O objetivo deste post é fazer uma investigação (breve) com dados reais de pessoas que recebem o bolsa família e têm os seus indicadores de saúde acompanhados por agentes no município. São dados fresquinhos (29/06/2018) e que estão disponíveis no site do SAS/DAB da coordenação geral de alimentação. Esta planilha é considerada de ‘small data’, mas válida para estudar estatística descritiva.

Particularmente não sabia que parte destes indivíduos possuiam um acompanhamento do Departamento de Atenção Básica do Ministério da saúde, incluindo aí grávidas e crianças. Isto é pouco divulgado (acredito eu) e existe um estudo muito interessante de estudantes da Universidade da Paraíba que analisaram a visão do agentes de saúde que visitam as casas, conhecem as pessoas e reportam estas informações. 

As informações foram obtidas por meio de entrevistas semi estruturadas e encontros de grupo focal. Os profissionais acreditam que o programa ocasionou mudanças favoráveis na vida das famílias participantes, como a redução da pobreza, o aumento da frequência escolar das crianças e mudanças positivas na relação entre as famílias participantes e os serviços de saúde. No entanto, relataram dificuldades de caráter organizacional no acompanhamento das condicionalidades, sobretudo devido ao aumento da demanda de trabalho. É importante que as condicionalidades de saúde proporcionem oportunidades para a realização de ações que visem ao empoderamento e autonomia dos sujeitos quanto ao autocuidado e desenvolvimento da cidadania.[…]  No setor saúde, as condicionalidades que as famílias devem cumprir são o acompanhamento do crescimento e desenvolvimento infantil pela vigilância nutricional, a vacinação para crianças menores de sete anos e a assistência pré-natal e pós-parto.

Análise exploratória de dados 

Neste banco de dados, em específico, estão dados de ordem variável quantitativa discreta. Ou seja, são variáveis que apresentam valores enumerados resultados de uma contagem. Eu utilizei para fazer análise exploratória apenas a coluna dois de “quantidade de famílias com perfil de saúde totalmente acompanhadas pelo município”, algumas vezes eu a comparei com a primeira coluna que indica a quantidade de pessoas que devem ser acompanhadas. Assim como a terceira coluna foi utilizada também porque apresenta o percentual das visitas, mas claro que conferi as contas que utilzei. Clique aqui para fazer o download. Abaixo estão as cinco cidades com maior quantidade de pessoas acompanhadas. 

 

Medidas de posição 

Moda | Moda é a observação mais frequente em um conjunto de observações. Ou seja, quantas vezes um mesmo número apareceu. Neste caso o número 0 apareceu 19 vezes nesta coluna, portanto é mais frequente cidades que não recebem visitas.  Especulo o motivo (abaixo) nos insights.

Mediana | Mediana é a observação que ocupa a posição central na amostra, o valor é 527. Existem três cidades que aparecem com esta mediana de visitas: Santarém novo (PA), Cabreuva (SP) e Venha-ver (RN). Das três a cidade no Rio Grande do Norte é a única com 100% das análises realizadas até agora porque só tem 527 pessoas para visitar. Justo, não?

Máximo | A cidade de Fortaleza obteve o número máximo de acompanhamentos com 84 596 pessoas visitadas. O que representa 54% da quantidade de pessoas que devem ser acompanhadas. Desconsiderei o mínimo 0 porque ele já apareceu na “moda”, porém se eu considerar 1 como mínimo aparece no extremo a cidade de Bento Fernandes (RN) com 690 beneficiados a serem acompanhados e apenas 1 visita. 

Mais Insights

  • A cidade de fortaleza obteve o máximo de visitas com 84 596, o que gera um percentual de 54% de cobertura, mas há 98 cidades com 100% de alcance. Por quê? Porque existe uma diferença na cobertura em um número maior de indivíduos a serem acompanhados como 155 889, caso da capital cearense, e uma cobertura total em 10 173 indivíduos, caso de Ipojuca (PE) que obteve aproveitamento total. Só para dados de comparação, Ipojuca, por exemplo, tem 91 341 habitantes e Fortaleza mais de dois milhões.
  • Provavelmente, quanto menor a cidade, maior é a probabilidade de cobertura, porém isto não é uma regra. Existem 19 cidades pequenas, com até três dígitos de indivíduos a serem acompanhados que não receberam ninguém. Caso de Morro da Fumaça (SC) que tem 201 pessoas precisando de acompanhamento, mas zero visitas. A cidade é bem nova (56 anos) e possui 16.247 habitantes, o que teoricamente não a transformaria nem em “cidade pequena” segundo a ONU porque tem menos de 20 mil pessoas.
  • Será que cidades ‘muito’ pequenas há menos agentes cadastrados? Vou em busca de uma base de dados de agentes por cidade, afim de comprovar a teoria. Acredito que há uma relação.

Observações 

  • É importante usarmos dados da realidade brasileira pra fazer análise, mesmo que corremos o risco de leitura enviezada. Neste post, por exemplo, evitei fazer juízo de valor quanto ao programa.
  • Eu sei que é tentador abrir o site do ‘datasets’ da Dinamarca, mas quanto mais a gente puder aplicar ‘small data’ ou ‘big data’ na realidade brasileira, melhor, né? Acho que seria legal juntar mais bases de dados reais fora daquelas manjadas dos livros de estatísticas tipo “um executivo gostaria de obter”. Sinto um pouco de preguiça ao me deparar com exemplos de estatística de marketing de alguns livros. Se estatística é o estudo do comportamento humano, por que não utilizamos mais dados gerais e fora da bolha da classe média pra estudar? Acho que apresentaria mais dados e soluções para o Brasil. Enfim, estou especulando.
  • Este tipo de análise, numa simples coluna, levam em média 5 horas. Estatística aplicada deveria estar presente em cursos de comunicação porque eu estaria ‘brincando’ com isso há mais tempo.
  • Fiquei curiosa e tentada e gostaria de fazer análises mais complexas, desta vez usando o R.