Posts Tagged: dados

Análise | Regressão linear múltipla – dados de campanha de mídia

person using smartphone and laptop at the same time

Fiz o um novo modelo usando dados de uma campanha de mídia.

Conclusões do modelo:

  • 86% do R ajustado indica que o modelo explica que a variabilidade do custo das campanhas;
  • O valor de p de impressões está maior do que 0,1, portanto deve ser excluído do modelo; já os valores de p dos cliques e CTR são aceitos no modelo por serem menores do que 0,1.
  • F indica a relação linear entre as variáveis.

Novo modelo, sem os valores de impressões.

Equação do modelo de projeção

Y = 989,0176468 + 1,11774408 +(-318737,5854)

Y = 319727,72

É muito bom trazer estatística aplicada para dados de comunicação. Não tem alternativa, nós precisamos abraçar o marketing preditivo.

Python para analistas de comunicação, marketing e afins (parte 1)

No início de uma carreira na área de business intelligence é legal fazermos análises próprias, mas, nem sempre, temos grana pra contratar ferramenta.  Na minha empresa, eu sempre coloco o custo da contratação por report contratado. No entanto, com python é possível fazer análises simples ou complexas de dados sociais, independentes da fonte, só que é preciso dominar a linguagem. Aqui inicio uma série em que abordarei programação e análises próximas do nosso dia a dia. Os dados abaixo processados com python são um dos 45 arquivos extraídos por mim, com cem mil tweets cada, através do Netlytic com a hashtag #Eleições2018. Os dados já estão em formato estruturado, portanto, não foi necessário colocá-los no formato JSON. 

 

Os cinco tweets que encabeçam a lista com head( )

 

As colunas da planilha: 

 

As @ dos twitteiros que encabeçam a lista: 

Bio do usuário, onde podemos coletar informações interessantes: 

Acostumados com ferramentas prontas de monitoramento de rdes sociais, o início em Big data, com background de comunicação, exige um pouco mais de esforço intelectual. Python, R, SQL, dentre outras linguagens, são necessários para fazer uma análise de dados volumosos e o objetivo deste post é mostrar que podemos ir além do que nos mostram os dashboards prontos extraídos das ferramentas e fazer análises mais rápidas sem depender diretamente do Excel. Confira aqui o relatório no slideshare

Isto não é um tutorial da biblioteca ‘pandas’ e para isso busquem outras fontes no blog do meu professor da disciplina, o cientista da computação e especialista em python, Dino Magri