No momento, você está visualizando 5 Erros Comuns da Análise de Dados, Exemplos e Soluções

5 Erros Comuns da Análise de Dados, Exemplos e Soluções

Quando analisamos informações precisamos ter o cuidado de não cair nesses erros comuns que até os analistas mais experientes correm o risco de cometer.

Alguns são bem óbvios, mas alguns dependem de se ter uma mente treinada e boas práticas de Quality Assurance para termos certeza de que nossas conclusões estão livres de falhas e não tendenciosas.

Erro #1: Dados pouco representativos

Isso ocorre quando seu extrato de dados não é suficientemente representativo, ou seja, existe um problema intransponível e seus dados não irão representar a realidade e portando seus resultados serão imprestáveis.

Exemplo:

Estou analisando a comida preferida dos habitantes da cidade de São Paulo, para chegar a essa conclusão eu pego os dados do bairro da Liberdade. Com esse conjunto de dados você invariavelmente irá chegar à conclusão de que a comida japonesa é a comida preferida, com uma margem enorme de “certeza”.

Solução:

Planeje quais fontes de dados estão disponíveis e qual o escopo mínimo necessário para ter um resultado confiável.

Neste quesito ter as ferramentas corretas de análise e as práticas corretas farão toda a diferença.

Erro #2: Falta de familiaridade com os dados

Esse problema é comum quando não temos o domínio de uma certa área do conhecimento. A falta de conhecimento certamente levará a erros de análise que tornaram suas conclusões erradas.

Exemplo:

Lembro que logo que cheguei para a força tarefa do Banestado eu fiz uma análise de dados de contas correntes e ao final havia um número absurdamente alto de contas que ultrapassavam o valor de corte, ou seja, cujos valores totais de transações eram altos e saltavam aos olhos, parecia que havia encontrado uma quantidade enorme de contas mães que são usadas para a lavagem de dinheiro.

Meu erro foi não saber que para aquele conjunto de dados havia uma duplicação e que cada operação tinha uma contra-operação e não conhecer os dados simplesmente me levou a duplicar o valor total das transações.

Solução:

Procure profissionais e empresas que possam te ajudar a compreender os dados disponíveis e seus relacionamentos e detalhes especiais que possam te levar a cometer um erro.

Ninguém é obrigado a conhecer todos os detalhes de todas as áreas, mas a falta de conhecimento poderá estragar suas análises.

Erro #3: Cherry-picking

O Cherry-picking acontece quando partimos de uma hipótese que queremos provar e simplesmente não resistimos a tentação de “dar uma força” escolhendo os dados que corroboram com nossa ideia pré-concebida. Além de ser antiético, invariavelmente não sobreviverá a uma revisão, mas pode levar a consequências muito ruins, especialmente nas áreas mais sensíveis como segurança pública e saúde.

Exemplo:

Temos certeza de que certo indivíduo está envolvido em algo ilegal e com isso escolhemos apenas os dados que interessam para levar a conclusão desejada.

Solução:

Quando estiver analisando suas informações, livre-se de seus preconceitos e seja frio com os dados que você dispõe, seja fiel aos fatos que os dados te mostram.

Erro #4: Falso positivo

O falso positivo geralmente é relacionado a uma revisão de dados pobre ou inexistente, sem confirmação de uma segunda coleção de dado, sem aplicação das melhores práticas, sem ferramentas corretas e sem bons métodos de revisão.

Exemplo:

Lembro que em uma investigação de fraude de concursos públicos algumas pessoas foram presas por envolvimento com o crime, entre elas foi presa uma pessoa completamente inocente e sem nenhuma relação com a quadrilha.

O que ocorreu cabe nas categorias de problemas de boas práticas acima: não houve revisão e não havia um conjunto de dados para a contraprova na hora da coleta dos dados. Houve um erro e o cadastro do proprietário do número era antigo e desatualizado.

Solução:

Revise seu trabalho e procure sempre cruzar dados de várias fontes, analisando vários ângulos diferentes do problema, algumas ferramentas especificas vão ajudar você nessa tarefa.

Erro #5: Problema do martelo

Meu pai era mecânico e entendia bem sobre a necessidade de usar a ferramenta correta para cada fase do seu trabalho; ele usava uma frase que eu sempre achei muito divertida: “Pra quem só conhece martelo tudo é prego.”

Seu trabalho de análise não terá qualidade se você não usar a ferramenta certa, ou seja, ferramentas para extrair, consolidar e gerar inteligência a partir de suas informações são essenciais e conhecer a ferramenta certa para o tipo de análise é uma parte importante do trabalho do analista.

Exemplo:

O MS Excel pode ser seu amigo e uma ferramenta muito útil, mas você pode estar usando as suas planilhas como um martelo.

Solução:

Mantenha-se atualizado e conheça as melhores ferramentas disponíveis no mercado e ativamente procure obtê-las, a qualidade do seu trabalho é importante, assim como sua reputação.