Capacitação em Analista de Dados

NOÇÕES BÁSICAS EM ANALISTA DE DADOS

 

MÓDULO 1 — Fundamentos da Análise de Dados 

Aula 1 — O que faz um analista de dados?

 

O analista de dados é o profissional que ajuda pessoas, equipes e organizações a enxergarem melhor uma situação por meio dos dados. Em vez de tomar decisões apenas por opinião, intuição ou costume, ele busca evidências: números, registros, históricos, respostas de formulários, informações de sistemas, planilhas, relatórios e outros materiais que possam mostrar o que está acontecendo de verdade. Seu trabalho não é apenas “mexer em planilhas”, mas transformar dados soltos em informações organizadas, compreensíveis e úteis para a tomada de decisão.

Imagine uma pequena loja que percebe queda nas vendas. Uma pessoa pode dizer que o problema é o preço, outra pode afirmar que é a concorrência, e outra pode acreditar que é falta de divulgação. O analista de dados entra justamente para investigar. Ele pode observar as vendas por mês, comparar produtos, verificar horários de maior movimento, analisar formas de pagamento, identificar clientes que deixaram de comprar e perceber se a queda aconteceu em todos os setores ou apenas em alguns produtos. Assim, em vez de trabalhar com achismos, a empresa passa a entender melhor o problema.

Na prática, o analista de dados trabalha com perguntas. Antes de abrir uma ferramenta, criar um gráfico ou montar um relatório, ele precisa compreender o que se deseja descobrir. Uma boa análise começa com uma boa pergunta. Por exemplo: “Qual produto teve maior queda nas vendas?”, “Quais clientes compram com mais frequência?”, “Qual turma teve melhor desempenho?”, “Quanto tempo leva, em média, para responder um atendimento?”, “Quais regiões apresentam mais atrasos de entrega?”. Essas perguntas orientam todo o processo, porque mostram quais dados devem ser procurados e que tipo de resposta será útil.

É importante entender a diferença entre dado, informação e insight. Um dado pode ser algo simples, como “150 pedidos”. Sozinho, esse número diz pouco. Ele se torna informação quando recebe contexto: “foram 150 pedidos em maio, contra 220 em abril”. O insight aparece quando essa informação ajuda a compreender uma situação e sugere uma ação: “a queda ocorreu principalmente depois que um produto muito vendido ficou sem estoque”. O analista de dados atua exatamente nesse caminho: parte de registros brutos, organiza esses registros, interpreta o que eles mostram e ajuda outras pessoas a decidir melhor.

O trabalho do analista costuma

seguir algumas etapas. Primeiro, ele entende o problema. Depois, identifica quais dados podem ajudar a responder à pergunta. Em seguida, coleta ou acessa esses dados, verifica se estão corretos, limpa erros, organiza as informações e realiza cálculos ou comparações. Por fim, apresenta os resultados por meio de tabelas, gráficos, painéis ou relatórios. A IBM descreve a análise de dados como um processo que permite descobrir tendências, padrões e correlações em dados brutos para apoiar decisões baseadas em dados.

Um ponto essencial é que nem toda análise precisa ser complexa. Em muitos casos, uma boa planilha já permite respostas importantes. Um iniciante pode começar calculando totais, médias, percentuais, rankings e comparações simples. Por exemplo, em uma escola, uma coordenação pode analisar notas por turma, frequência dos alunos, quantidade de atividades entregues e evolução ao longo do curso. Em uma clínica, pode acompanhar número de atendimentos, horários mais procurados e taxa de faltas. Em uma empresa de vendas, pode observar faturamento, ticket médio, produtos mais vendidos e sazonalidade.

O analista de dados também precisa saber interpretar. Esse é um dos maiores desafios da profissão. Um número não fala sozinho; ele precisa ser lido dentro de um contexto. Se uma empresa vendeu menos em janeiro, isso pode ser um problema, mas também pode ser um comportamento esperado por causa de férias, sazonalidade ou queda natural de demanda. Se uma turma teve média menor em uma avaliação, isso pode indicar dificuldade no conteúdo, mas também pode ter relação com o formato da prova, ausência dos alunos ou falta de tempo para estudar. Por isso, o analista não deve olhar apenas para o resultado final, mas investigar as condições em que aquele resultado foi produzido.

Outro cuidado importante é não confundir relação com causa. Se dois acontecimentos aparecem juntos, isso não significa automaticamente que um causou o outro. Por exemplo, se uma empresa percebe que as vendas aumentaram no mesmo mês em que publicou mais nas redes sociais, pode existir uma relação, mas ainda não se pode afirmar, sem investigação, que as postagens foram a única causa do aumento. Talvez também tenha ocorrido uma promoção, uma mudança no estoque, uma data comemorativa ou uma melhora no atendimento. O bom analista evita conclusões apressadas e procura levantar hipóteses com responsabilidade.

Existem diferentes tipos de análise de dados. A análise descritiva procura responder “o que

aconteceu?”, como o total de vendas de um mês ou a quantidade de atendimentos realizados. A análise diagnóstica tenta entender “por que aconteceu?”, buscando causas e padrões. A análise preditiva procura estimar “o que pode acontecer?”, usando dados históricos para identificar tendências. A análise prescritiva busca indicar “o que pode ser feito?”, sugerindo caminhos com base nas informações analisadas. A IBM apresenta esses quatro métodos como formas de revelar padrões e apoiar decisões dentro das organizações.

No começo da formação, o mais importante é dominar bem a análise descritiva e dar os primeiros passos na análise diagnóstica. Isso significa aprender a organizar dados, calcular indicadores básicos, comparar períodos, identificar variações e fazer boas perguntas. Antes de pensar em previsões avançadas, inteligência artificial ou modelos estatísticos complexos, o iniciante precisa desenvolver uma base sólida: entender tabelas, saber conferir dados, perceber inconsistências e explicar resultados com clareza.

As ferramentas usadas pelo analista podem variar bastante. Muitos começam pelo Excel ou pelo Google Planilhas, porque são recursos acessíveis e úteis para organizar dados, aplicar fórmulas, criar tabelas dinâmicas e construir gráficos. Depois, é comum avançar para ferramentas de visualização e business intelligence, como o Power BI. A documentação da Microsoft explica que o Power BI permite conectar fontes de dados, limpar e modelar dados, criar visualizações e compartilhar informações de forma interativa.

Além das ferramentas visuais, o analista pode aprender SQL, uma linguagem usada para consultar bancos de dados. Em empresas, os dados nem sempre estão em uma única planilha. Eles podem estar distribuídos em tabelas diferentes: clientes, pedidos, pagamentos, produtos, matrículas, atendimentos ou avaliações. Saber consultar essas informações ajuda o analista a encontrar respostas com mais autonomia. Mais adiante, também pode ser interessante aprender Python, especialmente para trabalhar com bases maiores ou automatizar tarefas repetitivas.

No entanto, ferramenta nenhuma substitui raciocínio. Uma pessoa pode saber usar vários programas e ainda assim fazer uma análise ruim, se não compreender o problema. Da mesma forma, um iniciante com uma planilha simples pode gerar uma boa análise se fizer perguntas claras, organizar bem os dados e apresentar conclusões honestas. A tecnologia ajuda, mas o olhar crítico é indispensável.

A comunicação é outra

competência fundamental. O analista de dados precisa traduzir números para pessoas. Nem todo gestor, professor, comerciante ou coordenador tem tempo ou conhecimento técnico para interpretar uma grande tabela. Por isso, o analista deve apresentar os resultados de forma simples, objetiva e visual. Um bom relatório não é aquele que mostra tudo, mas aquele que mostra o que realmente importa para a decisão. Muitas vezes, três indicadores bem escolhidos comunicam melhor do que vinte gráficos confusos.

Pense em um relatório sobre atendimento ao cliente. Se o analista apenas entregar uma planilha com centenas de linhas, talvez ninguém consiga entender rapidamente o problema. Mas se ele mostrar que o tempo médio de resposta aumentou, que a maior parte das reclamações acontece em determinado canal e que os atrasos se concentram em certos dias da semana, a equipe passa a ter uma visão mais clara. A partir disso, pode reorganizar horários, treinar colaboradores ou melhorar processos internos.

O analista de dados também deve agir com responsabilidade ética. Dados podem envolver pessoas: nomes, documentos, telefones, endereços, notas, compras, comportamentos, avaliações e informações sensíveis. No Brasil, a Lei Geral de Proteção de Dados Pessoais trata do uso de dados pessoais em meio físico ou digital e busca proteger direitos fundamentais como liberdade e privacidade. Isso significa que o analista precisa ter cuidado ao acessar, armazenar, compartilhar e apresentar informações.

Em uma análise profissional, nem sempre é necessário mostrar dados individuais. Muitas vezes, o correto é apresentar informações agregadas, como médias, totais e percentuais. Por exemplo, em vez de expor o nome de cada aluno com baixo desempenho, pode-se mostrar a porcentagem de alunos que precisam de reforço em determinado conteúdo. Em vez de divulgar dados pessoais de clientes, pode-se apresentar indicadores por região, faixa de tempo ou categoria de produto. Esse cuidado protege as pessoas e torna a análise mais segura.

Outro aspecto importante é a qualidade dos dados. Se a base estiver errada, a conclusão também pode estar errada. Dados duplicados, campos vazios, nomes escritos de formas diferentes e datas mal registradas podem distorcer os resultados. A IBM destaca que a limpeza de dados envolve formatar corretamente, remover duplicidades e eliminar entradas irrelevantes, ajudando a proteger a confiabilidade e a precisão das análises. Portanto, antes de calcular qualquer indicador, o analista

precisa desconfiar um pouco da base e verificar se ela está organizada.

Para entender melhor, imagine uma planilha de clientes em que a mesma cidade aparece como “São Paulo”, “Sao Paulo”, “SP” e “S. Paulo”. Se o analista agrupar os dados sem corrigir essa diferença, poderá dividir uma mesma localidade em grupos separados e chegar a uma leitura equivocada. O mesmo acontece quando há produtos com nomes duplicados, datas em formatos diferentes ou valores registrados com erro. A preparação dos dados não é uma etapa menor; ela é parte central do trabalho.

No dia a dia, o analista de dados costuma conversar com diferentes áreas. Ele pode falar com vendas, atendimento, financeiro, marketing, recursos humanos, educação, logística ou gestão. Por isso, precisa desenvolver escuta. Muitas vezes, a pessoa que pede uma análise não sabe exatamente qual indicador precisa. Ela apenas sente que há um problema. O analista ajuda a transformar essa sensação em uma pergunta objetiva. Em vez de “acho que os alunos estão desistindo muito”, a pergunta pode se tornar: “qual é a taxa de evasão por mês, por curso e por motivo informado?”. Essa mudança torna a investigação muito mais clara.

Ser analista de dados, portanto, é unir técnica, curiosidade e responsabilidade. É saber mexer em ferramentas, mas também saber perguntar. É calcular, mas também interpretar. É criar gráficos, mas também contar uma história verdadeira com base nas evidências. É encontrar padrões, mas sem forçar conclusões. É apoiar decisões, mas reconhecendo limites.

Para quem está começando, o caminho pode parecer grande, mas ele pode ser percorrido passo a passo. Primeiro, o aluno precisa aprender a observar dados simples. Depois, deve praticar organização de tabelas, criação de indicadores e leitura de gráficos. Com o tempo, pode avançar para bancos de dados, ferramentas de BI e análises mais sofisticadas. O mais importante, nesta primeira aula, é compreender que a análise de dados não é uma atividade distante ou exclusiva de grandes empresas. Ela está presente em qualquer situação em que seja necessário entender melhor a realidade para agir com mais segurança.

Ao final desta aula, o aluno deve guardar uma ideia central: o analista de dados é um profissional que transforma perguntas em investigações e dados em decisões. Ele não trabalha apenas para produzir números, mas para gerar entendimento. Seu valor está em ajudar pessoas a enxergar o que os dados mostram, o que ainda não se sabe e quais caminhos podem ser

escolhidos com mais consciência.

Atividade de fixação

Escolha uma situação simples do cotidiano, como vendas de uma loja, desempenho de uma turma, controle de estoque, atendimentos de uma secretaria ou postagens em uma rede social. Em seguida, escreva três perguntas que poderiam ser respondidas com dados. Depois, indique quais informações seriam necessárias para responder a cada pergunta.

Exemplo: se a pergunta for “qual produto vende mais?”, será necessário ter dados como nome do produto, quantidade vendida, período analisado e valor de venda. Se a pergunta for “em qual mês houve maior procura?”, será necessário ter datas ou meses registrados. O objetivo é perceber que toda boa análise começa antes da ferramenta: começa com uma pergunta clara.

Referências bibliográficas

BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados Pessoais.

GOV.BR. Lei Geral de Proteção de Dados Pessoais — LGPD.

IBM. O que é big data analytics? IBM Think.

IBM. O que é ciência de dados? IBM Think.

MICROSOFT. Microsoft Power BI: treinamento e documentação. Microsoft Learn.


Aula 2 — Tipos de dados e fontes de informação

 

Quando uma pessoa começa a estudar análise de dados, é comum imaginar que todo dado é simplesmente um número em uma planilha. Mas, na prática, os dados aparecem de muitas formas: nomes, datas, valores, respostas de formulários, registros de sistemas, imagens, textos, áudios, vídeos, comentários de clientes e até informações geradas automaticamente por aplicativos. Por isso, antes de analisar qualquer base, o futuro analista precisa aprender a reconhecer que tipo de dado está diante dele e de onde esse dado veio.

Essa etapa parece simples, mas é uma das mais importantes do trabalho. Se o analista não entende a natureza dos dados, pode escolher cálculos errados, criar gráficos inadequados ou chegar a conclusões frágeis. Um campo com “idade”, por exemplo, pode ser usado para calcular média. Já um campo com “cidade” não deve ser tratado da mesma forma, porque cidade é uma categoria, não uma medida numérica. Do mesmo modo, uma coluna com “data da compra” permite analisar evolução ao longo do tempo, mas precisa estar registrada corretamente para que isso funcione.

Podemos começar diferenciando os dados quantitativos dos dados qualitativos. Os dados quantitativos são aqueles que representam quantidades, medidas ou valores numéricos. São exemplos: preço, idade, nota, número de vendas, quantidade de produtos em estoque, tempo de atendimento, distância percorrida

emos começar diferenciando os dados quantitativos dos dados qualitativos. Os dados quantitativos são aqueles que representam quantidades, medidas ou valores numéricos. São exemplos: preço, idade, nota, número de vendas, quantidade de produtos em estoque, tempo de atendimento, distância percorrida e valor de uma compra. Esses dados permitem operações matemáticas, como soma, média, mínimo, máximo e percentual.

Já os dados qualitativos representam características, classificações ou categorias. Eles não servem, em geral, para fazer contas diretas, mas ajudam a organizar e comparar grupos. São exemplos: nome do produto, cidade, estado civil, área de atuação, categoria do curso, tipo de pagamento, status do pedido, turno da turma e motivo de cancelamento. Um analista pode contar quantas pessoas existem em cada categoria, comparar grupos ou observar qual classificação aparece com mais frequência.

Imagine uma planilha de vendas de uma loja. A coluna “valor da venda” é quantitativa, porque mostra um número que pode ser somado. A coluna “forma de pagamento” é qualitativa, porque indica se o cliente pagou com dinheiro, cartão, PIX ou boleto. A coluna “data da venda” é temporal, porque permite acompanhar o comportamento das vendas ao longo dos dias, semanas ou meses. A coluna “nome do vendedor” é categórica, porque permite comparar o desempenho entre pessoas ou equipes.

Além dessa divisão, também é importante entender a diferença entre dados estruturados, semiestruturados e não estruturados. Dados estruturados são aqueles organizados em formato bem definido, geralmente em tabelas com linhas e colunas. Uma planilha de alunos, uma tabela de clientes ou um cadastro de produtos são exemplos simples. A AWS explica que dados estruturados costumam ter formato padronizado, com linhas e colunas que definem claramente os atributos dos dados.

Os dados estruturados são os mais fáceis para o iniciante compreender, porque se parecem com as planilhas usadas no cotidiano. Cada linha representa um registro, e cada coluna representa uma característica daquele registro. Em uma tabela de alunos, por exemplo, cada linha pode representar um aluno, enquanto as colunas indicam nome, curso, matrícula, nota, frequência e situação final. Essa organização facilita filtros, cálculos, agrupamentos e gráficos.

Os dados semiestruturados ficam em uma posição intermediária. Eles não seguem exatamente o formato tradicional de tabela, mas possuem alguma organização interna. Arquivos JSON e XML são exemplos

comuns. A IBM explica que os dados semiestruturados combinam elementos dos dados estruturados e dos não estruturados, podendo conter marcadores que ajudam na organização e na análise. Em termos simples, é como se esses dados não estivessem em uma planilha comum, mas ainda tivessem uma lógica que permite interpretá-los.

Já os dados não estruturados são mais livres e não cabem facilmente em linhas e colunas. Entram aqui textos longos, mensagens de e-mail, comentários em redes sociais, imagens, vídeos, gravações de áudio, documentos digitalizados e avaliações escritas por clientes. A AWS diferencia esse tipo de dado ao mostrar que ele não se encaixa perfeitamente em tabelas, justamente por causa de sua natureza ou tamanho.

Isso não significa que dados não estruturados sejam inúteis. Pelo contrário, eles podem trazer informações muito ricas. Um comentário de cliente pode revelar insatisfação com o atendimento. Uma resposta aberta em um formulário pode mostrar uma dificuldade que os números não explicam. Um conjunto de mensagens pode indicar dúvidas frequentes. No entanto, esses dados exigem mais cuidado, porque precisam ser lidos, classificados, resumidos ou processados antes de gerar indicadores.

Para um iniciante, é recomendável começar pelos dados estruturados, especialmente em planilhas. Eles permitem desenvolver uma base segura: identificar colunas, limpar informações, calcular indicadores e criar gráficos. Depois, o aluno pode avançar para dados semiestruturados e não estruturados, entendendo que cada tipo exige ferramentas, métodos e cuidados diferentes.

Outro conceito essencial é o de fonte de dados. A fonte é o lugar de onde a informação vem. Em uma empresa, os dados podem vir de sistemas de vendas, cadastros de clientes, plataformas de pagamento, relatórios financeiros, planilhas internas, sistemas de atendimento, formulários de pesquisa, aplicativos de entrega, redes sociais e bancos de dados. Em uma escola, podem vir de diários de classe, sistemas acadêmicos, avaliações, matrículas, frequência, ambiente virtual de aprendizagem e pesquisas de satisfação.

As fontes podem ser internas ou externas. Fontes internas são aquelas produzidas dentro da própria organização. Uma planilha de estoque, um histórico de vendas, um cadastro de alunos ou um relatório de atendimento são exemplos. Elas costumam estar mais próximas da realidade da instituição e podem responder perguntas diretamente ligadas ao funcionamento do negócio.

As fontes externas são aquelas que vêm de

fontes externas são aquelas que vêm de fora da organização. Podem incluir dados públicos do governo, pesquisas de mercado, indicadores econômicos, informações demográficas, bases abertas, dados climáticos, estudos setoriais ou relatórios de instituições reconhecidas. Esses dados ajudam a ampliar o contexto. Por exemplo, uma empresa pode comparar suas vendas com datas comemorativas, condições econômicas ou mudanças de comportamento do consumidor.

No entanto, uma fonte de dados precisa ser avaliada. Nem todo dado disponível é confiável, completo ou adequado para a análise. O analista deve perguntar: quem produziu esses dados? Quando foram coletados? Estão atualizados? Há campos vazios? A base representa bem a realidade analisada? Existe autorização para usar essas informações? Os dados foram registrados de forma padronizada?

A qualidade dos dados é decisiva. Uma análise feita com dados incompletos, duplicados ou inconsistentes pode gerar conclusões equivocadas. A IBM destaca que valores ausentes podem levar a análises enviesadas ou enganosas, especialmente quando os dados disponíveis não representam bem o conjunto analisado. Também aponta a duplicidade como um problema de qualidade, pois registros repetidos podem distorcer resultados.

Pense em uma escola que deseja saber a taxa de conclusão de seus alunos. Se alguns registros aparecem duplicados, o total de matrículas pode ficar maior do que realmente é. Se muitos campos de situação final estão vazios, talvez não seja possível saber quem concluiu, quem desistiu e quem ainda está em andamento. Se a data de matrícula está escrita em formatos diferentes, a análise por mês pode ficar comprometida. Nesses casos, o problema não está na pergunta, mas na qualidade da base.

Por isso, antes de analisar, o profissional precisa conhecer a estrutura dos dados. Ele deve observar o nome das colunas, o significado de cada campo, o tipo de informação registrada e os possíveis problemas. Essa primeira leitura é como abrir uma caixa antes de usar seu conteúdo. Não basta olhar rapidamente; é necessário entender o que existe ali dentro.

Um bom exercício é perguntar, coluna por coluna: este dado é numérico, categórico ou temporal? Ele está completo? Está padronizado? Há valores estranhos? Há registros repetidos? A coluna é necessária para responder à pergunta da análise? Esse cuidado evita que o analista perca tempo com informações irrelevantes ou interprete incorretamente dados mal organizados.

Também é importante separar dado

original de dado tratado. O ideal é sempre preservar uma cópia da base inicial antes de fazer alterações. Se o analista remove duplicidades, corrige nomes, padroniza datas ou preenche valores ausentes, ele deve registrar o que foi feito. Essa prática aumenta a transparência e permite revisar o caminho percorrido caso alguém questione o resultado.

Na realidade, os dados quase nunca chegam perfeitos. Uma tabela de clientes pode conter nomes escritos com letras maiúsculas e minúsculas, telefones com formatos diferentes, cidades abreviadas e campos em branco. Uma base de produtos pode trazer categorias parecidas, como “eletrônico”, “eletrônicos” e “eletro”. Uma lista de pedidos pode conter datas inválidas, valores negativos por erro de digitação ou status desatualizados. O trabalho do analista começa justamente ao perceber essas imperfeições.

As ferramentas podem ajudar nessa organização. Em planilhas, é possível usar filtros, validação de dados, formatação, tabelas dinâmicas, fórmulas e recursos de remoção de duplicatas. Em bancos de dados, é possível usar consultas para selecionar, agrupar e cruzar informações. Em ferramentas de BI, os dados podem ser conectados, modelados e visualizados. Mas nenhuma ferramenta substitui a atenção do analista. Ele precisa saber o que está corrigindo e por quê.

Outro cuidado didático importante é entender que uma mesma informação pode ser analisada de formas diferentes. A idade de uma pessoa, por exemplo, é um dado numérico. Mas o analista pode transformá-la em faixas etárias, como “18 a 25 anos”, “26 a 35 anos” e “acima de 35 anos”. Nesse caso, um dado quantitativo passa a ser usado como categoria. Isso pode facilitar a visualização e a comparação entre grupos.

Da mesma forma, uma data pode ser transformada em dia da semana, mês, trimestre ou ano. Uma venda registrada em “15/03/2026” pode ajudar a responder perguntas diferentes: quantas vendas ocorreram em março? Qual foi o trimestre com maior faturamento? As vendas aumentam aos finais de semana? O comportamento muda em datas comemorativas? A riqueza da análise aparece quando o analista entende que uma coluna pode gerar várias leituras.

As fontes de dados também podem ser combinadas, mas isso exige cuidado. Uma empresa pode cruzar uma tabela de pedidos com uma tabela de clientes e outra de produtos. Uma escola pode cruzar matrícula, frequência e avaliação. Uma clínica pode cruzar agenda, comparecimento e especialidade. Para isso, é necessário existir algum campo de ligação, como

código do cliente, número da matrícula, ID do pedido ou código do produto. Sem esse vínculo, o cruzamento pode gerar erros.

Um erro comum entre iniciantes é juntar bases apenas porque elas parecem tratar do mesmo assunto. Por exemplo, duas planilhas podem ter nomes de clientes, mas nomes podem estar duplicados ou escritos de formas diferentes. O ideal é usar identificadores únicos, como código de cliente ou número de matrícula, quando isso for possível. Assim, reduz-se o risco de confundir pessoas, pedidos ou registros.

Outro erro comum é acreditar que mais dados sempre significam melhor análise. Nem sempre. Às vezes, uma base muito grande, mas desorganizada, traz mais ruído do que clareza. Em outros casos, poucas colunas bem escolhidas respondem melhor à pergunta do que dezenas de informações sem relação com o problema. O analista deve buscar os dados necessários, não simplesmente acumular tudo que encontra.

Também é preciso considerar a finalidade da análise. Coletar dados sem objetivo claro pode gerar trabalho desnecessário e riscos de privacidade. Se a pergunta é “qual produto vende mais por mês?”, talvez não seja necessário usar dados pessoais dos clientes. Se a análise é sobre desempenho geral de uma turma, talvez seja melhor trabalhar com resultados agregados, sem expor nomes individualmente. Essa postura mostra responsabilidade e respeito pelas pessoas envolvidas.

A ética no uso dos dados começa já na escolha da fonte. O analista deve usar informações obtidas de forma legítima, respeitar regras internas, proteger dados pessoais e evitar exposição desnecessária. Quando os dados envolvem pessoas, é recomendável apresentar resultados em grupos, percentuais ou médias, sempre que a identificação individual não for indispensável.

Nesta aula, o ponto principal é perceber que analisar dados não começa pelo gráfico. Começa pela compreensão da matéria-prima. O analista precisa olhar para a base e perguntar: que tipo de dado está aqui? De onde ele veio? Ele é confiável? Está completo? Está organizado? Pode responder à pergunta que foi feita? Há alguma limitação que precisa ser considerada?

Quando o aluno aprende a reconhecer tipos de dados e fontes de informação, ele passa a trabalhar com mais segurança. Ele entende que uma coluna de texto, uma coluna de número e uma coluna de data pedem tratamentos diferentes. Entende que uma fonte interna pode mostrar o funcionamento de uma organização, enquanto uma fonte externa pode oferecer contexto. Entende também que dados

ruins podem levar a decisões ruins.

Ao final desta aula, o aluno deve guardar uma ideia simples: antes de analisar, é preciso conhecer os dados. Um bom analista não se apressa para criar gráficos; ele primeiro observa, organiza e questiona a base. Essa postura evita erros e prepara o caminho para análises mais claras, úteis e responsáveis.

Atividade de fixação

Imagine uma planilha simples de vendas com as seguintes colunas: número do pedido, data da venda, nome do cliente, cidade, produto, categoria do produto, quantidade vendida, valor unitário, forma de pagamento e status da entrega.

Classifique cada coluna como dado numérico, categórico, temporal ou identificador. Depois, responda: quais colunas seriam necessárias para descobrir o produto mais vendido? Quais seriam usadas para analisar vendas por cidade? Quais ajudariam a acompanhar entregas atrasadas? Por fim, indique três possíveis problemas que poderiam aparecer nessa planilha, como campos vazios, nomes duplicados ou datas registradas de forma incorreta.

Referências bibliográficas

AMAZON WEB SERVICES. O que são dados estruturados? AWS.

AMAZON WEB SERVICES. Qual é a diferença entre dados estruturados e dados não estruturados? AWS.

IBM. Dados estruturados vs dados não estruturados: qual é a diferença? IBM Think.

IBM. O que são dados? IBM Think.

IBM. O que é qualidade de dados? IBM Think.

IBM. O que é limpeza de dados? IBM Think.


Aula 3 — Indicadores, métricas e perguntas de negócio

 

Toda análise de dados começa com uma pergunta. Antes de abrir uma planilha, montar um gráfico ou calcular uma média, o analista precisa entender o que realmente precisa ser descoberto. Essa etapa é fundamental porque os dados, por si só, não dizem tudo. Eles precisam ser organizados a partir de uma intenção clara. Quando uma empresa, escola, loja ou instituição procura um analista de dados, geralmente existe uma dúvida por trás: vender mais, reduzir atrasos, melhorar o atendimento, acompanhar desempenho, diminuir evasão, controlar custos ou entender melhor o comportamento de um público.

É nesse momento que entram as métricas e os indicadores. Eles são formas de medir a realidade. Sem eles, as conversas ficam vagas: “as vendas estão ruins”, “os alunos estão faltando muito”, “o atendimento está demorado”, “o estoque está desorganizado”. Essas frases podem indicar problemas, mas ainda não mostram exatamente o tamanho deles. Quando transformamos essas percepções em números, a situação fica mais clara: “as vendas caíram 18% em relação ao mês

anterior”, “a frequência média da turma ficou em 72%”, “o tempo médio de resposta passou de 2 para 5 horas”, “30% dos produtos cadastrados estão sem atualização de estoque”.

Uma métrica é qualquer medida usada para acompanhar algum aspecto de uma atividade. Pode ser o total de vendas, a quantidade de alunos matriculados, o número de atendimentos realizados, o valor médio de uma compra, a taxa de faltas ou o tempo de entrega. Já um indicador é uma medida interpretada dentro de um objetivo. Quando uma métrica passa a ajudar na avaliação de desempenho, no acompanhamento de uma meta ou na tomada de decisão, ela se torna mais estratégica.

Por exemplo, saber que uma loja fez 500 vendas no mês é uma métrica. Mas, se o objetivo da empresa era alcançar 600 vendas, esse mesmo número se transforma em um indicador de desempenho, porque mostra se a meta foi atingida ou não. Da mesma forma, saber que uma turma teve média 7,2 em uma avaliação é uma métrica. Mas, se a coordenação usa esse resultado para identificar necessidade de reforço pedagógico, o dado passa a funcionar como indicador para orientar uma ação.

Os chamados KPIs, sigla em inglês para Key Performance Indicators, são os indicadores-chave de desempenho. Eles medem aquilo que é realmente importante para um objetivo central. A Atlassian define KPIs como valores mensuráveis que demonstram o quanto uma empresa está alcançando seus principais objetivos de negócio, destacando que bons indicadores ajudam a transformar percepções subjetivas em dados concretos para acompanhamento e melhoria contínua.

Isso significa que nem toda métrica deve ser tratada como KPI. Uma empresa pode acompanhar dezenas de números, mas apenas alguns são realmente decisivos. Em uma loja virtual, por exemplo, o número de visitas ao site é uma métrica importante, mas talvez o KPI principal seja a taxa de conversão, ou seja, a proporção de visitantes que realmente compram. Em uma escola, a quantidade de alunos inscritos é uma métrica relevante, mas a taxa de conclusão pode ser um KPI mais importante para avaliar permanência e aprendizagem. Em um setor de atendimento, o total de mensagens recebidas é uma métrica, mas o tempo médio de resposta e o índice de resolução podem ser KPIs.

Um erro comum entre iniciantes é querer medir tudo ao mesmo tempo. Quando isso acontece, o relatório fica cheio de números, mas pobre em clareza. O bom analista precisa escolher indicadores que respondam a uma pergunta específica. Se a pergunta é “por que as vendas

diminuíram?”, talvez seja necessário analisar faturamento, quantidade de pedidos, ticket médio, produtos mais vendidos, canais de venda e comparação com períodos anteriores. Mas, se a pergunta é “por que os clientes estão reclamando mais?”, os indicadores devem ser outros: tempo de atendimento, número de reclamações, motivo das reclamações, avaliações recebidas e reincidência de problemas.

A pergunta de negócio é o ponto de partida da análise. Ela traduz uma dúvida prática em uma investigação objetiva. Uma pergunta mal formulada pode levar a uma análise confusa. Por exemplo, perguntar “a empresa está indo bem?” é amplo demais. O que significa “ir bem”? Vender mais? Ter lucro maior? Atender melhor? Reduzir custos? Manter clientes satisfeitos? Cada resposta exige dados diferentes. Por isso, o analista ajuda a transformar perguntas genéricas em perguntas mais claras.

Uma pergunta melhor seria: “o faturamento da empresa aumentou ou diminuiu nos últimos três meses?” Outra possibilidade: “quais produtos contribuíram mais para a queda nas vendas?” Ou ainda: “os clientes que compraram mais de uma vez têm ticket médio maior que os clientes novos?” Perceba que essas perguntas já indicam quais dados serão necessários e que tipo de comparação poderá ser feita.

A análise de dados, portanto, não começa na ferramenta, mas no raciocínio. A IBM explica que a análise de dados permite descobrir tendências, padrões e relações em dados brutos para apoiar decisões orientadas por evidências. Essa ideia é importante porque mostra que o analista não trabalha apenas para apresentar números bonitos. Ele trabalha para ajudar alguém a compreender uma situação e decidir com mais segurança.

Para criar bons indicadores, é necessário observar alguns critérios. Um indicador precisa ser claro, mensurável, relevante e possível de acompanhar. Se ele for muito vago, ninguém saberá exatamente como calculá-lo. Se for difícil demais de medir, talvez não seja viável na rotina. Se não estiver ligado a uma decisão, pode virar apenas uma curiosidade. O modelo SMART, muito utilizado em gestão, costuma orientar a criação de objetivos e indicadores específicos, mensuráveis, alcançáveis, relevantes e com prazo definido.

Vamos pensar em um exemplo simples. Dizer “melhorar o atendimento” é uma intenção positiva, mas ainda é vaga. Um indicador mais claro seria: “reduzir o tempo médio de resposta de 6 horas para 3 horas em até dois meses”. Agora existe uma medida, um ponto de partida, uma meta e um prazo. O

analista consegue acompanhar a evolução e verificar se a ação realizada produziu resultado.

Em outro exemplo, uma escola pode dizer que deseja “melhorar o desempenho dos alunos”. Para transformar isso em indicadores, pode acompanhar média das avaliações, taxa de aprovação, frequência, entrega de atividades, participação nos fóruns e evolução por módulo. Esses números ajudam a coordenação a perceber se o problema está em uma disciplina específica, em determinada turma, no formato da avaliação ou na falta de acompanhamento dos estudantes.

Na área de vendas, alguns indicadores comuns são faturamento total, número de pedidos, ticket médio, taxa de conversão, produtos mais vendidos, margem de lucro e taxa de recompra. O faturamento mostra quanto foi vendido em dinheiro. O número de pedidos mostra o volume de transações. O ticket médio revela o valor médio gasto por cliente ou pedido. A taxa de recompra indica quantos clientes voltaram a comprar. Cada indicador responde a uma pergunta diferente.

No atendimento ao cliente, os indicadores podem incluir tempo médio de resposta, tempo médio de resolução, número de chamados abertos, número de chamados concluídos, índice de satisfação e principais motivos de contato. Esses dados ajudam a identificar gargalos. Se o número de chamados aumenta, mas o tempo de resposta continua baixo, a equipe pode estar conseguindo absorver a demanda. Mas, se o tempo de resposta aumenta junto com as reclamações, talvez seja necessário rever processos, treinar colaboradores ou ampliar a equipe.

Na educação, os indicadores podem acompanhar frequência, evasão, conclusão, média de notas, participação em atividades e recuperação de aprendizagem. Uma coordenação pedagógica pode perceber, por exemplo, que os alunos não estão desistindo no início do curso, mas sim após determinado módulo. Esse tipo de informação permite uma ação mais precisa: revisar o conteúdo, melhorar a orientação, criar atividades de apoio ou acompanhar mais de perto os estudantes naquele momento específico.

Em estoque e logística, indicadores como giro de estoque, produtos parados, rupturas, atrasos de entrega e custo de frete ajudam a entender a operação. Um produto muito vendido, mas frequentemente indisponível, pode indicar falha de reposição. Um produto com grande quantidade parada pode representar dinheiro imobilizado. Um estado com muitas entregas atrasadas pode exigir revisão de prazo, transporte ou comunicação com o cliente.

O importante é lembrar que o indicador não

existe isoladamente. Ele precisa ser comparado com algo: uma meta, um período anterior, uma média histórica, uma região, uma categoria ou um grupo. Um faturamento de R$ 50 mil pode ser bom ou ruim dependendo do contexto. Se no mês anterior a empresa vendeu R$ 30 mil, houve crescimento. Se a meta era R$ 80 mil, o resultado ficou abaixo do esperado. Se dezembro costuma vender mais por causa de datas comemorativas, a comparação com novembro precisa ser feita com cuidado.

Esse cuidado com o contexto evita interpretações apressadas. Um número alto nem sempre é bom, e um número baixo nem sempre é ruim. Um aumento no número de reclamações pode indicar piora no atendimento, mas também pode acontecer porque a empresa criou um novo canal e facilitou o registro de problemas. Uma queda no tempo médio de atendimento pode ser positiva, mas também pode significar que a equipe está encerrando chamados rápido demais, sem resolver bem a demanda. O analista precisa olhar além do número.

Outra habilidade importante é diferenciar indicadores de resultado e indicadores de processo. Indicadores de resultado mostram o que aconteceu no final, como lucro, aprovação, vendas ou satisfação. Indicadores de processo mostram o caminho, como tempo de resposta, número de contatos realizados, frequência, etapas concluídas ou produtividade da equipe. Os dois tipos são importantes. Se a empresa acompanha apenas o resultado final, pode descobrir o problema tarde demais. Se acompanha também o processo, consegue agir antes que o resultado piore.

Por exemplo, uma escola pode acompanhar a taxa final de conclusão dos alunos. Esse é um indicador de resultado. Mas também pode acompanhar frequência semanal, acesso ao ambiente virtual, entrega de atividades e participação nas aulas. Esses são indicadores de processo. Eles permitem identificar sinais de risco antes da evasão acontecer. Da mesma forma, uma loja pode acompanhar o faturamento mensal, mas também observar visitas ao site, carrinhos abandonados, contatos recebidos e disponibilidade de produtos.

Um bom indicador também precisa ter dono e rotina de acompanhamento. Não basta criar uma planilha cheia de números se ninguém sabe quem deve olhar, quando deve olhar e o que fazer quando o resultado mudar. Indicadores úteis fazem parte de uma rotina de gestão. Eles ajudam a responder: estamos melhorando? Estamos piorando? O que precisa de atenção? Qual ação deve ser priorizada?

Para o analista de dados iniciante, uma boa prática é sempre escrever a pergunta

o analista de dados iniciante, uma boa prática é sempre escrever a pergunta antes de calcular. Por exemplo: “qual produto teve maior faturamento no mês?” Depois, identificar os dados necessários: produto, quantidade vendida, valor unitário e data da venda. Em seguida, definir o cálculo: multiplicar quantidade por valor unitário, somar por produto e filtrar pelo mês. Por fim, interpretar o resultado: qual produto liderou, qual teve queda, qual merece atenção e quais limitações a base possui.

Esse processo simples evita análises sem direção. Quando o analista começa calculando tudo sem saber o que procura, ele pode até encontrar números interessantes, mas corre o risco de não responder ao problema principal. A análise precisa ter foco. Isso não impede descobertas inesperadas, mas garante que o trabalho tenha uma finalidade.

Também é necessário cuidado com a escolha dos gráficos. Indicadores podem ser apresentados em cartões, tabelas, gráficos de barras, linhas, colunas ou pizza, dependendo da mensagem. Para evolução ao longo do tempo, gráficos de linha costumam funcionar bem. Para comparar categorias, barras ou colunas são mais adequadas. Para destacar um número principal, um cartão pode ser suficiente. Mas o gráfico só deve ser criado depois que o indicador estiver bem definido.

Um relatório eficiente não precisa apresentar muitos indicadores. Na verdade, o excesso pode atrapalhar. Se uma pessoa abre um painel e encontra trinta números diferentes, talvez não saiba para onde olhar. Um bom painel começa pelos indicadores mais importantes, aqueles que respondem diretamente à pergunta de negócio. Depois, pode trazer detalhes para investigação.

Pense em uma empresa que deseja acompanhar vendas mensais. Um painel inicial poderia mostrar faturamento total, número de pedidos, ticket médio, produto mais vendido e comparação com o mês anterior. Esses cinco indicadores já oferecem uma visão geral. Se algum deles apresentar mudança significativa, o analista pode aprofundar a investigação por região, canal, vendedor, categoria ou período.

No trabalho com indicadores, a honestidade é indispensável. O analista não deve escolher números apenas para confirmar uma opinião anterior. Também não deve esconder resultados ruins ou apresentar conclusões que os dados não sustentam. Se a base tem limitações, isso precisa ser dito. Se faltam dados, isso precisa ser registrado. Se a análise mostra apenas uma relação, e não uma causa, o relatório deve deixar isso claro.

Por exemplo, se

alunos com baixa frequência também têm notas menores, pode haver uma relação entre frequência e desempenho. Mas o analista deve ter cuidado antes de afirmar que a baixa frequência é a única causa das notas baixas. Pode haver outros fatores, como dificuldade de acesso, problemas pessoais, metodologia, complexidade do conteúdo ou falta de acompanhamento. Bons indicadores ajudam a investigar, mas não substituem a análise crítica.

Ao final desta aula, o aluno deve compreender que indicadores são instrumentos de leitura da realidade. Eles ajudam a transformar perguntas em medidas e medidas em decisões. Uma boa métrica mostra um número. Um bom indicador mostra um caminho. Um bom KPI destaca aquilo que realmente importa para o objetivo principal.

O analista de dados, especialmente no início da formação, deve praticar três movimentos: formular boas perguntas, escolher indicadores adequados e interpretar os resultados com responsabilidade. Quando esses três pontos são bem trabalhados, mesmo uma análise simples pode gerar grande valor. Afinal, a função do analista não é apenas contar o que aconteceu, mas ajudar as pessoas a entenderem o que os dados revelam e quais decisões podem ser tomadas a partir deles.

Atividade de fixação

Imagine uma pequena loja de roupas que deseja melhorar seus resultados. A loja possui uma planilha com data da venda, produto vendido, categoria, quantidade, valor unitário, forma de pagamento e nome do vendedor. A primeira tarefa é transformar a pergunta “a loja está vendendo bem?” em três perguntas mais específicas.

Em seguida, escolha cinco indicadores que poderiam ajudar a responder a essas perguntas. Por exemplo: faturamento mensal, número de peças vendidas, ticket médio, categoria mais vendida e desempenho por vendedor. Depois, explique por que cada indicador é útil e que decisão ele poderia apoiar. O objetivo é perceber que os indicadores devem nascer de uma pergunta clara e servir para orientar uma ação.

Referências bibliográficas

ATLASSIAN. Indicadores-chave de desempenho: o que são KPIs e como usá-los.

IBM. O que é big data analytics? IBM Think.

IBM. O que é análise de dados? IBM Think.

RD STATION. KPIs: o que são e como medir os seus resultados.

EVALCOMMUNITY. Indicadores SMART em monitoramento e avaliação.

VAN DE VEN, M.; LARA MACHADO, P.; ATHANASOPOULOU, A.; AYSOLMAZ, B.; TURETKEN, O. Indicadores-chave de desempenho para modelos de negócio: uma revisão sistemática da literatura. Information Systems and e-Business Management, 2023.


Estudo de

caso — Módulo 1

Quando os números parecem claros, mas a pergunta está errada

 

A Loja Horizonte era uma pequena empresa que vendia roupas, calçados e acessórios por loja física e redes sociais. Durante alguns meses, os proprietários perceberam uma sensação incômoda: havia movimento, os vendedores estavam ocupados, as mensagens chegavam pelo WhatsApp, mas o dinheiro no caixa parecia menor. A frase repetida nas reuniões era sempre a mesma: “as vendas caíram”.

Para resolver o problema, a gerente decidiu pedir ajuda a Júlia, uma colaboradora que estava começando a estudar análise de dados. Ela recebeu três planilhas: uma com vendas, outra com cadastro de clientes e uma terceira com controle de estoque. À primeira vista, parecia simples. Bastava somar as vendas de cada mês e comparar os valores. Mas Júlia logo percebeu que, antes de calcular qualquer coisa, precisava entender melhor a pergunta.

A primeira pergunta feita pela gerente era muito ampla: “a loja está vendendo mal?”. Júlia explicou que essa pergunta precisava ser transformada em questões mais objetivas. Vender mal poderia significar muitas coisas: queda no faturamento, redução na quantidade de pedidos, diminuição do ticket médio, perda de clientes recorrentes, falta de produtos importantes ou baixo desempenho em algum canal de venda. Como os indicadores de desempenho ajudam a acompanhar objetivos e metas de forma mais clara, a análise precisava começar pela definição do que seria medido.

Depois de conversar com a gerente, Júlia reorganizou o problema em três perguntas principais: “o faturamento caiu nos últimos três meses?”, “a queda aconteceu em todos os produtos ou apenas em algumas categorias?” e “houve diferença entre as vendas da loja física e das redes sociais?”. A partir daí, o trabalho ficou mais claro. Ela não estava mais procurando qualquer número interessante; estava buscando respostas para perguntas específicas.

Ao abrir a planilha de vendas, Júlia encontrou colunas como data da venda, produto, categoria, quantidade, valor unitário, forma de pagamento, vendedor e canal de venda. Ela percebeu que havia diferentes tipos de dados: valores numéricos, categorias e datas. O valor unitário e a quantidade permitiam cálculos; a categoria e o canal serviam para agrupamentos; a data permitia comparar períodos. Esse reconhecimento foi essencial para evitar erros. Uma data não deveria ser tratada como texto comum, e uma categoria não deveria ser usada como se fosse uma medida numérica.

O primeiro erro

apareceu quando Júlia tentou calcular o total vendido por categoria. A categoria “calçados” aparecia de três formas diferentes: “Calçados”, “calçado” e “Sapatos”. A mesma coisa acontecia com “acessórios”, registrado também como “Acessorio” e “acessórios femininos”. Se ela agrupasse os dados sem corrigir isso, a análise dividiria a mesma categoria em grupos diferentes. A IBM descreve dados sujos como informações imprecisas, incompletas, inválidas ou inconsistentes, incluindo duplicidades, valores ausentes e formatos diferentes.

Júlia então criou uma cópia da planilha original e começou a padronizar os dados. Corrigiu nomes de categorias, conferiu datas, removeu registros duplicados e sinalizou linhas com valor zerado. Ela não apagou informações sem critério; registrou as alterações feitas. Esse cuidado evitou que a base original fosse perdida e permitiu explicar depois como os resultados foram obtidos.

O segundo erro comum apareceu na escolha dos indicadores. A gerente queria destacar nas redes sociais que a loja tinha recebido muitas mensagens no mês. Júlia explicou que esse número poderia ser útil, mas não respondia diretamente ao problema de vendas. Muitas mensagens não significam, necessariamente, muitas compras. Era uma métrica de movimento, mas não um indicador central de resultado. Para aquele caso, os indicadores mais adequados seriam faturamento mensal, número de pedidos, ticket médio, quantidade vendida por categoria e participação de cada canal no total de vendas.

Ao calcular esses indicadores, Júlia descobriu algo interessante. O número de pedidos não tinha caído tanto. O grande problema estava no ticket médio: os clientes continuavam comprando, mas gastavam menos por compra. Além disso, a categoria de calçados, que antes gerava boa parte do faturamento, teve queda porque vários modelos mais vendidos estavam sem estoque. O problema, portanto, não era apenas “venda baixa”. Era uma combinação entre redução do valor médio por pedido e falta de produtos importantes.

Esse foi o momento em que os dados viraram informação. Antes, a gerente tinha uma percepção geral de queda. Agora, havia contexto: a loja ainda tinha clientes, mas vendia itens de menor valor e perdeu força em uma categoria importante. O insight veio em seguida: era necessário revisar o estoque dos produtos de maior saída e criar ações para aumentar o ticket médio, como kits, combinações de peças ou ofertas progressivas.

Durante a apresentação, outro erro quase aconteceu. Um vendedor afirmou

que as vendas pelas redes sociais tinham caído porque “os clientes não gostam mais de comprar pelo WhatsApp”. Júlia teve cuidado. Os dados mostravam queda nas vendas pelo canal, mas não provavam essa causa. Poderia haver outros motivos: demora nas respostas, falta de produtos, preços menos competitivos, pouca divulgação ou mudança no comportamento dos clientes. Ela explicou que uma análise responsável evita transformar relação em causa sem investigação suficiente.

No relatório final, Júlia montou uma apresentação simples. Começou pela pergunta principal, mostrou os indicadores escolhidos, explicou os ajustes feitos na base e apresentou os principais achados. Em vez de lotar a tela com muitos gráficos, destacou poucos elementos: evolução do faturamento, ticket médio por mês, vendas por categoria e comparação entre loja física e redes sociais. A visualização de dados ajuda a transformar dados detalhados em informações compreensíveis e úteis para o negócio.

A gerente, que antes queria apenas “ver se as vendas estavam ruins”, saiu da reunião com um plano mais concreto. A loja deveria repor os calçados mais vendidos, revisar a abordagem de vendas para aumentar o valor médio por pedido, acompanhar semanalmente o ticket médio e separar os resultados por canal. Também decidiu padronizar o preenchimento das planilhas, para que as próximas análises fossem mais confiáveis.

O caso da Loja Horizonte mostra que o trabalho do analista de dados começa muito antes dos gráficos. Começa na escuta, na formulação da pergunta, na compreensão dos dados disponíveis e na escolha dos indicadores certos. Uma análise simples, quando bem conduzida, pode revelar um problema real que estava escondido atrás de uma frase genérica.

Erros comuns observados no caso e como evitá-los

Erro 1 — Começar pela ferramenta antes de entender o problema.
Júlia poderia ter aberto a planilha e calculado tudo que encontrasse. Isso geraria muitos números, mas talvez poucas respostas. Para evitar esse erro, o analista deve começar perguntando: qual decisão precisa ser tomada? O que a pessoa quer entender? Que problema está tentando resolver?

Erro 2 — Fazer perguntas muito amplas.
“A loja está vendendo mal?” é uma pergunta vaga. Ela não indica quais dados analisar nem que resultado seria considerado bom ou ruim. A solução é transformar a dúvida em perguntas específicas, como: “o faturamento caiu?”, “qual categoria teve maior queda?” e “o ticket médio mudou?”.

Erro 3 — Confundir dado, informação e insight.
O número “R$

número “R$ 40 mil em vendas” é apenas um dado quando aparece sozinho. Ele vira informação quando comparado com meses anteriores. Torna-se insight quando ajuda a entender o motivo da queda e orientar uma ação. Para evitar esse erro, o aluno deve sempre acrescentar contexto aos números.

Erro 4 — Ignorar a qualidade da base.
Categorias escritas de formas diferentes, registros duplicados e campos vazios podem distorcer a análise. A IBM destaca dimensões de qualidade como precisão, completude, consistência, atualidade, validade e unicidade, todas importantes para avaliar se os dados são confiáveis e úteis. Para evitar problemas, é necessário revisar a base antes dos cálculos.

Erro 5 — Escolher métricas bonitas, mas pouco úteis.
O número de mensagens recebidas parecia interessante, mas não respondia diretamente à queda no faturamento. Para evitar esse erro, o analista deve diferenciar métricas comuns de indicadores realmente ligados ao objetivo da análise.

Erro 6 — Tirar conclusões sem contexto.
Uma queda nas vendas pode ter várias causas: sazonalidade, estoque, atendimento, preço, canal de venda ou comportamento do consumidor. Para evitar interpretações apressadas, o analista deve comparar períodos, observar categorias e reconhecer as limitações dos dados.

Erro 7 — Confundir relação com causa.
Se as vendas pelo WhatsApp caíram, isso não significa automaticamente que os clientes deixaram de gostar desse canal. A análise pode levantar hipóteses, mas nem sempre prova causalidade. Para evitar esse erro, o analista deve usar expressões cuidadosas, como “os dados indicam”, “há sinais de” ou “é necessário investigar”.

Erro 8 — Expor dados pessoais desnecessariamente.
Júlia não precisava apresentar nomes de clientes para explicar a queda nas vendas. Bastavam resultados por período, categoria e canal. Para evitar riscos, o analista deve trabalhar com dados agregados sempre que possível e preservar informações pessoais.

Proposta de atividade prática para o aluno

Imagine que você é o analista iniciante da Loja Horizonte. A gerente entrega uma planilha com as seguintes colunas: data da venda, produto, categoria, quantidade, valor unitário, canal de venda e vendedor.

Sua tarefa é construir um pequeno plano de análise com quatro partes. Primeiro, escreva três perguntas objetivas que ajudem a investigar a queda nas vendas. Depois, escolha cinco indicadores que poderiam responder a essas perguntas. Em seguida, aponte três problemas de qualidade que poderiam existir nessa base. Por fim,

escreva três perguntas objetivas que ajudem a investigar a queda nas vendas. Depois, escolha cinco indicadores que poderiam responder a essas perguntas. Em seguida, aponte três problemas de qualidade que poderiam existir nessa base. Por fim, escreva uma recomendação prática para a gerente, explicando como os dados poderiam ajudar na decisão.

Fechamento do estudo de caso

O principal aprendizado deste módulo é que o analista de dados não é apenas alguém que calcula números. Ele é uma pessoa que transforma dúvidas em perguntas, perguntas em indicadores e indicadores em decisões. Quando o problema é bem definido, os dados são compreendidos e os indicadores são escolhidos com cuidado, até uma análise simples pode gerar uma mudança importante na rotina de uma empresa.

Referências bibliográficas

IBM. O que são dados sujos? IBM Think.

IBM. O que são dimensões de qualidade de dados? IBM Think.

MICROSOFT. O que é visualização de dados? Microsoft Power BI.

SEBRAE. Como usar indicadores de desempenho na sua estratégia.

Voltar