Series temporais

Analisar a mudança ao longo do tempo significa que quer identificar formas, como tendências e padrões temporais, criadas por múltiplos pontos. A melhor geometria para encontrar essas formas é a linha. Embora possa usar barras para representar dados ao longo do tempo, as barras favorecem a comparação de pontos, pelo que é mais uma análise de variação entre pontos que uma análise da mudança ao longo do tempo. Claro que na prática as diferenças são menos claras, mas esta distinção entre formas e pontos é útil para clarificar a mensagem que quer comunicar.

Cinco tipos de mudança

Pode representar pelo menos cinco (mais dois) tipos de mudança temporal:

  • Linear: Esta é a mais comum: um gráfico em que uma linha reta liga dois pontos adjacentes e o tempo progride e é representado de forma linear da esquerda para a direita, e as unidades de tempo são espaçadas proporcionalmente.
  • Salto: Similar à linear, mas em vez de uma linha reta, dois pontos adjacentes são ligados por duas linhas formando um ângulo reto, criando um gráfico de degrau. A ideia é que a mudança não é gradual, ocorre de forma súbita (é útil para representação de mudança de preços)
  • Cíclico: Quando há uma acentuada e previsível sazonalidade (o turismo é um bom exemplo), a passagem linear do tempo não será muito informativa, porque enfatiza o que já sabe e torna difícil observar outras mudanças. Assim, em vez de uma passagem linear do tempo, a mudança cíclica foca-se em secções de tempo. Por exemplo, como mudou o turismo em Janeiro nos últimos 10 anos? E em Setembro? Mudanças em cada secção tornam-se mais claras, fáceis de identificar e relevantes.
  • Relacional: os gráficos de dispersão habitualmente representam a relação entre duas variáveis (riqueza e saúde em cada país da UE, por exemplo) num ponto temporal. Mas se selecionarmos apenas um ponto (uma entidade, como um país, por exemplo) com várias datas, e ligarmos esses pontos com linhas, podemos observar como a relação evoluiu ao longo do tempo. Este gráfico nem sempre é fácil de interpretar, mas pode comunicar conclusões que dificilmente de encontram noutros gráficos. Algumas curvas em economia, como a curva de Beveridge, tira partido desta análise.
  • Circular: Quando se representa uma série temporal em coordenadas polares. Este design é útil, por exemplo, para comparar o período diurno com o período noturno, dado que estamos familiarizados com a metáfora do relógio. Uma lina contínua num espaço circular que representa um ano é também comum, embora menos útil.
  • Ordenação: Em vez da representação dos dados reais ao longo do tempo, são calculados rankings e é essa a representação. É útil para representar a posição de equipas em temporadas desportivas.
  • Animação: em alguns casos, não é necessário representar o tempo. É criado um conjunto de gráficos, cada um correspondente a uma data, e são apresentados em sequência. O padrão temporal é criado pela animação. Para que este efeito seja possível, o padrão temporal tem de ser simples, para que possa ser processado pela audiência (a chamada “memória de trabalho” tem uma capacidade limitada, pelo que não permite o armazenamento de muitos detalhes). Um dos mais famosos exemplos de animação criando padrões temporais é a primeira TED Talk de Hans Rosling.

O eixo horizontal

Para uma correta representação do tempo, é necessário entendê-lo como uma variável qualitativa, garantindo que o espaço entre unidades ao longo do eixo é proporcional à sua distância temporal.

O eixo vertical

Quando lemos um gráfico de de linhas enterpretamos a inclinação das linhas. Tirando poderem ser positivas ou negativas, as inclinações não têm um significado intrínseco e absoluto, porque a escala e relação altura/largura do gráfico afetam a inclinação.

A escala do eixo vertical não tem de começar no zero, pelo que podemos focarmo-nos um conceito mais útil, o de “resolução”. Baixa resolução significa que a escala é demasiado ampla e as linhas tornam-se quase planas, e variação relevante é difícil de detetar. Por outro lado, alta resolução significa que os valores máximo e mínimo nos dados estão próximos dos valores máximo e mínimo na escala. Uma resolução alta torna a variação fácil de observar, mas arriscamo-nos a dar demasiado peso à intensidade da mudança. Para minimizar isto, é sempre aconselhável representar mais de uma série, de forma a comparar a inclinação (comparar, por exemplo, a evolução de Portugal com a da UE). Linhas de referência e bandas de variação são também úteis.

Número de séries e o problema do esparguete

O seu principal objetivo quando usa séries temporais é identificar tendências e padrões temporais relevantes. A ideia de “esparguete” é a de que o número de séries e a sua variação podem tornar o gráfico tão confuso que a mensagem se perde. Há várias soluções para isto:

  • Remover as séries desnecessárias;
  • Definir níveis de relevância, usando cinzento e sem identificação para séries pouco relevantes mas que servem de contexto;
  • Dividir o gráfico em pequenos múltiplos.

Tutoriais