Moving Averages Time Series Data Analysis


Moving Average Este exemplo ensina como calcular a média móvel de uma série de tempo no Excel. Um avanço em movimento é usado para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Observação: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Input Range e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Você gosta deste site gratuito Por favor, compartilhe esta página no GoogleA série de tempo é uma seqüência de observações que são ordenados no tempo (ou espaço). Se observações são feitas sobre algum fenômeno ao longo do tempo, é mais sensato exibir os dados na ordem em que eles surgiram, particularmente porque as observações sucessivas provavelmente serão dependentes. As séries temporais são exibidas melhor em um gráfico de dispersão. O valor da série X é representado no eixo vertical e o tempo t no eixo horizontal. O tempo é chamado de variável independente (neste caso no entanto, algo sobre o qual você tem pouco controle). Existem dois tipos de dados de séries temporais: Contínuo, onde temos uma observação em cada instante de tempo, p. Detectores de mentira, eletrocardiogramas. Denotamos isso usando a observação X no tempo t, X (t). Discreto, onde temos uma observação em intervalos (normalmente regulares) espaçados. Denotamos isso como Xt. Exemplos Economia - preços de ações semanais, lucros mensais Meteorologia - precipitação diária, velocidade do vento, temperatura Sociologia - números de crime (número de prisões, etc), números de emprego Queremos aumentar nossa compreensão de uma série de tempo selecionando suas principais características. Uma dessas características principais é a componente de tendência. As técnicas descritivas podem ser estendidas para prever (prever) valores futuros. Tendência é um movimento de longo prazo em uma série de tempo. É a direção subjacente (uma tendência para cima ou para baixo) ea taxa de variação em uma série de tempo, quando a tolerância foi feita para os outros componentes. Uma maneira simples de detectar a tendência em dados sazonais é tomar médias ao longo de um certo período. Se essas médias mudarem com o tempo podemos dizer que há evidências de uma tendência na série. Há também mais testes formais para permitir a detecção de tendência em séries temporais. Pode ser útil modelar a tendência usando linhas retas, polinômios etc. Nós queremos aumentar nossa compreensão de uma série de tempo escolhendo suas características principais. Uma dessas características principais é a componente cíclica. As técnicas descritivas podem ser estendidas para prever (prever) valores futuros. Em dados semanais ou mensais, o componente cíclico descreve flutuações regulares. É uma componente não sazonal que varia num ciclo reconhecível. Queremos aumentar nossa compreensão de uma série de tempo selecionando suas principais características. Uma dessas características principais é a componente sazonal. As técnicas descritivas podem ser estendidas para prever (prever) valores futuros. Em dados semanais ou mensais, a componente sazonal, frequentemente referida como sazonalidade, é a componente de variação de uma série temporal dependente da época do ano. Descreve flutuações regulares com um período de menos de um ano. Por exemplo, os custos de vários tipos de frutas e vegetais, os números do desemprego e a precipitação diária média, todos mostram uma variação sazonal marcada. Estamos interessados ​​em comparar os efeitos sazonais dentro dos anos, de ano para ano removendo efeitos sazonais para que a série temporal seja mais fácil de lidar e, também interessado em ajustar uma série para efeitos sazonais usando vários modelos. Queremos aumentar nossa compreensão de uma série de tempo selecionando suas principais características. Uma dessas características principais é o componente irregular (ou ruído). As técnicas descritivas podem ser estendidas para prever (prever) valores futuros. A componente irregular é a que resta quando os outros componentes da série (tendência, sazonal e cíclica) foram contabilizados. Técnicas de suavização são utilizadas para reduzir as irregularidades (flutuações aleatórias) em dados de séries temporais. Eles fornecem uma visão mais clara do verdadeiro comportamento subjacente da série. Em algumas séries temporais, a variação sazonal é tão forte que obscurece quaisquer tendências ou ciclos que são muito importantes para a compreensão do processo que está sendo observado. A suavização pode remover a sazonalidade e faz com que flutuações de longo prazo na série se destaquem mais claramente. O tipo mais comum de técnica de suavização é o alisamento médio móvel, embora outros existam. Uma vez que o tipo de sazonalidade vai variar de série para série, por isso deve o tipo de suavização. A suavização exponencial é uma técnica de suavização utilizada para reduzir as irregularidades (flutuações aleatórias) em dados de séries temporais, proporcionando assim uma visão mais clara do verdadeiro comportamento subjacente da série. Ele também fornece um meio eficaz de prever os valores futuros das séries temporais (previsão). Uma média móvel é uma forma de média que foi ajustada para permitir componentes sazonais ou cíclicos de uma série temporal. A suavização média móvel é uma técnica de suavização utilizada para tornar mais claras as tendências a longo prazo de uma série temporal. Quando uma variável, como o número de desempregados, ou o custo de morangos, é graficada contra o tempo, é provável que haja componentes sazonais ou cíclicos consideráveis ​​na variação. Estes podem tornar difícil ver a tendência subjacente. Estes componentes podem ser eliminados tomando uma média móvel adequada. Ao reduzir as flutuações aleatórias, a suavização média móvel torna as tendências a longo prazo mais claras. Running medianas suavização é uma técnica de suavização análoga à utilizada para médias móveis. O objetivo da técnica é o mesmo, para tornar uma tendência mais clara, reduzindo os efeitos de outras flutuações. Diferenciação é um método popular e eficaz de remover a tendência de uma série de tempo. Isso fornece uma visão mais clara do verdadeiro comportamento subjacente da série. A autocorrelação é a correlação (relação) entre membros de uma série de observações de tempo, como preços de ações semanais ou taxas de juros, e os mesmos valores em um intervalo de tempo fixo mais tarde. Mais tecnicamente, a autocorrelação ocorre quando os termos de erro residual de observações da mesma variável em momentos diferentes estão correlacionados (relacionados). A extrapolação é quando o valor de uma variável é estimado em momentos que ainda não foram observados. Esta estimativa pode ser razoavelmente fiável para curtos tempos no futuro, mas por períodos mais longos, a estimativa é susceptível de tornar-se menos precisa. Exemplo Suponha que Angela tinha 1,20 m de altura em 1º de janeiro de 1975 e 1,40 m de altura em 1º de janeiro de 1976. Por extrapolação, pode-se estimar que em 1º de janeiro de 1977 teria crescido mais 0,20 m para ser 1,60 m de altura. No entanto, isso pressupõe que ela continuou a crescer na mesma proporção. Isso deve eventualmente tornar-se uma suposição falsa, caso contrário, em 01 de janeiro de 1980, ela seria uma gigante. Dados suaves remove variação aleatória e mostra tendências e componentes cíclicos Inerente na coleta de dados ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. Uma técnica freqüentemente usada na indústria é suavizar. Essa técnica, quando corretamente aplicada, revela mais claramente a tendência subjacente, os componentes sazonais e cíclicos. Existem dois grupos distintos de métodos de alisamento Métodos de média Métodos de suavização exponencial Tomar médias é a maneira mais simples de suavizar os dados Vamos primeiro investigar alguns métodos de média, como a média simples de todos os dados passados. Um gerente de um armazém quer saber o quanto um fornecedor típico oferece em unidades de 1000 dólares. Ele / ela toma uma amostra de 12 fornecedores, aleatoriamente, obtendo os seguintes resultados: A média computada ou média dos dados 10. O gerente decide usar isto como a estimativa para despesa de um fornecedor típico. Esta é uma boa ou má estimativa O erro quadrático médio é uma maneira de julgar o quão bom é um modelo Vamos calcular o erro quadrático médio. O valor verdadeiro do erro gasto menos o valor estimado. O erro ao quadrado é o erro acima, ao quadrado. O SSE é a soma dos erros quadrados. O MSE é a média dos erros quadrados. Resultados do MSE por exemplo Os resultados são: Erro e esquadrado Erros A estimativa 10 A questão surge: podemos usar a média para prever a renda se suspeitarmos de uma tendência? Um olhar para o gráfico abaixo mostra claramente que não devemos fazer isso. A média pondera todas as observações passadas igualmente Em resumo, afirmamos que A média simples ou média de todas as observações passadas é apenas uma estimativa útil para previsão quando não há tendências. Se houver tendências, use estimativas diferentes que levem em conta a tendência. A média pesa todas as observações passadas igualmente. Por exemplo, a média dos valores 3, 4, 5 é 4. Sabemos, é claro, que uma média é calculada adicionando todos os valores e dividindo a soma pelo número de valores. Outra forma de calcular a média é adicionando cada valor dividido pelo número de valores, ou 3/3 4/3 5/3 1 1.3333 1.6667 4. O multiplicador 1/3 é chamado de peso. Em geral: barra fração soma esquerda (fratura direita) x1 esquerda (fratura direita) x2,. ,, Esquerda (frac direito) xn. O (esquerda (frac direito)) são os pesos e, claro, eles somam a 1.Moving médias Médias móveis Com conjuntos de dados convencionais o valor médio é muitas vezes o primeiro, e um dos mais úteis, sumário estatísticas para calcular. Quando os dados estão na forma de uma série temporal, a média da série é uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos em curto, anteriores ao período atual ou centrados no período atual, são freqüentemente mais úteis. Como esses valores médios variam, ou se movem, à medida que o período atual se move a partir do tempo t 2, t 3, etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel exponencialmente ponderada é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela sua proximidade ao tempo actual. Como não existe uma, mas toda uma série de médias móveis para uma dada série, o conjunto de Mas pode ser plotado em gráficos, analisado como uma série e usado na modelagem e previsão. Uma série de modelos pode ser construída usando médias móveis, e estes são conhecidos como modelos MA. Se tais modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média destes valores pode ser calculada. Se assumimos que n é bastante grande, e selecionamos um inteiro k que é muito menor que n. Podemos calcular um conjunto de médias de blocos, ou médias móveis simples (de ordem k): Cada medida representa a média dos valores de dados ao longo de um intervalo de k observações. Observe que o primeiro MA possível de ordem k gt0 é aquele para t k. De modo mais geral, podemos descartar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no instante t e os intervalos de tempo anteriores k-1. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais distantes no tempo, a média móvel é dita ser suavizada exponencialmente. As médias móveis são frequentemente utilizadas como uma forma de previsão, pelo que o valor estimado para uma série no tempo t 1, S t 1. É tomado como MA para o período até e incluindo o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores anteriores registrados até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição atmosférica mostrado na introdução deste tópico foi aumentado por uma linha de 7 dias de média móvel (MA), mostrada aqui em vermelho. Como pode ser visto, a linha de MA suaviza os picos e depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula padrão de cálculo de forward significa que os primeiros k -1 pontos de dados não têm nenhum valor de MA, mas a partir daí os cálculos se estendem até o ponto de dados final da série. Uma razão para computar médias móveis simples na maneira descrita é que permite que os valores sejam computados para todos os entalhes do tempo do tempo tk até o presente , E como uma nova medição é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem alguns problemas com esta abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, digamos, deve ser localizado no tempo t -1, não no tempo t. E para um MA sobre um número par de períodos, talvez ele deve ser localizado no ponto médio entre dois intervalos de tempo. Uma solução para este problema é usar cálculos centralizados MA, em que o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, esta abordagem não é geralmente utilizada porque exige que os dados estão disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centralizado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, removendo alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) as tendências de forma semelhante à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar um cálculo da média móvel a uma série que já tenha sido suavizada, isto é, suavizar ou filtrar uma série já suavizada. Por exemplo, com uma média móvel de ordem 2, podemos considerá-la como sendo calculada usando pesos, então a MA em x 2 0,5 x 1 0,5 x 2. Da mesma forma, a MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 ou seja, a filtragem de 2 estádios Processo (ou convolução) produziu uma média móvel simétrica ponderada variável, com pesos. Várias circunvoluções podem produzir médias móveis ponderadas bastante complexas, algumas das quais foram encontradas de uso particular em campos especializados, como nos cálculos do seguro de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computado com o comprimento da periodicidade como um conhecido. Por exemplo, com os dados mensais as variações sazonais podem frequentemente ser removidas (se este for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro eo último que são ponderados por 1/2. Isto é porque haverá 13 meses no modelo simétrico (tempo atual, t. / - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis exponencialmente ponderadas (EWMA) Com a fórmula da média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos k pesos seria igual a 1 / k. Então a soma dos pesos seria 1, ea fórmula seria: Já vimos que múltiplas aplicações deste processo resultam em pesos variando. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio das observações que são mais removidas no tempo é deliberada reduzida, enfatizando os eventos mais recentes (locais). Essencialmente um parâmetro de suavização, 0lt alfa lt1, é introduzido, ea fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: Se os pesos no modelo simétrico são selecionados como os termos dos termos da expansão binomial, (1/21/2) 2q. Eles somarão a 1, e quando q se tornar grande, aproximar-se-á da distribuição Normal. Esta é uma forma de ponderação do kernel, com o binômio agindo como a função do kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esta disposição, com q 1, produzindo os pesos. Em suavização exponencial é necessário usar um conjunto de pesos que somam a 1 e que reduzem em tamanho geometricamente. Os pesos usados ​​são tipicamente da forma: Para mostrar que esses pesos somam 1, considere a expansão de 1 / como uma série. Podemos escrever e expandir a expressão entre parênteses utilizando a fórmula binomial (1-x) p. Onde x (1-) e p -1, o que dá: Isso então fornece uma forma de média móvel ponderada da forma: Esta soma pode ser escrita como uma relação de recorrência: o que simplifica muito a computação e evita o problema de que o regime de ponderação Deve ser rigorosamente infinito para os pesos a somar a 1 (para pequenos valores de alfa, isso normalmente não é o caso). A notação utilizada pelos diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escrevem: enquanto a literatura da teoria de controle usa freqüentemente Z em vez de S para os valores exponencialmente ponderados ou suavizados (ver, por exemplo, Lucas e Saccucci, 1990, LUC1 , Eo site do NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com alfa 1, a estimativa média é simplesmente o seu valor medido (ou o valor do item de dados anterior). Com 0,5 a estimativa é a média móvel simples das medições atuais e anteriores. Nos modelos de previsão, o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isto mostra que o valor da previsão no tempo t 1 é uma combinação da média móvel exponencialmente ponderada anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Supondo que uma série de tempo é dada e uma previsão é necessária, um valor para alfa é necessário. Isto pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados obtidos com valores variáveis ​​de alfa para cada t 2,3. Definindo a primeira estimativa como sendo o primeiro valor de dados observado, x 1. Em aplicações de controle o valor de alfa é importante na medida em que é usado na determinação dos limites de controle superior e inferior, e afeta o comprimento de execução médio (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que as séries temporais representam um conjunto de variáveis ​​independentes aleatoriamente distribuídas, com variância comum). Nestas circunstâncias, a variância da estatística de controlo é (Lucas e Saccucci, 1990): Os limites de controlo são normalmente definidos como múltiplos fixos desta variância assintótica, p. / - 3 vezes o desvio padrão. Se alfa 0,25, por exemplo, e os dados monitorados forem assumidos como tendo uma distribuição Normal, N (0,1), quando em controle, os limites de controle serão de - 1,134 eo processo atingirá um ou outro limite em 500 Passos em média. Lucas e Saccucci (1990 LUC1) derivam as ARLs para uma ampla gama de valores alfa e sob várias suposições usando procedimentos de Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARLs quando a média do processo de controle foi alterada por algum múltiplo do desvio padrão. Por exemplo, com um deslocamento 0,5 com alfa 0,25 o ARL é menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Como os procedimentos são aplicados uma vez para a série de tempo e, em seguida, análises ou processos de controle são realizadas no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, a suavização exponencial de dois ou três estágios pode ser aplicada como um meio de remover (explicitamente modelar) esses efeitos (consulte a seção sobre Previsão abaixo e o exemplo trabalhado do NIST ). CHA1 Chatfield C (1975) A análise de séries de tempos: teoria e prática. Chapman e Hall, Londres HUN1 Hunter J S (1986) A média móvel exponencialmente ponderada. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de Controlo de Média Móvel Ponderados Exponencialmente: Propriedades e Melhoramentos. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de gráficos de controle baseados em médias móveis geométricas. Sobre esta planilha: Mostra as etapas necessárias para preparar análises de dados experimentais do mundo real e ilustra a funcionalidade fornecida no PTC Mathcad para expor o conteúdo de informações de forma otimizada de um conjunto de dados Aplicável Introdução de médias móveis e detrending, juntamente com técnicas de entrada de dados, programação em linha da PTC Mathcad, gráficos em série 2D e funções definidas pelo usuário Esta planilha da Mathcad da PTC mostra como preparar Análise de dados experimentais do mundo real com o software Mathcad da PTC e como expor o conteúdo da informação em um conjunto de dados. Médias e detrending são duas técnicas muito eficazes utilizadas para preparar dados de séries temporais para aplicações de modelagem estatística e previsão. Esta folha de cálculo mostra como pode importar um ficheiro de dados consistindo em dados de séries temporais no PTC Mathcad. Determinadas funções definidas pelo usuário foram escritas para facilitar o processo de utilização desses dados em parcelas, eliminando informações de cabeçalho indesejadas. Um filtro de média móvel para suavizar as flutuações de dados, bem como uma abordagem de média móvel ponderada mais complexa, são comparados na planilha. Um algoritmo de detrending que envolve diferenciar sua série de tempos também é exibido. Esta é uma ferramenta simples mas eficaz para remover uma tendência dos dados que é usada. Qualquer previsão resultante significa que deve haver menos viés nas previsões com base nos dados das séries cronológicas. Esta folha de trabalho usando o PTC Mathcad é completa com notação, gráficos, dados e soluções para ajudá-lo na aprendizagem. Faça o download e explore esta planilha Você pode fazer o download de uma cópia gratuita da PTC Mathcad Express e obter 30 dias de funcionalidade completa.

Comments

Popular posts from this blog

Live Forex Rates Singapore

Jason Fielder Forex Peace Army

Forex Negociação Ironfx Retirada