Eu tenho uma lista de pessoas, horários de registro e pontuação. Em Stata, eu quero calcular uma média móvel de pontuação com base em uma janela de tempo em torno de cada observação (não uma janela baseada no número de observações). Por exemplo, assumindo - 2 dias de cada lado e não incluindo a observação atual, estou tentando calcular algo como isto: eu tentei definir o conjunto de dados com tsset e depois use tssmooth. Mas não conseguiu que ele funcionasse. Uma vez que pode haver várias observações para um determinado período de tempo, não tenho certeza de que isso seja mesmo a abordagem certa. Além disso, na realidade, a variável do dia é um timestamp tc. Pediu 6 de dezembro às 16:04 tsset não pode ajudar aqui, mesmo que você tenha feito seus tempos regularmente espaçados, pois você tem alguns valores repetidos para o tempo, mas seus dados não se qualificam como dados de painel no Statas sense. Mas o problema deve render-se a um loop sobre as possibilidades. Primeiro, vamos usar seu exemplo literalmente usando dias inteiros. Aqui, assumimos que não existem valores em falta. O princípio de reencaminhamento é a média de outros (soma de todos - esse valor) (número de valores - 1) Na prática, você não deseja encaminhar todas as datas-vezes possíveis em milissegundos. Então, experimente um loop sobre as observações deste formulário. Observe os elementos ltpseudocodegt. Este documento também é relevante: se as faltas forem possíveis, uma linha precisa ser mais complicada: o que significa que, se o valor atual estiver faltando, subtraimos 0 da soma e 0 da contagem de observações. EDITAR: durante 2 dias em milissegundos, explorar a função incorporada e usar cofd (2).MOVAVG: módulo Stata usando Mata para gerar médias móveis Ao solicitar uma correção, mencione o identificador de itens: RePEc: boc: bocode: s457476. Veja informações gerais sobre como corrigir o material no RePEc. Para questões técnicas relativas a este item, ou para corrigir seus autores, títulos, resumo, informações bibliográficas ou de download, entre em contato: (Christopher F Baum) Se você é o autor deste item e ainda não está registrado no RePEc, encorajamos você a fazê-lo aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item sobre o qual não temos certeza. Se as referências faltam completamente, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não ligou a ele, você pode ajudar com este formulário. Se você souber de itens faltantes citando este, você pode nos ajudar a criar esses links, adicionando as referências relevantes da mesma maneira que acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações em seu perfil, pois pode haver citações em espera de confirmação. Observe que as correções podem levar algumas semanas para filtrar os vários serviços do RePEc. Mais serviços Siga as séries, periódicos, autores amplificar Novos artigos por e-mail Inscreva-se para novas adições ao RePEc Inscrição do autor Perfis públicos para pesquisadores de Economia Vários rankings de pesquisa em campos relacionados à economia de amplificadores Quem foi um estudante de quem, usando RePEc RePEc Biblio Curated artigos amp Artigos sobre vários temas de economia Carregar seu papel para ser listado em RePEc e IDEIAS EconAcademics Blog agregador para pesquisa econômica Plágio Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de papel de trabalho dedicada ao mercado de trabalho Fantasy League Imagine que você está no comando de uma economia Departamento de Serviços da StL Fed Data, pesquisa, amplificador de aplicativos mais do St. Louis FedStata: Análise de Dados e Software Estatístico Nicholas J. Cox, Universidade de Durham, Reino Unido Christopher Baum, Boston College egen, ma () e suas limitações Statarsquos mais óbvios O comando para calcular médias móveis é a função ma () de egen. Dada uma expressão, ela cria uma média móvel daquela expressão. Por padrão, é tomado como 3. deve ser estranho. No entanto, como a entrada manual indica, egen, ma () não podem ser combinados com varlist:. E, por esse motivo, não é aplicável aos dados do painel. Em qualquer caso, fica fora do conjunto de comandos especificamente escritos para séries temporais veja séries temporais para detalhes. Abordagens alternativas Para calcular as médias móveis para os dados do painel, existem pelo menos duas opções. Ambos dependem do conjunto de dados ter sido o tsset de antemão. Isto vale muito a pena fazer: não só você pode economizar várias vezes especificando a variável do painel e a variável de tempo, mas o Stata se comporta de forma inteligente com quaisquer lacunas nos dados. 1. Escreva sua própria definição usando gerar Usando operadores de séries temporais, como L. e F.. Dê a definição da média móvel como o argumento para uma declaração de geração. Se você fizer isso, você, naturalmente, não está limitado às médias móveis ponderadas (não ponderadas), calculadas por egen, ma (). Por exemplo, as médias móveis de três períodos, igualmente ponderadas, seriam dadas e alguns pesos podem ser facilmente especificados: você pode, é claro, especificar uma expressão como log (myvar) em vez de um nome de variável como myvar. Uma grande vantagem desta abordagem é que a Stata faz automaticamente o que é certo para os dados do painel: os valores avançados e atrasados são elaborados dentro dos painéis, assim como a lógica dita que deveria ser. A desvantagem mais notável é que a linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores. Isso pode ser útil para gerar uma expectativa adaptativa sobre o que uma variável será baseada puramente em informações até à data: o que alguém poderia prever para o período atual com base nos quatro últimos valores, usando um esquema de ponderação fixa (um atraso de 4 períodos pode ser Especialmente comumente usado com timeseries trimestrais.) 2. Use egen, filter () de SSC Use o filtro de função egen () do usuário do pacote egenmore em SSC. No Stata 7 (atualizado após 14 de novembro de 2001), você pode instalar este pacote depois do qual ajuda, além disso, aponta para detalhes no filtro (). Os dois exemplos acima serão renderizados (Nesta comparação, a abordagem de geração é talvez mais transparente, mas veremos um exemplo do oposto em um momento.) Os atrasos são um número. Leva a desvios negativos: neste caso -11 se expande para -1 0 1 ou liderar 1, lag 0, lag 1. Os coeficientes, outro número, multiplicam os itens atrasados ou atrasados correspondentes: neste caso, esses itens são F1.myvar . Myvar e L1.myvar. O efeito da opção de normalização é escalar cada coeficiente pela soma dos coeficientes de modo que o coeficiente de coeficiente (1 1 1) seja equivalente aos coeficientes de 13 13 13 e a normalização de coef (1 2 1) seja equivalente aos coeficientes de 14 12 14 . Você deve especificar não apenas os atrasos, mas também os coeficientes. Como egen, ma () fornece o caso igualmente ponderado, a lógica principal para egen, filter () é suportar o caso pontualmente ponderado, para o qual você deve especificar coeficientes. Também pode-se dizer que obrigar os usuários a especificar coeficientes é uma pressão pequena sobre eles para pensar sobre os coeficientes que eles querem. A principal justificativa para os pesos iguais é, contudo, a simplicidade, mas pesos iguais têm propriedades de domínio de freqüência péssimas, para mencionar apenas uma consideração. O terceiro exemplo acima poderia ser qualquer um dos quais é tão complicado quanto a abordagem de geração. Há casos em que egen, filter () dá uma formulação mais simples do que gerar. Se você quer um filtro binomial de nove séculos, que os climatologistas acham útil, então parece talvez menos horrível do que, e mais fácil de conseguir, do mesmo modo, assim como com a abordagem de geração, egen, filter () funciona corretamente com os dados do painel. Na verdade, como afirmado acima, depende do conjunto de dados ter sido tsset de antemão. Uma dica gráfica Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico. O comando do usuário com tsgraph é inteligente sobre conjuntos de dados tsset. Instale-o em um Stata 7 atualizado por ssc inst tsgraph. E quanto a subconjunto com se nenhum dos exemplos acima faz uso de restrições if. Na verdade egen, ma () não permitirá se for especificado. Ocasionalmente, as pessoas querem usar se ao calcular médias móveis, mas seu uso é um pouco mais complicado do que normalmente. O que você esperaria de uma média móvel calculada com if. Vamos identificar duas possibilidades: interpretação fraca: não quero ver nenhum resultado para as observações excluídas. Interpretação forte: eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto. Suponha que, como consequência de alguma condição, as observações 1-42 estão incluídas, mas não as observações 43. Mas a média móvel para 42 dependerá, entre outras coisas, do valor para a observação 43, se a média se estender para trás e para frente e for pelo menos de 3, e dependerá de algumas das observações 44 em algumas circunstâncias. Nosso palpite é que a maioria das pessoas iria para a interpretação fraca, mas se isso é correto, egen, filter () não é compatível se também. Você sempre pode ignorar o que você não quer ou mesmo definir valores indesejados a perder depois, usando a substituição. Uma nota sobre resultados faltantes nas extremidades da série Como as médias móveis são funções de atrasos e ligações, egen, ma () produz ausente onde os atrasos e as derivações não existem, no início e no final da série. Uma opção de nomiss força o cálculo de médias móveis mais curtas e não centradas para as caudas. Em contraste, nem gerar nem egen, filter () faz, ou permite, qualquer coisa especial para evitar resultados perdidos. Se algum dos valores necessários para o cálculo estiver faltando, esse resultado está faltando. Cabe aos usuários decidir se e qual cirurgia corretiva é necessária para essas observações, presumivelmente depois de olhar para o conjunto de dados e considerando qualquer ciência subjacente que possa ser trazida.
No comments:
Post a Comment