top of page

TEL: 123.456.7890

Download do pacote sandwich r

kcenifinusarsi


Como baixar e usar o pacote sanduíche no R




Se você está procurando uma maneira robusta e versátil de estimar a matriz de covariância dos parâmetros de seu modelo em R, talvez queira verificar o pacote sanduíche. Este pacote fornece uma variedade de estimadores de matriz de covariância que são consistentes mesmo quando algumas das suposições do modelo são violadas, como heterocedasticidade, autocorrelação ou agrupamento. Neste artigo, mostraremos como baixar e utilizar o pacote sanduíche no R, além de explicar algumas de suas funcionalidades e alternativas.


O que é o Pacote Sanduíche?




O pacote sanduíche é um pacote para R que implementa vários estimadores robustos de matriz de covariância, também conhecidos como covariâncias sanduíche. Esses estimadores são úteis quando você deseja realizar inferências nos parâmetros do modelo, como testes de hipótese ou intervalos de confiança, mas suspeita que algumas das suposições do modelo não foram atendidas. Por exemplo, se seu modelo sofre de heterocedasticidade (variância desigual dos termos de erro), autocorrelação (correlação dos termos de erro ao longo do tempo) ou agrupamento (dependência das observações dentro dos grupos), o estimador de matriz de covariância usual pode ser tendencioso e levar a inferência incorreta. Nesse caso, você pode usar um estimador de matriz de covariância sanduíche consistente sob essas violações e conectá-lo ao seu procedimento de inferência.




sandwich package r download



Características do Pacote Sanduíche




O pacote sanduíche possui vários recursos que o tornam uma ferramenta poderosa e flexível para estimativa de matriz de covariância robusta. Algumas dessas características são:



  • É orientado a objetos, o que significa que pode trabalhar com muitas classes de modelo diferentes, como lm, glm, survreg, coxph, mlogit, polr, hurdle, zeroinfl, ivreg, betareg e muito mais. Você não precisa modificar ou ajustar seu objeto de modelo para usar o pacote sanduíche.



  • Ele fornece uma ampla variedade de covariâncias de sanduíche para diferentes tipos de dados e modelos, como corte transversal, série temporal, clusterizado, painel, longitudinal, linear generalizado, sobrevivência, contagem, ordinal, inflado por zero, variável instrumental, regressão beta e muito mais. Você pode escolher o estimador de matriz de covariância apropriado para sua situação.



  • É modular e extensível, o que significa que você pode facilmente combinar diferentes componentes das covariâncias do sanduíche, como o pão (o inverso da matriz de informações de Fisher) e a carne (o produto cruzado das funções de pontuação) ou criar seus próprios componentes personalizados. Você também pode estender o pacote sanduíche para novas classes de modelo fornecendo métodos S3 para estfun (a função de pontuação) e bread (a matriz de informações de Fisher).



Alternativas ao Pacote Sanduíche




O pacote sanduíche não é a única opção para estimativa de matriz de covariância robusta em R. Existem alguns outros pacotes que oferecem funcionalidades semelhantes ou complementares. Alguns desses pacotes são:



  • lmtest: Este pacote fornece vários testes para modelos lineares baseados em diferentes tipos de covariâncias robustas. Ele também possui uma função coeftest que permite realizar testes de hipótese nos coeficientes de seu modelo usando qualquer estimador de matriz de covariância.



  • multiwayvcov: Este pacote estende o pacote sanduíche para permitir agrupamento multiway de erros padrão. Ele também fornece funções para computar ajustes de graus de liberdade para erros padrão agrupados.



  • plm: Este pacote fornece funções para análise de dados de painel com base em modelos lineares. Ele também oferece vários estimadores robustos de matriz de covariância para modelos de dados em painel.



  • pcse: Este pacote implementa erros padrão corrigidos pelo painel para modelos de dados do painel com dependência transversal.



Como instalar e carregar o pacote sanduíche no RComo instalar e carregar o pacote sanduíche no R




Instalar e carregar o pacote sanduíche no R é muito fácil. Você pode seguir estas etapas:


Instalando do CRAN




O pacote sanduíche está disponível no CRAN, o Comprehensive R Archive Network, que é o repositório oficial dos pacotes R. Para instalar o pacote sanduíche do CRAN, você pode usar a função install.packages no R. Por exemplo, você pode executar este código no console do R:


install.packages("sanduíche")


Isso fará o download e instalará a versão mais recente do pacote sanduíche e suas dependências do CRAN. Você só precisa fazer isso uma vez, a menos que queira atualizar o pacote para uma versão mais recente.


Instalando do GitHub




Se você quiser instalar a versão de desenvolvimento do pacote sanduíche, que pode ter alguns novos recursos ou correções de bugs que ainda não estão no CRAN, você pode instalá-lo a partir do GitHub, que é uma plataforma de hospedagem e compartilhamento de código. Para instalar o pacote sanduíche do GitHub, você precisa ter o pacote devtools instalado no R. Você pode instalar o pacote devtools do CRAN usando a mesma função install.packages. Por exemplo, você pode executar este código em seu console R:


install.packages("devtools")


Depois de instalar o pacote devtools, você pode usar a função install_github para instalar o pacote sanduíche do GitHub. Por exemplo, você pode executar este código em seu console R:


devtools::install_github("sandwich-org/sandwich")


Isso fará o download e instalará a versão de desenvolvimento mais recente do pacote sanduíche e suas dependências do GitHub. Talvez seja necessário fazer isso com mais frequência, pois a versão de desenvolvimento pode mudar com frequência.


Carregando o pacote de sanduíche




Depois de instalar o pacote sanduíche, você precisa carregá-lo em sua sessão R antes de poder usá-lo. Para carregar o pacote sanduíche, você pode usar a função de biblioteca em R. Por exemplo, você pode executar este código em seu console R:


biblioteca (sanduíche)


Isso carregará o pacote sanduíche e disponibilizará suas funções para uso. Você precisa fazer isso toda vez que iniciar uma nova sessão do R. Como usar o pacote sanduíche no R




Agora que você instalou e carregou o pacote sanduíche no R, pode começar a usá-lo para estimar matrizes de covariância robustas para seus modelos. O pacote sanduíche fornece uma função genérica chamada vcovHC, que significa matriz de variância-covariância heterocedasticidade consistente, que pode ser aplicada a qualquer objeto de modelo que tenha métodos para estfun e bread. A função vcovHC retorna um estimador de matriz de covariância sanduíche que é consistente sob heterocedasticidade de forma desconhecida. Você pode usar esse estimador em seu procedimento de inferência, como coeftest do pacote lmtest, para obter erros padrão robustos, estatísticas t e valores p para os coeficientes de seu modelo.


A função vcovHC possui vários argumentos que permitem personalizar o estimador da matriz de covariância sanduíche de acordo com seus dados e modelo. Alguns desses argumentos são:



  • type: Este argumento especifica o tipo de estimador sanduíche a ser usado. O padrão é type = "HC3", que é um estimador com correção de viés que funciona bem em amostras pequenas. Outras opções são type = "HC0", que é o estimador original proposto por White (1980), type = "HC1", que é um ajuste simples de graus de liberdade, type = "HC2", que é outro estimador com correção de viés, e type = "HC4", que é um estimador ponderado que leva em conta os pontos de alavancagem.



  • order.by: Este argumento especifica a ordem das observações para calcular o estimador sanduíche. O padrão é order.by = NULL, o que significa que não há ordenação. Isso é adequado para dados transversais. Outras opções são order.by = timevar, que significa ordenar por uma variável de tempo. Isso é adequado para dados de séries temporais. Você também pode especificar um vetor ou uma fórmula para a ordenação.



  • cluster: Este argumento especifica a variável de agrupamento para calcular o estimador sanduíche. O padrão é cluster = NULL, o que significa sem clustering. Isso é adequado para dados independentes. Outras opções são cluster = groupvar, que significa agrupamento por uma variável de grupo.Isso é adequado para dados agrupados ou em painel. Você também pode especificar um vetor ou uma fórmula para o agrupamento.



Além da função vcovHC, o pacote sanduíche também fornece outras funções para diferentes tipos de estimadores robustos de matriz de covariância, como vcovHAC, vcovCL e vcovBS. Essas funções têm argumentos e uso semelhantes aos de vcovHC, mas são projetadas para cenários diferentes. Descreveremos brevemente cada uma dessas funções a seguir.


Estimador Básico de Matriz de Covariância Sanduíche




O estimador básico da matriz de covariância sanduíche é dado por:



onde é o inverso da matriz de informação de Fisher, e é o produto vetorial das funções de pontuação.


O estimador de matriz de covariância sanduíche básico é consistente sob a suposição de especificação correta do modelo e independência das observações. No entanto, pode ser ineficiente ou tendencioso se essas suposições forem violadas. Portanto, geralmente é modificado ou ajustado para dar conta de várias formas de especificação incorreta ou dependência.


O estimador básico da matriz de covariância sanduíche pode ser calculado usando a função vcov do pacote sanduíche. Por exemplo, se você tiver um objeto de modelo linear chamado lmfit, poderá executar este código no console do R:


vcov(lmfit)


Isso retornará o estimador de matriz de covariância sanduíche básico para lmfit. Estimador de matriz de covariância consistente com heterocedasticidade




O estimador de matriz de covariância consistente com heterocedasticidade é uma modificação do estimador de matriz de covariância sanduíche básico que leva em consideração a possibilidade de variância desigual dos termos de erro entre as observações. É dado por:



onde é o resíduo para a observação i, e é a função de pontuação para a observação i.


O estimador de matriz de covariância consistente com heterocedasticidade é consistente sob a suposição de especificação correta do modelo e independência das observações, mas não requer a suposição de homocedasticidade (variância igual dos termos de erro).No entanto, pode ser ineficiente ou tendencioso em amostras pequenas, portanto, geralmente é modificado ou ajustado para melhorar seu desempenho em amostras finitas. Existem vários tipos de estimadores de matriz de covariância consistentes com a heterocedasticidade, como HC0, HC1, HC2, HC3 e HC4, que diferem em seus esquemas de correção de viés ou ponderação.


O estimador de matriz de covariância consistente com heterocedasticidade pode ser calculado usando a função vcovHC do pacote sanduíche. Por exemplo, se você tiver um objeto de modelo linear chamado lmfit, poderá executar este código no console do R:


vcovHC(lmfit)


Isso retornará o estimador de matriz de covariância consistente com heterocedasticidade padrão para lmfit, que é type = "HC3". Você pode alterar o argumento de tipo para escolher um tipo diferente de estimador. Estimador de matriz de covariância consistente com heterocedasticidade e autocorrelação




O estimador de matriz de covariância consistente com heterocedasticidade e autocorrelação é uma modificação do estimador de matriz de covariância sanduíche básico que considera a possibilidade de variância desigual e correlação dos termos de erro entre as observações. É dado por:



onde é o resíduo para a observação i, é a função de pontuação para a observação i, e é uma função de peso que depende da distância entre as observações i e j.


O estimador de matriz de covariância consistente com heterocedasticidade e autocorrelação é consistente sob a suposição de especificação correta do modelo e dependência fraca das observações, mas não requer as suposições de homocedasticidade ou nenhuma autocorrelação. No entanto, pode ser ineficiente ou tendencioso em amostras pequenas ou sob forte dependência, portanto, geralmente é modificado ou ajustado para melhorar seu desempenho ou robustez em amostras finitas.Existem vários tipos de estimadores de matriz de covariância consistentes com heterocedasticidade e autocorrelação, como Newey-West, Andrews, Driscoll-Kraay e Kiefer, que diferem em sua escolha de função de peso ou parâmetro de largura de banda.


O estimador de matriz de covariância consistente com heterocedasticidade e autocorrelação pode ser calculado usando a função vcovHAC do pacote sanduíche. Por exemplo, se você tiver um objeto de modelo linear chamado lmfit, poderá executar este código no console do R:


vcovHAC(lmfit)


Isso retornará o estimador de matriz de covariância consistente com heterocedasticidade e autocorrelação padrão para lmfit, que é tipo = "HC3". Você pode alterar o argumento de tipo para escolher um tipo diferente de estimador. Você também pode especificar o argumento order.by para indicar a ordem das observações e o argumento kernel para escolher uma função de peso diferente. Estimador de matriz de covariância agrupada




O estimador de matriz de covariância agrupada é uma modificação do estimador de matriz de covariância sanduíche básico que considera a possibilidade de dependência das observações dentro de clusters ou grupos. É dado por:



onde é o resíduo para a observação i, é a função de pontuação para a observação i e G é o número de clusters ou grupos.


O estimador de matriz de covariância agrupada é consistente sob a suposição de especificação correta do modelo e independência dos clusters ou grupos, mas não requer a suposição de independência das observações dentro de clusters ou grupos. No entanto, pode ser ineficiente ou tendencioso em amostras pequenas ou em poucos clusters, portanto, geralmente é modificado ou ajustado para melhorar seu desempenho ou robustez em amostras finitas. Existem vários tipos de estimadores de matriz de covariância agrupada, como CR0, CR1, CR2 e CR3, que diferem em seus graus de liberdade de ajuste ou esquemas de ponderação.


O estimador de matriz de covariância agrupada pode ser calculado usando a função vcovCL do pacote sanduíche. Por exemplo, se você tiver um objeto de modelo linear chamado lmfit, poderá executar este código no console do R:


vcovCL(lmfit, cluster = groupvar)


Isso retornará o estimador de matriz de covariância agrupada padrão para lmfit, que é type = "CR2". Você pode alterar o argumento de tipo para escolher um tipo diferente de estimador. Você também pode especificar o argumento de cluster para indicar a variável de agrupamento. Estimador de matriz de covariância Bootstrap




O estimador de matriz de covariância bootstrap é uma modificação do estimador de matriz de covariância sanduíche básico que usa uma técnica de reamostragem para estimar a matriz de covariância dos parâmetros do modelo. É dado por:



onde é a estimativa do parâmetro do modelo com base na b-ésima amostra de bootstrap, é a média das estimativas de parâmetros do modelo em todas as amostras bootstrap e B é o número de amostras bootstrap.


O estimador de matriz de covariância bootstrap é consistente sob a hipótese de especificação correta do modelo e dependência fraca das observações, mas não requer nenhuma suposição paramétrica sobre a distribuição dos termos de erro ou os parâmetros do modelo. No entanto, pode ser computacionalmente intensivo ou sensível à escolha do método bootstrap ou tamanho da amostra, por isso é geralmente usado como um complemento ou uma verificação para outros estimadores de matriz de covariância.


O estimador da matriz de covariância bootstrap pode ser calculado usando a função vcovBS do pacote sanduíche. Por exemplo, se você tiver um objeto de modelo linear chamado lmfit, poderá executar este código no console do R:


vcovBS(lmfit)


Isso retornará o estimador de matriz de covariância de inicialização padrão para lmfit, que é baseado em 999 amostras de inicialização com reamostragem de caso. Você pode alterar o argumento R para escolher um número diferente de amostras bootstrap e o argumento type para escolher um tipo diferente de método de reamostragem.


Conclusão




Neste artigo, mostramos como baixar e usar o pacote sanduíche em R, que é um pacote poderoso e flexível para estimativa robusta de matriz de covariância. Explicamos alguns dos recursos e alternativas do pacote sanduíche e demonstramos como usar algumas de suas funções para diferentes tipos de estimadores robustos de matriz de covariância, como estimadores consistentes com heterocedasticidade, consistentes com heterocedasticidade e autocorrelação, clusterizados e bootstrap. Esperamos que este artigo tenha ajudado você a entender e aplicar o pacote sanduíche em sua própria análise de dados.


perguntas frequentes




O que é um estimador de matriz de covariância sanduíche?




Um estimador de matriz de covariância sanduíche é um tipo de estimador de matriz de covariância robusto que é consistente mesmo quando algumas das suposições do modelo são violadas, como heterocedasticidade, autocorrelação ou agrupamento. Tem a forma de um sanduíche, com duas fatias de pão (o inverso da matriz de informação de Fisher) e uma fatia de carne (o produto cruzado das funções de pontuação).


Por que usar um estimador de matriz de covariância sanduíche?




Um estimador de matriz de covariância sanduíche é útil quando você deseja realizar inferência nos parâmetros do modelo, como testes de hipótese ou intervalos de confiança, mas suspeita que algumas das suposições do modelo não foram atendidas. Nesse caso, usar um estimador de matriz de covariância sanduíche pode fornecer inferência mais confiável e precisa do que usar um estimador de matriz de covariância padrão.


Como escolher um estimador de matriz de covariância sanduíche?




A escolha de um estimador de matriz de covariância sanduíche depende de seus dados e características do modelo. Você deve considerar fatores como o tipo de dados (transversal, série temporal, agrupado etc.), o tipo de modelo (linear, linear generalizado, sobrevivência etc.)Você também deve considerar o tamanho da amostra e o desempenho de diferentes estimadores em amostras finitas.


Como interpretar um estimador de matriz de covariância sanduíche?




Um estimador de matriz de covariância sanduíche pode ser interpretado da mesma forma que um estimador de matriz de covariância padrão. Ele fornece uma estimativa da variância e covariância dos parâmetros do modelo. Você pode usá-lo para calcular erros padrão, estatísticas t, valores p, intervalos de confiança ou testes de hipótese para os parâmetros de seu modelo usando um estimador de matriz de covariância sanduíche.


Quais são as limitações de um estimador de matriz de covariância sanduíche?




Um estimador de matriz de covariância sanduíche não é uma panacéia para todas as especificações ou dependências incorretas do modelo. Ele tem algumas limitações e desvantagens das quais você deve estar ciente. Algumas dessas limitações são:



  • Pode não ser consistente ou eficiente sob forte dependência ou não estacionariedade das observações.



  • Pode não ser válido ou confiável sob especificação incorreta do modelo ou forma funcional incorreta.



  • Pode não ser robusto ou estável sob outliers ou observações influentes.



  • Pode não estar disponível ou aplicável para algumas classes de modelo ou métodos de estimativa.



  • Pode ser computacionalmente intensivo ou complexo para implementar algumas estruturas de dados ou recursos de modelo.



Portanto, você deve sempre verificar a validade e adequação de um estimador de matriz de covariância sanduíche para seus dados e modelo antes de usá-lo e compará-lo com outros métodos ou abordagens, se possível. 0517a86e26


 
 
 

Recent Posts

See All

Comments


© 2023 by TAX.EXPERTS. Proudly created with Wix.com

STAY INFORMED

Thanks for submitting!

Stay Up to Date On The Latest News

bottom of page