Por exemplo, muitas pessoas não gostam de padronizar variáveis fictícias, que têm apenas valores de 0 e 1, porque um “aumento de um desvio padrão” não é algo que realmente poderia acontecer com tal variável. Portanto, você pode querer deixar as variáveis fictícias não padronizadas enquanto padroniza as variáveis X contínuas.
Preciso padronizar a variável dependente?
Você deve padronizar as variáveis quando seu modelo de regressão contém termos polinomiais ou termos de interação. Embora esses tipos de termos possam fornecer informações extremamente importantes sobre a relação entre as variáveis de resposta e preditoras, eles também produzem quantidades excessivas de multicolinearidade.
Faz sentido padronizar variáveis binárias?
Alguns pesquisadores são a favor da padronização de variáveis binárias, pois isso faria todos os preditores na mesma escala. É uma prática padrão na regressão penalizada (lasso). Nesse caso, os pesquisadores ignoram a interpretação das variáveis.
Devemos padronizar variáveis categóricas?
É prática comum padronizar ou centralizar variáveis para tornar os dados mais interpretáveis na análise de inclinações simples; entretanto, variáveis categóricas nunca devem ser padronizadas ou centralizadas. Este teste pode ser usado com todos os sistemas de codificação.
Como você padroniza diferentes variáveis?
Normalmente, para padronizarvariáveis, você calcula a média e o desvio padrão para uma variável. Então, para cada valor observado da variável, você subtrai a média e divide pelo desvio padrão.