Em formação

Qual teste estatístico devo usar quando há vários preditores latentes e vários resultados latentes?

Qual teste estatístico devo usar quando há vários preditores latentes e vários resultados latentes?

Qual método estatístico devo usar ao prever o comprometimento da organização (composto de 3 variáveis ​​latentes) usando os cinco fatores da personalidade?

É um desenho transversal com dados de pesquisa. Os fatores de personalidade são cinco fatores independentes (derivados da análise fatorial) e cada fator é medido em uma escala likert, o mesmo vale para os três componentes de comprometimento e também são medidos em uma escala do tipo likert.

Os estudos que li até agora usam correlações parciais e regressão hierárquica para ligar esses construtos, mas de alguma forma acho que deve haver uma maneira melhor.

Nota: esta pergunta foi originalmente feita aqui no Stats.SE, mas o moderador sugeriu postá-la no cogsci.se


Suponho que você esteja relacionando os 5 grandes fatores da personalidade ao modelo de três fatores de comprometimento de Meyer e Allen (normativo, continuação, afetivo).

Você certamente poderia adotar a abordagem simples de criar pontuações compostas observadas para cada variável e relatar a matriz de correlação e um conjunto de regressões múltiplas.

No entanto, a linguagem de sua pergunta também sugere que você está interessado em modelar variáveis ​​latentes em vez de variáveis ​​observadas. Isso pode sugerir que uma abordagem de modelagem de equações estruturais pode ser adequada.

Benefícios da abordagem de modelagem de equações estruturais

  • Você pode modelar seu modelo de medição (ou seja, fazer as variáveis ​​observadas carregar apropriadamente em seus 8 fatores latentes; existe um fator de compromisso geral de ordem superior que representa os três fatores de compromisso)
  • Você pode modelar relações entre fatores latentes em vez de variáveis ​​observadas (ou seja, você pode ajustar a confiabilidade da medição); isso geralmente alinha mais as análises com os interesses teóricos em psicologia.
  • Você pode explorar abordagens de comparação de modelos mais sofisticadas. Uma abordagem que eu realmente gosto envolve comparar modelos com várias restrições nas correlações ou coeficientes de regressão entre o conjunto de preditor (ou seja, personalidade) e o conjunto de resultados (ou seja, comprometimento). Por exemplo, um modelo poderia restringir todos os 15 coeficientes de regressão entre as variáveis ​​de personalidade e comprometimento para serem iguais; outro modelo poderia dizer que os relacionamentos são restritos a serem iguais nas variáveis ​​de compromisso, mas diferentes nas variáveis ​​de personalidade.

3. Resultados

O critério de informação de Akaike, BIC e entropia foram examinados para determinar o número ideal de classes no modelo. AIC e entropia sugeriram uma solução de 10 classes, e BIC sugeriu uma solução de três classes. Portanto, todas as opções entre três e 10 classes foram consideradas. Uma solução de quatro classes foi selecionada com base no fato de que esse modelo produziu uma distinção clara entre classes interpretáveis.

A Tabela 3 fornece as probabilidades de resposta ao item por associação de classe latente. Também fornecemos a média de probabilidade estimada da população para cada um dos riscos, que pode ser interpretada como a proporção de crianças em cada classe que endossam cada fator de risco.

Classe Habilitado para desenvolvimento (70%) Grupo de risco parental (16%) Grupo de risco emocionalmente imaturo (7%) Grupo de risco de linguagem e desenvolvimento (7%) Média da população
Proporção 0.70 0.16 0.07 0.07 1.00
Probabilidades de resposta ao item
Indicadores de vulnerabilidade do desenvolvimento infantil do Censo Australiano de Desenvolvimento Inicial
Domínio de saúde física e bem-estar 0.026 0.020 0.170 0.539 0.066
Domínio de competência social 0.008 0.000 0.493 0.510 0.069
Domínio da maturidade emocional 0.011 0.000 0.686 0.361 0.074
Domínio de habilidades cognitivas e de linguagem (baseado na escola) 0.014 0.031 0.013 0.572 0.052
Habilidades de comunicação e domínio de conhecimento geral 0.014 0.040 0.000 0.673 0.058
Indicadores de família
Sem leitura de livro entre pais e filhos 0.035 0.193 0.099 0.174 0.075
Baixa consistência parental 0.081 0.530 0.238 0.201 0.170
Baixa eficácia parental 0.059 0.493 0.272 0.152 0.148
Sofrimento psíquico dos pais 0.048 0.338 0.168 0.151 0.108
Condições de saúde dos pais 0.046 0.123 0.095 0.151 0.069
Indicadores de escola e comunidade
Fraco ambiente de aprendizagem e alfabetização escolar 0.153 0.165 0.225 0.275 0.167
Fraca relação professor-criança 0.110 0.211 0.545 0.305 0.165
Capital social de baixa vizinhança 0.187 0.352 0.192 0.274 0.220
Riscos médios 0.79 2.50 3.20 4.34 1.44
n 3,083 713 294 296 4,386

As quatro classes diferiam em prevalência de 70 por cento das crianças na classe um a 7 por cento nas classes três e quatro. O número médio e o tipo de riscos experimentados pelas crianças nesses grupos diferiram consideravelmente, e nenhum grupo foi definido exclusivamente pela presença ou ausência de um único fator de risco (Figura 1).

O primeiro grupo (ou seja, grupo de referência) foi tipificado como Habilitado para o Desenvolvimento e compreendia 70 por cento das crianças do estudo. Em média, cada criança desse grupo foi exposta a 0,8 riscos. Este grupo foi distinguido por ser inferior à proporção média da população em todos os fatores de risco. As crianças neste grupo tinham probabilidade muito baixa de serem vulneráveis ​​ao desenvolvimento em qualquer um dos indicadores de vulnerabilidade do desenvolvimento infantil AEDC (saúde física e bem-estar, competência social, maturidade emocional, linguagem e habilidades cognitivas (na escola)) (p = .008–.026).

O segundo grupo foi tipificado como o grupo de fatores de risco parental e compreendeu 16 por cento das crianças do estudo. Em média, cada criança desse grupo foi exposta a 2,5 riscos. Este grupo foi distinguido por uma maior probabilidade de a criança do estudo não ser lida, baixa consistência dos pais, baixa eficácia dos pais, sofrimento psicológico dos pais e baixo capital social da vizinhança avaliado pelos pais. As crianças neste grupo eram muito semelhantes às crianças com capacidade de desenvolvimento em sua probabilidade de vulnerabilidade em todos os cinco indicadores de vulnerabilidade de desenvolvimento infantil AEDC.

O terceiro grupo foi tipificado como o grupo de risco emocionalmente imaturo e compreendeu 7 por cento das crianças do estudo. Em média, cada criança deste grupo foi exposta a 3,2 riscos. Este grupo foi distinguido por uma maior probabilidade de vulnerabilidade de desenvolvimento nos domínios de competência social infantil AEDC e maturidade emocional, e uma relação professor-criança pobre. O grupo de risco emocionalmente imaturo foi comparável ao grupo com capacidade de desenvolvimento em termos de vulnerabilidade de desenvolvimento na linguagem e habilidades cognitivas (na escola) e habilidades de comunicação e domínios de conhecimento geral.

O quarto grupo foi tipificado como Grupo de Riscos de Desenvolvimento e Linguagem e compreendia 7 por cento das crianças do estudo. Em relação ao grupo de pessoas com deficiência de desenvolvimento, este grupo foi distinguido pelo risco elevado em todos os indicadores AEDC, mas particularmente no domínio das habilidades cognitivas e de linguagem (baseado na escola) (p = 0,57) e habilidades de comunicação e domínio de conhecimento geral (p = 0,67). As crianças neste grupo também estavam em risco elevado em todos os indicadores familiares, escolares e comunitários e tinham o maior número de riscos médios por criança (4,3).

As tabelas 4–6 mostram os resultados do ajuste de modelos de regressão logística para cada classe latente em relação às medidas de resultado.

Classe % da classe com baixa compreensão de leitura Razão de probabilidade p-valor
Habilitado para desenvolvimento (70%) 9.8 1 (ref.)
Grupo de risco parental (16%) 30.0 3.93 (2.66, 5.8) & lt.0001
Grupo de risco emocionalmente imaturo (7%) 18.4 2.07 (1.08, 3.97) .04634
Grupo de riscos de linguagem e desenvolvimento (7%) 51.1 9.63 (5.86, 15.8) & lt.0001
Classe % da classe com dificuldades emocionais e comportamentais Razão de probabilidade p-valor
Habilitado para desenvolvimento (70%) 7.3 1 (ref.)
Grupo de risco parental (16%) 49.5 12.42 (8.85, 17.42) & lt.0001
Grupo de risco emocionalmente imaturo (7%) 39.2 8.19 (5.11, 13.12) & lt.0001
Grupo de riscos de linguagem e desenvolvimento (7%) 28.5 5.06 (2.77, 9.24) & lt.0001
Classe % da aula com altas taxas de ausência Razão de probabilidade p-valor
Habilitado em termos de desenvolvimento (70%) 14.7 1 (ref.)
Grupo de risco parental (16%) 20.6 1.50 (0.98, 2.30) .12154
Grupo de risco emocionalmente imaturo (7%) 19.3 1.38 (0.73, 2.62) .35148
Grupo de riscos de linguagem e desenvolvimento (7%) 21.3 1.57 (0.85, 2.89) .17790

Em relação ao perfil de Deficientes de Desenvolvimento, as crianças dos grupos Paternidade, Emocionalmente Imaturas e Linguagem e Riscos de Desenvolvimento apresentaram maior probabilidade de baixa compreensão de leitura no Ano 3 (Tabela 4). A chance de uma criança ter baixa compreensão de leitura no ano 3 foi 3,9 vezes maior para o grupo Risco Parental, 2,1 vezes maior para o grupo Emocionalmente Imaturo e 9,6 vezes maior para o grupo Linguagem e Riscos de Desenvolvimento.

Em relação ao perfil de pessoas com deficiência de desenvolvimento, as crianças dos grupos Paternidade, Emocionalmente Imaturas e Linguagem e Riscos de Desenvolvimento apresentaram maior probabilidade de apresentar dificuldades emocionais e comportamentais aos 8 anos (Tabela 5). A chance de uma criança ter dificuldades emocionais e comportamentais aos 8 anos foi 12,4 vezes maior para o grupo de perfil de Risco Parental, 8,2 vezes maior para o grupo Emocionalmente Imaturo e 5,1 vezes maior para o grupo de Linguagem e Riscos de Desenvolvimento.

Embora tenha havido indicações de um aumento da tendência de altas taxas de absentismo escolar nos grupos Paternidade, Emocionalmente Imaturo e Linguagem e Riscos de Desenvolvimento, não houve diferenças estatisticamente significativas entre os grupos na probabilidade de altas taxas de absentismo escolar aos 8 anos (Tabela 6).


Fronteiras em psicologia

As afiliações do editor e dos revisores são as mais recentes fornecidas em seus perfis de pesquisa do Loop e podem não refletir sua situação no momento da revisão.


  • Baixar Artigo
    • baixar PDF
    • ReadCube
    • EPUB
    • XML (NLM)
    • Suplementar
      Material
    • EndNote
    • Gerente de Referência
    • Arquivo TEXT simples
    • BibTex


    COMPARTILHAR NO

    O que é análise de classe latente?

    Um dos desafios mais comuns - e um dos mais complicados - na análise de dados é decidir como incluir vários preditores em um modelo, especialmente quando eles estão relacionados entre si.

    Aqui está um exemplo. Digamos que você esteja interessado em estudar a relação entre a repercussão do trabalho no tempo pessoal como um indicador de desgaste do trabalho.

    Você tem 5 variáveis ​​categóricas sim / não que indicam se um sintoma específico de transbordamento de trabalho está presente (veja abaixo).

    Embora você possa usar cada variável individual, você não está realmente interessado se uma em particular estiver relacionada ao resultado. Talvez não seja realmente cada sintoma que é importante, mas a ideia de que o transbordamento está acontecendo.

    Uma possibilidade é contar o número de itens aos quais cada respondente disse sim. Esta variável medirá o grau em que o spillover está acontecendo. Em muitos estudos, isso é exatamente o que você precisa.

    Mas não diz a você algo importante - se há combinações que geralmente co-ocorrem, e são essas combinações que afetam o esgotamento?

    Em outras palavras, e se não for apenas o grau de repercussões que são importantes, mas o modelo?

    Digite a análise de classe latente (LCA).

    LCA é um modelo de medição no qual os indivíduos podem ser classificados em tipos mutuamente exclusivos e exaustivos, ou classes latentes, com base em seu padrão de respostas em um conjunto de variáveis ​​indicadoras categóricas. (A Análise Fatorial também é um modelo de medição, mas com variáveis ​​indicadoras contínuas).

    Probabilidade de 'sim'Resposta para cada classe

    A verdadeira associação de classe é desconhecida para cada indivíduo. Como categorias de uma variável latente, essas classes não podem ser medidas diretamente, a não ser por meio dos padrões de respostas nas variáveis ​​indicadoras.

    Existem dois conjuntos de parâmetros em um LCA. O primeiro é o conjunto de probabilidades de inclusão de que qualquer pessoa aleatória estará em qualquer classe latente. Você pode ver no exemplo acima que existem 4 classes e que 20% dos entrevistados estão na Classe 1, 61% estão na Classe 2, etc.

    Os números azuis em cada coluna são o segundo tipo de parâmetro, equivalente a cargas fatoriais na análise fatorial confirmatória. Cada um é a probabilidade condicional de que alguém em uma classe específica responderia & # 8216 sim & # 8217 a um determinado item. Esses parâmetros são usados ​​para interpretar as classes.

    Por exemplo, a maior classe, Classe 2, pode ser interpretada como o grupo & # 8220Low Spillover & # 8221. A probabilidade de responder & # 8216 sim & # 8217 a qualquer uma das 5 perguntas é relativamente baixa. O único que é um pouco alto é & # 8216Verifica o e-mail do trabalho de casa & # 8217 mas, mesmo assim, esse grupo faz isso com a probabilidade mais baixa de qualquer uma das classes.

    Da mesma forma, a Classe 4, a menor, tem uma probabilidade muito alta de responder & # 8216 sim & # 8217 a todas as perguntas. Essa classe seria o grupo & # 8220High Spillover & # 8221.

    Até agora, não é muito interessante, certo? Parece apenas um nível de grau.

    Mas as classes 1 e 3 são mais interessantes.

    A classe 1 tem probabilidades muito altas de responder & # 8216 sim & # 8217 a três das perguntas e probabilidades muito baixas de responder & # 8216 sim & # 8217 às outras duas. Se você examinar o que eles estão dizendo sim, eles querem ser acessível para a empresa fora do horário de trabalho. Portanto, suas vidas pessoais são frequentemente interrompidas, mas eles não trabalham regularmente por muitas horas.

    Compare isso com a classe 3. A classe 3 é bem diferente. Os membros da Classe 3 são altamente propensos a verificar o e-mail do trabalho em casa, mas eles também fazem regularmente trabalho extra à noite e, em menor grau, nos fins de semana. Não se espera que eles estejam à disposição para trabalhar, no entanto. (Talvez sejam eles que estão trabalhando até tarde).

    Essas são duas maneiras qualitativamente diferentes de fazer com que o trabalho penetre na vida doméstica e podem ter impactos diferentes sobre o esgotamento. É assim que a Análise de Classe Latente pode ser tão útil.

    Neste exemplo, pudemos usar a Análise de Classe Latente para identificar uma tipologia latente que é usada como variável preditora, mas também existem muitos outros usos dentro das estatísticas.

    Portanto, certifique-se de manter o LCA em seu radar - você nunca sabe quando pode ser útil.


    Classes latentes de comportamentos sexuais: prevalência, fatores preditivos e consequências

    Estudiosos da sexualidade adolescente e adulta emergente começaram recentemente a estudar como diversos padrões de comportamento sexual contribuem para o desenvolvimento e o bem-estar. Uma abordagem orientada para a pessoa para estudar os comportamentos sexuais fornece uma compreensão diferenciada dos repertórios sexuais. Os objetivos deste artigo eram documentar padrões de comportamento sexual, desde beijos a sexo com penetração, e examinar como classes latentes de comportamento, gênero e tipo de parceiro (romântico versus não romântico) predizem as consequências intra e interpessoais dos comportamentos sexuais. A análise latente das classes de uma amostra aleatória estratificada de estudantes universitários dos EUA revelou quatro classes de comportamentos sexuais: Beijar somente, Beijar e tocar, Todos os comportamentos e Somente oral e penetrante. Em comparação com os indivíduos da classe Todos os Comportamentos, os indivíduos da classe Somente Beijo eram menos propensos a experimentar uma consequência intrapessoal positiva ou negativa de comportamentos sexuais. Os homens eram menos propensos a relatar uma consequência intrapessoal negativa do que as mulheres. O tipo de parceiro previu consequências interpessoais negativas para a classe Todos os comportamentos. As implicações são discutidas em termos de desenvolvimento sexual normativo, prevenção e educação sexual e de relacionamento.

    Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


    Introdução

    Investigar os fatores de risco associados ao ajustamento psicológico das crianças tem sido um objetivo onipresente nas ciências psicológicas e do desenvolvimento. Relacionado a esse objetivo, uma linha de investigação enfocou como as crianças expostas a vários fatores de risco concomitantes tendem a ter resultados de desenvolvimento piores do que aquelas que têm menos ou nenhuma exposição aos fatores de risco. Rutter [1,2] propôs um método para medir risco cumulativo (CR) em que vários fatores de risco são agregados para criar um único índice composto de risco. Este método tem sido amplamente utilizado por pesquisadores e é um preditor robusto de problemas de saúde mental e ajustamento psicológico em crianças (para uma revisão, ver Evans, Li, & amp Whipple, 2013 [3]).

    Os pesquisadores articularam vários argumentos conceituais e metodológicos para agregar vários indicadores de risco em uma única variável composta, ou CR. Conceitualmente, agregar vários indicadores de risco pode determinar com mais precisão como a exposição das crianças ao risco pode cruzar vários sistemas e domínios, incluindo os contextos dos pais, da família, da casa, da escola e da vizinhança [3,4]. Para muitas populações (por exemplo, crianças que vivem em contextos urbanos de baixa renda), a exposição ao risco nesses domínios tende a ocorrer simultaneamente e raramente existe de forma isolada [5]. Metodologicamente, essa abordagem fornece um modelo mais simplificado do que estimar cada fator de risco como um preditor separado. Isso pode ser particularmente vantajoso quando os investigadores estão usando amostras de tamanhos pequenos, examinando a exposição a um grande número de fatores de risco dentro de um modelo, ou quando alguns fatores de risco co-ocorrem e se correlacionam entre si, o que pode resultar em preocupações sobre colinearidade ou efeitos de supressão [6]. Além disso, o uso de um escore agregado normalmente tem maior poder preditivo do que qualquer fator de risco único [3]. No entanto, quando esse não for o caso, isso justificaria o uso de um único fator de risco em vez de agregar vários índices de risco. Os investigadores também relataram efeitos de limiar, que não são aparentes ao examinar os fatores de risco individuais [7]. Os efeitos de limite indicam que o efeito de vários indicadores de risco é exacerbado quando o número de riscos aos quais uma criança está exposta excede um determinado limite, portanto, a exposição a RC pode ter uma associação não linear com o ajuste psicológico das crianças.

    Desde o início da abordagem CR, houve inúmeros avanços metodológicos que podem ser aplicados prontamente para medir a exposição das crianças a vários fatores de risco. No entanto, as comparações entre vários métodos têm sido raras e a maioria dos estudos normalmente se baseia em um método de medição de RC. Os objetivos deste estudo foram fornecer uma comparação conceitual e metodológica de vários métodos alternativos que podem ser aplicados para medir a exposição a riscos múltiplos, com o objetivo de auxiliar os pesquisadores a considerar as nuances e distinções de várias abordagens. Do ponto de vista conceitual, várias comparações são feitas em cada método avaliado. Mais especificamente, consideramos, 1) as suposições de cada abordagem com relação a se os indicadores de risco individuais devem ser medidos ao longo de um continuum ou dicotomizados para diferenciar aqueles com o risco mais grave, e 2) as implicações de cada abordagem com respeito ao relativo influência (peso) dos indicadores de risco individuais na formação de uma variável composta. Do ponto de vista metodológico, apresentamos uma estratégia de aplicação de cada método e elaboramos os pressupostos conceituais que fundamentam cada método. Uma vez que um dos principais objetivos dos estudos que incorporam uma abordagem de risco múltiplo é prever um resultado específico de interesse, avaliamos a utilidade preditiva de cada método em problemas de externalização de crianças em uma amostra diversificada de baixa renda e alto risco devido à substância materna uso durante a gravidez. Como existem inúmeros riscos concomitantes que estão presentes nesta população, esta foi uma amostra ideal para examinar os vários métodos de avaliação da exposição a múltiplos riscos de crianças.

    Deve-se enfatizar que o objetivo deste estudo não era recomendar uma única abordagem ou propor um "padrão ouro" para medir a RC, mas sim destacar vários métodos que foram usados ​​pelos investigadores. Ao avaliar e comparar os pressupostos conceituais e metodológicos e os potenciais pontos fortes e limitações desses métodos, este estudo visa auxiliar os pesquisadores a se tornarem mais informados sobre as várias opções disponíveis para avaliar a RC e melhor equipados para tomar uma decisão mais informada sobre sua escolha de método. Dependendo de como os pesquisadores escolhem conceituar e medir RC, e seus objetivos de pesquisa específicos (por exemplo, projetos analíticos e de pesquisa), existem casos prováveis ​​em que cada um desses métodos pode ser eficaz e adequadamente aplicado. Assim, propomos uma árvore de decisão que pode facilitar esse processo (ver Fig. 1).

    Métodos de pontuação observados

    Índice de risco cumulativo (CR).

    O índice de risco cumulativo convencional (CR) normalmente depende de um conjunto de variáveis ​​dicotômicas ou binárias, cada uma das quais é codificada para refletir a presença ou ausência de um fator de risco específico (ou seja, 1 = alto risco, 0 = nenhum ou baixo risco) Esse índice é calculado somando cada um dos indicadores de risco de forma que pontuações mais altas reflitam maior exposição a múltiplos fatores de risco. Esta variável composta somada (referida aqui como o índice CR) pode então ser incorporada em outras análises (por exemplo, modelos de regressão, modelagem de equação estrutural) como uma variável preditora.

    No nível de risco individual, o investigador deve levar vários fatores em consideração. As decisões devem ser feitas a priori sobre como cada variável deve ser dicotomizada. Para algumas variáveis ​​(por exemplo, dados categóricos), a variável já pode ser medida no nível binário. Por exemplo, a baixa escolaridade materna pode ser medida pela presença ou ausência de um diploma do ensino médio, ou a paternidade monoparental pode ser medida pela presença ou ausência de um segundo cuidador residente na casa da criança. No entanto, em muitos casos, isso pode exigir a conversão de uma variável de escala contínua em uma variável dicotômica. Nesses casos, os investigadores devem ter uma justificativa para determinar uma pontuação de corte (por exemplo, uma divisão mediana, quartil superior, pontuação de limiar) ou critério pelo qual dicotomizar uma variável contínua. Notavelmente, a dicotomização de variáveis ​​contínuas traz certas desvantagens que os investigadores devem levar em consideração [8, 9]. Como essa abordagem usa indicadores de risco individuais dicotomizados, ela não leva em consideração os indicadores de risco individuais que podem abranger um continuum. Dito de outra forma, essa abordagem tende a medir a exposição mais alta ou mais grave a um fator de risco, em oposição a diferenciar um fator de risco ao longo de um continuum que diferencia a gravidade. Por exemplo, usando uma divisão do quartil superior (ou seja, 75º percentil e acima são considerados "em risco"), presume-se que aqueles que se enquadram no 50º ao 75º percentil têm "nenhum risco" semelhante àqueles que caem no intervalo de percentil 0 a 25. Dependendo de como um investigador dicotomiza os indicadores de risco individuais, esta abordagem pode ser específica para a amostra. Por exemplo, o uso de uma divisão do quartil superior pode constituir classificações de risco muito diferentes em uma amostra de alto ou baixo risco.

    No nível composto, essa abordagem também assume que, quando o risco está presente, cada variável de risco individual carrega o mesmo peso em relação ao índice CR agregado. Ou seja, essa abordagem não pesa diferentemente os fatores de risco individuais, de modo que alguns indicadores podem ter uma influência mais forte no composto do que outros. Conceitualmente, o índice CR é baseado na premissa de que a exposição ao risco se torna mais prejudicial com base na número de diferentes riscos que uma criança experimenta, ao invés do específico Formato ou natureza de risco. Assim, impor pesos iguais parece consistente com essa premissa.

    Uma das vantagens potenciais do índice CR é que ele é facilmente interpretável. Para ilustrar, supondo que o coeficiente não padronizado do índice CR seja igual a .2, isso pode ser facilmente interpretado como sugerindo que para um aumento de uma unidade no risco cumulativo (o que corresponderia à presença de um risco adicional), há um .2 aumento na variável de resultado. Na medida em que há um efeito de limiar presente, outra vantagem potencial do índice CR é que ele pode detectar prontamente tais efeitos (por exemplo, determinar o número de fatores de risco necessários para uma criança estar em maior risco para certos resultados de desenvolvimento).

    Índice de risco cumulativo de pontuação de proporção (PCR).

    Como alternativa ao índice CR, outra estratégia que pode ser aplicada é o índice de risco cumulativo de pontuação de proporção (PCR) [10]. Para cada indicador de risco, uma pontuação de proporção é calculada dividindo cada pontuação individual pela pontuação máxima, resultando em uma pontuação de proporção com valor máximo de um. No nível composto, o índice PCR consiste em calcular a média (ou soma) de cada pontuação de proporção para estimar uma variável composta. Em comparação com o índice CR, pode haver condições em que essa abordagem seja mais ou menos vantajosa. Quando os indicadores de risco individuais são derivados de variáveis ​​de escala contínua, pode ser mais viável transformá-los em um escore de proporção do que dicotomizar. Notavelmente, quando um indicador de risco individual é dicotômico por design, ele não requer uma transformação para uma pontuação de proporção. Uma das distinções dessa abordagem é que ela mantém a classificação relativa dos indivíduos em uma variável que se perde na dicotomização. Assim, ao contrário do índice CR que tende a diferenciar a presença de alto risco, esta abordagem assume que o risco ocorre em um continuum com vários graus de gravidade. Como uma pontuação de proporção tem um valor máximo possível de um, essa abordagem é semelhante ao índice CR em que altos níveis de risco em diferentes indicadores de risco carregam o mesmo peso máximo. Considerando que as pontuações proporcionais são derivadas da pontuação máxima em uma amostra particular, uma das desvantagens potenciais dessa abordagem, talvez mais do que o índice CR, é que ela é específica para a amostra.

    Em comparação com o índice CR, o índice PCR tem sido usado com pouca frequência. Uma exceção é o estudo de Moran et al. (2016), que aplicou essa abordagem para formar um índice PCR que consiste em baixa escolaridade materna, status de pai solteiro, instabilidade residencial, densidade familiar, eventos negativos na vida, divórcio dos pais e depressão materna. No entanto, esses investigadores não avaliaram explicitamente as vantagens potenciais desta abordagem em comparação com o índice CR.

    Índice padronizado (z-score) de risco cumulativo (ZCR).

    O índice de risco cumulativo (ZCR) padronizado (ou seja, pontuação z) é outra abordagem que compartilha várias semelhanças com o índice PCR (observe que esta abordagem é chamada de pontuação sumária em Evans et al., 2013). Esta abordagem envolve transformar cada variável de risco individual em uma pontuação padronizada (ou seja, pontuação z) e agregar as pontuações padronizadas (ou seja, calcular uma pontuação média ou soma). É uma abordagem viável quando os indicadores de risco são baseados em escalas contínuas e mantém a ordem relativa dos indivíduos. Assim, esta abordagem assume que o risco ocorre em um continuum com vários graus de gravidade ou risco. Como os escores z são derivados do desvio padrão em uma determinada amostra, essa abordagem também é altamente específica para a amostra, semelhante ao PCR.

    Ao contrário dos índices CR ou PCR, esta abordagem não assume inerentemente que todos os indicadores de risco são igualmente ponderados. Ou seja, enquanto os índices CR e PCR têm uma faixa imposta para cada indicador de risco individual (0 = sem risco, 1 = alto risco), este não é o caso com pontuações z. Assim, pode haver casos em que certas variáveis ​​de risco (ou seja, aquelas em que há uma gama maior de pontuações padronizadas) contribuem mais para o índice composto. Pesos diferenciais podem ser vantajosos nos casos em que um pesquisador presume que a exposição severa a um indicador de risco específico (ou indicadores múltiplos) pode ser particularmente prejudicial para um determinado resultado e, portanto, tem uma justificativa para não assumir pesos iguais dos indicadores de risco.

    Poucos investigadores compararam explicitamente o ZCR ao índice CR ou outros métodos. Por exemplo, uma revisão sistemática de Evans e colegas (2013) encontrou apenas um estudo que comparou explicitamente esses dois métodos. Este estudo relatou que o ZCR foi um preditor mais forte do que o índice CR [11]. No entanto, esse achado pode ser específico para os indicadores de risco, ou resultados, que foram avaliados. Assim, permanece a necessidade de pesquisas adicionais para comparar esses métodos.

    Métodos centrados em variáveis

    Desde o início do índice CR, a aplicação de modelos de variáveis ​​latentes (por exemplo, modelagem de equações estruturais, modelagem de mistura) na pesquisa psicológica se expandiu consideravelmente, permitindo que os investigadores utilizem esses métodos para operacionalizar múltiplos indicadores de risco usando latente (não observado) constrói. Conforme ilustrado na Fig. 1, quando os investigadores decidem renunciar ao uso de índices de pontuação CR observados (ou seja, CR, PCR e ZCR), eles têm a opção de usar métodos de variáveis ​​latentes. Discutimos várias variantes de modelos que podem ser aplicados para medir vários indicadores de risco, incluindo métodos centrados em variáveis ​​(ou seja, indicadores reflexivos e formativos) e métodos centrados na pessoa (análise de classe latente e análise de perfil latente). Esses métodos podem ser aplicados com indicadores dicotômicos, de proporção e de pontuação z. Notavelmente, como os indicadores de proporção e escore z consistem em transformações que mantêm a mesma ordem de classificação dos indivíduos, eles produzem matrizes de covariância (correlação) equivalentes. Assim, as diferenças entre essas duas abordagens são talvez mais evidentes ao usar índices de pontuação CR observados e menos relevantes para as abordagens de variáveis ​​latentes discutidas nas seções seguintes, que dependem de uma matriz de covariância.

    Método do indicador reflexivo (RI).

    Modelos de indicadores reflexivos (RI) envolvem a especificação de um modelo de medição usando vários indicadores de risco como indicadores de efeito de uma construção latente não observável [12]. Isso pode ser alcançado especificando um fator latente de modo que cada variável de risco individual seja tratada como um indicador do construto de risco múltiplo latente. Uma das vantagens dessa abordagem é que ela pode ser aplicada quando os indicadores de risco individuais são variáveis ​​dicotômicas ou contínuas (ou seja, proporção ou pontuação z). Comparar este método com outras abordagens levanta várias outras considerações. O método RI assume unidade conceitual e que os indicadores são inter-correlacionados, o que implica que cada indicador é reflexo de um construto latente não observado subjacente [12]. Dependendo de como a medida de risco múltiplo é conceituada e de quais domínios de risco ela se destina a medir, essa suposição pode, ou não, ser atendida. Do nosso ponto de vista, o método de RI pode ser problemático quando os investigadores estão tentando medir uma única variável composta que é baseada em processos de risco conceitualmente distintos, que não estão necessariamente correlacionados entre si. Nesses casos, um indicador não correlacionado com outros indicadores pode ter um efeito diminuído no construto latente [13].

    O método RI pode ser concebido como um modelo analítico fatorial. Por extensão, este modelo também pode ser usado para especificar várias variáveis ​​latentes (fatores) para avaliar vários domínios de risco. Para simplificar a comparação de abordagens no presente estudo, consideramos a forma mais simples desse modelo em que uma variável latente (domínio) é especificada. No entanto, essa abordagem pode ser particularmente vantajosa em cenários nos quais os pesquisadores buscam agregar os indicadores de risco individuais em vários domínios distintos [14].

    Método do indicador formativo (FI).

    Uma segunda abordagem centrada na variável consiste na indicador formativo (FI) método. O método FI consiste em especificar uma variável composta de risco múltiplo em que os indicadores são preditores do composto [15], ao invés de ser reflexo dele (como na abordagem RI). The use of formative indicators within psychological research has been a contentious one [13, 16], however, there may be strengths to using this approach to investigate multiple risk processes. Moreover, although this approach has been used infrequently to assess multiple risk factors, it may serve as an alternative method that deserves further empirical evaluation [15].

    To determine whether a multiple risk composite should be measured using the reflective or formative indicator approach, Bollen and Diamantopoulos (2017, p. 582) suggest that, “A researcher should imagine a change in the indicator and ask whether this change is likely to change the value of the latent variable. If so, this is theoretical evidence supporting causal or formative indicators.” Applying this standard, we contend that from both a conceptual and methodological perspective, there may be instances in which the formative indicator approach is well aligned with multiple risk assessment. For instance, within the CR perspective, it is conceivable that an increase in maternal education or substance use (i.e., risk indicators) would increase the child’s exposure to CR (i.e., the composite variable). However, CR is not conceived to cause (precede) maternal education or substance use (as is conceptualized with a reflective indicator).

    To further clarify the FI approach, we adopt the terminology proposed by Bollen and colleagues [13, 17] to differentiate causal-formative e composite-formative indicators. We posit that, in many instances, the measurement of a single composite risk variable is theoretically more consistent with the composite-formative indicator method. Unlike the causal FI approach, the composite FI approach does not assume conceptual unity, such that each indicator corresponds with the definition of the concept that the latent variable represents. Furthermore, in contrast to the RI method, the composite FI method does not assume that the individual risk indicators are correlated with one another. Consequently, the composite FI approach is particularly applicable in instances in which investigators seek to derive a single composite risk index to aggregate uncorrelated individual risk indicators.

    In contrast to other approaches which make assumptions about the equal weights of the individual risk indicators on the composite measure, one of the potential advantages of the RI and FI methods is that this assumption can be tested empirically comparing two nested measurement models (e.g., via a chi-square difference test). In one model, which assumes unequal weights, an unconstrained measurement model can be specified in which factor loadings or coefficients are estimated freely for each indicator. In a second model, which assumes equal weights, a constrained measurement model can be specified in which factors loadings (or coefficients) are estimated to be equal to one another. Given that these two models are nested, a chi-square difference test (or likelihood ratio test statistic) can then be used to compare these models and to determine whether imposing equality of weights across indicators results in a reduction in model fit.

    Person-centered methods

    CR can also be conceptualized and measured using person-centered methods [18]. Person-centered methods such as latent class analysis (LCA) and latent profile analysis (LPA) consist of identifying groups of individuals who exhibit a similar pattern of responses on a pre-specified set of variables. This methodology can be applied to dichotomous risk indicators (using LCA) and to continuous risk indicators (using LPA). That is, the primary distinction between LCA and LPA is the use of categorical or continuous indicators [19]. This methodology can be conceived as a data-driven approach such that the qualitative nature of the identified groups (i.e., latent classes) are not specified a priori, but rather depend on the extent to which the estimated model represents the observed data. Applying this approach to the investigation of multiple risk indicators, it is conceivable that there are subgroups of individuals who exhibit similar risk profiles (e.g., high risk across multiple indicators, low risk across multiple indicators, or a combination of high and low risk across indicators).

    There are several considerations in applying person-centered methods for investigating multiple risk. One potential advantage of this approach is that it may provide greater specification about the constellations of risk that are most problematic for adjustment, rather than the total number of risk factors (based on the CR index) or the severity of aggregated risk exposure (based on the PCR or ZCR). In this respect, person-centered methods rely on a markedly different conceptual assumption about how risk exposure impacts adjustment [18]. Stated differently, whereas the CR index assumes that the number of risk factors to which an individual is exposed influences adjustment outcomes, person-centered approaches may provide greater insights—depending on the qualitative distinctions of the latent classes that are identified—into how a specific set of risk factors are associated with adjustment. Because this is a data-driven approach which examines profiles of risk within a given sample, the nature of the latent classes that are identified are sample-specific. Moreover, this approach may require larger sample sizes to distinguish several distinct risk classes (or subgroups).

    Study aims

    In order to assess each of the alternative methods described, this study consisted of five primary aims. Aim 1 was to examine the effects of the independent (non-aggregated) risk indicators on children’s externalizing problems. Aim 2 was to examine the simultaneous (additive) effects of the individual risk indicators. Taken together, these two aims were important preliminary steps considering that the primary rationale of forming a composite variable is that it presumably has a stronger association with the outcome variable than any individual risk indicator. Aim 3 was to compute three observed score CR risk indices based on the three sets of individual risk indicators (i.e., dichotomous, proportion- and z-scores). Aim 4 was to incorporate variable-centered analyses as an alternative to the observed score CR indices. Towards this end, the reflective and formative indicator approaches (i.e., RI and FI methods) were examined. Aim 5 was to incorporate person-centered methods, via the use of latent class and latent profile analyses. LCA was used to estimate the models using dichotomous indicators and LPA was used for the proportion- and z-score indicators.

    Before addressing these primary aims, numerous studies were reviewed to identify a set of empirically derived risk indicators. Although researchers have not consistently measured the same risk indicators across studies, there are several that have been identified across multiple investigations including: low maternal education, hunger, meal and money unpredictability, maternal psychopathology, maternal substance (e.g., alcohol, tobacco and cocaine use), harsh parenting and discipline, family stress, and family violence [20–29]. Notably, some of these studies have also incorporated measures of family income, race, and family structure however, because the majority of participants in the current sample were low-income, African American, and single-mothers, these indicators were not included because they exhibited low variability (see Method section for more details on the sample).

    For each of the primary aims, effect sizes (R 2 ) were used to compare the relative predictive power of each method. Since one of the primary aims of studies which incorporate a multiple risk variable is to predict a specific outcome of interest, we evaluate the predictive utility of each method on children’s externalizing problems in kindergarten. The rationale for this selected outcome and developmental period was based on several considerations. There is a substantial body of research which has been interested in examining how early childhood risk and adversity impacts children’s psychological adjustment, and in particular the development of externalizing problems (e.g., aggression, disruptive and conduct problems [3,4,30–34]. In turn, children with higher rates of externalizing problems lack the prerequisite (i.e., school readiness) skills to more effectively adapt to the demands of being in a structured kindergarten classroom environment, increasing their risks for social and academic problems during this important transitional period [31,32]. Consequently, an examination of the role of CR on children’s externalizing problems during this developmental period may serve as an empirical example that is of interest to researchers across multiple disciplines.


    Author information

    Affiliations

    School of Public Health, University of Alberta, Edmonton, AB, Canada

    School of Public Health and Health Management, Weifang Medical University, Weifang, Shandong Province, China

    School of Nursing, Trinity Western University & Centre for Health Evaluation and Outcomes Sciences, Providence Health Care, Langley, BC, Canada

    Department of Public Health Sciences, Queen’s University, Kingston, ON, Canada

    McGill University Health Centre, Montréal, QC, Canada

    Department of Community Health Sciences & O’Brien Institute for Public Health, University of Calgary, Calgary, AB, Canada

    Department of Mathematics and Statistics, University of Saskatchewan, Saskatoon, SK, Canada

    Division of Endocrinology, Department of Medicine, University of British Columbia, Vancouver, BC, Canada

    Department of Medicine, McMaster University, Hamilton, ON, Canada

    Department of Medicine, Faculty of Medicine, University of Toronto, Toronto, ON, Canada

    Department of Medicine, Queen’s University, Kingston, ON, Canada

    Faculty of Graduate Studies, University of Victoria, Victoria, BC, Canada

    Department of Community Health Sciences, University of Manitoba, S113-750 Bannatyne Ave, Winnipeg, MB, R3E 0W3, Canada


    Learning Individualized Treatment Rules for Multiple-Domain Latent Outcomes

    For many mental disorders, latent mental status from multiple-domain psychological or clinical symptoms may perform as a better characterization of the underlying disorder status than a simple summary score of the symptoms, and they may also serve as more reliable and representative features to differentiate treatment responses. Therefore, to address the complexity and heterogeneity of treatment responses for mental disorders, we provide a new paradigm for learning optimal individualized treatment rules (ITRs) by modeling patients’ latent mental status. We first learn the multi-domain latent states at baseline from the observed symptoms under a restricted Boltzmann machine (RBM) model, which encodes patients’ heterogeneous symptoms using an economical number of latent variables and yet remains flexible. We then optimize a value function defined by the latent states after treatment by exploiting a transformation of the observed symptoms based on the RBM without modeling the relationship between the latent mental states before and after treatment. The optimal treatment rules are derived using a weighted large margin classifier. We derive the convergence rate of the proposed estimator under the latent models. Simulation studies are conducted to test the performance of the proposed method. Finally, we apply the developed method to real world studies and we demonstrate the utility and advantage of our method in tailoring treatments for patients with major depression, and identify patient subgroups informative for treatment recommendations. Supplementary materials for this article are available online.


    Confusing Statistical Term #9: Multiple Regression Model and Multivariate Regression Model

    Much like General Linear Model and Generalized Linear Model in #7, there are many examples in statistics of terms with (ridiculously) similar names, but nuanced meanings.

    Today I talk about the difference between multivariate and multiple, as they relate to regression.

    Multiple Regression

    A regression analysis with one dependent variable and eight independent variables is NOT a multivariate regression model. It’s a multiple regression model.

    And believe it or not, it’s considered a univariate model.

    This is uniquely important to remember if you’re an SPSS user. Choose Univariate GLM (General Linear Model) for this model, not multivariate.

    I know this sounds crazy and misleading because why would a model that contains nine variables (eight Xs and one Y) be considered a univariate model?

    It’s because of the fundamental idea in regression that Xs and Ys aren’t the same. We’re using the Xs to understand the mean and variance of Y. This is why the residuals in a linear regression are differences between predicted and actual values of Y. Not X.

    (And of course, there is an exception, called Type II or Major Axis linear regression, where X and Y are not distinct. But in most regression models, Y has a different role than X).

    It’s the number of Ys that tell you whether it’s a univariate or multivariate model. That said, other than SPSS, I haven’t seen anyone use the term univariate to refer to this model in practice. Instead, the assumed default is that indeed, regression models have one Y, so let’s focus on how many Xs the model has. This leads us to…

    Simple Regression: A regression model with one Y (dependent variable) and one X (independent variable).

    Multiple Regression: A regression model with one Y (dependent variable) and more than one X (independent variables).

    Multivariate Regression

    Multivariate analysis ALWAYS describes a situation with multiple dependent variables.

    So a multivariate regression model is one with multiple Y variables. It may have one or more than one X variables. It is equivalent to a MANOVA: Multivariate Analysis of Variance.

    Other examples of Multivariate Analysis include:

    • Principal Component Analysis
    • Factor Analysis
    • Canonical Correlation Analysis
    • Linear Discriminant Analysis
    • Cluster Analysis

    But wait. Multivariate analyses like cluster analysis and factor analysis have no dependent variable, per se. Why is it about dependent variables?

    Well, it’s not really about dependency. It’s about which variables’ mean and variance is being analyzed. In a multivariate regression, we have multiple dependent variables, whose joint mean is being predicted by the one or more Xs. It’s the variance and covariance in the set of Ys that we’re modeling (and estimating in the Variance-Covariance matrix).

    Note: this is actually a situation where the subtle differences in what we call that Y variable can help. Calling it the outcome or response variable, rather than dependent, is more applicable to something like factor analysis.

    So when to choose multivariate GLM? When you’re jointly modeling the variation in multiple response variables.

    Referências

    In response to many requests in the comments, I suggest the following references. I give the caveat, though, that neither reference compares the two terms directly. They simply define each one. So rather than just list references, I’m going to explain them a little.

    1. Neter, Kutner, Nachtsheim, Wasserman’s Applied Linear Regression Models, 3rd ed. There are, incidentally, never editions with slight changes in authorship. But I’m citing the one on my shelf.

    Chapter 1, Linear Regression with One Independent Variable, includes:

    “Regression model 1.1 … is “simple” in that there is only one predictor variable.”

    Chapter 6 is titled Multiple Regression – I, and section 6.1 is “Multiple Regression Models: Need for Several Predictor Variables.” Interestingly enough, there is no direct quotable definition of the term “multiple regression.” Even so, it’s pretty clear. Go read the chapter to see.

    There is no mention of the term “Multivariate Regression” in this book.

    2. Johnson & Wichern’s Applied Multivariate Statistical Analysis, 3rd ed.

    Chapter 7, Multivariate Linear Regression Models, section 7.1 Introduction. Here it says:

    “In this chapter we first discuss the multiple regression model for the prediction of a solteiro response. This model is then generalized to handle the prediction of several dependent variables.” (Emphasis theirs).

    They finally get to Multivariate Multiple Regression in Section 7.7. Here they “consider the problem of modeling the relationship between m responses, Y1, Y2, …,Ym, and a single set of predictor variables.”

    Misuses of the Terms

    I’d be shocked, however, if there aren’t some books or articles out there where the terms are not used or defined the way I’ve described them here, according to these references. It’s very easy to confuse these terms, even for those of us who should know better.

    And honestly, it’s not that hard to just describe the model instead of naming it. “Regression model with four predictors and one outcome” doesn’t take a lot more words and is much less confusing.

    If you’re ever confused about the type of model someone is describing to you, just ask.


    Getting started with Multivariate Multiple Regression

    Multivariate Multiple Regression is the method of modeling multiple responses, or dependent variables, with a single set of predictor variables. For example, we might want to model both math and reading SAT scores as a function of gender, race, parent income, and so forth. This allows us to evaluate the relationship of, say, gender with each score. You may be thinking, “why not just run separate regressions for each dependent variable?” That’s actually a good idea! And in fact that’s pretty much what multivariate multiple regression does. It regresses each dependent variable separately on the predictors. However, because we have multiple responses, we have to modify our hypothesis tests for regression parameters and our confidence intervals for predictions.

    To get started, let’s read in some data from the book Applied Multivariate Statistical Analysis (6th ed.) by Richard Johnson and Dean Wichern. This data come from exercise 7.25 and involve 17 overdoses of the drug amitriptyline (Rudorfer, 1982). There are two responses we want to model: TOT and AMI. TOT is total TCAD plasma level and AMI is the amount of amitriptyline present in the TCAD plasma level. The predictors are as follows:

    GEN, gender (male = 0, female = 1)
    AMT, amount of drug taken at time of overdose
    PR, PR wave measurement
    DIAP, diastolic blood pressure
    QRS, QRS wave measurement

    We’ll use the R statistical computing environment to demonstrate multivariate multiple regression. The following code reads the data into R and names the columns.

    Before going further you may wish to explore the data using the summary and pairs functions.

    Performing multivariate multiple regression in R requires wrapping the multiple responses in the cbind() function. cbind() takes two vectors, or columns, and “binds” them together into two columns of data. We insert that on the left side of the formula operator:

    . On the other side we add our predictors. The + signs do not mean addition per se but rather inclusion. Taken together the formula “cbind(TOT, AMI)

    GEN + AMT + PR + DIAP + QRS” translates to “model TOT and AMI as a function of GEN, AMT, PR, DIAP and QRS.” To fit this model we use the workhorse lm() function and save it to an object we named “mlm1”. Finally we view the results with summary().

    Notice the summary shows the results of two regressions: one for TOT and one for AMI. These are exactly the same results we would get if modeled each separately. You can verify this for yourself by running the following code and comparing the summaries to what we got above. They’re identical.

    The same diagnostics we check for models with one predictor should be checked for these as well. For a review of some basic but essential diagnostics see our post Understanding Diagnostic Plots for Linear Regression Analysis.

    We can use R’s extractor functions with our mlm1 object, except we’ll get double the output. For example, instead of one set of residuals, we get two:

    Instead of one set of fitted values, we get two:

    Instead of one set of coefficients, we get two:

    Instead of one residual standard error, we get two:

    Again these are all identical to what we get by running separate models for each response. The similarity ends, however, with the variance-covariance matrix of the model coefficients. We don’t reproduce the output here because of the size, but we encourage you to view it for yourself:

    The main takeaway is that the coefficients from both models covary. That covariance needs to be taken into account when determining if a predictor is jointly contributing to both models. For example, the effects of PR and DIAP seem borderline. They appear significant for TOT but less so for AMI. But it’s not enough to eyeball the results from the two separate regressions! We need to formally test for their inclusion. And that test involves the covariances between the coefficients in both models.

    Determining whether or not to include predictors in a multivariate multiple regression requires the use of multivariate test statistics. These are often taught in the context of MANOVA, or multivariate analysis of variance. Again the term “multivariate” here refers to multiple responses or dependent variables. This means we use modified hypothesis tests to determine whether a predictor contributes to a model.

    The easiest way to do this is to use the Anova() or Manova() functions in the car package (Fox and Weisberg, 2011), like so:

    The results are titled “Type II MANOVA Tests”. The Anova() function automatically detects that mlm1 is a multivariate multiple regression object. “Type II” refers to the type of sum-of-squares. This basically says that predictors are tested assuming all other predictors are already in the model. This is usually what we want. Notice that PR and DIAP appear to be jointly insignificant for the two models despite what we were led to believe by examining each model separately.

    Based on these results we may want to see if a model with just GEN and AMT fits as well as a model with all five predictors. One way we can do this is to fit a smaller model and then compare the smaller model to the larger model using the anova() function, (notice the little “a” this is different from the Anova() function in the car package). For example, below we create a new model using the update() function that only includes GEN and AMT. The expression “.

    . – PR – DIAP – QRS” says “keep the same responses and predictors except PR, DIAP and QRS.”

    The large p-value provides good evidence that the model with two predictors fits as well as the model with five predictors. Notice the test statistic is “Pillai”, which is one of the four common multivariate test statistics.

    The car package provides another way to conduct the same test using the linearHypothesis() function. The beauty of this function is that it allows us to run the test without fitting a separate model. It also returns all four multivariate test statistics. The first argument to the function is our model. The second argument is our null hypothesis. The linearHypothesis() function conveniently allows us to enter this hypothesis as character phrases. The null entered below is that the coefficients for PR, DIAP and QRS are all 0.

    The Pillai result is the same as we got using the anova() function above. The Wilks, Hotelling-Lawley, and Roy results are different versions of the same test. The consensus is that the coefficients for PR, DIAP and QRS do not seem to be statistically different from 0. There is some discrepancy in the test results. The Roy test in particular is significant, but this is likely due to the small sample size (n = 17).

    Also included in the output are two sum of squares and products matrices, one for the hypothesis and the other for the error. These matrices are used to calculate the four test statistics. These matrices are stored in the lh.out object as SSPH (hypothesis) and SSPE (error). We can use these to manually calculate the test statistics. For example, let SSPH = H and SSPE = E. The formula for the Wilks test statistic is

    In R we can calculate that as follows:

    Likewise the formula for Pillai is

    tr means trace. That’s the sum of the diagonal elements of a matrix. In R we can calculate as follows:


    Assista o vídeo: Introdução aos testes estatísticos (Dezembro 2021).