Em formação

Que artigo discutiu as propriedades cognitivas das escalas Likert / visual analógica nas avaliações?

Que artigo discutiu as propriedades cognitivas das escalas Likert / visual analógica nas avaliações?

Parece que me lembro de um artigo recente que investigou se as classificações criadas usando os formatos Likert ou Visual Analogue Scales tinham as propriedades cognitivas dos dados de intervalo ou proporção (uma vez que são geralmente analisados ​​como tal).

Acho que uma questão central era se, por exemplo, os participantes entenderam a diferença entre 2 e 3 como sendo a diferença entre 5 e 6, mas não consigo encontrar! Isso soa sinos para alguém?


Acabei encontrando algo que pode ser o que eu estava pensando, examinando a normalidade e as propriedades psicométricas das escalas Likert com diferentes números de pontos. Eles concluíram que a escala de 11 pontos era a mais próxima dos dados do tipo intervalo em escala e normalidade.

Referência:
Uma comparação de propriedades psicométricas e normalidade em escalas Likert de 4, 5, 6 e 11 pontos. Leung, Shing-On. Journal of Social Service Research37.4 (julho de 2011): 412-421. http://dx.doi.org.ezproxy.library.tufts.edu/10.1080/01488376.2011.580697


Orientação de atenção baseada no significado em cenas conforme revelado por mapas de significado

Cenas do mundo real consistem em uma confusão de informações florescente e vibrante. Para gerenciar essa complexidade, a atenção visual é direcionada para regiões importantes da cena em tempo real 1,2,3,4,5,6,7. Que fatores orientam a atenção dentro das cenas? Uma posição teórica de liderança sugere que a saliência visual baseada em características de imagem semanticamente não interpretadas desempenha um papel causal crítico na orientação atencional, com o conhecimento e o significado desempenhando um papel secundário ou modulador 8,9,10,11. Em vez disso, propomos que o significado desempenha o papel dominante em guiar a atenção humana através das cenas. Para testar esta proposta, desenvolvemos "mapas de significado" que representam a riqueza semântica das regiões da cena em um formato que pode ser comparado diretamente à saliência da imagem. Em seguida, comparamos o grau em que as distribuições espaciais de significado e relevância predizem a atenção aberta dos espectadores dentro das cenas. Os resultados mostraram que tanto o significado quanto a saliência previram a distribuição da atenção, mas que, quando a relação entre significado e saliência foi controlada, apenas o significado foi responsável pela variação única na atenção. Esse padrão de resultados era aparente desde o primeiro ponto no tempo na visualização da cena. Concluímos que o significado é a força motriz que guia a atenção por meio de cenas do mundo real.

De acordo com as teorias de orientação de imagem, a atenção é direcionada às regiões da cena com base em recursos de imagem semanticamente não interpretados. Nesta visão, a atenção é, em um sentido fundamental, uma reação às propriedades da imagem do estímulo que confronta o espectador, com a atenção "puxada" para regiões visualmente salientes 12. A teoria mais abrangente desse tipo é baseada na saliência visual, na qual recursos básicos da imagem, como contraste de luminância, cor e orientação das bordas, são usados ​​para formar um mapa de saliência que fornece a base para a orientação atencional 8,13,14.


Juicy Conceptualizations: Aumentando a aliança através do atendimento à linguagem metafórica do cliente

Contexto: Há um interesse crescente no uso de metáforas na terapia cognitivo-comportamental. Os especialistas defendem trazer as metáforas do cliente para as conceituações de caso, mas há pouca pesquisa empírica para apoiar isso. Objetivos: Este estudo avaliou o efeito do treinamento de 12 terapeutas para atender às metáforas do cliente e trazê-las para as conceituações de caso. Método: sessões de terapia encenadas pré e pós-treinamento foram conduzidas e gravadas em vídeo. A Alliance foi avaliada por 'clientes' de dramatização e um especialista externo avaliou a qualidade das sessões e das conceituações compartilhadas. Resultados: Houve aumentos significativos em algumas classificações de aliança, com base nas classificações do "cliente" da dramatização e nas classificações externas de dramatizações de sessões de terapia antes e depois do treinamento. Quanto maior a diferença entre o terapeuta e o "cliente" em uma medida de preferência para produzir metáfora, menor será a classificação da sessão pelo "cliente" na pontuação do fator de Bond de uma medida de aliança, o Working Alliance Inventory. Esse resultado sugere que trabalhar metaforicamente pode ser mais eficaz quando o terapeuta e o cliente têm um grau semelhante de preferência por falar metaforicamente. Conclusão: Este estudo fornece suporte preliminar para a ideia de que atender às metáforas do cliente durante a conceituação pode ser benéfico para a aliança.


Resultados

A busca inicial resultou em 1.083 resumos, uma revisão manual de artigos adicionais resultou em 11 artigos, por último, uma revisão dos potenciais 439 resumos de conferências com o termo “escala” gerou três resumos em potencial. Após a triagem de resumos e textos completos e referências de triagem de fontes adicionais (resultados da revisão completa da literatura), nesta revisão, identificamos 6 artigos de revisão / consenso / opinião de especialistas e 16 artigos empíricos que forneceram orientação ou evidência sobre a seleção da escala de resposta pediátrica (Fig. . 1). Três faixas etárias (4 a 8 anos, 6 a 18 anos e 10 a 18 anos) emergiram como as mais comumente descritas na literatura.

Processo de triagem e revisão

Nos artigos de revisão e opinião de especialistas, houve um consenso geral de que o VRS de 5 pontos, incluindo escalas de Likert, era apropriado para crianças de 7 ou 8 anos de idade ou mais (Tabela 2) [2, 6]. Embora escalas gráficas ou de rosto sejam frequentemente usadas em estudos pediátricos [7, 8], alguns dos artigos de revisão observaram que evidências empíricas adicionais são necessárias para apoiar o uso dessas escalas e as idades específicas para as quais são apropriadas [2]. Há algumas evidências que apóiam o uso de uma escala de resposta aprimorada de gráficos faciais em crianças mais novas (entre as idades de 4 e 7) [9]. Para crianças de 7 ou 8 anos ou mais, alguns artigos de revisão defendem o uso de NRS ou VAS [9], enquanto outro artigo sugere que as crianças preferem um VRS a um NRS ou VAS [2]. Cohen et al. [10] observaram que a orientação visual de escalas, emoções expressas em escalas gráficas e escolha de palavras para âncoras verbais podem produzir vieses inesperados devido à imaturidade nas habilidades de pensamento abstrato dos entrevistados, por exemplo, uma criança pode escolher uma resposta numérica com base no número favorito, em vez do que a representação da experiência.

Crianças entre 4 e 8 anos

A Tabela 3 apresenta os estudos empíricos que avaliaram a escolha da escala de resposta ideal entre os mais jovens dos entrevistados (com idades entre 4 e 7 a 8). Liu et al. [5] encontraram um VRS de 4 pontos com faces gráficas para auxiliar na compreensão da escala com resposta aprimorada em crianças entre 4 e 11 anos de idade. Em um estudo que avaliou várias escalas de resposta à dor para uso em crianças com idades entre 6 e 8 anos, os resultados foram inconclusivos quanto a se uma escala Faces, NRS, VAS ou uma cor (por exemplo, as crianças selecionam uma cor associada ao nível de intensidade) , foi superior [11]. Essas escalas de resposta produziram diferentes estimativas de dor e não foram consideradas intercambiáveis ​​em crianças pequenas [11].

Crianças entre 6 e 18 anos

A Tabela 4 inclui os estudos que avaliaram escalas de respostas múltiplas dentro do mesmo estudo entre crianças de 6 anos de idade ou mais. Van Laerhoven et al. [12] encontraram uma VRS de 5 pontos a ser preferida a VAS ou NRS em crianças de 6 a 18 anos de idade, mas todos os tipos de escala mostraram confiabilidade comparável. Em contraste, Jylli et al. [13] descobriram que crianças mais novas (idades de 6 a 11 anos) em sua amostra (faixa geral entre 6 e 16 anos de idade) não compreenderam totalmente todas as palavras descritivas em um VRS de 5 pontos, e que o VRS não estava altamente correlacionado com uma dor VAS. Bailey et al. [14] encontraram VAS, NRS e VRS confiáveis ​​e válidos na avaliação da dor em crianças de 8 a 17 anos de idade, mas os escores produzidos não foram intercambiáveis. Connelly e Neville [15] descobriram que as escalas VAS, NRS e Faces tendiam a ser altamente inter-relacionadas, mas os escores eram geralmente mais altos no NRS, e que VAS e Faces eram mais responsivos a tendências decrescentes nos escores de dor em crianças entre as idades de 9 e 18 anos. Bailey et al. [16] avaliaram a correspondência entre as escalas NRS, VAS, VAS com cor e Faces em crianças de 8 a 18 anos que tinham dor abdominal e descobriram que, embora houvesse alta correspondência entre VAS e VAS com cor, o NRS não correspondem com os outros tipos de escala. Benini et al. [17] descobriram que o VAS é mais fácil para crianças de 7 a 18 anos de idade entenderem e usarem em comparação com Faces e outras escalas gráficas, especialmente para crianças com atraso de desenvolvimento leve ou moderado que sofrem de síndrome de Down ou tetraplegia espástica.

Crianças entre 10 e 18 anos

A Tabela 5 apresenta estudos que avaliaram a seleção de escalas de resposta em crianças mais velhas (10 a 18 anos). Verificou-se que o NRS produziu escores mais altos do que a escala VAS ou Faces, mas o NRS teve maior correspondência com o VAS do que com o Faces [18]. Um VRS de 5 pontos foi considerado bem aceito e compreendido [19]. Finalmente, um VRS de 5 pontos foi considerado estável, independentemente do período de recordação [20].


A avaliação da dor é uma necessidade institucional

Em um esforço para abordar a questão do tratamento inadequado da dor, a prática clínica e as diretrizes de garantia de qualidade foram publicadas pela Agência de Política e Pesquisa de Saúde (AHCPR), [3] [4] pela American Pain Society, [6] [7] ] e a Joint Commission on Accreditation of Healthcare Organizations. [67] Embora essas diretrizes sejam de escopo amplo, as considerações exclusivas para o cuidado de pessoas idosas são limitadas. Para abordar as preocupações especiais com a dor em adultos mais velhos, a American Geriatrics Society publicou diretrizes de prática clínica específicas para a avaliação e tratamento da dor em pessoas idosas, [1] [2] e a American Medical Directors Association publicou recentemente diretrizes de prática clínica para o tratamento da dor em ambientes de cuidados de longo prazo. [5] Embora essas diretrizes forneçam fontes úteis para basear as decisões da prática clínica, os painéis de especialistas recomendam fortemente que as investigações sobre a avaliação e o tratamento da dor entre idosos continuem em um esforço para desenvolver e refinar ainda mais as recomendações para a prática clínica.


Artigo ORIGINAL RESEARCH

  • Instituto de Design e Engenharia Ambiental, The Bartlett, University College London, Londres, Reino Unido

As escalas Likert são úteis para coletar dados sobre atitudes e percepções de grandes amostras de pessoas. Em particular, eles se tornaram uma ferramenta bem estabelecida em estudos de paisagens sonoras para a condução no local pesquisas para determinar como as pessoas experimentam os espaços públicos urbanos. No entanto, ainda não está claro se as métricas das escalas são interpretadas de forma consistente durante uma tarefa de avaliação típica. O presente trabalho visa identificar algumas tendências gerais na interpretação de métricas em escala Likert e introduzir um procedimento para a derivação de correções métricas por meio da análise de um conjunto de dados de estudo de caso de 984 avaliações de paisagens sonoras em 11 locais urbanos de Londres. De acordo com a ISO / TS 12913-2: 2018, as paisagens sonoras podem ser avaliadas através da escala de 8 dimensões: agradável, irritante, vibrante, monótono, agitado, sem intercorrências, calmo e caótico. A hipótese subjacente a este estudo é que existe uma ligação entre as correlações entre a porcentagem de avaliações que caem em cada categoria da escala Likert e um fator de dilatação / compressão que afeta a interpretação da métrica das escalas. O resultado desta derivação do valor de correção métrica é introduzido para a paisagem sonora, e uma nova projeção das paisagens sonoras de Londres de acordo com o espaço circunplex corrigido é comparada com o espaço circunplex ISO inicial. Os resultados gerais mostram uma interpretação geral não equidistante das escalas, principalmente na direção vibrante-monótona. As implicações dessa correção foram demonstradas por meio de uma tarefa Linear Ridge Classifier para prever as respostas da paisagem sonora de Londres usando parâmetros acústicos objetivos, o que mostra uma melhora significativa quando aplicado aos dados corrigidos. Os resultados sugerem que os valores corrigidos respondem pela interpretação não equidistante das métricas Likert, permitindo assim que as operações matemáticas sejam viáveis ​​quando aplicadas aos dados.


Melhorando a validade, confiabilidade e participação na medição de resultados de saúde auto-relatados para crianças e jovens: uma revisão sistemática do período de recordação, formato da escala de resposta e modalidade de administração

O autorrelato é o padrão ouro para medir os resultados relacionados à saúde das crianças. O desenho de tais medidas é complexo e desafiador. Esta revisão tem como objetivo avaliar sistematicamente as evidências sobre o período de recordação, formato da escala de resposta, modo de administração e abordagens necessárias para permitir que crianças e jovens com menos de 19 anos participem de autorrelatos válidos e confiáveis ​​de seus resultados de saúde.

Método

PsycInfo, Medline, CINAHL e Embase foram pesquisados ​​de 1 de janeiro de 1990 a 15 de março de 2020, e a pesquisa de citações foi realizada no Scopus. Os artigos foram incluídos se fossem pesquisas primárias ou relatos de caso de ≥ 3 participantes relatando o seguinte: período de recall, seleção de escala de resposta, modalidade de administração. A qualidade foi avaliada usando QualSyst, e os resultados sintetizados narrativamente. Esta revisão foi conduzida e relatada de acordo com as diretrizes PRISMA.

Resultados

81 de 13.215 artigos recuperados preencheram os critérios de inclusão. Crianças com menos de 5 anos não podem relatar resultados de saúde por conta própria de maneira válida e confiável. As escalas faciais demonstram melhores propriedades psicométricas do que as escalas visuais analógicas ou Likert. As escalas computadorizadas e de papel geralmente mostram validade de construto equivalente. As crianças preferem medidas informatizadas. Crianças com idade ≤ 7 anos pensam de maneira dicotômica, portanto, precisam de duas opções de resposta. Pessoas com mais de 8 anos podem usar com segurança uma escala de 3 pontos.

Conclusão

Os resultados desta revisão têm implicações clínicas e de pesquisa. Eles podem ser usados ​​para informar a escolha apropriada de PROM para uso com CYP no ambiente clínico. Também fornecemos oito recomendações para o desenvolvimento futuro de medidas de resultados auto-relatados para crianças e jovens.


Declarações de ética

Aprovação ética e consentimento para participar

O estudo foi aprovado pelo Comitê de Ética em Pesquisa de Londres - Camden e Kings Cross NHS (referência no. 15 / LO / 1999) em novembro de 2016. Termo de consentimento livre e esclarecido por escrito será dado por todos os participantes para a participação e publicação dos resultados. Isso incluirá um lembrete de que os participantes podem se retirar a qualquer momento, e seus dados serão armazenados de forma anônima e segura em arquivos trancados e discos rígidos protegidos por senha, de acordo com a Lei de Proteção de Dados do Reino Unido e o Regulamento Geral de Proteção de Dados da UE. Todos os dados publicados permanecerão anônimos. O recrutamento foi concluído no momento da revisão das provas deste artigo.

Interesses competitivos

Os autores declaram não ter interesses conflitantes.


Métodos

Material e procedimentos

A Women's Experience of Maternity Care Scale (arquivo adicional 1), foi originalmente escrita em inglês e inclui 30 itens quantitativos divididos em três seções (escalas) submetidas a um processo de avaliação: (1) cuidado pré-natal (8 itens), (2) cuidados intraparto (10 itens) e (3) cuidados pós-natal (12 itens). Uma escala Likert de sete pontos variando de 1 a 7 e correspondendo a 1 = discordo totalmente a 7 = concordo totalmente permite uma avaliação detalhada de cada item [20]. As declarações são formuladas de forma positiva, com uma exceção: "Muitas vezes achei que os médicos / parteiras eram muito apressados". Um item relacionado a uma avaliação geral foi fornecido no final de cada seção, como 'No balanço, como você descreveria seu cuidado?', Usando a mesma escala Likert de sete pontos (1 = muito ruim, 7 = muito bom) para permitir uma avaliação global de cada período com um item [25]. O questionário traduzido foi denominado ‘Échelle de Satisfaction de l’Experience des Soins en Maternité, ou ESEM (arquivo adicional 2).

Tradução e adaptação cultural

O processo de tradução e adaptação transcultural da versão inglesa para a francesa foi conduzido por método preciso e rigoroso de acordo com diretrizes recentes, utilizando as cinco etapas de tradução e adaptação transcultural desenvolvidas por Beaton, Bombardier, Guillemin e Bosi Ferraz (2000). Isso inclui tradução, síntese, retrotradução, comitê de especialistas e pré-teste. O processo neste estudo ocorreu da seguinte forma: (1) Tradução. Após a aprovação dos autores [20, 22], três tradutores profissionais realizaram três traduções independentes (2) Síntese. A partir das três traduções, um painel de especialistas (uma parteira, gerente clínico, pesquisador e palestrante) chegou a um consenso sobre cada questão (3) Retrotradução. A retrotradução para o idioma original foi realizada por dois tradutores profissionais (cegos) (especialistas na área de tradução médica) e (4) A quarta e a quinta etapas - avaliação por comitê de especialistas e pré-teste - foram realizadas simultaneamente.

Questões problemáticas foram abordadas e, em seguida, adaptadas pelo painel de especialistas, que revisou a tradução, ajudou a abordar as diferentes perspectivas e alterou os questionários de acordo, finalmente os itens específicos foram pré-testados novamente. Diretriz recente de Perneger et al. (2015) sugeriram que o número de pré-testes deve ser determinado com base nos resultados coletados e na prevalência do problema encontrado na entrevista cognitiva. Portanto, de 10 a 30 participantes podem ser necessários para os pré-testes. Neste estudo, 15 mulheres com as mesmas características da população-alvo e que atenderam aos critérios de inclusão foram obrigadas a participar do pré-teste [28]. Essas mulheres não foram incluídas na amostra. O pré-teste foi realizado por meio de entrevistas individuais (entrevista cognitiva) com o apoio de uma grade específica. A grade de apoio foi utilizada para explorar a compreensão do questionário. Foi baseado na publicação de Sousa et al. [29] e conduzido com o painel de especialistas. As questões foram detalhadas de acordo com a seção (pré-natal, intraparto e pós-natal). Foram avaliadas a forma e a clareza dos termos utilizados no questionário.As mulheres foram convidadas a comentar a clareza das instruções e a precisão das questões (por meio de considerações dicotômicas), após o que foram convidadas a explicar cada questão com suas próprias palavras. Suas opiniões foram discutidas, juntamente com os pontos atribuídos na escala Likert. As entrevistas ocorreram, por telefone, entre uma e 2 semanas após o retorno do questionário.

Processo de tradução

Algumas das perguntas traduzidas para o francês incluíam palavras adicionais em comparação com as perguntas em inglês para garantir que as mulheres entendessem o tópico levantado. Veja os seguintes exemplos:

Item da Escala de Experiências de Maternidade de Mulheres: "Fiquei feliz com o apoio emocional que recebi durante a gravidez de médicos / parteiras".

Do tradutor 1: ‘J’ai été satisfaite du soutien moral reçu de la part des médecins / sages-femmes durant ma grossesse’.

Do tradutor 2: ‘J’étais satisfaite par le soutien émotionnel dont j’ai bénéficié de la part des médecins / sages-femmes lors de ma grossesse’.

Do tradutor 3: ‘J’ai été satisfaite du soutien psychologique reçu de la part des médecins / sages-femmes pendant ma grossesse’.

O consenso da equipe foi ‘J’ai été satisfaite du soutien moral (émotionnel) reçu de la part des médecins et des sages-femmes pendant ma grossesse’.

Em retrotradução, isso se tornou "Fiquei satisfeita com o apoio moral (emocional) recebido de médicos e parteiras durante minha gravidez".

Identificamos algumas dificuldades das mulheres em responder à pergunta sobre o atendimento das parteiras versus o dos médicos. Uma explicação pode ser a falta de diferenciação entre a definição do papel do profissional e os cuidados que ele deve prestar. Isso pode ser refletido na dificuldade de responder com segurança às perguntas sobre os cuidados prestados por uma parteira em comparação com os cuidados prestados por um médico. A título de ilustração, uma mulher afirmou: ‘O médico e as parteiras foram muito apressados’ nas escalas pré-natal, intraparto e pós-natal, mas, por outro lado, ela respondeu positivamente às outras perguntas no resto do questionário. Isso talvez trate de uma questão de tradução ou redação incorreta da pergunta, o que pode diminuir a validade das respostas da mesma mulher ao longo do tempo.

Fator exploratório

A validade de construto do ESEM foi testada com a análise fatorial exploratória (EFA) [30]. A análise fatorial foi usada para investigar como as variáveis ​​observadas estavam associadas aos construtos latentes. A análise de componentes principais (PCA) foi usada para identificar o número de dimensões das três escalas e para examinar a estrutura subjacente do questionário. A adequação da amostra foi testada com o teste de esfericidade de Bartlett com base nos critérios de p & lt 0,001 e com o teste Kaiser-Meyer-Olkin (KMO) baseado em um critério de ≥0,7 [31]. Os componentes principais foram identificados com o critério de Kaiser de autovalores de 1, um exame do gráfico de cascalho Cattell e com a porcentagem de variância explicada. Finalmente, análises paralelas foram feitas para confirmar o número de componentes retidos [32]. Para identificar a estrutura fatorial de cada escala, exploramos a inter-relação entre o item e os fatores. As medidas estatísticas relatadas a partir da análise incluíram comunalidades e carregamentos de componentes. A carga fatorial de 0,30 foi considerada o mínimo aceitável, itens de pelo menos 0,45 foram considerados regulares, aqueles de pelo menos 0,55 foram considerados bons, aqueles de pelo menos 0,63 foram considerados muito bons e aqueles maiores que 0,71 foram considerados excelentes [33]. As comunalidades (soma das cargas fatoriais quadradas para cada variável) foram usadas para determinar como cada variável é explicada pelos fatores. Valores ≥0,40 foram considerados valores aceitáveis ​​[34].

Capacidade de resposta

A soma de cada escala da versão francesa de ‘Experiência feminina em cuidados à maternidade’ (ESEM) foi comparada com os valores da escala de cinco itens: ruim, ruim, bom, muito bom e excelente, usando a correlação rho de Spearman. Uma correlação acima de 0,68 garantiu a validade do construto [35]. Uma curva Receiver Operating Characteristic (ROC) foi usada para determinar os melhores valores de corte para satisfação ideal ou satisfação não ideal nas três escalas. A sensibilidade e a especificidade foram calculadas com base em valores de corte usando o índice de Youden e a área sob a curva (AUC) para indicar a relevância dos resultados, como a probabilidade de que os níveis de satisfação foram identificados de forma adequada. Na ausência de uma medida padrão ouro, a escala Likert de cinco itens (ruim, ruim, bom, muito bom, excelente), dicotomizada com excelente e muito bom versus ruim, ruim e bom durante os períodos pré-natal, intraparto e pós-natal, foi usada para discriminar entre satisfação ótima e satisfação não ideal. Esta medida e este método de discriminação foram baseados em um levantamento institucional geral da qualidade global dos cuidados de saúde, usado para determinar o algoritmo de codificação de valores problemáticos pelo Picker Institute Europe [36].

A consistência do questionário foi determinada com base na estabilidade desta ferramenta ao longo do tempo. A associação entre o escore de satisfação das três escalas e o tempo decorrido entre o parto e o preenchimento do questionário de retorno foi testada.

Consistência interna

A confiabilidade do instrumento foi estimada por meio da consistência interna calculando o alfa de Cronbach para testar a inter-relação entre os itens de cada escala (pré-natal, intraparto, pós-natal) [37]. Um alfa de Cronbach entre 0,7 e 0,9 era esperado [38].

A homogeneidade dos itens inter-relacionados para cada uma das três escalas foi medida pela correlação rho de Spearman. Para avaliar o grau de consistência entre os componentes de cada nível, a soma dos itens e o escore de satisfação geral (sem o item) foram avaliados por meio do coeficiente de correlação de Spearman. Valores de r ≤ 0,35 foi considerado uma correlação fraca, 0,36 a 67 uma correlação moderada e acima de 0,68 uma correlação forte [35]. Neste estudo, foram tentadas correlações fortes usando esses testes.

Efeitos de piso e teto

Os efeitos de piso e teto foram testados para as três escalas. O maior de 15% de valores altos ou baixos foram considerados resultados limitados do questionário e podem indicar desempenho insuficiente da escala [37].

Reprodutibilidade

O período de tempo entre o teste e o reteste foi de 1 mês [37]. Esse período de tempo foi selecionado para evitar viés de memória e levando em consideração as responsabilidades de uma nova mãe e a dificuldade potencial em enviar o questionário imediatamente após o parto. Este elemento foi consistente com um estudo anterior [39].

Confiabilidade

A confiabilidade relativa foi calculada para cada escala usando coeficientes de correlação intraclasse (ICC) e intervalos de confiança. O ICC mede a variabilidade entre os resultados individuais e o erro dos coeficientes de medição foi tentado um mínimo de & gt 0,70 [40, 41].

O erro padrão de medição (SEM) e a porcentagem de SEM permitem a avaliação da confiabilidade absoluta do reteste [40]. O SEM foi utilizado para avaliar a precisão do instrumento entre duas avaliações em cada escala. A menor diferença real (SRD) e a porcentagem de SRD entre as duas medidas também foram estimadas em cada escala [42]. Nesta amostra, a menor mudança foi buscada [37].

Acordo

O gráfico de Bland-Altman foi usado para medir o limite de concordância. Os erros padrão de medição e a proporção de concordância foram usados ​​para verificar a estabilidade de cada escala no instrumento ao longo do tempo e para avaliar o limite de flutuação aceitável [41, 43]. Para garantir a estabilidade do instrumento, um número mínimo de outliers deve ser usado.

Aceitabilidade

Para avaliar a aceitabilidade do ESEM, examinamos a taxa de devolução e o tempo entre o envio e o recebimento do questionário devolvido. A quantidade de dados faltantes e a distribuição das respostas foram avaliadas. Os dados que faltam para cada escala foram listados. Se um ou dois itens não fossem concluídos, eles eram substituídos pela média dividida pelo número de itens concluídos. Se mais de dois itens não foram preenchidos, a seção não foi incluída na análise.

Validade convergente

Várias medidas são necessárias para demonstrar a validade convergente. Neste estudo, este teste não pôde ser realizado de forma eficaz devido à falta de escalas francesas validadas de forma semelhante na área de cuidado perinatal que avaliassem a satisfação pré-natal durante o trabalho de parto e pós-parto [18].

Variáveis ​​independentes

Os dados demográficos incluíram idade do participante, naturalidade, escolaridade, estado civil, ocupação, renda familiar anual e uso de tabaco. Os resultados obstétricos foram extraídos dos prontuários médicos e incluíram a idade gestacional, paridade, tipo de parto, indução do parto e analgesia.

Análise estatística

Foram realizadas análises descritivas dos escores por escala (escores mínimo e máximo, média e desvio padrão ou intervalo interquartil). O processo de exame das propriedades psicométricas foi realizado com pontuação contínua. Os dados foram testados por meio do teste de Kolmogorov-Smirnov para verificar a normalidade da distribuição. São apresentados o número e as porcentagens de problemas obstétricos e neonatais. A regressão linear foi utilizada para estimar as associações entre o tempo de devolução do questionário e o escore de satisfação nas três escalas.

Conforme mencionado acima, a consistência interna foi avaliada com o alfa de Cronbach. A homogeneidade dos itens inter-relacionados foi medida usando o coeficiente de correlação rho de Spearman. O coeficiente de confiabilidade do resultado foi calculado para cada escala usando o ICC com intervalo de confiança (IC) de 95%. O nível de significância estatística foi considerado p & lt 0,05. As médias da diferença foram apresentadas usando o método do gráfico de Bland-Altman e o erro padrão de medição (SEM = DP diff / √2) [42].

Tamanho da amostra

Não há nenhuma recomendação científica válida a priori para determinar a adequação de um tamanho de amostra que tem sido recomendado em diretrizes para validar escalas de medição com um parâmetro principal, como a análise fatorial [44,45,46]. A maioria dos estudos empregou estratégias empíricas para estimar um tamanho de amostra adequado, como uma proporção do número de itens por assunto - por exemplo, 1: 5 ou 1:10 [47] - ou um sistema de classificação que avalia os itens em cinco classificações, variando de 100 assuntos (ruim) a 1000 assuntos (excelente) [45, 46]. O referencial teórico definido por MacCallum para estimar o tamanho da amostra pode ser confirmado apenas a posteriori. Nesta estrutura, os tamanhos das amostras são independentes do número de itens da pesquisa. MacCallum sugere que, com base na simulação de Monte Carlo, a qualidade dos dados pode ser usada para determinar um tamanho de amostra adequado. Em sua teoria, a qualidade dos dados é verificada pelo grau de variação entre as variáveis, como a avaliação do nível de comunalidade (a parte da variância explicada por fatores comuns) [48].

No presente estudo, os resultados analisados ​​incluíram uma forte carga fatorial a posteriori (acima de 0,7) e altas comunalidades (acima de 0,6) para a maioria das variáveis. Esses resultados mostram que uma amostra de N = 200 seria suficiente para explorar nossa questão de pesquisa e propriedades psicométricas, o que apóia a hipótese de MacCallum para estimar o tamanho da amostra [48].

Amostra

Os participantes foram recrutados em uma sala de espera antes da consulta pré-natal ou durante sua primeira ou segunda consulta pré-natal no Hospital Universitário de Genebra (HUG). As inscrições foram realizadas pela equipe de pesquisa e pelas parteiras do hospital em dias de trabalho após verificação dos critérios de elegibilidade. O método de amostragem de conveniência foi usado na inscrição. Esta maternidade é a maior maternidade pública na parte francesa da Suíça, com 4.000 nascimentos anuais. As mulheres elegíveis tiveram gestações de baixo risco, de acordo com as normas institucionais, incluindo sem história obstétrica patológica, como pré-eclâmpsia, restrição de crescimento intrauterino, parto prematuro ou aborto espontâneo. Além disso, as mulheres elegíveis não tinham condições médicas patológicas, como hipertensão, diabetes, doença renal, trombocitopenia, hemoglobinopatia ou distúrbios psiquiátricos, e precisavam ter uma situação psicossocial estável, ser capazes de ler francês e ter um parto previsto neste hospital. As mulheres que aceitaram participar preencheram o termo de consentimento por escrito e forneceram dados socioeconômicos durante a consulta de pré-natal. Para medir a qualidade da satisfação global do atendimento recebido durante os três períodos - pré-natal, intraparto e pós-natal - uma escala de Likert de cinco itens (ruim, ruim, bom, muito bom, excelente) fez parte de uma pesquisa institucional geral e foi preenchida separadamente para o ESEM. Essas medidas foram utilizadas anteriormente no levantamento institucional geral.

Coleção de dados

A coleta de dados foi processada em diferentes formulários. A primeira parte foi preenchida pelas mulheres no momento da inscrição e assinatura do Termo de Consentimento Livre e Esclarecido. Esta primeira parte foi em papel e as questões envolviam dados sociodemográficos. Os dados obstétricos foram extraídos dos prontuários dos pacientes. Dois meses após o parto, as mulheres receberam o questionário ESEM, em papel, por correio (em casa). Eles podem enviar o questionário de volta no envelope de devolução (pré-pago e endereçado). Esse método foi escolhido porque nem todas as mães usavam a Internet em 2013–2014 e há algumas disparidades sociais na Suíça em relação ao acesso à Internet. Se os participantes não respondessem inicialmente, eles eram chamados por telefone e, posteriormente, uma carta enviada pelo correio para melhorar as taxas de resposta. O questionário foi enviado 2 meses após o nascimento de acordo com a metodologia utilizada por outros autores [24,25,26]. O atraso da publicação ocorreu devido às agendas de trabalho dos autores, processos editoriais e de revisão por pares.

Processamento de dados

Os resultados foram analisados ​​no SPSS versão 22, exceto a análise fatorial exploratória, a Receiver Operating Characteristic e as figuras, que foram produzidas no Stata 12.

Enquadramento ético

As informações fornecidas foram coletadas após a obtenção dos formulários de consentimento do paciente durante a consulta pré-natal pelas parteiras e pela equipe de pesquisa. Este protocolo foi aprovado pela Comissão de Ética do Departamento de Maternidade-Pediatria do HUG e está registrado sob o CER 11–242.


Revisão das Medidas

Auto-relato de intensidade de dor

Em adultos, tem sido recomendado que a intensidade da dor seja avaliada pedindo aos pacientes que classifiquem sua dor em uma escala numérica, com 0 indicando que não há dor e 10 indicando a pior dor possível (Dworkin et al., 2005). Por causa da compreensão mais limitada das crianças de conceitos numéricos, uma variedade de outras escalas de avaliação foram desenvolvidas nas quais as crianças fornecem uma representação gráfica da intensidade da dor marcando um ponto em uma linha (VAS), apontando ou colorindo um determinado nível de dor “Termômetro”, selecionando de uma série de rostos que representam diferentes níveis de dor ou contando diferentes números de objetos simples e tangíveis, como fichas de pôquer que permitem que a criança indique mais ou menos dor.

VAS normalmente consiste em uma linha horizontal de 100 mm com âncoras indicando “sem dor” no ponto final esquerdo e “pior dor possível” (ou um termo comparável) no ponto final direito. A criança faz uma marca vertical na linha para indicar quanta dor ela sente. Os escores de intensidade da dor são calculados medindo-se a distância do ponto final esquerdo da escala até a marca da criança. O texto exato das âncoras varia de estudo para estudo. Os exemplos incluem: “sem dor” versus “dor muito forte”, “pior dor de todas”, “dor extrema”, “dor tão forte quanto poderia ser” e “muita dor” (Hicks, von Baeyer, Spafford, van Korlaar, & amp Goodenough, 2001 Polkki, Pietila, & amp Vehvilainen-Julkunen, 2003).

Evidências extensas apóiam as classificações de dor VAS como indicadores válidos da experiência de dor das crianças. Foi demonstrado que as pontuações VAS das crianças se correlacionam significativamente com as avaliações dos pais sobre a dor das crianças (Luffy & amp Grove, 2003 Varni, Thompson e amp Hanson, 1987) e com as avaliações do pessoal médico (Gragg et al., 1996). As pontuações VAS correlacionam-se positivamente com as pontuações obtidas em outras escalas de dor, como o Oucher (Aradine, Beyer, & amp Thompson, 1988 Beyer & amp Aradine, 1987), a Escala de Cor Eland (Guariso et al., 1990), várias escalas de faces (Hunfeld , van der Wouden, den Deurwaarder, van Suijlekom-Smit, & amp Hazebroek-Kampschreur, 1997), e a escala COMFORT (van Dijk et al., 2000). As pontuações VAS se correlacionam positivamente com indicadores de doença comumente associados à dor, como inchaço nas articulações e gravidade da doença em crianças com artrite (Schanberg, Keefe, Lefebvre, Kredich, & amp Gill, Scott, Ansell, & amp Huskinsson, 1977, 1977) e recuperação pós-operatória ( Beyer & amp Aradine, 1987). As pontuações VAS demonstraram ser sensíveis a mudanças na dor após medicamentos analgésicos (Romsing, Moller-Sonnergaard, Hertel, & amp Rasmussen, 1996) e intervenção psicológica no manejo da dor (Powers, Blount, Bachanas, Cotter e amp Swan, 1993).

A estabilidade de qualquer avaliação de dor de autorrelato é necessariamente limitada pela estabilidade da experiência de dor das crianças. Portanto, altas correlações teste-reteste não seriam necessariamente esperadas. Por exemplo, Gragg et al. (1996) obtiveram correlações teste-reteste de 6 meses de 41 para pacientes de 8 a 16 anos com doença reumática. Van Dijk et al. (2000) relataram confiabilidade teste-reteste de.58 em uma amostra de pré-escolares testada em intervalos de 3 horas após a cirurgia.

As vantagens do VAS incluem facilidade de administração, baixo custo e o fato de que a escala produz dados de proporção. O VAS foi recomendado como o mais apropriado para crianças com mais de 8 anos de idade (Stinson et al., 2006). É importante notar que as alterações no formato VAS podem criar mudanças significativas nas propriedades psicométricas da escala. Por exemplo, Tesler et al. (1991) adicionaram os rótulos verbais de: "pouca dor", "dor média" e "grande dor" em pontos regulares ao longo de uma linha ancorada "sem dor" e "pior dor possível". A escala resultante, chamada Word-Graphic Rating Scale, é uma escala ordinal ao invés de uma escala de razão, as distâncias entre as descrições verbais não são iguais (Sinkin-Feldman, Tesler, & amp Savedra, 1997).Limitações semelhantes se aplicam à Escala do Descritor de Palavras (Whaley & amp Wong, 1987), que inclui descritores de: "sem dor", "pouco", "médio", "bastante", "muito ruim" e "pior dor" ao longo de uma linha horizontal.

Alguns autores adicionaram marcadores numéricos ao longo do VAS (por exemplo, em intervalos de 5 ou 10 pontos) (Jay, Elliott, Katz, & amp Siegel, 1987), no entanto, esta prática foi criticada porque os números preferidos ou familiares podem ser escolhidos com mais frequência (Huskisson, 1983 McGrath, 1990). Polkki et al. (2003) descobriram que as crianças mais novas compreenderam a ideia de combinar um ponto mais alto com maior dor ao usar uma VAS orientada verticalmente melhor do que a correspondência da esquerda para a direita associada a uma VAS de linha horizontal. No entanto, Huskisson relatou que os indivíduos são mais propensos a selecionar os desfechos extremos quando o VAS é apresentado verticalmente em vez de horizontalmente. Os VASs se qualificam para uma classificação de "bem estabelecido".

Escalas de rosto consistem em um conjunto de desenhos de linhas ou fotografias de rostos que retratam estados de dor (Chambers et al., 1999). Eles são considerados apropriados para crianças porque não empregam palavras sofisticadas ou valores numéricos abstratos. A psicometria geralmente tem sido forte para essas escalas. Como exemplos, foi demonstrado que as escalas de rostos estão altamente correlacionadas com outros índices de autorrelato (Spafford, von Baeyer, & amp Hicks, 2002), avaliações de pais e enfermeiras (Chambers et al., 1999), medidas comportamentais de dor (MacLaren & amp Cohen, 2005), e ser sensível a intervenções analgésicas e não farmacológicas (Gold, Hyeon Kim, Kant, Joseph, & amp Rizzo, 2006 Spafford et al., 2002), para diminuir durante o pós-procedimento (Paik & amp Ahn, 2002 Smith, Shah, Goldman, & amp Taddio, 2007), e para variar dependendo do estímulo da dor (por exemplo, diferentes imunizações Wood et al., 2004).

O afeto retratado nas âncoras das diferentes escalas de faces não é consistente em todas as escalas e foi descoberto que influencia as respostas das crianças. Por exemplo, a âncora de rosto sorridente na extremidade inferior da Escala de Avaliação de Dor Faces de Wong-Baker pode influenciar os escores de dor das crianças, uma vez que muitas crianças em situações médicas não estão sorrindo e felizes (Chambers & amp Craig, 1998 Chambers, Hadial, Craig, Court, & amp Mongomery, 2005). Por outro lado, o fato de a face mais angustiada das seis faces estar chorando pode fazer com que algumas crianças não escolham essa face a menos que elas mesmas estejam chorando (McCaffery, 2002).

McGrath (1987) também levantou a preocupação de que rostos com escalas numéricas ao lado deles possam confundir o componente afetivo da dor (presumivelmente capturado nos rostos) e a intensidade da dor (refletida nos números). Finalmente, não se pode presumir que as escalas de faces produzem dados de intervalo ou proporção, mesmo que cada face seja rotulada com um número inteiro. Na melhor das hipóteses, os dados devem ser considerados ordinais; os intervalos entre os estímulos podem muito bem ser desiguais da perspectiva da criança (McGrath, de Veber & amp Hearn, 1985).

Uma escala de rostos populares, The Oucher (Beyer, 1984, 2000 Beyer & amp Knott, 1998), fornece diferentes fotografias para crianças brancas, hispânicas e negras. Os rostos retratados no Escala de faces Wong-Baker (Wong & amp Baker, 1988) e o Escala de dor facial revisada (FPS-R Hicks et al., 2001), duas outras medidas de escala de faces comumente usadas, são desenhos de linha sem distinções de etnia. As escalas Oucher e Wong-Baker atribuem um valor numérico a cada face (por exemplo, 0-5). A escala Wong-Baker também adiciona descritores de palavras a cada rosto (não machuca, dói um pouco, dói muito, etc.) e o Oucher é orientado em uma orientação vertical semelhante a um termômetro. O FPS-R contém seis faces, variando de uma expressão neutra a uma de dor intensa, mas sem lágrimas, e essas faces podem ser numeradas 0, 2, 4, 6, 8 e 10, o que fornece uma aproximação do 0 comumente usado –10 métrica. Além disso, o FPS-R foi traduzido para mais de 30 idiomas e recebeu considerável suporte empírico. Este grupo classificou o Wong-Baker como "bem estabelecido", o Oucher como "bem estabelecido" e a Escala de Dor Faces Revisada como "bem estabelecida".

A ferramenta de fichas de pôquer ou Pieces of Hurt Tool (Hester, 1979 Hester, Foster, & amp Kristensen, 1990) é uma medida de intensidade de dor muito simples, consistindo em quatro chips vermelhos que representam "pedaços de dor" (com um chip indicando um pouco machucado e todos os quatro chips indicando o mais machucado que uma criança poderia ter) Essa medida direta e concreta tem sido usada com pré-escolares de uma variedade de culturas, incluindo crianças taiwanesas (Suraseranivongse et al., 2005) e jordanianas (Gharaibeh & amp Abu-Saad, 2002). As pontuações tendem a se correlacionar com outras medidas de dor de autorrelato, como o Oucher, descritores de palavras e faces (Gharaibeh & amp Abu-Saad, 2002 Goodenough et al., 1997), e com observações comportamentais verbais, vocais, faciais e comportamentos motores indicativos de dor (Hester). Como seria de se esperar, o acordo pai-filho ou enfermeira-filho usando a ferramenta de fichas de pôquer é normalmente significativo, mas moderado (rs = 0,23 −,70). As pontuações da Poker Chip Tool mostram as diminuições esperadas após a administração de analgésicos (Romsing et al., 1996). A ferramenta Poker Chip parece ter a maior utilidade como uma ferramenta de avaliação clínica simples para identificar a presença / ausência de dor e estimativas muito grosseiras da intensidade da dor em crianças pequenas. Foi recomendado para uso em crianças de 3 a 4 anos de idade para dor pós-operatória e relacionada a procedimentos agudos (Stinson et al., 2006). A ferramenta de fichas de pôquer foi classificada como "bem estabelecida".

Questionário e Diários

Quatro medidas de automonitoramento foram selecionadas com base em sua frequência de uso na literatura de avaliação da dor. Essas medidas de automonitoramento são semelhantes no que diz respeito ao preenchimento dos informantes e às dimensões da dor avaliadas. No entanto, as medidas diferem no que diz respeito à amostra de padronização ou amostra de validação, propriedades psicométricas e o grau de sensibilidade cultural. Essas medidas são mais comumente usadas em populações de crianças com dor recorrente ou crônica que requer monitoramento prospectivo.

The Headache Diary (Richardson et al., 1983) é uma medida de autorrelato usando uma escala de 0-5 com instruções para o paciente completar avaliações em horários específicos do dia (por exemplo, café da manhã, almoço, jantar e hora de dormir). The Headache Diary se originou no Canadá (Richardson et al., 1983) e tem sido usado nos Estados Unidos (Andrasik, Burke, Attanasio, & amp Rosenblum, 1985) e na Holanda (Langeveld, Koot, & amp Passchier, 1999). O Diário da Cefaleia oferece classificações prospectivas de dor e é fácil de preencher. No entanto, os diários podem conter menos gravações do que o ideal devido ao não cumprimento das classificações (van de Brink, Bandell-Hoekstra e amp Abu-Saad, 2001). Além disso, as discrepâncias nas classificações parecem ocorrer para classificações de dor “leve” e “leve”, especialmente quando mudanças na atividade são estipuladas (Richardson et al., 1983). The Headache Diary mostrou sensibilidade aos efeitos do tratamento em pesquisas de intervenção em dor de cabeça (McGrath et al., 1992 Richter et al., 1986). O Diário da Cefaléia foi classificado como “bem estabelecido”.

O diário da dor (Hunfeld et al., 2001 Hunfeld et al., 2002) emprega uma linha horizontal de 100 mm para avaliar a intensidade, frequência e duração da dor. Ele pode ser usado em todos os tipos de dor. Semelhante ao Diário de Dor de cabeça, as avaliações são feitas em horários específicos do dia. Uma concordância significativa entre as avaliações dos jovens e dos pais da atividade da dor de cabeça no Diário da Dor foi relatada por um período de 4 semanas (Richardson et al., 1983) e após uma intervenção de 10 sessões usando relaxamento ou biofeedback de temperatura (Andrasik et al. ., 1985). Enquanto o Diário da Dor pode gerar informações sobre situações que podem estar associadas à dor, ele se concentrou na dor recorrente e só tem uma forma substituta dos pais para crianças menores de 12 anos de idade (Hunfeld et al., 2001, 2002). O Diário da Dor recebeu uma classificação de "bem estabelecido".

A ferramenta de avaliação da dor pediátrica de Abu-Saad (PPAT, Abu-Saad et al., 1990) é um questionário elaborado para avaliar a dor em crianças em idade escolar. Ele foi originalmente desenvolvido na Holanda e avalia vários aspectos da dor, como os gatilhos da dor e o tipo e a quantidade do medicamento. Consiste em descritores de 30 palavras de aspectos sensoriais, afetivos e avaliativos da dor com base no trabalho de Melzack e Torgerson (1971) e usa uma escala de 10 cm para medir a dor presente e pior. O PPAT foi administrado a crianças com dores relacionadas com a doença, bem como a crianças submetidas a cirurgia (Abu-Saad, 1994 Abu-Saad et al., 1990). Apoiando a validade do construto e a utilidade clínica do PPAT está a evidência de mudanças nos escores de dor desde a administração antes até a pós-analgesia (Abu-Saad, Pool, & amp Tulkens, 1994). O PPAT foi administrado a crianças árabes-americanas (Abu-Saad, 1984) e jordanianas (Gharaibeh & amp Abu-Saad, 2002) para determinar aspectos culturais específicos da avaliação da dor. Em termos de confiabilidade, a consistência interna do PPAT (Abu-Saad et al., 1990) tem sido adequada. Correlações significativas entre as avaliações da criança, dos pais, da enfermeira e do médico da dor presente e da pior dor foram encontradas para o PPAT (Abu-Saad, 1994) e as correlações entre as avaliações da intensidade da dor para o PPAT foram variáveis ​​e dependentes da população de pacientes ( isto é, artrite reumatóide juvenil, câncer, pós-operatório). No entanto, as correlações não foram significativas entre a frequência e a intensidade da cefaleia no Diário de Cefaleia e a escala de 10 cm no PPAT (van de Brink et al., 2001), bem como as informações da entrevista ou questionário (Laurell, Larson, & amp Eeg- Ologsson, 2003). O PPAT recebeu uma classificação de "se aproximando bem estabelecido".

Questionário de dor pediátrica de Varni / Thompson (PPQ Varni & amp Thompson, 1985) é um questionário multidimensional para avaliar a dor na infância, com formulários separados para o paciente pediátrico, pais e médico. Foi modelado de acordo com o instrumento de avaliação da dor em adultos mais amplamente utilizado, o Questionário de Dor McGill (Melzack, 1975). O PPQ avalia as percepções do médico, do paciente e dos pais sobre a experiência de dor do paciente em um formato apropriado para o desenvolvimento. Mais especificamente, este instrumento mede a intensidade da dor, a localização e as qualidades sensoriais, avaliativas e afetivas da dor. Os diferentes formulários usam formatos diferentes, como o uso de cores para crianças mais novas e termos descritivos para adolescentes. A utilidade clínica do PPQ se concentrou principalmente em duas populações de pacientes, JRA (Thompson, Varni, & amp Hanson, 1987) e doença falciforme (SCD) (Walco & amp Dampier, 1990), e foi investigado em crianças com dor crônica ( Walco, Sterling, Conte & amp Engel, 1999). O PPQ foi traduzido para vários idiomas, incluindo dinamarquês, francês para a França e para o Canadá, norueguês, português para o Brasil, espanhol para os Estados Unidos e sueco (www.pedsql.org). Em termos de psicometria, boas estimativas de teste-reteste para intervalos de 1 semana, 3 semanas e 6 meses e correlações entre as avaliações da criança, dos pais, da enfermeira e do médico da dor presente e da pior dor foram encontradas para o PPQ (Gragg et al. Thompson et al. Walco & amp Dampier). Além disso, foram obtidas avaliações cruzadas de informantes significativas, mas as correlações foram maiores entre pais e filhos em comparação com aqueles com médicos. Por último, para crianças com SCD, as avaliações dos pais e do médico VAS foram preditivas das estimativas do médico de deficiência (Walco & amp Dampier, 1990). O grupo de trabalho classificou o PPQ como "bem estabelecido".

Escalas de observação do comportamento para avaliar a dor e a angústia comportamental

Escalas de observação comportamental são usadas para avaliar a exibição de comportamentos dos pacientes que são indicativos de dor e angústia. Eles utilizam monitoramento objetivo de comportamentos operacionalmente definidos, subjetivamente exibidos e observáveis. Supõe-se que a ansiedade, o medo e outras formas de angústia comportamental se misturam e coexistem com a experiência da dor. Freqüentemente, os termos sofrimento comportamental e dor são usados ​​alternadamente. Na verdade, a natureza entrelaçada dos aspectos sensoriais da experiência da dor e dos estados afetivos concomitantes é consistente com a definição de dor proposta pela Associação Internacional para o Estudo da Dor (IASP 1979) como, “A dor é uma experiência sensorial e emocional desagradável associada com dano real ou potencial ao tecido, ou descrito em seus termos ”(p. 249).

As medidas de observação comportamental da dor são particularmente aplicáveis ​​para crianças mais novas, crianças com deficiências cognitivas ou durante os momentos em que a criança está muito angustiada para indicar seu nível de dor, como antes, durante ou logo após as injeções dolorosas (von Baeyer & amp Spagrud, 2007) . Assim como o autorrelato, as manifestações comportamentais de comportamentos de dor também estão sujeitas aos efeitos de minimização, exagero e à influência de variáveis ​​sociais e outras variáveis ​​contextuais. Dados os pontos fortes e as falhas inerentes a qualquer método de avaliação, recomendamos que, quando apropriado, use uma combinação de observação comportamental e métodos de autorrelato.

Com escalas de observação para adolescentes, crianças e bebês, comportamentos como dizer "ai", choro, necessidade de contenção, caretas faciais e postura são exemplos de índices de comportamento socialmente aceitos, empiricamente suportados e que refletem a experiência de dor durante procedimentos médicos. Muitas das escalas de observação comportamental foram desenvolvidas para estudar a dor e o desconforto comportamental em crianças e adolescentes com câncer que apresentavam aspirações dolorosas da medula óssea e procedimentos de punção lombar. Como tal, eles foram projetados para capturar reações a procedimentos médicos agudos, intensos e dolorosos que muitas vezes eram realizados em um contexto emocional forte e frequentemente social (por exemplo, na presença da equipe médica e talvez dos pais). Os procedimentos médicos tiveram um ponto de início definido e as observações ocorreram em momentos específicos antes, durante e após o procedimento médico. Codificadores treinados observam as reações comportamentais das crianças ou codificam fitas de vídeo das reações das crianças aos procedimentos.

A escala de avaliação comportamental procedimental (PBRS) foi desenvolvido por Katz, Kellerman e Siegel em 1980. O PBRS incluía originalmente 25 comportamentos, depois 13 e, eventualmente, 11 na versão revisada (PBRS-R Katz, Kellerman & amp Ellenberg, 1987). Esses 11 comportamentos são chorar, agarrar, dor verbal, gritar, parar, mangual, posições de recusa, conter, rigidez muscular, suporte emocional, e solicita rescisão. Cada comportamento foi monitorado como presente ou ausente em cada uma das quatro fases do procedimento médico. Esses comportamentos foram então totalizados para obter uma pontuação total do PBRS. A desvantagem do PBRS, conforme projetado originalmente, é que ele não leva em consideração exibições repetidas de um comportamento na mesma fase, o que provavelmente afetaria a sensibilidade. O PBRS foi muito valioso como uma das primeiras medidas observacionais de angústia. O PBRS foi classificado como "quase bem estabelecido".

A Escala Observacional de Angústia Comportamental (OSBD, Jay et al., 1983) e a versão revisada (OSBD-R, Elliott et al., 1987) estão entre as escalas mais amplamente utilizadas nesta categoria. O OSBD original continha 11 comportamentos definidos operacionalmente que eram indicativos de perigo. O número de comportamentos de angústia no OSBD-R foi reduzido para oito. Tanto o OSBD quanto o OSBD-R são únicos, pois os comportamentos de angústia são ponderados em uma escala de 1 a 4 pontos para refletir a intensidade da angústia. Exemplos incluem busca de informações e chorar, ponderado em 1,5, e gritar, restrição física, e mangual, ponderado em 4. 0. Elliott et al. encontraram correlações mais altas entre as avaliações dos enfermeiros e das crianças de medo e dor ao usar pontuações ponderadas em vez de não ponderadas. Os comportamentos são registrados como ocorrendo ou não em intervalos de 15 segundos nas quatro fases do procedimento médico. Normalmente, essas pontuações de fase são adicionadas para produzir uma pontuação de distress da sessão inteira. O OSBD / OSBD-R foi classificado como "bem estabelecido".

A escala de interação de procedimentos médicos de crianças e adultos (CAMPIS Blount et al., 1989) e o CAMPIS-Revised foram desenvolvidos em parte com base no OSBD. O CAMPIS inclui uma subescala de sofrimento infantil na qual os comportamentos são registrados com base em sua frequência de ocorrência nas fases que ocorrem antes, durante e depois dos eventos médicos. Esses comportamentos podem então ser somados para obter uma pontuação total por fase ou agrupados em categorias, incluindo angústia apreensiva ou antecipatória (solicitar apoio emocional, busca de informações, e medo verbal) e sofrimento demonstrativo (chorar, gritar, resistência verbal, dor verbal, e emoção verbal) (Blount, Sturges & amp Powers, 1990). Códigos de comportamento adicionais no CAMPIS são indicativos de enfrentamento infantil e outros comportamentos que as crianças exibem durante procedimentos médicos. O CAMPIS também inclui 17 comportamentos que podem ser realizados por pais, equipe médica ou outros adultos que possam acompanhar a criança durante os tratamentos médicos. A versão revisada do CAMPIS agrupa esses comportamentos em seis códigos (CAMPIS-R Blount et al., 1997, 1990). Além de um sofrimento infantil subescala, os outros cinco códigos CAMPIS-R são criança enfrentando, criança neutra, promoção de sofrimento adulto, promoção de enfrentamento adulto, e adulto neutro comportamentos. Para medir a angústia, foram utilizadas as taxas e proporções dos comportamentos de angústia, com boa validade para ambas as métricas (Blount et al., 1997). O CAMPIS-Short Form (Blount, Bunke, Cohen, & amp Forbes, 2001) foi desenvolvido para fornecer um método mais fácil e rápido de classificar os códigos CAMPIS-R. Recentemente, o CAMPIS foi modificado para uso em ambientes perioperatórios, com a introdução da Escala de Interação de Procedimentos Médicos Perioperatórios Criança-Adulto (P-CAMPIS Caldwell-Andrews, Blount, Mayes, & amp Kain, 2005) e para avaliar o sofrimento infantil (CAMPIS -Infant Version ou CAMPIS-IV Devine, Blount, Cheng, Seri, & amp Simons, 2006). Tanto o P-CAMPIS como o CAMPIS-IV medem as mesmas dimensões que o CAMPIS-R. O CAMPIS / CAMPIS-R foi classificado como “bem estabelecido”.

A Lista de Verificação de Comportamento do Procedimento (PBCL LeBaron & amp Zeltzer, 1984) é uma escala de observação direta e uma escala de classificação de sofrimento comportamental. Oito comportamentos são codificados como ocorrendo ou não antes, durante e depois do procedimento médico. As ocorrências são classificadas em uma escala de 1 a 5 pontos para intensidade, com âncoras de muito leve a extremamente intenso.Após a conclusão do período de observação, essas classificações são adicionadas para produzir uma pontuação PBCL total. O PBCL foi classificado como "bem estabelecido".

Para evitar redundância nos relatórios e dada a consistência nos resultados dessas medidas, a psicometria para o PBRS, OSBD, CAMPIS e PBCL será descrita em conjunto posteriormente. Entre essas quatro medidas, a confiabilidade entre avaliadores é adequada a excelente (Blount et al., 1997 Chen, Craske, Katz, Schwartz, & amp Zeltzer, 2000 Jay et al., 1983 Katz et al., 1987) e a consistência interna é boa para o OSBD-R (Elliott et al., 1987). Existem fortes evidências que apóiam a validade de cada uma dessas medidas. As pontuações de angústia correlacionam-se negativamente com a idade da criança (Jay et al. LeBaron & amp Zeltzer, 1984), positivamente com a ansiedade (por exemplo, Jay et al. Frank, Blount, Smith, Manimala e amp Martin, 1995 LeBaron & amp Zeltzer), e positivamente com relatos dos pais sobre a dor e angústia da criança durante procedimentos médicos anteriores (Jay et al. Frank et al.). O sofrimento das crianças durante as fases antecipatórias não dolorosas do procedimento médico previu até 86% da variação do sofrimento das crianças durante a fase dolorosa dos procedimentos de BMA / LP (Blount et al., 1990). O comportamento dos pais e da equipe médica durante o procedimento médico foi considerado responsável por 53% da variação no sofrimento infantil (Frank et al., 1995). A utilidade clínica foi demonstrada pela sensibilidade aos efeitos de intervenções de base psicológica e / ou farmacológica (Cohen, Blount, Cohen, Schaen, & amp Zaff, 1999 Jay, Elliott, Fitzgibbons, Woody e amp Siegel, 1995). Além disso, as descobertas usando subescalas adicionais do CAMPIS / CAMPIS-R produziram resultados que informam diretamente o desenho dos programas de intervenção de tratamento (Blount, Bunke, & amp Zaff, 2000).

O PBRS, OSBD, CAMPIS e PBCL foram usados ​​com pacientes pediátricos submetidos a vários procedimentos médicos, atestando sua ampla aplicabilidade. Esses procedimentos incluem crianças submetidas a reparo de laceração (Luhmann, Kennedy, Porter, Miller, & amp Jaffee, 2001), injeções de imunização de rotina (Blount et al., 1997), punção venosa (MacLaren & amp Cohen, 2005 Smith et al., 2007), queimadura lesões (Elliott & amp Olson, 1983), regimes de fisioterapia dolorosa (Miller, Johanna-Murphy, & amp Zhelezniak, 2001), procedimentos de uretografia urinária miccional (Salmon & amp Pereira, 2002 Zelikovsky, Rodrigue, Gidyzc, & amp Davis, 2000) e cirurgia ambulatorial (Caldwell-Andrews et al., 2005). Além disso, partes do CAMPIS-R foram usadas em procedimentos analógicos de indução de dor com crianças, incluindo a tarefa pressora de frio (Chambers, Craig, & amp Bennett, 2002) e um procedimento de carregamento de água, no qual as crianças são instruídas a beber o máximo de água como eles podem até que estejam cheios (Walker et al., 2006). Essas medidas observacionais também mostram aplicabilidade em todas as idades (Jay et al., 1983), gênero (Blount et al., 1997), línguas (Calamenddrei et al., 1995), países (Lossi & amp Hatira, 2003 Salmon & amp Pereira) e etnias incluindo amostras europeias-americanas (Blount et al., 1997), afro-americanas (Cohen et al., 1999) e latino-americanas (LeBaron & amp Zeltzer, 1984).

Além dos vários pontos fortes observados anteriormente, a principal fraqueza das medidas observacionais de sofrimento comportamental é o tempo e o esforço necessários para concluí-las. Para observação direta, os codificadores devem ser treinados e estar presentes durante o tempo em que os comportamentos estão ocorrendo ou devem ter acesso a gravações de vídeo das crianças submetidas a procedimentos médicos. Embora as informações derivadas deles sobre a topografia do sofrimento sejam ricas em detalhes, a quantidade de esforço e pessoal necessários podem impedir o uso contínuo em ambientes clínicos aplicados. Escalas de avaliação que incluem algumas das mesmas dimensões, como o PBCL e o CAMPIS-SF, podem ajudar a superar a barreira do uso em ambientes clínicos. No entanto, as gravações devem ser feitas com um observador treinado.

Além das medidas observacionais revisadas anteriormente, os métodos de observação direta provaram ser particularmente úteis para avaliar a dor em bebês e crianças pequenas. Eles compartilham muitos dos mesmos pontos fortes e fracos das medidas revisadas acima.

Escala de dor do Children's Hospital of Eastern Ontario (CHEOPS McGrath et al., 1985) é uma medida de dor pós-operatória em crianças. É diferente porque pode ser usado como uma ferramenta de codificação ao vivo em tempo real. Inclui definições operacionais para seis domínios: chorar, facial, criança verbal, tronco, tocar, e pernas. Cada domínio é pontuado em uma escala de 0–3. A confiabilidade entre avaliadores após procedimentos cirúrgicos para crianças de 1 a 5 anos varia de 90% a 99,2% para os diferentes domínios comportamentais (McGrath et al.). Os escores do CHEOPS se correlacionam com o autorrelato da criança de dor durante as injeções e foi considerado sensível aos efeitos das intervenções farmacológicas para reduzir a dor (Cassidy et al., 2001). No entanto, não foram detectadas diferenças no CHEOPS entre as crianças que receberam intervenção comportamental e aquelas que não receberam durante as imunizações (Cassidy et al., 2002). O CHEOPS foi classificado como "bem estabelecido".

A Escala COMFORT (Ambuel et al., 1992) foi projetado para uso em crianças de 0 a 18 anos, embora tenha sido usado com mais frequência em crianças de 0 a 5 anos, que estão em uma unidade de terapia intensiva pediátrica. Existem oito domínios ancorados no comportamento: alerta, calma / agitação, resposta respiratória, movimento físico, pressão arterial média, frequência cardíaca, tônus ​​muscular, e tensão facial. Cada domínio é classificado em uma escala de 1–5. A confiabilidade interexaminador para a pontuação total do COMFORT usando correlações de Pearson foi de 0,84 (Ambuel et al.,). Dois componentes da Escala COMFORT foram identificados, domínios comportamentais e fisiológicos, que estão fortemente correlacionados. A validade é apoiada por correlações entre as pontuações do COMFORT e as classificações de dor VAS (van Dijk et al., 2000). O COMFORT também foi sensível às diferenças exibidas por crianças de 1 a 3 anos de idade recebendo morfina intermitente ou contínua (Bouwmeester et al., 2001) e à administração pré / pós-morfina em bebês com peso superior a 2.500 gramas (Blauer & amp Gerstmann, 1998). A escala COMFORT recebeu uma classificação de "bem estabelecida".

O sistema de codificação facial infantil (CFCS Chambers et al., 1996) mede as expressões faciais das crianças durante experiências dolorosas. Ele foi projetado para crianças em idade pré-escolar, com idades entre 2–5 anos. Inclui 13 ações faciais (por exemplo, aperto de olho, sulco nasolabial), 10 dos quais são codificados para intensidade usando as classificações de nenhuma ação, ação leve e ação distinta / máxima. Três itens (ou seja, piscar, narina dilatada, e lábios abertos) são codificados como presentes ou ausentes. A confiabilidade entre avaliadores variou de 0,75 a,83 (Cassidy et al., 2002, Gilbert et al., 1999). As pontuações de CFCS diferiam dependendo se o paciente estava recebendo uma injeção (Breau et al., 2001). O CFCS foi sensível às diferenças de grupo na expressão da dor para crianças que receberam injeções com ou sem EMLA (Cassidy et al., 2001) e para aquelas que receberam intervenção comportamental ou não (Cassidy et al., 2002). O CFCS tem sido usado principalmente no Canadá e principalmente com crianças saudáveis. Devido ao sistema de codificação detalhado, fitas de vídeo devem ser usadas para capturar as ações faciais da criança. O CFCS foi classificado como "bem estabelecido".

O Perfil de Dor em Bebês Prematuros (PIPP Stevens et al., 1996) é uma medida multidimensional observacional de 7 itens da dor aguda em bebês prematuros (idade gestacional entre 28 e 36 semanas). Cada item é pontuado em uma escala de 4 pontos. Os itens incluem dimensões fisiológicas (frequência cardíaca, saturação de oxigênio) e comportamentais (expressão facial, compressão dos olhos, protuberância da sobrancelha, sulco nasolabial e choro). As pontuações são somadas nos sete itens. A confiabilidade entre avaliadores foi alta, com αs próximo a.95 (Ballantyne, Stevens, McAllister, Dionne, & amp Jack, 1999). As pontuações no PIPP para bebês que sofreram picadas no calcanhar foram maiores do que para aqueles que foram segurados (Stevens et al.) Ou experimentaram uma troca de fralda (Ballantyne et al.). O PIPP demonstrou ser sensível a várias intervenções de redução da dor em bebês (Johnston, Stremler, Horton, & amp Friedman, 1999). O PIPP recebeu uma classificação de "bem estabelecido".

O CHEOPS, COMFORT, CFCS e PIPP geralmente têm se mostrado sensíveis aos efeitos do tratamento, embora em graus variáveis. Devido à sua facilidade de uso, o CHEOPS, COMFORT e PIPP são aplicáveis ​​para codificação em tempo real em ambientes clínicos e podem ajudar a orientar a aplicação de intervenções farmacológicas ou outras.


Orientação de atenção baseada no significado em cenas conforme revelado por mapas de significado

Cenas do mundo real consistem em uma confusão de informações florescente e vibrante. Para gerenciar essa complexidade, a atenção visual é direcionada para regiões importantes da cena em tempo real 1,2,3,4,5,6,7. Que fatores orientam a atenção dentro das cenas? Uma posição teórica de liderança sugere que a saliência visual baseada em características de imagem semanticamente não interpretadas desempenha um papel causal crítico na orientação atencional, com o conhecimento e o significado desempenhando um papel secundário ou modulador 8,9,10,11. Em vez disso, propomos que o significado desempenha o papel dominante em guiar a atenção humana através das cenas. Para testar esta proposta, desenvolvemos "mapas de significado" que representam a riqueza semântica das regiões da cena em um formato que pode ser comparado diretamente à saliência da imagem. Em seguida, comparamos o grau em que as distribuições espaciais de significado e relevância predizem a atenção aberta dos espectadores dentro das cenas. Os resultados mostraram que tanto o significado quanto a saliência previram a distribuição da atenção, mas que, quando a relação entre significado e saliência foi controlada, apenas o significado foi responsável pela variação única na atenção. Esse padrão de resultados era aparente desde o primeiro ponto no tempo na visualização da cena. Concluímos que o significado é a força motriz que guia a atenção por meio de cenas do mundo real.

De acordo com as teorias de orientação de imagem, a atenção é direcionada às regiões da cena com base em recursos de imagem semanticamente não interpretados. Nesta visão, a atenção é, em um sentido fundamental, uma reação às propriedades da imagem do estímulo que confronta o espectador, com a atenção "puxada" para regiões visualmente salientes 12. A teoria mais abrangente desse tipo é baseada na saliência visual, na qual recursos básicos da imagem, como contraste de luminância, cor e orientação das bordas, são usados ​​para formar um mapa de saliência que fornece a base para a orientação atencional 8,13,14.


Juicy Conceptualizations: Aumentando a aliança através do atendimento à linguagem metafórica do cliente

Contexto: Há um interesse crescente no uso de metáforas na terapia cognitivo-comportamental. Os especialistas defendem trazer as metáforas do cliente para as conceituações de caso, mas há pouca pesquisa empírica para apoiar isso. Objetivos: Este estudo avaliou o efeito do treinamento de 12 terapeutas para atender às metáforas do cliente e trazê-las para as conceituações de caso. Método: sessões de terapia encenadas pré e pós-treinamento foram conduzidas e gravadas em vídeo. A Alliance foi avaliada por 'clientes' de dramatização e um especialista externo avaliou a qualidade das sessões e das conceituações compartilhadas. Resultados: Houve aumentos significativos em algumas classificações de aliança, com base nas classificações do "cliente" da dramatização e nas classificações externas de dramatizações de sessões de terapia antes e depois do treinamento. Quanto maior a diferença entre o terapeuta e o "cliente" em uma medida de preferência para produzir metáfora, menor será a classificação da sessão pelo "cliente" na pontuação do fator de Bond de uma medida de aliança, o Working Alliance Inventory. Esse resultado sugere que trabalhar metaforicamente pode ser mais eficaz quando o terapeuta e o cliente têm um grau semelhante de preferência por falar metaforicamente. Conclusão: Este estudo fornece suporte preliminar para a ideia de que atender às metáforas do cliente durante a conceituação pode ser benéfico para a aliança.


A avaliação da dor é uma necessidade institucional

Em um esforço para abordar a questão do tratamento inadequado da dor, a prática clínica e as diretrizes de garantia de qualidade foram publicadas pela Agência de Política e Pesquisa de Saúde (AHCPR), [3] [4] pela American Pain Society, [6] [7] ] e a Joint Commission on Accreditation of Healthcare Organizations. [67] Embora essas diretrizes sejam de escopo amplo, as considerações exclusivas para o cuidado de pessoas idosas são limitadas. Para abordar as preocupações especiais com a dor em adultos mais velhos, a American Geriatrics Society publicou diretrizes de prática clínica específicas para a avaliação e tratamento da dor em pessoas idosas, [1] [2] e a American Medical Directors Association publicou recentemente diretrizes de prática clínica para o tratamento da dor em ambientes de cuidados de longo prazo. [5] Embora essas diretrizes forneçam fontes úteis para basear as decisões da prática clínica, os painéis de especialistas recomendam fortemente que as investigações sobre a avaliação e o tratamento da dor entre idosos continuem em um esforço para desenvolver e refinar ainda mais as recomendações para a prática clínica.


Artigo ORIGINAL RESEARCH

  • Instituto de Design e Engenharia Ambiental, The Bartlett, University College London, Londres, Reino Unido

As escalas Likert são úteis para coletar dados sobre atitudes e percepções de grandes amostras de pessoas. Em particular, eles se tornaram uma ferramenta bem estabelecida em estudos de paisagens sonoras para a condução no local pesquisas para determinar como as pessoas experimentam os espaços públicos urbanos. No entanto, ainda não está claro se as métricas das escalas são interpretadas de forma consistente durante uma tarefa de avaliação típica. O presente trabalho visa identificar algumas tendências gerais na interpretação de métricas em escala Likert e introduzir um procedimento para a derivação de correções métricas por meio da análise de um conjunto de dados de estudo de caso de 984 avaliações de paisagens sonoras em 11 locais urbanos de Londres. De acordo com a ISO / TS 12913-2: 2018, as paisagens sonoras podem ser avaliadas através da escala de 8 dimensões: agradável, irritante, vibrante, monótono, agitado, sem intercorrências, calmo e caótico. A hipótese subjacente a este estudo é que existe uma ligação entre as correlações entre a porcentagem de avaliações que caem em cada categoria da escala Likert e um fator de dilatação / compressão que afeta a interpretação da métrica das escalas. O resultado desta derivação do valor de correção métrica é introduzido para a paisagem sonora, e uma nova projeção das paisagens sonoras de Londres de acordo com o espaço circunplex corrigido é comparada com o espaço circunplex ISO inicial. Os resultados gerais mostram uma interpretação geral não equidistante das escalas, principalmente na direção vibrante-monótona. As implicações dessa correção foram demonstradas por meio de uma tarefa Linear Ridge Classifier para prever as respostas da paisagem sonora de Londres usando parâmetros acústicos objetivos, o que mostra uma melhora significativa quando aplicado aos dados corrigidos. Os resultados sugerem que os valores corrigidos respondem pela interpretação não equidistante das métricas Likert, permitindo assim que as operações matemáticas sejam viáveis ​​quando aplicadas aos dados.


Métodos

Material e procedimentos

A Women's Experience of Maternity Care Scale (arquivo adicional 1), foi originalmente escrita em inglês e inclui 30 itens quantitativos divididos em três seções (escalas) submetidas a um processo de avaliação: (1) cuidado pré-natal (8 itens), (2) cuidados intraparto (10 itens) e (3) cuidados pós-natal (12 itens). Uma escala Likert de sete pontos variando de 1 a 7 e correspondendo a 1 = discordo totalmente a 7 = concordo totalmente permite uma avaliação detalhada de cada item [20]. As declarações são formuladas de forma positiva, com uma exceção: "Muitas vezes achei que os médicos / parteiras eram muito apressados". Um item relacionado a uma avaliação geral foi fornecido no final de cada seção, como 'No balanço, como você descreveria seu cuidado?', Usando a mesma escala Likert de sete pontos (1 = muito ruim, 7 = muito bom) para permitir uma avaliação global de cada período com um item [25]. O questionário traduzido foi denominado ‘Échelle de Satisfaction de l’Experience des Soins en Maternité, ou ESEM (arquivo adicional 2).

Tradução e adaptação cultural

O processo de tradução e adaptação transcultural da versão inglesa para a francesa foi conduzido por método preciso e rigoroso de acordo com diretrizes recentes, utilizando as cinco etapas de tradução e adaptação transcultural desenvolvidas por Beaton, Bombardier, Guillemin e Bosi Ferraz (2000). Isso inclui tradução, síntese, retrotradução, comitê de especialistas e pré-teste. O processo neste estudo ocorreu da seguinte forma: (1) Tradução. Após a aprovação dos autores [20, 22], três tradutores profissionais realizaram três traduções independentes (2) Síntese. A partir das três traduções, um painel de especialistas (uma parteira, gerente clínico, pesquisador e palestrante) chegou a um consenso sobre cada questão (3) Retrotradução. A retrotradução para o idioma original foi realizada por dois tradutores profissionais (cegos) (especialistas na área de tradução médica) e (4) A quarta e a quinta etapas - avaliação por comitê de especialistas e pré-teste - foram realizadas simultaneamente.

Questões problemáticas foram abordadas e, em seguida, adaptadas pelo painel de especialistas, que revisou a tradução, ajudou a abordar as diferentes perspectivas e alterou os questionários de acordo, finalmente os itens específicos foram pré-testados novamente. Diretriz recente de Perneger et al. (2015) sugeriram que o número de pré-testes deve ser determinado com base nos resultados coletados e na prevalência do problema encontrado na entrevista cognitiva. Portanto, de 10 a 30 participantes podem ser necessários para os pré-testes. Neste estudo, 15 mulheres com as mesmas características da população-alvo e que atenderam aos critérios de inclusão foram obrigadas a participar do pré-teste [28]. Essas mulheres não foram incluídas na amostra. O pré-teste foi realizado por meio de entrevistas individuais (entrevista cognitiva) com o apoio de uma grade específica. A grade de apoio foi utilizada para explorar a compreensão do questionário. Foi baseado na publicação de Sousa et al. [29] e conduzido com o painel de especialistas. As questões foram detalhadas de acordo com a seção (pré-natal, intraparto e pós-natal). Foram avaliadas a forma e a clareza dos termos utilizados no questionário.As mulheres foram convidadas a comentar a clareza das instruções e a precisão das questões (por meio de considerações dicotômicas), após o que foram convidadas a explicar cada questão com suas próprias palavras. Suas opiniões foram discutidas, juntamente com os pontos atribuídos na escala Likert. As entrevistas ocorreram, por telefone, entre uma e 2 semanas após o retorno do questionário.

Processo de tradução

Algumas das perguntas traduzidas para o francês incluíam palavras adicionais em comparação com as perguntas em inglês para garantir que as mulheres entendessem o tópico levantado. Veja os seguintes exemplos:

Item da Escala de Experiências de Maternidade de Mulheres: "Fiquei feliz com o apoio emocional que recebi durante a gravidez de médicos / parteiras".

Do tradutor 1: ‘J’ai été satisfaite du soutien moral reçu de la part des médecins / sages-femmes durant ma grossesse’.

Do tradutor 2: ‘J’étais satisfaite par le soutien émotionnel dont j’ai bénéficié de la part des médecins / sages-femmes lors de ma grossesse’.

Do tradutor 3: ‘J’ai été satisfaite du soutien psychologique reçu de la part des médecins / sages-femmes pendant ma grossesse’.

O consenso da equipe foi ‘J’ai été satisfaite du soutien moral (émotionnel) reçu de la part des médecins et des sages-femmes pendant ma grossesse’.

Em retrotradução, isso se tornou "Fiquei satisfeita com o apoio moral (emocional) recebido de médicos e parteiras durante minha gravidez".

Identificamos algumas dificuldades das mulheres em responder à pergunta sobre o atendimento das parteiras versus o dos médicos. Uma explicação pode ser a falta de diferenciação entre a definição do papel do profissional e os cuidados que ele deve prestar. Isso pode ser refletido na dificuldade de responder com segurança às perguntas sobre os cuidados prestados por uma parteira em comparação com os cuidados prestados por um médico. A título de ilustração, uma mulher afirmou: ‘O médico e as parteiras foram muito apressados’ nas escalas pré-natal, intraparto e pós-natal, mas, por outro lado, ela respondeu positivamente às outras perguntas no resto do questionário. Isso talvez trate de uma questão de tradução ou redação incorreta da pergunta, o que pode diminuir a validade das respostas da mesma mulher ao longo do tempo.

Fator exploratório

A validade de construto do ESEM foi testada com a análise fatorial exploratória (EFA) [30]. A análise fatorial foi usada para investigar como as variáveis ​​observadas estavam associadas aos construtos latentes. A análise de componentes principais (PCA) foi usada para identificar o número de dimensões das três escalas e para examinar a estrutura subjacente do questionário. A adequação da amostra foi testada com o teste de esfericidade de Bartlett com base nos critérios de p & lt 0,001 e com o teste Kaiser-Meyer-Olkin (KMO) baseado em um critério de ≥0,7 [31]. Os componentes principais foram identificados com o critério de Kaiser de autovalores de 1, um exame do gráfico de cascalho Cattell e com a porcentagem de variância explicada. Finalmente, análises paralelas foram feitas para confirmar o número de componentes retidos [32]. Para identificar a estrutura fatorial de cada escala, exploramos a inter-relação entre o item e os fatores. As medidas estatísticas relatadas a partir da análise incluíram comunalidades e carregamentos de componentes. A carga fatorial de 0,30 foi considerada o mínimo aceitável, itens de pelo menos 0,45 foram considerados regulares, aqueles de pelo menos 0,55 foram considerados bons, aqueles de pelo menos 0,63 foram considerados muito bons e aqueles maiores que 0,71 foram considerados excelentes [33]. As comunalidades (soma das cargas fatoriais quadradas para cada variável) foram usadas para determinar como cada variável é explicada pelos fatores. Valores ≥0,40 foram considerados valores aceitáveis ​​[34].

Capacidade de resposta

A soma de cada escala da versão francesa de ‘Experiência feminina em cuidados à maternidade’ (ESEM) foi comparada com os valores da escala de cinco itens: ruim, ruim, bom, muito bom e excelente, usando a correlação rho de Spearman. Uma correlação acima de 0,68 garantiu a validade do construto [35]. Uma curva Receiver Operating Characteristic (ROC) foi usada para determinar os melhores valores de corte para satisfação ideal ou satisfação não ideal nas três escalas. A sensibilidade e a especificidade foram calculadas com base em valores de corte usando o índice de Youden e a área sob a curva (AUC) para indicar a relevância dos resultados, como a probabilidade de que os níveis de satisfação foram identificados de forma adequada. Na ausência de uma medida padrão ouro, a escala Likert de cinco itens (ruim, ruim, bom, muito bom, excelente), dicotomizada com excelente e muito bom versus ruim, ruim e bom durante os períodos pré-natal, intraparto e pós-natal, foi usada para discriminar entre satisfação ótima e satisfação não ideal. Esta medida e este método de discriminação foram baseados em um levantamento institucional geral da qualidade global dos cuidados de saúde, usado para determinar o algoritmo de codificação de valores problemáticos pelo Picker Institute Europe [36].

A consistência do questionário foi determinada com base na estabilidade desta ferramenta ao longo do tempo. A associação entre o escore de satisfação das três escalas e o tempo decorrido entre o parto e o preenchimento do questionário de retorno foi testada.

Consistência interna

A confiabilidade do instrumento foi estimada por meio da consistência interna calculando o alfa de Cronbach para testar a inter-relação entre os itens de cada escala (pré-natal, intraparto, pós-natal) [37]. Um alfa de Cronbach entre 0,7 e 0,9 era esperado [38].

A homogeneidade dos itens inter-relacionados para cada uma das três escalas foi medida pela correlação rho de Spearman. Para avaliar o grau de consistência entre os componentes de cada nível, a soma dos itens e o escore de satisfação geral (sem o item) foram avaliados por meio do coeficiente de correlação de Spearman. Valores de r ≤ 0,35 foi considerado uma correlação fraca, 0,36 a 67 uma correlação moderada e acima de 0,68 uma correlação forte [35]. Neste estudo, foram tentadas correlações fortes usando esses testes.

Efeitos de piso e teto

Os efeitos de piso e teto foram testados para as três escalas. O maior de 15% de valores altos ou baixos foram considerados resultados limitados do questionário e podem indicar desempenho insuficiente da escala [37].

Reprodutibilidade

O período de tempo entre o teste e o reteste foi de 1 mês [37]. Esse período de tempo foi selecionado para evitar viés de memória e levando em consideração as responsabilidades de uma nova mãe e a dificuldade potencial em enviar o questionário imediatamente após o parto. Este elemento foi consistente com um estudo anterior [39].

Confiabilidade

A confiabilidade relativa foi calculada para cada escala usando coeficientes de correlação intraclasse (ICC) e intervalos de confiança. O ICC mede a variabilidade entre os resultados individuais e o erro dos coeficientes de medição foi tentado um mínimo de & gt 0,70 [40, 41].

O erro padrão de medição (SEM) e a porcentagem de SEM permitem a avaliação da confiabilidade absoluta do reteste [40]. O SEM foi utilizado para avaliar a precisão do instrumento entre duas avaliações em cada escala. A menor diferença real (SRD) e a porcentagem de SRD entre as duas medidas também foram estimadas em cada escala [42]. Nesta amostra, a menor mudança foi buscada [37].

Acordo

O gráfico de Bland-Altman foi usado para medir o limite de concordância. Os erros padrão de medição e a proporção de concordância foram usados ​​para verificar a estabilidade de cada escala no instrumento ao longo do tempo e para avaliar o limite de flutuação aceitável [41, 43]. Para garantir a estabilidade do instrumento, um número mínimo de outliers deve ser usado.

Aceitabilidade

Para avaliar a aceitabilidade do ESEM, examinamos a taxa de devolução e o tempo entre o envio e o recebimento do questionário devolvido. A quantidade de dados faltantes e a distribuição das respostas foram avaliadas. Os dados que faltam para cada escala foram listados. Se um ou dois itens não fossem concluídos, eles eram substituídos pela média dividida pelo número de itens concluídos. Se mais de dois itens não foram preenchidos, a seção não foi incluída na análise.

Validade convergente

Várias medidas são necessárias para demonstrar a validade convergente. Neste estudo, este teste não pôde ser realizado de forma eficaz devido à falta de escalas francesas validadas de forma semelhante na área de cuidado perinatal que avaliassem a satisfação pré-natal durante o trabalho de parto e pós-parto [18].

Variáveis ​​independentes

Os dados demográficos incluíram idade do participante, naturalidade, escolaridade, estado civil, ocupação, renda familiar anual e uso de tabaco. Os resultados obstétricos foram extraídos dos prontuários médicos e incluíram a idade gestacional, paridade, tipo de parto, indução do parto e analgesia.

Análise estatística

Foram realizadas análises descritivas dos escores por escala (escores mínimo e máximo, média e desvio padrão ou intervalo interquartil). O processo de exame das propriedades psicométricas foi realizado com pontuação contínua. Os dados foram testados por meio do teste de Kolmogorov-Smirnov para verificar a normalidade da distribuição. São apresentados o número e as porcentagens de problemas obstétricos e neonatais. A regressão linear foi utilizada para estimar as associações entre o tempo de devolução do questionário e o escore de satisfação nas três escalas.

Conforme mencionado acima, a consistência interna foi avaliada com o alfa de Cronbach. A homogeneidade dos itens inter-relacionados foi medida usando o coeficiente de correlação rho de Spearman. O coeficiente de confiabilidade do resultado foi calculado para cada escala usando o ICC com intervalo de confiança (IC) de 95%. O nível de significância estatística foi considerado p & lt 0,05. As médias da diferença foram apresentadas usando o método do gráfico de Bland-Altman e o erro padrão de medição (SEM = DP diff / √2) [42].

Tamanho da amostra

Não há nenhuma recomendação científica válida a priori para determinar a adequação de um tamanho de amostra que tem sido recomendado em diretrizes para validar escalas de medição com um parâmetro principal, como a análise fatorial [44,45,46]. A maioria dos estudos empregou estratégias empíricas para estimar um tamanho de amostra adequado, como uma proporção do número de itens por assunto - por exemplo, 1: 5 ou 1:10 [47] - ou um sistema de classificação que avalia os itens em cinco classificações, variando de 100 assuntos (ruim) a 1000 assuntos (excelente) [45, 46]. O referencial teórico definido por MacCallum para estimar o tamanho da amostra pode ser confirmado apenas a posteriori. Nesta estrutura, os tamanhos das amostras são independentes do número de itens da pesquisa. MacCallum sugere que, com base na simulação de Monte Carlo, a qualidade dos dados pode ser usada para determinar um tamanho de amostra adequado. Em sua teoria, a qualidade dos dados é verificada pelo grau de variação entre as variáveis, como a avaliação do nível de comunalidade (a parte da variância explicada por fatores comuns) [48].

No presente estudo, os resultados analisados ​​incluíram uma forte carga fatorial a posteriori (acima de 0,7) e altas comunalidades (acima de 0,6) para a maioria das variáveis. Esses resultados mostram que uma amostra de N = 200 seria suficiente para explorar nossa questão de pesquisa e propriedades psicométricas, o que apóia a hipótese de MacCallum para estimar o tamanho da amostra [48].

Amostra

Os participantes foram recrutados em uma sala de espera antes da consulta pré-natal ou durante sua primeira ou segunda consulta pré-natal no Hospital Universitário de Genebra (HUG). As inscrições foram realizadas pela equipe de pesquisa e pelas parteiras do hospital em dias de trabalho após verificação dos critérios de elegibilidade. O método de amostragem de conveniência foi usado na inscrição. Esta maternidade é a maior maternidade pública na parte francesa da Suíça, com 4.000 nascimentos anuais. As mulheres elegíveis tiveram gestações de baixo risco, de acordo com as normas institucionais, incluindo sem história obstétrica patológica, como pré-eclâmpsia, restrição de crescimento intrauterino, parto prematuro ou aborto espontâneo. Além disso, as mulheres elegíveis não tinham condições médicas patológicas, como hipertensão, diabetes, doença renal, trombocitopenia, hemoglobinopatia ou distúrbios psiquiátricos, e precisavam ter uma situação psicossocial estável, ser capazes de ler francês e ter um parto previsto neste hospital. As mulheres que aceitaram participar preencheram o termo de consentimento por escrito e forneceram dados socioeconômicos durante a consulta de pré-natal. Para medir a qualidade da satisfação global do atendimento recebido durante os três períodos - pré-natal, intraparto e pós-natal - uma escala de Likert de cinco itens (ruim, ruim, bom, muito bom, excelente) fez parte de uma pesquisa institucional geral e foi preenchida separadamente para o ESEM. Essas medidas foram utilizadas anteriormente no levantamento institucional geral.

Coleção de dados

A coleta de dados foi processada em diferentes formulários. A primeira parte foi preenchida pelas mulheres no momento da inscrição e assinatura do Termo de Consentimento Livre e Esclarecido. Esta primeira parte foi em papel e as questões envolviam dados sociodemográficos. Os dados obstétricos foram extraídos dos prontuários dos pacientes. Dois meses após o parto, as mulheres receberam o questionário ESEM, em papel, por correio (em casa). Eles podem enviar o questionário de volta no envelope de devolução (pré-pago e endereçado). Esse método foi escolhido porque nem todas as mães usavam a Internet em 2013–2014 e há algumas disparidades sociais na Suíça em relação ao acesso à Internet. Se os participantes não respondessem inicialmente, eles eram chamados por telefone e, posteriormente, uma carta enviada pelo correio para melhorar as taxas de resposta. O questionário foi enviado 2 meses após o nascimento de acordo com a metodologia utilizada por outros autores [24,25,26]. O atraso da publicação ocorreu devido às agendas de trabalho dos autores, processos editoriais e de revisão por pares.

Processamento de dados

Os resultados foram analisados ​​no SPSS versão 22, exceto a análise fatorial exploratória, a Receiver Operating Characteristic e as figuras, que foram produzidas no Stata 12.

Enquadramento ético

As informações fornecidas foram coletadas após a obtenção dos formulários de consentimento do paciente durante a consulta pré-natal pelas parteiras e pela equipe de pesquisa. Este protocolo foi aprovado pela Comissão de Ética do Departamento de Maternidade-Pediatria do HUG e está registrado sob o CER 11–242.


Melhorando a validade, confiabilidade e participação na medição de resultados de saúde auto-relatados para crianças e jovens: uma revisão sistemática do período de recordação, formato da escala de resposta e modalidade de administração

O autorrelato é o padrão ouro para medir os resultados relacionados à saúde das crianças. O desenho de tais medidas é complexo e desafiador. Esta revisão tem como objetivo avaliar sistematicamente as evidências sobre o período de recordação, formato da escala de resposta, modo de administração e abordagens necessárias para permitir que crianças e jovens com menos de 19 anos participem de autorrelatos válidos e confiáveis ​​de seus resultados de saúde.

Método

PsycInfo, Medline, CINAHL e Embase foram pesquisados ​​de 1 de janeiro de 1990 a 15 de março de 2020, e a pesquisa de citações foi realizada no Scopus. Os artigos foram incluídos se fossem pesquisas primárias ou relatos de caso de ≥ 3 participantes relatando o seguinte: período de recall, seleção de escala de resposta, modalidade de administração. A qualidade foi avaliada usando QualSyst, e os resultados sintetizados narrativamente. Esta revisão foi conduzida e relatada de acordo com as diretrizes PRISMA.

Resultados

81 de 13.215 artigos recuperados preencheram os critérios de inclusão. Crianças com menos de 5 anos não podem relatar resultados de saúde por conta própria de maneira válida e confiável. As escalas faciais demonstram melhores propriedades psicométricas do que as escalas visuais analógicas ou Likert. As escalas computadorizadas e de papel geralmente mostram validade de construto equivalente. As crianças preferem medidas informatizadas. Crianças com idade ≤ 7 anos pensam de maneira dicotômica, portanto, precisam de duas opções de resposta. Pessoas com mais de 8 anos podem usar com segurança uma escala de 3 pontos.

Conclusão

Os resultados desta revisão têm implicações clínicas e de pesquisa. Eles podem ser usados ​​para informar a escolha apropriada de PROM para uso com CYP no ambiente clínico. Também fornecemos oito recomendações para o desenvolvimento futuro de medidas de resultados auto-relatados para crianças e jovens.


Resultados

A busca inicial resultou em 1.083 resumos, uma revisão manual de artigos adicionais resultou em 11 artigos, por último, uma revisão dos potenciais 439 resumos de conferências com o termo “escala” gerou três resumos em potencial. Após a triagem de resumos e textos completos e referências de triagem de fontes adicionais (resultados da revisão completa da literatura), nesta revisão, identificamos 6 artigos de revisão / consenso / opinião de especialistas e 16 artigos empíricos que forneceram orientação ou evidência sobre a seleção da escala de resposta pediátrica (Fig. . 1). Três faixas etárias (4 a 8 anos, 6 a 18 anos e 10 a 18 anos) emergiram como as mais comumente descritas na literatura.

Processo de triagem e revisão

Nos artigos de revisão e opinião de especialistas, houve um consenso geral de que o VRS de 5 pontos, incluindo escalas de Likert, era apropriado para crianças de 7 ou 8 anos de idade ou mais (Tabela 2) [2, 6]. Embora escalas gráficas ou de rosto sejam frequentemente usadas em estudos pediátricos [7, 8], alguns dos artigos de revisão observaram que evidências empíricas adicionais são necessárias para apoiar o uso dessas escalas e as idades específicas para as quais são apropriadas [2]. Há algumas evidências que apóiam o uso de uma escala de resposta aprimorada de gráficos faciais em crianças mais novas (entre as idades de 4 e 7) [9]. Para crianças de 7 ou 8 anos ou mais, alguns artigos de revisão defendem o uso de NRS ou VAS [9], enquanto outro artigo sugere que as crianças preferem um VRS a um NRS ou VAS [2]. Cohen et al. [10] observaram que a orientação visual de escalas, emoções expressas em escalas gráficas e escolha de palavras para âncoras verbais podem produzir vieses inesperados devido à imaturidade nas habilidades de pensamento abstrato dos entrevistados, por exemplo, uma criança pode escolher uma resposta numérica com base no número favorito, em vez do que a representação da experiência.

Crianças entre 4 e 8 anos

A Tabela 3 apresenta os estudos empíricos que avaliaram a escolha da escala de resposta ideal entre os mais jovens dos entrevistados (com idades entre 4 e 7 a 8). Liu et al. [5] encontraram um VRS de 4 pontos com faces gráficas para auxiliar na compreensão da escala com resposta aprimorada em crianças entre 4 e 11 anos de idade.Em um estudo que avaliou várias escalas de resposta à dor para uso em crianças com idades entre 6 e 8 anos, os resultados foram inconclusivos quanto a se uma escala Faces, NRS, VAS ou uma cor (por exemplo, as crianças selecionam uma cor associada ao nível de intensidade) , foi superior [11]. Essas escalas de resposta produziram diferentes estimativas de dor e não foram consideradas intercambiáveis ​​em crianças pequenas [11].

Crianças entre 6 e 18 anos

A Tabela 4 inclui os estudos que avaliaram escalas de respostas múltiplas dentro do mesmo estudo entre crianças de 6 anos de idade ou mais. Van Laerhoven et al. [12] encontraram uma VRS de 5 pontos a ser preferida a VAS ou NRS em crianças de 6 a 18 anos de idade, mas todos os tipos de escala mostraram confiabilidade comparável. Em contraste, Jylli et al. [13] descobriram que crianças mais novas (idades de 6 a 11 anos) em sua amostra (faixa geral entre 6 e 16 anos de idade) não compreenderam totalmente todas as palavras descritivas em um VRS de 5 pontos, e que o VRS não estava altamente correlacionado com uma dor VAS. Bailey et al. [14] encontraram VAS, NRS e VRS confiáveis ​​e válidos na avaliação da dor em crianças de 8 a 17 anos de idade, mas os escores produzidos não foram intercambiáveis. Connelly e Neville [15] descobriram que as escalas VAS, NRS e Faces tendiam a ser altamente inter-relacionadas, mas os escores eram geralmente mais altos no NRS, e que VAS e Faces eram mais responsivos a tendências decrescentes nos escores de dor em crianças entre as idades de 9 e 18 anos. Bailey et al. [16] avaliaram a correspondência entre as escalas NRS, VAS, VAS com cor e Faces em crianças de 8 a 18 anos que tinham dor abdominal e descobriram que, embora houvesse alta correspondência entre VAS e VAS com cor, o NRS não correspondem com os outros tipos de escala. Benini et al. [17] descobriram que o VAS é mais fácil para crianças de 7 a 18 anos de idade entenderem e usarem em comparação com Faces e outras escalas gráficas, especialmente para crianças com atraso de desenvolvimento leve ou moderado que sofrem de síndrome de Down ou tetraplegia espástica.

Crianças entre 10 e 18 anos

A Tabela 5 apresenta estudos que avaliaram a seleção de escalas de resposta em crianças mais velhas (10 a 18 anos). Verificou-se que o NRS produziu escores mais altos do que a escala VAS ou Faces, mas o NRS teve maior correspondência com o VAS do que com o Faces [18]. Um VRS de 5 pontos foi considerado bem aceito e compreendido [19]. Finalmente, um VRS de 5 pontos foi considerado estável, independentemente do período de recordação [20].


Revisão das Medidas

Auto-relato de intensidade de dor

Em adultos, tem sido recomendado que a intensidade da dor seja avaliada pedindo aos pacientes que classifiquem sua dor em uma escala numérica, com 0 indicando que não há dor e 10 indicando a pior dor possível (Dworkin et al., 2005). Por causa da compreensão mais limitada das crianças de conceitos numéricos, uma variedade de outras escalas de avaliação foram desenvolvidas nas quais as crianças fornecem uma representação gráfica da intensidade da dor marcando um ponto em uma linha (VAS), apontando ou colorindo um determinado nível de dor “Termômetro”, selecionando de uma série de rostos que representam diferentes níveis de dor ou contando diferentes números de objetos simples e tangíveis, como fichas de pôquer que permitem que a criança indique mais ou menos dor.

VAS normalmente consiste em uma linha horizontal de 100 mm com âncoras indicando “sem dor” no ponto final esquerdo e “pior dor possível” (ou um termo comparável) no ponto final direito. A criança faz uma marca vertical na linha para indicar quanta dor ela sente. Os escores de intensidade da dor são calculados medindo-se a distância do ponto final esquerdo da escala até a marca da criança. O texto exato das âncoras varia de estudo para estudo. Os exemplos incluem: “sem dor” versus “dor muito forte”, “pior dor de todas”, “dor extrema”, “dor tão forte quanto poderia ser” e “muita dor” (Hicks, von Baeyer, Spafford, van Korlaar, & amp Goodenough, 2001 Polkki, Pietila, & amp Vehvilainen-Julkunen, 2003).

Evidências extensas apóiam as classificações de dor VAS como indicadores válidos da experiência de dor das crianças. Foi demonstrado que as pontuações VAS das crianças se correlacionam significativamente com as avaliações dos pais sobre a dor das crianças (Luffy & amp Grove, 2003 Varni, Thompson e amp Hanson, 1987) e com as avaliações do pessoal médico (Gragg et al., 1996). As pontuações VAS correlacionam-se positivamente com as pontuações obtidas em outras escalas de dor, como o Oucher (Aradine, Beyer, & amp Thompson, 1988 Beyer & amp Aradine, 1987), a Escala de Cor Eland (Guariso et al., 1990), várias escalas de faces (Hunfeld , van der Wouden, den Deurwaarder, van Suijlekom-Smit, & amp Hazebroek-Kampschreur, 1997), e a escala COMFORT (van Dijk et al., 2000). As pontuações VAS se correlacionam positivamente com indicadores de doença comumente associados à dor, como inchaço nas articulações e gravidade da doença em crianças com artrite (Schanberg, Keefe, Lefebvre, Kredich, & amp Gill, Scott, Ansell, & amp Huskinsson, 1977, 1977) e recuperação pós-operatória ( Beyer & amp Aradine, 1987). As pontuações VAS demonstraram ser sensíveis a mudanças na dor após medicamentos analgésicos (Romsing, Moller-Sonnergaard, Hertel, & amp Rasmussen, 1996) e intervenção psicológica no manejo da dor (Powers, Blount, Bachanas, Cotter e amp Swan, 1993).

A estabilidade de qualquer avaliação de dor de autorrelato é necessariamente limitada pela estabilidade da experiência de dor das crianças. Portanto, altas correlações teste-reteste não seriam necessariamente esperadas. Por exemplo, Gragg et al. (1996) obtiveram correlações teste-reteste de 6 meses de 41 para pacientes de 8 a 16 anos com doença reumática. Van Dijk et al. (2000) relataram confiabilidade teste-reteste de.58 em uma amostra de pré-escolares testada em intervalos de 3 horas após a cirurgia.

As vantagens do VAS incluem facilidade de administração, baixo custo e o fato de que a escala produz dados de proporção. O VAS foi recomendado como o mais apropriado para crianças com mais de 8 anos de idade (Stinson et al., 2006). É importante notar que as alterações no formato VAS podem criar mudanças significativas nas propriedades psicométricas da escala. Por exemplo, Tesler et al. (1991) adicionaram os rótulos verbais de: "pouca dor", "dor média" e "grande dor" em pontos regulares ao longo de uma linha ancorada "sem dor" e "pior dor possível". A escala resultante, chamada Word-Graphic Rating Scale, é uma escala ordinal ao invés de uma escala de razão, as distâncias entre as descrições verbais não são iguais (Sinkin-Feldman, Tesler, & amp Savedra, 1997). Limitações semelhantes se aplicam à Escala do Descritor de Palavras (Whaley & amp Wong, 1987), que inclui descritores de: "sem dor", "pouco", "médio", "bastante", "muito ruim" e "pior dor" ao longo de uma linha horizontal.

Alguns autores adicionaram marcadores numéricos ao longo do VAS (por exemplo, em intervalos de 5 ou 10 pontos) (Jay, Elliott, Katz, & amp Siegel, 1987), no entanto, esta prática foi criticada porque os números preferidos ou familiares podem ser escolhidos com mais frequência (Huskisson, 1983 McGrath, 1990). Polkki et al. (2003) descobriram que as crianças mais novas compreenderam a ideia de combinar um ponto mais alto com maior dor ao usar uma VAS orientada verticalmente melhor do que a correspondência da esquerda para a direita associada a uma VAS de linha horizontal. No entanto, Huskisson relatou que os indivíduos são mais propensos a selecionar os desfechos extremos quando o VAS é apresentado verticalmente em vez de horizontalmente. Os VASs se qualificam para uma classificação de "bem estabelecido".

Escalas de rosto consistem em um conjunto de desenhos de linhas ou fotografias de rostos que retratam estados de dor (Chambers et al., 1999). Eles são considerados apropriados para crianças porque não empregam palavras sofisticadas ou valores numéricos abstratos. A psicometria geralmente tem sido forte para essas escalas. Como exemplos, foi demonstrado que as escalas de rostos estão altamente correlacionadas com outros índices de autorrelato (Spafford, von Baeyer, & amp Hicks, 2002), avaliações de pais e enfermeiras (Chambers et al., 1999), medidas comportamentais de dor (MacLaren & amp Cohen, 2005), e ser sensível a intervenções analgésicas e não farmacológicas (Gold, Hyeon Kim, Kant, Joseph, & amp Rizzo, 2006 Spafford et al., 2002), para diminuir durante o pós-procedimento (Paik & amp Ahn, 2002 Smith, Shah, Goldman, & amp Taddio, 2007), e para variar dependendo do estímulo da dor (por exemplo, diferentes imunizações Wood et al., 2004).

O afeto retratado nas âncoras das diferentes escalas de faces não é consistente em todas as escalas e foi descoberto que influencia as respostas das crianças. Por exemplo, a âncora de rosto sorridente na extremidade inferior da Escala de Avaliação de Dor Faces de Wong-Baker pode influenciar os escores de dor das crianças, uma vez que muitas crianças em situações médicas não estão sorrindo e felizes (Chambers & amp Craig, 1998 Chambers, Hadial, Craig, Court, & amp Mongomery, 2005). Por outro lado, o fato de a face mais angustiada das seis faces estar chorando pode fazer com que algumas crianças não escolham essa face a menos que elas mesmas estejam chorando (McCaffery, 2002).

McGrath (1987) também levantou a preocupação de que rostos com escalas numéricas ao lado deles possam confundir o componente afetivo da dor (presumivelmente capturado nos rostos) e a intensidade da dor (refletida nos números). Finalmente, não se pode presumir que as escalas de faces produzem dados de intervalo ou proporção, mesmo que cada face seja rotulada com um número inteiro. Na melhor das hipóteses, os dados devem ser considerados ordinais; os intervalos entre os estímulos podem muito bem ser desiguais da perspectiva da criança (McGrath, de Veber & amp Hearn, 1985).

Uma escala de rostos populares, The Oucher (Beyer, 1984, 2000 Beyer & amp Knott, 1998), fornece diferentes fotografias para crianças brancas, hispânicas e negras. Os rostos retratados no Escala de faces Wong-Baker (Wong & amp Baker, 1988) e o Escala de dor facial revisada (FPS-R Hicks et al., 2001), duas outras medidas de escala de faces comumente usadas, são desenhos de linha sem distinções de etnia. As escalas Oucher e Wong-Baker atribuem um valor numérico a cada face (por exemplo, 0-5). A escala Wong-Baker também adiciona descritores de palavras a cada rosto (não machuca, dói um pouco, dói muito, etc.) e o Oucher é orientado em uma orientação vertical semelhante a um termômetro. O FPS-R contém seis faces, variando de uma expressão neutra a uma de dor intensa, mas sem lágrimas, e essas faces podem ser numeradas 0, 2, 4, 6, 8 e 10, o que fornece uma aproximação do 0 comumente usado –10 métrica. Além disso, o FPS-R foi traduzido para mais de 30 idiomas e recebeu considerável suporte empírico. Este grupo classificou o Wong-Baker como "bem estabelecido", o Oucher como "bem estabelecido" e a Escala de Dor Faces Revisada como "bem estabelecida".

A ferramenta de fichas de pôquer ou Pieces of Hurt Tool (Hester, 1979 Hester, Foster, & amp Kristensen, 1990) é uma medida de intensidade de dor muito simples, consistindo em quatro chips vermelhos que representam "pedaços de dor" (com um chip indicando um pouco machucado e todos os quatro chips indicando o mais machucado que uma criança poderia ter) Essa medida direta e concreta tem sido usada com pré-escolares de uma variedade de culturas, incluindo crianças taiwanesas (Suraseranivongse et al., 2005) e jordanianas (Gharaibeh & amp Abu-Saad, 2002). As pontuações tendem a se correlacionar com outras medidas de dor de autorrelato, como o Oucher, descritores de palavras e faces (Gharaibeh & amp Abu-Saad, 2002 Goodenough et al., 1997), e com observações comportamentais verbais, vocais, faciais e comportamentos motores indicativos de dor (Hester). Como seria de se esperar, o acordo pai-filho ou enfermeira-filho usando a ferramenta de fichas de pôquer é normalmente significativo, mas moderado (rs = 0,23 −,70). As pontuações da Poker Chip Tool mostram as diminuições esperadas após a administração de analgésicos (Romsing et al., 1996). A ferramenta Poker Chip parece ter a maior utilidade como uma ferramenta de avaliação clínica simples para identificar a presença / ausência de dor e estimativas muito grosseiras da intensidade da dor em crianças pequenas. Foi recomendado para uso em crianças de 3 a 4 anos de idade para dor pós-operatória e relacionada a procedimentos agudos (Stinson et al., 2006). A ferramenta de fichas de pôquer foi classificada como "bem estabelecida".

Questionário e Diários

Quatro medidas de automonitoramento foram selecionadas com base em sua frequência de uso na literatura de avaliação da dor. Essas medidas de automonitoramento são semelhantes no que diz respeito ao preenchimento dos informantes e às dimensões da dor avaliadas. No entanto, as medidas diferem no que diz respeito à amostra de padronização ou amostra de validação, propriedades psicométricas e o grau de sensibilidade cultural. Essas medidas são mais comumente usadas em populações de crianças com dor recorrente ou crônica que requer monitoramento prospectivo.

The Headache Diary (Richardson et al., 1983) é uma medida de autorrelato usando uma escala de 0-5 com instruções para o paciente completar avaliações em horários específicos do dia (por exemplo, café da manhã, almoço, jantar e hora de dormir). The Headache Diary se originou no Canadá (Richardson et al., 1983) e tem sido usado nos Estados Unidos (Andrasik, Burke, Attanasio, & amp Rosenblum, 1985) e na Holanda (Langeveld, Koot, & amp Passchier, 1999). O Diário da Cefaleia oferece classificações prospectivas de dor e é fácil de preencher. No entanto, os diários podem conter menos gravações do que o ideal devido ao não cumprimento das classificações (van de Brink, Bandell-Hoekstra e amp Abu-Saad, 2001). Além disso, as discrepâncias nas classificações parecem ocorrer para classificações de dor “leve” e “leve”, especialmente quando mudanças na atividade são estipuladas (Richardson et al., 1983). The Headache Diary mostrou sensibilidade aos efeitos do tratamento em pesquisas de intervenção em dor de cabeça (McGrath et al., 1992 Richter et al., 1986). O Diário da Cefaléia foi classificado como “bem estabelecido”.

O diário da dor (Hunfeld et al., 2001 Hunfeld et al., 2002) emprega uma linha horizontal de 100 mm para avaliar a intensidade, frequência e duração da dor. Ele pode ser usado em todos os tipos de dor. Semelhante ao Diário de Dor de cabeça, as avaliações são feitas em horários específicos do dia. Uma concordância significativa entre as avaliações dos jovens e dos pais da atividade da dor de cabeça no Diário da Dor foi relatada por um período de 4 semanas (Richardson et al., 1983) e após uma intervenção de 10 sessões usando relaxamento ou biofeedback de temperatura (Andrasik et al. ., 1985). Enquanto o Diário da Dor pode gerar informações sobre situações que podem estar associadas à dor, ele se concentrou na dor recorrente e só tem uma forma substituta dos pais para crianças menores de 12 anos de idade (Hunfeld et al., 2001, 2002). O Diário da Dor recebeu uma classificação de "bem estabelecido".

A ferramenta de avaliação da dor pediátrica de Abu-Saad (PPAT, Abu-Saad et al., 1990) é um questionário elaborado para avaliar a dor em crianças em idade escolar. Ele foi originalmente desenvolvido na Holanda e avalia vários aspectos da dor, como os gatilhos da dor e o tipo e a quantidade do medicamento. Consiste em descritores de 30 palavras de aspectos sensoriais, afetivos e avaliativos da dor com base no trabalho de Melzack e Torgerson (1971) e usa uma escala de 10 cm para medir a dor presente e pior. O PPAT foi administrado a crianças com dores relacionadas com a doença, bem como a crianças submetidas a cirurgia (Abu-Saad, 1994 Abu-Saad et al., 1990). Apoiando a validade do construto e a utilidade clínica do PPAT está a evidência de mudanças nos escores de dor desde a administração antes até a pós-analgesia (Abu-Saad, Pool, & amp Tulkens, 1994). O PPAT foi administrado a crianças árabes-americanas (Abu-Saad, 1984) e jordanianas (Gharaibeh & amp Abu-Saad, 2002) para determinar aspectos culturais específicos da avaliação da dor. Em termos de confiabilidade, a consistência interna do PPAT (Abu-Saad et al., 1990) tem sido adequada. Correlações significativas entre as avaliações da criança, dos pais, da enfermeira e do médico da dor presente e da pior dor foram encontradas para o PPAT (Abu-Saad, 1994) e as correlações entre as avaliações da intensidade da dor para o PPAT foram variáveis ​​e dependentes da população de pacientes ( isto é, artrite reumatóide juvenil, câncer, pós-operatório). No entanto, as correlações não foram significativas entre a frequência e a intensidade da cefaleia no Diário de Cefaleia e a escala de 10 cm no PPAT (van de Brink et al., 2001), bem como as informações da entrevista ou questionário (Laurell, Larson, & amp Eeg- Ologsson, 2003). O PPAT recebeu uma classificação de "se aproximando bem estabelecido".

Questionário de dor pediátrica de Varni / Thompson (PPQ Varni & amp Thompson, 1985) é um questionário multidimensional para avaliar a dor na infância, com formulários separados para o paciente pediátrico, pais e médico. Foi modelado de acordo com o instrumento de avaliação da dor em adultos mais amplamente utilizado, o Questionário de Dor McGill (Melzack, 1975). O PPQ avalia as percepções do médico, do paciente e dos pais sobre a experiência de dor do paciente em um formato apropriado para o desenvolvimento. Mais especificamente, este instrumento mede a intensidade da dor, a localização e as qualidades sensoriais, avaliativas e afetivas da dor. Os diferentes formulários usam formatos diferentes, como o uso de cores para crianças mais novas e termos descritivos para adolescentes. A utilidade clínica do PPQ se concentrou principalmente em duas populações de pacientes, JRA (Thompson, Varni, & amp Hanson, 1987) e doença falciforme (SCD) (Walco & amp Dampier, 1990), e foi investigado em crianças com dor crônica ( Walco, Sterling, Conte & amp Engel, 1999). O PPQ foi traduzido para vários idiomas, incluindo dinamarquês, francês para a França e para o Canadá, norueguês, português para o Brasil, espanhol para os Estados Unidos e sueco (www.pedsql.org). Em termos de psicometria, boas estimativas de teste-reteste para intervalos de 1 semana, 3 semanas e 6 meses e correlações entre as avaliações da criança, dos pais, da enfermeira e do médico da dor presente e da pior dor foram encontradas para o PPQ (Gragg et al. Thompson et al. Walco & amp Dampier). Além disso, foram obtidas avaliações cruzadas de informantes significativas, mas as correlações foram maiores entre pais e filhos em comparação com aqueles com médicos. Por último, para crianças com SCD, as avaliações dos pais e do médico VAS foram preditivas das estimativas do médico de deficiência (Walco & amp Dampier, 1990). O grupo de trabalho classificou o PPQ como "bem estabelecido".

Escalas de observação do comportamento para avaliar a dor e a angústia comportamental

Escalas de observação comportamental são usadas para avaliar a exibição de comportamentos dos pacientes que são indicativos de dor e angústia. Eles utilizam monitoramento objetivo de comportamentos operacionalmente definidos, subjetivamente exibidos e observáveis. Supõe-se que a ansiedade, o medo e outras formas de angústia comportamental se misturam e coexistem com a experiência da dor.Freqüentemente, os termos sofrimento comportamental e dor são usados ​​alternadamente. Na verdade, a natureza entrelaçada dos aspectos sensoriais da experiência da dor e dos estados afetivos concomitantes é consistente com a definição de dor proposta pela Associação Internacional para o Estudo da Dor (IASP 1979) como, “A dor é uma experiência sensorial e emocional desagradável associada com dano real ou potencial ao tecido, ou descrito em seus termos ”(p. 249).

As medidas de observação comportamental da dor são particularmente aplicáveis ​​para crianças mais novas, crianças com deficiências cognitivas ou durante os momentos em que a criança está muito angustiada para indicar seu nível de dor, como antes, durante ou logo após as injeções dolorosas (von Baeyer & amp Spagrud, 2007) . Assim como o autorrelato, as manifestações comportamentais de comportamentos de dor também estão sujeitas aos efeitos de minimização, exagero e à influência de variáveis ​​sociais e outras variáveis ​​contextuais. Dados os pontos fortes e as falhas inerentes a qualquer método de avaliação, recomendamos que, quando apropriado, use uma combinação de observação comportamental e métodos de autorrelato.

Com escalas de observação para adolescentes, crianças e bebês, comportamentos como dizer "ai", choro, necessidade de contenção, caretas faciais e postura são exemplos de índices de comportamento socialmente aceitos, empiricamente suportados e que refletem a experiência de dor durante procedimentos médicos. Muitas das escalas de observação comportamental foram desenvolvidas para estudar a dor e o desconforto comportamental em crianças e adolescentes com câncer que apresentavam aspirações dolorosas da medula óssea e procedimentos de punção lombar. Como tal, eles foram projetados para capturar reações a procedimentos médicos agudos, intensos e dolorosos que muitas vezes eram realizados em um contexto emocional forte e frequentemente social (por exemplo, na presença da equipe médica e talvez dos pais). Os procedimentos médicos tiveram um ponto de início definido e as observações ocorreram em momentos específicos antes, durante e após o procedimento médico. Codificadores treinados observam as reações comportamentais das crianças ou codificam fitas de vídeo das reações das crianças aos procedimentos.

A escala de avaliação comportamental procedimental (PBRS) foi desenvolvido por Katz, Kellerman e Siegel em 1980. O PBRS incluía originalmente 25 comportamentos, depois 13 e, eventualmente, 11 na versão revisada (PBRS-R Katz, Kellerman & amp Ellenberg, 1987). Esses 11 comportamentos são chorar, agarrar, dor verbal, gritar, parar, mangual, posições de recusa, conter, rigidez muscular, suporte emocional, e solicita rescisão. Cada comportamento foi monitorado como presente ou ausente em cada uma das quatro fases do procedimento médico. Esses comportamentos foram então totalizados para obter uma pontuação total do PBRS. A desvantagem do PBRS, conforme projetado originalmente, é que ele não leva em consideração exibições repetidas de um comportamento na mesma fase, o que provavelmente afetaria a sensibilidade. O PBRS foi muito valioso como uma das primeiras medidas observacionais de angústia. O PBRS foi classificado como "quase bem estabelecido".

A Escala Observacional de Angústia Comportamental (OSBD, Jay et al., 1983) e a versão revisada (OSBD-R, Elliott et al., 1987) estão entre as escalas mais amplamente utilizadas nesta categoria. O OSBD original continha 11 comportamentos definidos operacionalmente que eram indicativos de perigo. O número de comportamentos de angústia no OSBD-R foi reduzido para oito. Tanto o OSBD quanto o OSBD-R são únicos, pois os comportamentos de angústia são ponderados em uma escala de 1 a 4 pontos para refletir a intensidade da angústia. Exemplos incluem busca de informações e chorar, ponderado em 1,5, e gritar, restrição física, e mangual, ponderado em 4. 0. Elliott et al. encontraram correlações mais altas entre as avaliações dos enfermeiros e das crianças de medo e dor ao usar pontuações ponderadas em vez de não ponderadas. Os comportamentos são registrados como ocorrendo ou não em intervalos de 15 segundos nas quatro fases do procedimento médico. Normalmente, essas pontuações de fase são adicionadas para produzir uma pontuação de distress da sessão inteira. O OSBD / OSBD-R foi classificado como "bem estabelecido".

A escala de interação de procedimentos médicos de crianças e adultos (CAMPIS Blount et al., 1989) e o CAMPIS-Revised foram desenvolvidos em parte com base no OSBD. O CAMPIS inclui uma subescala de sofrimento infantil na qual os comportamentos são registrados com base em sua frequência de ocorrência nas fases que ocorrem antes, durante e depois dos eventos médicos. Esses comportamentos podem então ser somados para obter uma pontuação total por fase ou agrupados em categorias, incluindo angústia apreensiva ou antecipatória (solicitar apoio emocional, busca de informações, e medo verbal) e sofrimento demonstrativo (chorar, gritar, resistência verbal, dor verbal, e emoção verbal) (Blount, Sturges & amp Powers, 1990). Códigos de comportamento adicionais no CAMPIS são indicativos de enfrentamento infantil e outros comportamentos que as crianças exibem durante procedimentos médicos. O CAMPIS também inclui 17 comportamentos que podem ser realizados por pais, equipe médica ou outros adultos que possam acompanhar a criança durante os tratamentos médicos. A versão revisada do CAMPIS agrupa esses comportamentos em seis códigos (CAMPIS-R Blount et al., 1997, 1990). Além de um sofrimento infantil subescala, os outros cinco códigos CAMPIS-R são criança enfrentando, criança neutra, promoção de sofrimento adulto, promoção de enfrentamento adulto, e adulto neutro comportamentos. Para medir a angústia, foram utilizadas as taxas e proporções dos comportamentos de angústia, com boa validade para ambas as métricas (Blount et al., 1997). O CAMPIS-Short Form (Blount, Bunke, Cohen, & amp Forbes, 2001) foi desenvolvido para fornecer um método mais fácil e rápido de classificar os códigos CAMPIS-R. Recentemente, o CAMPIS foi modificado para uso em ambientes perioperatórios, com a introdução da Escala de Interação de Procedimentos Médicos Perioperatórios Criança-Adulto (P-CAMPIS Caldwell-Andrews, Blount, Mayes, & amp Kain, 2005) e para avaliar o sofrimento infantil (CAMPIS -Infant Version ou CAMPIS-IV Devine, Blount, Cheng, Seri, & amp Simons, 2006). Tanto o P-CAMPIS como o CAMPIS-IV medem as mesmas dimensões que o CAMPIS-R. O CAMPIS / CAMPIS-R foi classificado como “bem estabelecido”.

A Lista de Verificação de Comportamento do Procedimento (PBCL LeBaron & amp Zeltzer, 1984) é uma escala de observação direta e uma escala de classificação de sofrimento comportamental. Oito comportamentos são codificados como ocorrendo ou não antes, durante e depois do procedimento médico. As ocorrências são classificadas em uma escala de 1 a 5 pontos para intensidade, com âncoras de muito leve a extremamente intenso. Após a conclusão do período de observação, essas classificações são adicionadas para produzir uma pontuação PBCL total. O PBCL foi classificado como "bem estabelecido".

Para evitar redundância nos relatórios e dada a consistência nos resultados dessas medidas, a psicometria para o PBRS, OSBD, CAMPIS e PBCL será descrita em conjunto posteriormente. Entre essas quatro medidas, a confiabilidade entre avaliadores é adequada a excelente (Blount et al., 1997 Chen, Craske, Katz, Schwartz, & amp Zeltzer, 2000 Jay et al., 1983 Katz et al., 1987) e a consistência interna é boa para o OSBD-R (Elliott et al., 1987). Existem fortes evidências que apóiam a validade de cada uma dessas medidas. As pontuações de angústia correlacionam-se negativamente com a idade da criança (Jay et al. LeBaron & amp Zeltzer, 1984), positivamente com a ansiedade (por exemplo, Jay et al. Frank, Blount, Smith, Manimala e amp Martin, 1995 LeBaron & amp Zeltzer), e positivamente com relatos dos pais sobre a dor e angústia da criança durante procedimentos médicos anteriores (Jay et al. Frank et al.). O sofrimento das crianças durante as fases antecipatórias não dolorosas do procedimento médico previu até 86% da variação do sofrimento das crianças durante a fase dolorosa dos procedimentos de BMA / LP (Blount et al., 1990). O comportamento dos pais e da equipe médica durante o procedimento médico foi considerado responsável por 53% da variação no sofrimento infantil (Frank et al., 1995). A utilidade clínica foi demonstrada pela sensibilidade aos efeitos de intervenções de base psicológica e / ou farmacológica (Cohen, Blount, Cohen, Schaen, & amp Zaff, 1999 Jay, Elliott, Fitzgibbons, Woody e amp Siegel, 1995). Além disso, as descobertas usando subescalas adicionais do CAMPIS / CAMPIS-R produziram resultados que informam diretamente o desenho dos programas de intervenção de tratamento (Blount, Bunke, & amp Zaff, 2000).

O PBRS, OSBD, CAMPIS e PBCL foram usados ​​com pacientes pediátricos submetidos a vários procedimentos médicos, atestando sua ampla aplicabilidade. Esses procedimentos incluem crianças submetidas a reparo de laceração (Luhmann, Kennedy, Porter, Miller, & amp Jaffee, 2001), injeções de imunização de rotina (Blount et al., 1997), punção venosa (MacLaren & amp Cohen, 2005 Smith et al., 2007), queimadura lesões (Elliott & amp Olson, 1983), regimes de fisioterapia dolorosa (Miller, Johanna-Murphy, & amp Zhelezniak, 2001), procedimentos de uretografia urinária miccional (Salmon & amp Pereira, 2002 Zelikovsky, Rodrigue, Gidyzc, & amp Davis, 2000) e cirurgia ambulatorial (Caldwell-Andrews et al., 2005). Além disso, partes do CAMPIS-R foram usadas em procedimentos analógicos de indução de dor com crianças, incluindo a tarefa pressora de frio (Chambers, Craig, & amp Bennett, 2002) e um procedimento de carregamento de água, no qual as crianças são instruídas a beber o máximo de água como eles podem até que estejam cheios (Walker et al., 2006). Essas medidas observacionais também mostram aplicabilidade em todas as idades (Jay et al., 1983), gênero (Blount et al., 1997), línguas (Calamenddrei et al., 1995), países (Lossi & amp Hatira, 2003 Salmon & amp Pereira) e etnias incluindo amostras europeias-americanas (Blount et al., 1997), afro-americanas (Cohen et al., 1999) e latino-americanas (LeBaron & amp Zeltzer, 1984).

Além dos vários pontos fortes observados anteriormente, a principal fraqueza das medidas observacionais de sofrimento comportamental é o tempo e o esforço necessários para concluí-las. Para observação direta, os codificadores devem ser treinados e estar presentes durante o tempo em que os comportamentos estão ocorrendo ou devem ter acesso a gravações de vídeo das crianças submetidas a procedimentos médicos. Embora as informações derivadas deles sobre a topografia do sofrimento sejam ricas em detalhes, a quantidade de esforço e pessoal necessários podem impedir o uso contínuo em ambientes clínicos aplicados. Escalas de avaliação que incluem algumas das mesmas dimensões, como o PBCL e o CAMPIS-SF, podem ajudar a superar a barreira do uso em ambientes clínicos. No entanto, as gravações devem ser feitas com um observador treinado.

Além das medidas observacionais revisadas anteriormente, os métodos de observação direta provaram ser particularmente úteis para avaliar a dor em bebês e crianças pequenas. Eles compartilham muitos dos mesmos pontos fortes e fracos das medidas revisadas acima.

Escala de dor do Children's Hospital of Eastern Ontario (CHEOPS McGrath et al., 1985) é uma medida de dor pós-operatória em crianças. É diferente porque pode ser usado como uma ferramenta de codificação ao vivo em tempo real. Inclui definições operacionais para seis domínios: chorar, facial, criança verbal, tronco, tocar, e pernas. Cada domínio é pontuado em uma escala de 0–3. A confiabilidade entre avaliadores após procedimentos cirúrgicos para crianças de 1 a 5 anos varia de 90% a 99,2% para os diferentes domínios comportamentais (McGrath et al.). Os escores do CHEOPS se correlacionam com o autorrelato da criança de dor durante as injeções e foi considerado sensível aos efeitos das intervenções farmacológicas para reduzir a dor (Cassidy et al., 2001). No entanto, não foram detectadas diferenças no CHEOPS entre as crianças que receberam intervenção comportamental e aquelas que não receberam durante as imunizações (Cassidy et al., 2002). O CHEOPS foi classificado como "bem estabelecido".

A Escala COMFORT (Ambuel et al., 1992) foi projetado para uso em crianças de 0 a 18 anos, embora tenha sido usado com mais frequência em crianças de 0 a 5 anos, que estão em uma unidade de terapia intensiva pediátrica. Existem oito domínios ancorados no comportamento: alerta, calma / agitação, resposta respiratória, movimento físico, pressão arterial média, frequência cardíaca, tônus ​​muscular, e tensão facial. Cada domínio é classificado em uma escala de 1–5. A confiabilidade interexaminador para a pontuação total do COMFORT usando correlações de Pearson foi de 0,84 (Ambuel et al.,). Dois componentes da Escala COMFORT foram identificados, domínios comportamentais e fisiológicos, que estão fortemente correlacionados. A validade é apoiada por correlações entre as pontuações do COMFORT e as classificações de dor VAS (van Dijk et al., 2000). O COMFORT também foi sensível às diferenças exibidas por crianças de 1 a 3 anos de idade recebendo morfina intermitente ou contínua (Bouwmeester et al., 2001) e à administração pré / pós-morfina em bebês com peso superior a 2.500 gramas (Blauer & amp Gerstmann, 1998). A escala COMFORT recebeu uma classificação de "bem estabelecida".

O sistema de codificação facial infantil (CFCS Chambers et al., 1996) mede as expressões faciais das crianças durante experiências dolorosas. Ele foi projetado para crianças em idade pré-escolar, com idades entre 2–5 anos. Inclui 13 ações faciais (por exemplo, aperto de olho, sulco nasolabial), 10 dos quais são codificados para intensidade usando as classificações de nenhuma ação, ação leve e ação distinta / máxima. Três itens (ou seja, piscar, narina dilatada, e lábios abertos) são codificados como presentes ou ausentes. A confiabilidade entre avaliadores variou de 0,75 a,83 (Cassidy et al., 2002, Gilbert et al., 1999). As pontuações de CFCS diferiam dependendo se o paciente estava recebendo uma injeção (Breau et al., 2001). O CFCS foi sensível às diferenças de grupo na expressão da dor para crianças que receberam injeções com ou sem EMLA (Cassidy et al., 2001) e para aquelas que receberam intervenção comportamental ou não (Cassidy et al., 2002). O CFCS tem sido usado principalmente no Canadá e principalmente com crianças saudáveis. Devido ao sistema de codificação detalhado, fitas de vídeo devem ser usadas para capturar as ações faciais da criança. O CFCS foi classificado como "bem estabelecido".

O Perfil de Dor em Bebês Prematuros (PIPP Stevens et al., 1996) é uma medida multidimensional observacional de 7 itens da dor aguda em bebês prematuros (idade gestacional entre 28 e 36 semanas). Cada item é pontuado em uma escala de 4 pontos. Os itens incluem dimensões fisiológicas (frequência cardíaca, saturação de oxigênio) e comportamentais (expressão facial, compressão dos olhos, protuberância da sobrancelha, sulco nasolabial e choro). As pontuações são somadas nos sete itens. A confiabilidade entre avaliadores foi alta, com αs próximo a.95 (Ballantyne, Stevens, McAllister, Dionne, & amp Jack, 1999). As pontuações no PIPP para bebês que sofreram picadas no calcanhar foram maiores do que para aqueles que foram segurados (Stevens et al.) Ou experimentaram uma troca de fralda (Ballantyne et al.). O PIPP demonstrou ser sensível a várias intervenções de redução da dor em bebês (Johnston, Stremler, Horton, & amp Friedman, 1999). O PIPP recebeu uma classificação de "bem estabelecido".

O CHEOPS, COMFORT, CFCS e PIPP geralmente têm se mostrado sensíveis aos efeitos do tratamento, embora em graus variáveis. Devido à sua facilidade de uso, o CHEOPS, COMFORT e PIPP são aplicáveis ​​para codificação em tempo real em ambientes clínicos e podem ajudar a orientar a aplicação de intervenções farmacológicas ou outras.


Declarações de ética

Aprovação ética e consentimento para participar

O estudo foi aprovado pelo Comitê de Ética em Pesquisa de Londres - Camden e Kings Cross NHS (referência no. 15 / LO / 1999) em novembro de 2016. Termo de consentimento livre e esclarecido por escrito será dado por todos os participantes para a participação e publicação dos resultados. Isso incluirá um lembrete de que os participantes podem se retirar a qualquer momento, e seus dados serão armazenados de forma anônima e segura em arquivos trancados e discos rígidos protegidos por senha, de acordo com a Lei de Proteção de Dados do Reino Unido e o Regulamento Geral de Proteção de Dados da UE. Todos os dados publicados permanecerão anônimos. O recrutamento foi concluído no momento da revisão das provas deste artigo.

Interesses competitivos

Os autores declaram não ter interesses conflitantes.


Assista o vídeo: Escala Likert (Dezembro 2021).