Detalhadamente

Teorias da aprendizagem: reforço, desamparo e punição aprendidos

Teorias da aprendizagem: reforço, desamparo e punição aprendidos

Teorias de aprendizagem

Conteúdo

  • 1 Condicionamento Clássico
  • 2 Motivar para continuar: reforço
  • 3 Desamparo aprendido
  • 4 O castigo
  • 5 Aprendendo por imitação
  • 6 Superstição

Condicionamento clássico

Na primeira parte deste artigo, revisamos o condicionamento clássico, ao nosso dom da adaptabilidade e o apresentamos ao condicionamento operante (repetimos mais os comportamentos premiados e menos os punidos).

Modo de ação

O processo de condicionamento instrumental ou operante Requer a seguinte sequência:

  1. Estímulo, que chamaremos de agora em diante, estímulo discriminatório (DE), porque discriminará a resposta de outras pessoas.
  2. Resposta, que chamaremos de Operant Response (RO).
  3. Reforço, que é um estímulo de reforço (ER), que implica uma associação com a resposta do operante para aprimorá-lo.

Repetimos o que gostamos

O lei de efeito descoberto por Thorndike, afirma um princípio muito simples que consiste em duas partes. O primeiro afirma que as respostas que produzem conseqüências satisfatórias são consolidadas e, portanto, são emitidas com frequência crescente. O segundo pressupõe que os organismos aprendam respostas que impedem ou evitam estímulos desagradáveis.

Os pais usam recompensas para moldar boas maneiras na mesa elogiam o comportamento semelhante ao dos adultos, certo? Este é um exemplo claro de condicionamento operante.

Motivar para continuar: reforço

Qual é o intensificador? É tudo o que aumenta a frequência da resposta. Existem dois tipos de reforçadores: o positivo e o negativo. Um reforço é positivo ao consolidar uma resposta a ser apresentada após ela e a ser considerada pelo sujeito como um prêmio (comida, aprovação, dinheiro, expressões de afeto ...). É negativo quando tende a ser eliminado após a resposta, que pode ser consolidada.

Supressão de alimentos ou dor são impulsionadores primários, entendido assim porque são inato. Por outro lado, dinheiro, sucesso, elogios, qualificações, tom de voz agradável etc. são secundário e eles aprendem em geral relacionado ao primário.

O imediatismo Um reforçador influencia muitos comportamentos. Muitos fumantes ou usuários de drogas sabem disso. Isso se baseia no uso de analgésicos. Mas, em geral, aprendemos a responder a mais reforçadores atrasado: o salário no final do mês, o triunfo no final de uma luta, as qualificações trimestrais ... e embora o reforço instantâneo seja geralmente muito eficaz, para funcionar solidamente, precisamos aprender a adiar as recompensas imediatas em favor das de longo prazo, que Eles geralmente são mais bruscos. Está provado que as crianças que já estão aprendendo a adiar prêmios importantes, contra recompensas imediatas, se tornam adolescentes mais competentes.

Programar é progredir

Na vida cotidiana, existem regras bem definidas que governam a existência de cada um de nós, que programa nossos prêmios ou punições. Assim, nossos pais costumavam nos dizer que nos dariam apoio financeiro ou algum privilégio desejado (por exemplo, sair à noite) com a condição de cumprirmos nossos deveres. Estamos sujeitos a regras que podemos chamar programas de reforço parcial ou intermitente e que garantem a persistência de um comportamento, muito mais que reforços constantes, que acabam extinguindo a resposta por fadiga ou rotina. A longo prazo, o reforço parcial determina uma maior resistência à extinção.

  1. O programas de intervalo fixo Eles são regulados por um certo tempo de antecedência, com uma pausa igual após cada reforço. Durante esse período, não há reforços disponíveis, sendo a seguinte resposta reforçada no final do intervalo fixo. Os exemplos mais claros são nosso salário ou os presentes oferecidos em um horário específico por tradição, como o Natal.
  1. Nos programas de intervalo variável, o lapso é marcado por um valor médio parcialmente enviado aleatoriamente. A primeira resposta é reforçada após intervalos variáveis. Por exemplo, quando damos às birras das crianças em busca da tranquilidade que, a longo prazo, possa se voltar contra nós. Esses programas tendem a produzir uma resposta lenta, mas regular.
  1. O programas de taxa fixa Eles são baseados em um reforço que aparece após um certo número e número predefinido de respostas. Por exemplo, trabalho por peça: para cada cinquenta unidades de produção é recebido um prêmio. Pode ser considerado um sistema eficaz, pois geralmente produz altas taxas de resposta, com pausas breves e momentâneas após cada reforço.
  1. O programas de taxa variável Eles oferecem uma recompensa após um número certo, mas previsível de respostas. Eles são os mais usados ​​no jogo e responsável por um bom número de vícios compulsivos, pois eles determinam altas taxas de resposta, porque os aprimoradores aumentam à medida que a resposta aumenta.

O desamparo aprendido

Organismos sujeitos a processos que consideram incontroláveis ​​desenvolveriam aprendizados de não controle, de eventos considerados independentes de sua própria vontade. As pessoas podem se resignar às condições ambientais que indicam a incapacidade de controlar os resultados de suas próprias ações. Entramos na expectativa de desamparo, já que recebemos punição (geralmente autoinfligida por nossos próprios pensamentos negativos), qualquer que seja o nosso comportamento. Nós não escapamos mais, mesmo que a situação permita; Até subestimamos as possibilidades de possíveis recompensas no caso de adotar uma estratégia apropriada, para que caímos em uma situação de paralisia que, por sua vez, causa distúrbios emocionais de desespero.

O castigo

A punição nos diz o que não devemos fazer; o reforço o que devemos fazer. O mais eficaz é combinar a punição com o reforço positivo, o que aumentará a eficácia do método. Se a punição é aplicada, ela deve atender a certas condições para alcançar uma certa eficácia: 

  • Deve estar subordinado ao comportamento específico.
  • Nunca alterne recompensa e punição pelo mesmo comportamento (evite distorções entre pai e mãe ou entre pais e professores).
  • Forneça aos sujeitos meios alternativos para obter a recompensa.
  • Não deve ser generalizado para traços pessoais ("você é estúpido").
  • Temos que evitar punições prolongadas.

Certos autores argumentam ainda que punição prolongada e excessiva pode desencadear agressividade no sujeito que sofre com issoe dê como exemplo a correlação entre agressores agressivos e crianças que tiveram em casas que eram muito aversivas e punitivas.

Aprendizagem por imitação

Como somos bebês, observamos e imitamos as formas de comportamento dos outros, que são chamadas modelagem ou aprendizado vicário. Esse processo é incrivelmente eficaz, pois evita os procedimentos tediosos de pontuação e tentativa-erro que acompanham o condicionamento instrumental. Graças a isso, também aprendemos sem tentativas anteriores e facilita o amplo repertório de nosso comportamento social.

A modelagem permite explicar os comportamentos psicossociais que causam efeitos positivos e solidários, marcado por nossos pais, ambiente social ou pela mídia.

Superstição

Boa parte do nosso superstições eles aprendem tomando uma reforço positivo ou negativo casualmente. No famoso experimento de Skinner com pombos, que eram reforçados com comida ao bicar um disco, ele observou que, se um pombo girasse casualmente antes de bicar, ele acreditava que a vez servia para obter comida e, apesar do fato de a comida ter sido dada para bicando, independentemente da curva, o pombo aprendeu um comportamento supersticioso e continuou a fazer a curva, mesmo que fosse inútil. É assim que aprendemos a atribuir uma causa incorreta a um efeito, porque nossa mente é assim, ela precisa ter tudo em ordem.

Técnicas de estudo: o poder das imagens.