Condicionamento: Clássico e Operante

Haroldo Fala
21 de set. de 2021
5 min de leitura

O Behaviorismo, ou comportamentalismo é uma teoria de aprendizagem que afirma que todos os comportamentos são aprendidos da interação com o ambiente por meio de um processo chamado de condicionamento.

Assim, o comportamento é simplesmente uma resposta a estímulos do ambiente.

O comportamentalismo está preocupado apenas com comportamentos de estímulo-resposta observáveis, pois eles podem ser estudados de uma maneira sistemática e objetiva.

Toda teoria científica precisa ser apoiada por dados empíricos obtidos por meio de observação cuidadosa e controlada e com dados mensuráveis.

John B. Watson, considerado o pai do comportamentalismo afirmou em 1913 que:

“A psicologia, como uma visão comportamentalista, é um ramo experimental puramente objetivo das ciências naturais. Seu objetivo teórico é (…) previsão e controle.'

Embora os comportamentalistas aceitem a existência de cognições e emoções, eles preferem não estudar e porque apenas o comportamento observável (ou seja, externo) pode ser medido objetiva e cientificamente. Portanto, eventos internos, como o pensamento, devem ser explicados por meio de termos comportamentais.

Dentro dessa teoria, todo comportamento, não importa quão complexo seja, pode ser reduzido a uma simples associação estímulo-resposta-consequência.

Então, quando falamos sobre treino de animais com base científica, devemos analisar apenas o comportamento observável.

Você só pode modificar comportamentos que estão de fato acontecendo, e tentar adivinhar os processos internos que estão acontecendo na mente do indivíduo é contra produtivo, e só contribui para que o processo de treino e adestramento seja mais complexo do que ele precisa ser.

Condicionamento clássico

O condicionamento clássico é a aprendizagem por associação e foi descoberto por Pavlov, um fisiologista russo. (por isso ele também é conhecido como condicionamento pavloviano)

Em termos simples, dois estímulos inicialmente neutros são associados entre si para produzir uma resposta aprendida em uma pessoa ou animal.

O exemplo mais clássico de condicionamento Pavloviano é o “sino de Pavlov”: Pavlov pegou um sino, que antes do experimento era um estímulo neutro, e começou a tocá-lo antes de alimentar seus cães, e com o tempo, depois foi criada a associação do som com a comida, e seus cães salivavam ao ouvir o sino.

Mas quero trazer aqui outro experimento que demonstra o condicionamento clássico: O experimento com pequeno Albert, um bebê humano. Em resumo:

- Os cientistas Watson e Raynor apresentaram ao pequeno Albert um rato branco e ele não demonstrou medo.

- Watson em seguida apresentou o rato junto a um grande som de estrondo que assustou o pequeno bebê Albert e o fez chorar.

- Após a associação contínua do rato branco com barulho alto, Albert foi classicamente condicionado a sentir medo ao ver o rato, que antes era um estímulo neutro.

- O medo de Albert se generalizou para outros estímulos semelhantes ao do rato, incluindo um casaco de pele, um chumaço de algodão e uma máscara de Papai Noel.

Note que no caso dos cachorros e o sino, e do albert e o rato, a associação feita causou uma resposta fisiológica: salivação, e medo. Os indivíduos que participaram do teste, não aprenderam um comportamento novo, eles apenas passaram a apresentar respostas naturais que eles já tinham, mas agora, mediante a apresentação de um estímulo específico; o sino no caso dos cães, e o rato no caso do bebê.

Mais tarde surgiu o termo “contra condicionamento”. Onde nesses experimentos o objetivo era criar uma resposta que antes não existia, o contra-condicionamento busca mudar uma resposta que já existe. Por exemplo, se o sino de Pavlov não fosse um estímulo neutro no começo do experimento, mas um estímulo que causasse a reação de medo, ao parear o sino com a comida, ele estaria trabalhando para substituir a resposta de medo, pela salivação e a antecipação da alimentação. Efetivamente trocando a resposta ao sino.

Condicionamento Operante

O condicionamento operante é um método de aprendizagem que ocorre por meio de recompensas e punições por comportamento. Por meio do condicionamento operante, um indivíduo faz a associação entre um comportamento e uma consequência.

B.F Skinner, cientista que criou essa nova teoria do aprendizado, acreditava que apesar de termos uma mente e um mecanismo interno de pensamento, é simplesmente mais produtivo estudar o comportamento observável em vez de eventos mentais internos.

Ele acreditava que a melhor maneira de entender o comportamento é examinar as causas de uma ação e suas consequências. Ele chamou essa abordagem de condicionamento operante.

O trabalho de Skinner foi baseado na “Lei do Efeito” de Thorndike (1898). De acordo com esse princípio, o comportamento que é seguido por consequências agradáveis provavelmente se repetirá, e o comportamento seguido por consequências desagradáveis tem menos probabilidade de se repetir.

Skinner introduziu um novo termo na Lei do Efeito - Reforço. O comportamento que é reforçado tende a ser repetido (isto é, fortalecido); comportamento que não é reforçado tende a morrer ou ser extinto (ou seja, enfraquecido).

Skinner identificou três tipos de respostas, ou operantes, que podem seguir (ser consequência para) um comportamento.

• Operantes neutros: respostas do ambiente que não aumentam nem diminuem a probabilidade de um comportamento se repetir.

• Reforços: Respostas do ambiente que aumentam a probabilidade de um comportamento se repetir. Os reforços podem ser positivos ou negativos!

• Punições: Respostas do ambiente que diminuem a probabilidade de um comportamento se repetir. A punição enfraquece o comportamento.

Baseado nesses três operantes, nos anos que se seguiram, estudiosos do comportamento animal - principalmente aqueles que tinham um interesse especial em prever e controlar o comportamento animal (treinadores) - desenvolveram uma tabela de quatro quadrantes para ilustrar 4 tipos de consequência que poderiam se aplicar seguido de um comportamento com o objetivo de intencionalmente ensinar, aumentar, diminuir ou eliminar comportamentos:

Nesta tabela, vemos os quadrantes reforço positivo (R+), reforço negativo (R-), punição positiva (P+), e punição negativa (P-). Nesse contexto, positivo(+), significa adição, Ou seja, quando a consequência de um comportamento adiciona algo. (um petisco ou uma pressão, por exemplo) negativo(-) significa subtração, reforço algo que pode fortalecer um comportamento, e punição algo que enfraquece um comportamento, de modo que:

Então podemos concluir que: o Reforço Positivo - adiciona algo que é considerado uma consequência agradável pelo sujeito; incentivando o aumento, ou fortalecimento de um comportamento

O Reforço Negativo - O reforço negativo, remove algo que o sujeito considera uma consequência desagradavel, fortalecendo um comportamento.

A remoção de um estímulo adverso é recompensadora para o sujeito; o R- fortalece o comportamento porque interrompe ou remove uma experiência desagradável.

A Punição Positiva - é a introdução de um estímulo que o sujeito considera uma consequência desagradavel a fim de parar, ou enfraquecer um comportamento.

Punição Negativa é a retirada de um estímulo potencialmente gratificante ao sujeito, com o objetivo de parar ou enfraquecer um comportamento.

O reforço é o nome dado a qualquer consequência que possa aumentar a probabilidade de um comportamento se repetir:

A punição é definida como o oposto do reforço, porque é projetada para enfraquecer ou eliminar um comportamento ao invés de aumentá-lo. É um evento aversivo que busca diminuir a probabilidade de um comportamento se repetir

(Como você pode notar, reforço negativo e punição negativa são quadrantes bem parecidos! preste atenção nas definições para saber classificar as consequências corretamente!)

Punições tem uma má reputação porque associamos a palavra com coisas ruins. Mas uma punição, apesar de sempre ser indesejável para o sujeito, não significa que ela seja necessariamente algo ruim. Um som alto, um toque, ou uma barreira podem todos ser punições, mas elas não são ruins por si só, e não são prejudiciais nem cruéis inerentemente.

Dar um tapa, jogar coisas, chutar, derrubar no chão, enforcar, causar dor e medo são todas punições é claro. Mas você não precisa ser violenta nem cruel para aplicar um estímulo que seja considerado uma punição.

A questão é que, nos conectamos a palavra punição a essas ações terríveis, mas cientificamente falando, punição é a introdução de um estímulo que ajuda a eliminar um comportamento. só isso.

Cabe a cada treinador saber o que é uma punição e o que é uma recompensa para cada animal que treina. Essa associação de punição com violência e crueldade não é à toa claro: nos primórdios do treino animal, a dor e o medo eram infligidos como punições porque essas coisas são universalmente desagradáveis para qualquer um. Porém descobriu-se que fazem mais para atrapalhar do que ajudar…

Mencionei as possiveis consequências negativas desse tipo de estímulo na postagem sobre a Teoria de Dominação.

A questão é, precisamos perder o preconceito com essa palavra porque seu real significado no comportamentalismo é neutro.

Condicionamento: Clássico e Operante

Condicionamento clássico

Condicionamento Operante

Posts recentes

Comentários