Como funciona o treinamento de cães
"Senta" e "fica" são geralmente os primeiros comandos que os cães aprendem.
Embora os cães tenham ajudado pessoas com trabalhos específicos por milênios, hoje a maioria se parece mais com membros da família do que com funcionários. De acordo com a American Pet Products Manufacturers Association, em 2005, os donos de animais americanos gastaram cerca de 39,5 bilhões dólares em seus animais de estimação, mais que o dobro do que gastaram em 1994.
Embora isso represente uma idade de ouro para cães sortudos, o status de membro da família também pode exigir que o cão atenda a certos padrões de comportamento. Embora você possa imaginar o contrário pela abundância de moda canina agora disponível, os cães não são pessoas pequenas e peludas. Eles têm sua própria maneira de pensar e fazer as coisas. Milhares de cães são entregues a abrigos de animais a cada ano, ou permanentemente relegados a um curral de quintal, simplesmente por agirem como cães.
Cães e pessoas podem viver juntos felizes, mas isso exige que os donos se esforcem para preencher a lacuna entre as espécies e treinem seus cães para se comportarem adequadamente na sociedade humana. Existem muitas maneiras diferentes de treinar cães e muitos treinadores que dirão que a maneira deles é a única maneira "certa", mas a realidade é que existem vários métodos que funcionam. A principal diferença entre eles é a rapidez com que funcionam e como são agradáveis para o cão e o condutor.
Neste artigo, exploraremos a história e as ideias por trás da maioria dos métodos de treinamento de cães e falaremos sobre um dos métodos mais populares atualmente:o treinamento com clicker.
O treinamento de cães geralmente se concentra no condicionamento operante . O primeiro cientista a definir esse conceito foi B.F. Skinner, que estudou o trabalho do fisiologista russo Dr. Ivan Pavlov sobre comportamento animal. No estudo inovador de Pavlov, os cães aprenderam que um estímulo (neste caso, um sino) significava que eles estavam prestes a ser alimentados. Começando com duas coisas que são naturalmente pareadas – salivar e ser alimentado – Pavlov adicionou um terceiro componente tocando um sino antes de se alimentar. Após algumas tentativas, os cães aprenderam a associar o sino com a alimentação e reagiriam salivando ao som do sino em antecipação à comida, mas sem nenhum alimento presente.
Como os cães naturalmente começam a salivar quando recebem comida, a comida é um estímulo incondicionado . Nenhum condicionamento ou treinamento especial é necessário para fazer o cão salivar, o que é uma resposta incondicionada . Em contraste, um sino tocando normalmente não faz os cães salivarem; eles o farão somente se tiverem sido condicionados a associar um sino a ser alimentado. Portanto, o sino é um estímulo condicionado . A nova reação do cão é um reflexo ao estímulo e é uma resposta condicionada .
Muitos de nós vemos isso hoje com nossos próprios cães quando eles começam a latir ao som da campainha, às vezes até mesmo uma campainha na televisão. Neste caso, o cão foi condicionado a associar o estímulo da campainha com a chegada iminente de um estranho.
Quando vemos luzes piscando ou ouvimos uma sirene atrás de nós enquanto dirigimos, podemos ficar tensos reflexivamente e nossa frequência cardíaca pode aumentar. Fomos condicionados a associar o som das sirenes à experiência desagradável e estressante de conseguir uma multa. Este é o condicionamento clássico . Tanto os animais quanto as pessoas podem aprender a relacionar um par de eventos e responder ao primeiro em antecipação ao segundo. Esse tipo de aprendizado é passivo e involuntário; ocorre sem que o aluno faça nada e muitas vezes sem consciência.
Enquanto o trabalho de Pavlov tratava de uma reação reflexiva a um estímulo condicionado, Skinner se interessou em criar uma reação comportamental específica a um estímulo adicionando um reforçador . Um reforçador pode ser uma recompensa ou um punidor . Uma recompensa é qualquer coisa que aumente a frequência de uma ação; um punidor é qualquer coisa que diminua sua frequência.
Quando somos recompensados por um determinado comportamento, é provável que o repitamos. Quando somos punidos por um determinado comportamento, é provável que paremos. Este tipo de aprendizagem é ativa e voluntária; depende das ações do aluno.
Como a definição de um reforçador é baseada em sua eficácia, é importante lembrar que uma recompensa para uma pessoa pode não ser significativa e, portanto, não é uma recompensa para outra. Da mesma forma, o que é uma recompensa em um contexto pode não ser em outro.
Um rato em uma caixa básica de Skinner
Skinner mostrou que tanto animais quanto pessoas realizariam certos comportamentos por uma recompensa. Em seus experimentos com ratos e pombos, Skinner mostrou como os animais podem aprender a pressionar uma alavanca para obter uma recompensa alimentar. Quando os animais foram introduzidos pela primeira vez na caixa de teste, eles se moveram aleatoriamente. Quando eles acidentalmente pressionaram a alavanca, um pellet de comida foi dispensado. Eles rapidamente aprenderam a pressionar a alavanca de propósito para obter uma pelota. Ele também modelou comportamentos que são mais complicados, reforçando-os passo a passo. Skinner chamou sua abordagem de "condicionamento operante" porque o comportamento do animal realmente operava no ambiente (pressionando a alavanca) em resposta ao resultado antecipado (receber uma recompensa alimentar).
Recompensar para encorajar o bom comportamento e punir para desencorajar o mau é algo que a maioria de nós faz instintivamente; é bom senso. O condicionamento operante tinha uma longa história no treinamento de animais antes mesmo de ser definido. O coronel Konrad Most, que publicou "Training Dogs:A Manual" em 1910, estava usando muitos dos mesmos princípios que Skinner estudou, décadas antes de descrevê-los. Os métodos de treinamento do Coronel Most parecem um tanto severos para os padrões de hoje, mas ele é considerado por muitos como o pai do treinamento moderno de cães. A maioria e outros treinadores usavam recompensas e punições para moldar e reforçar o comportamento desejado.
A seguir, veremos como os reforçadores são usados no treinamento de animais.
Os reforçadores podem envolver a adição de um novo elemento ou a remoção de um elemento atualmente presente. A terminologia para isso é um pouco confusa, mas adicionar algo é referido como "positivo", embora não necessariamente no sentido de "feliz" ou "bom". "Negativo", neste caso, é a remoção de algo, e não significa necessariamente "ruim". Portanto, tanto as recompensas quanto os punidores podem ser positivos ou negativos.
Dar a um papagaio um pedaço de fruta por acenar com o pé é um acréscimo de algo bom (uma recompensa positiva); um cavalo se movendo mais rápido para parar a pressão das esporas é o fim de algo ruim (recompensa negativa). Mesmo que "recompensa negativa" soe como um paradoxo, a remoção de algo ruim é uma espécie de recompensa.
Alguns punidores positivos comumente usados incluem coleiras de choque, coleiras de pinos e correntes de estrangulamento.
Há muitas maneiras de ensinar um cão a sentar usando um reforçador. O treinador pode empurrar ou atrair o cão para uma posição sentada, ou pode simplesmente esperar até que o cão se sente naturalmente por conta própria. Uma vez que o cão se senta, o treinador pode oferecer uma recompensa positiva, como elogios verbais ("bom menino!"), elogios táteis (um tapinha na cabeça), um brinquedo favorito ou uma guloseima. Alguns treinadores usam recompensas negativas, como coleiras eletrônicas, para dar um leve choque no cão, que para assim que ele se senta. O cão aprende que pode eliminar o choque sentado. Por razões éticas, muitas pessoas desaprovam isso. No entanto, segue os mesmos princípios do condicionamento operante. Em todos os casos, o cão aprenderá que, ao ouvir o comando "senta" e se sentar, receberá uma recompensa.
Muitas pessoas preferem usar guloseimas como reforço durante o treinamento.
Os reforçadores podem ser quase tudo, desde que sejam significativos para o cão. Um cão pode pensar que guloseimas são mais valiosas do que brinquedos, enquanto outro pode sentir o oposto. Não importa realmente qual é o reforçador, mas por razões práticas, alguns reforçadores são mais fáceis de trabalhar do que outros. Além disso, o mesmo reforçador não precisa ser usado todas as vezes ou em todas as situações. Algumas tarefas podem exigir um reforçador mais valioso do que outras. Como diz o treinador de obediência da PetSmart, Dan O'Leary, "você provavelmente passaria por cima de uma cadeira se eu lhe oferecesse um dólar para fazer isso. Mas você provavelmente não lavaria e enceraria meu carro por um dólar". Da mesma forma, seu cão pode trabalhar por um tipo de recompensa na relativa calma de sua casa, mas pode precisar de algo mais desejável para manter o foco na aula.
Veremos como os treinadores desenvolveram marcadores, ou pistas, para treinar outros animais além dos cães.
Keller e Marian Breland foram alunos de B.F. Skinner e expandiram suas técnicas para treinar uma variedade de diferentes tipos de animais. Na década de 1950, Keller Breland começou a desenvolver um programa de treinamento para mamíferos marinhos. Por razões óbvias, é difícil e perigoso projetar um punidor eficaz para um golfinho ou uma orca. Também é um desafio recompensar um mamífero marinho prontamente porque ele está na água, e o treinador geralmente está a alguma distância em terra.
Muitos dos mesmos problemas são inerentes ao treinamento de cães. Se um cão se sentar, pular, girar e receber um petisco, provavelmente não saberá qual parte do desempenho agradou ao condutor. Isso é especialmente verdadeiro se o treinador levar um minuto para retirar o petisco e apresentá-lo ao cão. Normalmente, o cão irá emparelhar a recompensa com o comportamento final que realizou antes de receber o deleite. Então, se o cachorro sentou, depois pulou e recebeu um petisco, o que ele está realmente sendo treinado para fazer é pular, não sentar.
Isso também vale para os punidores. Se um cachorro foge de seu dono e se envolve em uma brincadeira de esconde-esconde, é natural que o dono castigue o cachorro quando ele o pega. No entanto, a última coisa que o cão fez antes de ser punido foi chegar ao dono. Então, vir quando chamado é o comportamento que provavelmente diminuirá, em vez de fugir.
A Breland resolveu esse problema projetando um marcador , ou sugestão, que deixaria o animal saber que tinha se comportado corretamente e receberia uma recompensa em breve. Breland usou o condicionamento clássico para emparelhar um sinal marcador com uma recompensa, de modo que, quando o animal ouvisse o sinal, soubesse que receberia uma recompensa. Então ele usou o condicionamento operante para moldar o comportamento usando recompensas positivas.
O marcador ajuda a reforçar o comportamento correto porque é imediato. O marcador não é a recompensa; é simplesmente um sinal de que o comportamento foi correto e uma promessa de uma recompensa por vir. Como os mamíferos marinhos são naturalmente orientados para a comunicação via som, fazia sentido usar um apito como marcador.
Karen Pryor usou as mesmas técnicas de reforço positivo na década de 1960 para treinar golfinhos. Ela percebeu as amplas aplicações desse tipo de modificação comportamental e, em 1984, escreveu o livro "Don't Shoot the Dog", que, apesar do título, não é realmente sobre adestramento de cães. Abrange o uso de reforço positivo para moldar o comportamento de qualquer pessoa, desde gatos de estimação até adolescentes difíceis. Muitas empresas ainda usam este livro para ensinar seus funcionários sobre gerenciamento eficaz.
Clickers de metal básicos são frequentemente usados como marcadores.
Pryor usou um clicker de metal como marcador para começar a moldar o comportamento dos cães, assim como de muitos outros animais e o nome dela é o nome mais comumente associado ao treinamento moderno de clicker. Suas técnicas foram adotadas por outros treinadores e com o advento da Internet, o treinamento com clicker se espalhou rapidamente.
Karen Pryor descreve o clique como tirar uma foto do comportamento que você deseja; você encaixá-lo naquele segundo. O clique significa:"você fez alguma coisa, foi a coisa certa, e você receberá um presente por isso".
Muitos treinadores iniciantes cometem o erro de clicar para marcar um comportamento, mas não seguem o clique com um petisco. Sem recompensa real, o cão pode continuar a oferecer o comportamento por um tempo, mas eventualmente desaparecerá.
A seguir, aprenderemos como introduzir comandos.
Outros marcadores
Um marcador não precisa ser um clicker. Pode ser qualquer coisa que marque o comportamento desejado. Os treinadores de golfinhos costumam usar espreitadelas de apito. Os peixes podem ser treinados ligando e desligando uma lanterna, e coleiras vibratórias podem marcar o comportamento de cães surdos. Algumas pessoas marcam o comportamento com uma palavra específica, como "sim!" O marcador pode ser qualquer coisa que seja curta, específica e consistente. Por esses motivos, deve-se ter cuidado ao usar a voz como marcador primário, pois o tom geralmente é inconsistente e palavras ou sons marcadores também podem ser usados em conversas regulares e perder o significado para o cão.
O clicker não é inerentemente significativo para o cão. Como o sino de Pavlov, o cão deve aprender que significa:"Treats estão chegando!" através do condicionamento clássico. Para fazer isso, os treinadores "carregam" o clicker clicando repetidamente e oferecendo imediatamente um petisco. Desta forma, o cão aprende a emparelhar o clicker com o petisco. Uma vez que o cão saiba que um clique significa um deleite, ele está pronto para começar a aprender novos comportamentos.
Os treinadores variam em seus métodos de eliciar um comportamento. Alguns defendem o uso de comida para atrair o cão para a posição. Outros simplesmente esperam que o cão ofereça o comportamento simultaneamente. A maioria dos treinadores de clicker não defende empurrar fisicamente o cão para a posição, pois isso é contrário à filosofia sem força do treinamento com clicker.
Uma vez que o cão oferece o comportamento, o momento é crítico. O treinador deve clicar no momento exato em que vê o comportamento que deseja. Se o cão se deitar e rolar antes que o condutor clique, rolar foi marcado como o comportamento desejado, não deitar.
Os cães podem aprender padrões de comportamento complicados usando o treinamento com clicker se você ensinar a sequência gradualmente. Por exemplo, se você quiser treinar seu cachorro para pular em um aro, você pode inicialmente clicar e tratar o cachorro apenas por caminhar até o aro. Uma vez que o cão está caminhando de forma confiável até o aro, você clicaria apenas quando ele enfiasse a cabeça pela abertura e apenas quando ele passasse. Finalmente, você clicaria apenas quando o cachorro realmente pulasse no aro. O padrão para o que ganhará uma recompensa continua aumentando à medida que o cão aprende cada novo passo. Isso é formar .
Em vez de dar um comando e depois ensinar ao cão o que isso significa, a maioria dos treinadores de clicker prefere introduzir o comando somente depois que o cão estiver oferecendo o comportamento de maneira confiável. Movimentos de atração (como segurar uma guloseima e movê-la na frente do nariz do cão, em seguida, para o chão para ensinar o cão a "cair") podem ser adaptados em sinais de mão para comandos estilizando o movimento e eliminando a atração de comida. Muitos treinadores sentem sinais manuais são mais fáceis para os cães aprenderem que sinais verbais de qualquer maneira, mas ter um cão que responda a qualquer um deles é o ideal. Uma vez que um cão está oferecendo o comportamento desejado, o condutor pode começar a usar o comando para que o cão aprenda a associar os dois. Eventualmente, o manipulador só clicará no comportamento se for solicitado com um comando, não quando for oferecido espontaneamente.
Este cão aprendeu o sinal de mão para "high five".
É importante lembrar que os animais são aprendizes contextuais . Isso significa que eles podem entender um comando em um lugar, mas não em outro. Um cão pode sentar-se perfeitamente quando o condutor está de pé, mas fica muito confuso quando o condutor dá o comando sentado. Ao treinar um novo comando, os tratadores precisam adicionar novos contextos, fazendo backup quando necessário, para ajudar o cão a generalizar.
Em seguida, veremos como usar o treinamento com o clicker para fazer com que seu cão pare de certos comportamentos.
Entrevista com Dan O'Leary, treinador de clicker na PetSmart em Lexington, KY
Quando e como você começou a treinar cães?
Embora eu tenha cães desde criança, nunca treinei um de verdade até 1979, quando ganhei meu primeiro pastor alemão. Afinal, os pastores eram cães policiais, ou cães como Rin Tin Tin, ou Bullet (o cachorro de Roy Rogers), então é claro que eles deveriam ser treinados. Então eu me inscrevi para uma aula de treinamento.
Você já trabalhou treinando outras espécies de animais?
Não até recentemente. Atualmente, estou treinando nosso gatinho de 6 meses, usando os princípios básicos do treinamento com clicker, para buscar e cumprimentar.
Você sempre usou treinamento com clicker?
Não.
Que outros métodos você usou?
Quando comecei, ninguém estava treinando cães com clicker. Comecei com o treinamento "tradicional", usando correntes de estrangulamento, coleiras de pinos e correções de trelas.
Qual você diria que é a maior vantagem do treinamento com clicker?
...para as pessoas?
Muitas pessoas preferem não ter que usar correções de trela e correntes de estrangulamento. O treinamento com clicker oferece uma alternativa. Além disso, como o treinamento com clicker não requer o uso de força física, uma criança ou uma pessoa mais velha ainda pode treinar um cachorro grande e forte.
... para os cães?
Os cães que são treinados com métodos tradicionais são essencialmente punidos, geralmente com uma correcção da trela, sempre que cometem um erro. Isso pode fazer com que eles "desliguem" quando não tiverem certeza do que fazer. Como fazer a coisa errada traz punição, o cão não faz nada. Cães treinados com clicker, por outro lado, vão experimentar, tentar coisas diferentes na esperança de encontrar o comportamento que traz uma recompensa. Eles estão mais engajados no processo de treinamento.
Existem desvantagens?
Não acredito que haja desvantagens para o cão. Para as pessoas, parece ser mais difícil entender a ideia de que um cão pode ser treinado usando principalmente recompensas em vez de principalmente punição.
Qual é a coisa mais difícil para as pessoas dominarem?
Bom timing e consistência.
O que geralmente leva as pessoas às suas aulas?
Normalmente, as pessoas fazem uma aula porque têm um problema comportamental que querem resolver. Normalmente, são coisas comuns, como arrombar a casa, comportamento destrutivo, beliscar, pular, etc. Às vezes, as pessoas têm problemas mais sérios, como ansiedade de separação, agressividade ou problemas de medo. Alguns desses problemas podem ser resolvidos em uma situação de classe e alguns podem exigir aulas particulares.
Existem algumas raças ou temperamentos de cães que se saem melhor com esse tipo de treinamento do que outros?
Todas as raças de cães são treináveis. O que é fácil e o que é difícil de treinar pode variar muito de acordo com o que o cão foi criado para fazer. Se um cão simplesmente não se senta com muita frequência, levará mais tempo para ensiná-lo a sentar do que para um cão que se senta com frequência. Acredito que se trata de uma comunicação clara com o cão e descobrir o que é mais motivador para o cão individualmente.
O que você gostaria que as pessoas soubessem sobre o treinamento com clicker?
O treinamento com clicker é eficaz, fácil e divertido, tanto para o dono quanto para o cão. E até as crianças podem ser treinadores de clicker maravilhosos. O treinamento com clicker é adequado para cães e nunca envolve punição ou força severa. Os cães apreciam a estimulação mental do treinamento com clicker, e o treinamento com clicker ajuda toda a família a desfrutar de seu cão porque fortalece a comunicação e o vínculo.
Outras ideias ou comentários?
Mais cães são sacrificados a cada ano por problemas de comportamento solucionáveis. Treinar cães salva vidas.
consulte Mais informação
É muito mais fácil ensinar um cachorro a fazer algo bom do que ensiná-lo a não fazer algo ruim. Ao quebrar um cão de um comportamento indesejável, a primeira coisa a considerar é qual recompensa o cão está recebendo por isso. Ele deve estar recebendo alguma recompensa ou não continuaria fazendo isso, mas às vezes as recompensas são sutis ou contra-intuitivas . Quando um cachorro pula em cima de seu dono e o dono o empurra, ser manuseado é a recompensa física e pode ser mais poderoso para o cachorro do que a punição de gritar. Os tratadores devem ter cuidado para não recompensar acidentalmente os cães por comportamento indesejável. Uma vez que o manipulador identifica e elimina a recompensa acidental (na medida do possível), o próximo passo é treinar um comportamento incompatível. O cão treinado para sentar quando o dono pega a coleira não pode pular simultaneamente e derrubar seu dono.
O clicker é uma ferramenta de treinamento e os manipuladores não devem usá-lo indefinidamente. O objetivo do clicker é comunicar o comportamento desejado. Uma vez que o cão entenda o comando e o execute de forma confiável, você pode eliminar o clicker. Você ainda pode recompensar o cão, mas com o tempo você pode mudar de uma recompensa alimentar altamente valorizada para uma recompensa alimentar menos desejável, então talvez para apenas uma recompensa verbal. Quando o comportamento é aprendido completamente, nenhuma recompensa pode ser necessária, embora cães e pessoas apreciem feedback por um trabalho bem feito.
O condicionamento operante é uma ferramenta poderosa para moldar o comportamento de quase todos os animais, incluindo cães. Um foco no reforço positivo ajuda todos a desfrutar do treinamento e aprofunda o vínculo entre o treinador e o aluno. O uso de um marcador ajuda a identificar com precisão o comportamento desejado e acelera muito o processo de treinamento. Quando um cão não consegue aprender alguma coisa, geralmente é por causa de uma falha na comunicação, e não por falta de vontade de cooperar. Um bom treinador pode ajudar a solucionar esses problemas. Os únicos limites reais desse tipo de treinamento são a capacidade do manipulador de identificar corretamente reforçadores significativos e de dividir o comportamento desejado em etapas gerenciáveis.
Para obter mais informações sobre condicionamento operante ou para encontrar aulas de treinamento com clicker perto de você, consulte nossos links úteis na próxima página.
Recompensas vs. Justiceiros
Por que usar recompensas em vez de punidores? Não há dúvida de que tanto as recompensas quanto os punidores podem ser reforçadores eficazes, mas as recompensas geralmente são mais fáceis de usar. Para ser eficaz, uma punição deve ser imediata, intensa, inevitável e consistente, o que é surpreendentemente difícil de alcançar na vida real [ref]. É muito fácil atrapalhar um punidor usando um timing ruim, força excessiva ou inadequada. Além disso, consequências desagradáveis são frequentemente associadas ao manipulador e não ao mau comportamento.
Embora os cães tenham ajudado pessoas com trabalhos específicos por milênios, hoje a maioria se parece mais com membros da família do que com funcionários. De acordo com a American Pet Products Manufacturers Association, em 2005, os donos de animais americanos gastaram cerca de 39,5 bilhões dólares em seus animais de estimação, mais que o dobro do que gastaram em 1994.
Embora isso represente uma idade de ouro para cães sortudos, o status de membro da família também pode exigir que o cão atenda a certos padrões de comportamento. Embora você possa imaginar o contrário pela abundância de moda canina agora disponível, os cães não são pessoas pequenas e peludas. Eles têm sua própria maneira de pensar e fazer as coisas. Milhares de cães são entregues a abrigos de animais a cada ano, ou permanentemente relegados a um curral de quintal, simplesmente por agirem como cães.
Cães e pessoas podem viver juntos felizes, mas isso exige que os donos se esforcem para preencher a lacuna entre as espécies e treinem seus cães para se comportarem adequadamente na sociedade humana. Existem muitas maneiras diferentes de treinar cães e muitos treinadores que dirão que a maneira deles é a única maneira "certa", mas a realidade é que existem vários métodos que funcionam. A principal diferença entre eles é a rapidez com que funcionam e como são agradáveis para o cão e o condutor.
Neste artigo, exploraremos a história e as ideias por trás da maioria dos métodos de treinamento de cães e falaremos sobre um dos métodos mais populares atualmente:o treinamento com clicker.
Teoria de Aprendizagem
Famoso estudo de PavlovO treinamento de cães geralmente se concentra no condicionamento operante . O primeiro cientista a definir esse conceito foi B.F. Skinner, que estudou o trabalho do fisiologista russo Dr. Ivan Pavlov sobre comportamento animal. No estudo inovador de Pavlov, os cães aprenderam que um estímulo (neste caso, um sino) significava que eles estavam prestes a ser alimentados. Começando com duas coisas que são naturalmente pareadas – salivar e ser alimentado – Pavlov adicionou um terceiro componente tocando um sino antes de se alimentar. Após algumas tentativas, os cães aprenderam a associar o sino com a alimentação e reagiriam salivando ao som do sino em antecipação à comida, mas sem nenhum alimento presente.
Como os cães naturalmente começam a salivar quando recebem comida, a comida é um estímulo incondicionado . Nenhum condicionamento ou treinamento especial é necessário para fazer o cão salivar, o que é uma resposta incondicionada . Em contraste, um sino tocando normalmente não faz os cães salivarem; eles o farão somente se tiverem sido condicionados a associar um sino a ser alimentado. Portanto, o sino é um estímulo condicionado . A nova reação do cão é um reflexo ao estímulo e é uma resposta condicionada .
Muitos de nós vemos isso hoje com nossos próprios cães quando eles começam a latir ao som da campainha, às vezes até mesmo uma campainha na televisão. Neste caso, o cão foi condicionado a associar o estímulo da campainha com a chegada iminente de um estranho.
Quando vemos luzes piscando ou ouvimos uma sirene atrás de nós enquanto dirigimos, podemos ficar tensos reflexivamente e nossa frequência cardíaca pode aumentar. Fomos condicionados a associar o som das sirenes à experiência desagradável e estressante de conseguir uma multa. Este é o condicionamento clássico . Tanto os animais quanto as pessoas podem aprender a relacionar um par de eventos e responder ao primeiro em antecipação ao segundo. Esse tipo de aprendizado é passivo e involuntário; ocorre sem que o aluno faça nada e muitas vezes sem consciência.
Enquanto o trabalho de Pavlov tratava de uma reação reflexiva a um estímulo condicionado, Skinner se interessou em criar uma reação comportamental específica a um estímulo adicionando um reforçador . Um reforçador pode ser uma recompensa ou um punidor . Uma recompensa é qualquer coisa que aumente a frequência de uma ação; um punidor é qualquer coisa que diminua sua frequência.
Quando somos recompensados por um determinado comportamento, é provável que o repitamos. Quando somos punidos por um determinado comportamento, é provável que paremos. Este tipo de aprendizagem é ativa e voluntária; depende das ações do aluno.
Como a definição de um reforçador é baseada em sua eficácia, é importante lembrar que uma recompensa para uma pessoa pode não ser significativa e, portanto, não é uma recompensa para outra. Da mesma forma, o que é uma recompensa em um contexto pode não ser em outro.
Um rato em uma caixa básica de Skinner
Skinner mostrou que tanto animais quanto pessoas realizariam certos comportamentos por uma recompensa. Em seus experimentos com ratos e pombos, Skinner mostrou como os animais podem aprender a pressionar uma alavanca para obter uma recompensa alimentar. Quando os animais foram introduzidos pela primeira vez na caixa de teste, eles se moveram aleatoriamente. Quando eles acidentalmente pressionaram a alavanca, um pellet de comida foi dispensado. Eles rapidamente aprenderam a pressionar a alavanca de propósito para obter uma pelota. Ele também modelou comportamentos que são mais complicados, reforçando-os passo a passo. Skinner chamou sua abordagem de "condicionamento operante" porque o comportamento do animal realmente operava no ambiente (pressionando a alavanca) em resposta ao resultado antecipado (receber uma recompensa alimentar).
Recompensar para encorajar o bom comportamento e punir para desencorajar o mau é algo que a maioria de nós faz instintivamente; é bom senso. O condicionamento operante tinha uma longa história no treinamento de animais antes mesmo de ser definido. O coronel Konrad Most, que publicou "Training Dogs:A Manual" em 1910, estava usando muitos dos mesmos princípios que Skinner estudou, décadas antes de descrevê-los. Os métodos de treinamento do Coronel Most parecem um tanto severos para os padrões de hoje, mas ele é considerado por muitos como o pai do treinamento moderno de cães. A maioria e outros treinadores usavam recompensas e punições para moldar e reforçar o comportamento desejado.
A seguir, veremos como os reforçadores são usados no treinamento de animais.
Reforçadores
É importante que os periquitos e outras aves mantidas como animais de estimação sejam treinados manualmente.Os reforçadores podem envolver a adição de um novo elemento ou a remoção de um elemento atualmente presente. A terminologia para isso é um pouco confusa, mas adicionar algo é referido como "positivo", embora não necessariamente no sentido de "feliz" ou "bom". "Negativo", neste caso, é a remoção de algo, e não significa necessariamente "ruim". Portanto, tanto as recompensas quanto os punidores podem ser positivos ou negativos.
Dar a um papagaio um pedaço de fruta por acenar com o pé é um acréscimo de algo bom (uma recompensa positiva); um cavalo se movendo mais rápido para parar a pressão das esporas é o fim de algo ruim (recompensa negativa). Mesmo que "recompensa negativa" soe como um paradoxo, a remoção de algo ruim é uma espécie de recompensa.
Alguns punidores positivos comumente usados incluem coleiras de choque, coleiras de pinos e correntes de estrangulamento.
Há muitas maneiras de ensinar um cão a sentar usando um reforçador. O treinador pode empurrar ou atrair o cão para uma posição sentada, ou pode simplesmente esperar até que o cão se sente naturalmente por conta própria. Uma vez que o cão se senta, o treinador pode oferecer uma recompensa positiva, como elogios verbais ("bom menino!"), elogios táteis (um tapinha na cabeça), um brinquedo favorito ou uma guloseima. Alguns treinadores usam recompensas negativas, como coleiras eletrônicas, para dar um leve choque no cão, que para assim que ele se senta. O cão aprende que pode eliminar o choque sentado. Por razões éticas, muitas pessoas desaprovam isso. No entanto, segue os mesmos princípios do condicionamento operante. Em todos os casos, o cão aprenderá que, ao ouvir o comando "senta" e se sentar, receberá uma recompensa.
Muitas pessoas preferem usar guloseimas como reforço durante o treinamento.
Os reforçadores podem ser quase tudo, desde que sejam significativos para o cão. Um cão pode pensar que guloseimas são mais valiosas do que brinquedos, enquanto outro pode sentir o oposto. Não importa realmente qual é o reforçador, mas por razões práticas, alguns reforçadores são mais fáceis de trabalhar do que outros. Além disso, o mesmo reforçador não precisa ser usado todas as vezes ou em todas as situações. Algumas tarefas podem exigir um reforçador mais valioso do que outras. Como diz o treinador de obediência da PetSmart, Dan O'Leary, "você provavelmente passaria por cima de uma cadeira se eu lhe oferecesse um dólar para fazer isso. Mas você provavelmente não lavaria e enceraria meu carro por um dólar". Da mesma forma, seu cão pode trabalhar por um tipo de recompensa na relativa calma de sua casa, mas pode precisar de algo mais desejável para manter o foco na aula.
Veremos como os treinadores desenvolveram marcadores, ou pistas, para treinar outros animais além dos cães.
Marcadores
Golfinhos em execuçãoKeller e Marian Breland foram alunos de B.F. Skinner e expandiram suas técnicas para treinar uma variedade de diferentes tipos de animais. Na década de 1950, Keller Breland começou a desenvolver um programa de treinamento para mamíferos marinhos. Por razões óbvias, é difícil e perigoso projetar um punidor eficaz para um golfinho ou uma orca. Também é um desafio recompensar um mamífero marinho prontamente porque ele está na água, e o treinador geralmente está a alguma distância em terra.
Muitos dos mesmos problemas são inerentes ao treinamento de cães. Se um cão se sentar, pular, girar e receber um petisco, provavelmente não saberá qual parte do desempenho agradou ao condutor. Isso é especialmente verdadeiro se o treinador levar um minuto para retirar o petisco e apresentá-lo ao cão. Normalmente, o cão irá emparelhar a recompensa com o comportamento final que realizou antes de receber o deleite. Então, se o cachorro sentou, depois pulou e recebeu um petisco, o que ele está realmente sendo treinado para fazer é pular, não sentar.
Isso também vale para os punidores. Se um cachorro foge de seu dono e se envolve em uma brincadeira de esconde-esconde, é natural que o dono castigue o cachorro quando ele o pega. No entanto, a última coisa que o cão fez antes de ser punido foi chegar ao dono. Então, vir quando chamado é o comportamento que provavelmente diminuirá, em vez de fugir.
A Breland resolveu esse problema projetando um marcador , ou sugestão, que deixaria o animal saber que tinha se comportado corretamente e receberia uma recompensa em breve. Breland usou o condicionamento clássico para emparelhar um sinal marcador com uma recompensa, de modo que, quando o animal ouvisse o sinal, soubesse que receberia uma recompensa. Então ele usou o condicionamento operante para moldar o comportamento usando recompensas positivas.
O marcador ajuda a reforçar o comportamento correto porque é imediato. O marcador não é a recompensa; é simplesmente um sinal de que o comportamento foi correto e uma promessa de uma recompensa por vir. Como os mamíferos marinhos são naturalmente orientados para a comunicação via som, fazia sentido usar um apito como marcador.
Karen Pryor usou as mesmas técnicas de reforço positivo na década de 1960 para treinar golfinhos. Ela percebeu as amplas aplicações desse tipo de modificação comportamental e, em 1984, escreveu o livro "Don't Shoot the Dog", que, apesar do título, não é realmente sobre adestramento de cães. Abrange o uso de reforço positivo para moldar o comportamento de qualquer pessoa, desde gatos de estimação até adolescentes difíceis. Muitas empresas ainda usam este livro para ensinar seus funcionários sobre gerenciamento eficaz.
Clickers de metal básicos são frequentemente usados como marcadores.
Pryor usou um clicker de metal como marcador para começar a moldar o comportamento dos cães, assim como de muitos outros animais e o nome dela é o nome mais comumente associado ao treinamento moderno de clicker. Suas técnicas foram adotadas por outros treinadores e com o advento da Internet, o treinamento com clicker se espalhou rapidamente.
Karen Pryor descreve o clique como tirar uma foto do comportamento que você deseja; você encaixá-lo naquele segundo. O clique significa:"você fez alguma coisa, foi a coisa certa, e você receberá um presente por isso".
Muitos treinadores iniciantes cometem o erro de clicar para marcar um comportamento, mas não seguem o clique com um petisco. Sem recompensa real, o cão pode continuar a oferecer o comportamento por um tempo, mas eventualmente desaparecerá.
A seguir, aprenderemos como introduzir comandos.
Outros marcadores
Um marcador não precisa ser um clicker. Pode ser qualquer coisa que marque o comportamento desejado. Os treinadores de golfinhos costumam usar espreitadelas de apito. Os peixes podem ser treinados ligando e desligando uma lanterna, e coleiras vibratórias podem marcar o comportamento de cães surdos. Algumas pessoas marcam o comportamento com uma palavra específica, como "sim!" O marcador pode ser qualquer coisa que seja curta, específica e consistente. Por esses motivos, deve-se ter cuidado ao usar a voz como marcador primário, pois o tom geralmente é inconsistente e palavras ou sons marcadores também podem ser usados em conversas regulares e perder o significado para o cão.
Treinamento do Clicker:Introdução aos comandos
Este cão está sendo treinado, ou moldado, para pular um aro.O clicker não é inerentemente significativo para o cão. Como o sino de Pavlov, o cão deve aprender que significa:"Treats estão chegando!" através do condicionamento clássico. Para fazer isso, os treinadores "carregam" o clicker clicando repetidamente e oferecendo imediatamente um petisco. Desta forma, o cão aprende a emparelhar o clicker com o petisco. Uma vez que o cão saiba que um clique significa um deleite, ele está pronto para começar a aprender novos comportamentos.
Os treinadores variam em seus métodos de eliciar um comportamento. Alguns defendem o uso de comida para atrair o cão para a posição. Outros simplesmente esperam que o cão ofereça o comportamento simultaneamente. A maioria dos treinadores de clicker não defende empurrar fisicamente o cão para a posição, pois isso é contrário à filosofia sem força do treinamento com clicker.
Uma vez que o cão oferece o comportamento, o momento é crítico. O treinador deve clicar no momento exato em que vê o comportamento que deseja. Se o cão se deitar e rolar antes que o condutor clique, rolar foi marcado como o comportamento desejado, não deitar.
Os cães podem aprender padrões de comportamento complicados usando o treinamento com clicker se você ensinar a sequência gradualmente. Por exemplo, se você quiser treinar seu cachorro para pular em um aro, você pode inicialmente clicar e tratar o cachorro apenas por caminhar até o aro. Uma vez que o cão está caminhando de forma confiável até o aro, você clicaria apenas quando ele enfiasse a cabeça pela abertura e apenas quando ele passasse. Finalmente, você clicaria apenas quando o cachorro realmente pulasse no aro. O padrão para o que ganhará uma recompensa continua aumentando à medida que o cão aprende cada novo passo. Isso é formar .
Em vez de dar um comando e depois ensinar ao cão o que isso significa, a maioria dos treinadores de clicker prefere introduzir o comando somente depois que o cão estiver oferecendo o comportamento de maneira confiável. Movimentos de atração (como segurar uma guloseima e movê-la na frente do nariz do cão, em seguida, para o chão para ensinar o cão a "cair") podem ser adaptados em sinais de mão para comandos estilizando o movimento e eliminando a atração de comida. Muitos treinadores sentem sinais manuais são mais fáceis para os cães aprenderem que sinais verbais de qualquer maneira, mas ter um cão que responda a qualquer um deles é o ideal. Uma vez que um cão está oferecendo o comportamento desejado, o condutor pode começar a usar o comando para que o cão aprenda a associar os dois. Eventualmente, o manipulador só clicará no comportamento se for solicitado com um comando, não quando for oferecido espontaneamente.
Este cão aprendeu o sinal de mão para "high five".
É importante lembrar que os animais são aprendizes contextuais . Isso significa que eles podem entender um comando em um lugar, mas não em outro. Um cão pode sentar-se perfeitamente quando o condutor está de pé, mas fica muito confuso quando o condutor dá o comando sentado. Ao treinar um novo comando, os tratadores precisam adicionar novos contextos, fazendo backup quando necessário, para ajudar o cão a generalizar.
Em seguida, veremos como usar o treinamento com o clicker para fazer com que seu cão pare de certos comportamentos.
Entrevista com Dan O'Leary, treinador de clicker na PetSmart em Lexington, KY
Quando e como você começou a treinar cães?
Embora eu tenha cães desde criança, nunca treinei um de verdade até 1979, quando ganhei meu primeiro pastor alemão. Afinal, os pastores eram cães policiais, ou cães como Rin Tin Tin, ou Bullet (o cachorro de Roy Rogers), então é claro que eles deveriam ser treinados. Então eu me inscrevi para uma aula de treinamento.
Você já trabalhou treinando outras espécies de animais?
Não até recentemente. Atualmente, estou treinando nosso gatinho de 6 meses, usando os princípios básicos do treinamento com clicker, para buscar e cumprimentar.
Você sempre usou treinamento com clicker?
Não.
Que outros métodos você usou?
Quando comecei, ninguém estava treinando cães com clicker. Comecei com o treinamento "tradicional", usando correntes de estrangulamento, coleiras de pinos e correções de trelas.
Qual você diria que é a maior vantagem do treinamento com clicker?
...para as pessoas?
Muitas pessoas preferem não ter que usar correções de trela e correntes de estrangulamento. O treinamento com clicker oferece uma alternativa. Além disso, como o treinamento com clicker não requer o uso de força física, uma criança ou uma pessoa mais velha ainda pode treinar um cachorro grande e forte.
... para os cães?
Os cães que são treinados com métodos tradicionais são essencialmente punidos, geralmente com uma correcção da trela, sempre que cometem um erro. Isso pode fazer com que eles "desliguem" quando não tiverem certeza do que fazer. Como fazer a coisa errada traz punição, o cão não faz nada. Cães treinados com clicker, por outro lado, vão experimentar, tentar coisas diferentes na esperança de encontrar o comportamento que traz uma recompensa. Eles estão mais engajados no processo de treinamento.
Existem desvantagens?
Não acredito que haja desvantagens para o cão. Para as pessoas, parece ser mais difícil entender a ideia de que um cão pode ser treinado usando principalmente recompensas em vez de principalmente punição.
Qual é a coisa mais difícil para as pessoas dominarem?
Bom timing e consistência.
O que geralmente leva as pessoas às suas aulas?
Normalmente, as pessoas fazem uma aula porque têm um problema comportamental que querem resolver. Normalmente, são coisas comuns, como arrombar a casa, comportamento destrutivo, beliscar, pular, etc. Às vezes, as pessoas têm problemas mais sérios, como ansiedade de separação, agressividade ou problemas de medo. Alguns desses problemas podem ser resolvidos em uma situação de classe e alguns podem exigir aulas particulares.
Existem algumas raças ou temperamentos de cães que se saem melhor com esse tipo de treinamento do que outros?
Todas as raças de cães são treináveis. O que é fácil e o que é difícil de treinar pode variar muito de acordo com o que o cão foi criado para fazer. Se um cão simplesmente não se senta com muita frequência, levará mais tempo para ensiná-lo a sentar do que para um cão que se senta com frequência. Acredito que se trata de uma comunicação clara com o cão e descobrir o que é mais motivador para o cão individualmente.
O que você gostaria que as pessoas soubessem sobre o treinamento com clicker?
O treinamento com clicker é eficaz, fácil e divertido, tanto para o dono quanto para o cão. E até as crianças podem ser treinadores de clicker maravilhosos. O treinamento com clicker é adequado para cães e nunca envolve punição ou força severa. Os cães apreciam a estimulação mental do treinamento com clicker, e o treinamento com clicker ajuda toda a família a desfrutar de seu cão porque fortalece a comunicação e o vínculo.
Outras ideias ou comentários?
Mais cães são sacrificados a cada ano por problemas de comportamento solucionáveis. Treinar cães salva vidas.
consulte Mais informação
Treinamento do Clicker:Eliminando o Comportamento Indesejável
Hector, uma mistura de Chihuahua, espera para receber a bola.É muito mais fácil ensinar um cachorro a fazer algo bom do que ensiná-lo a não fazer algo ruim. Ao quebrar um cão de um comportamento indesejável, a primeira coisa a considerar é qual recompensa o cão está recebendo por isso. Ele deve estar recebendo alguma recompensa ou não continuaria fazendo isso, mas às vezes as recompensas são sutis ou contra-intuitivas . Quando um cachorro pula em cima de seu dono e o dono o empurra, ser manuseado é a recompensa física e pode ser mais poderoso para o cachorro do que a punição de gritar. Os tratadores devem ter cuidado para não recompensar acidentalmente os cães por comportamento indesejável. Uma vez que o manipulador identifica e elimina a recompensa acidental (na medida do possível), o próximo passo é treinar um comportamento incompatível. O cão treinado para sentar quando o dono pega a coleira não pode pular simultaneamente e derrubar seu dono.
O clicker é uma ferramenta de treinamento e os manipuladores não devem usá-lo indefinidamente. O objetivo do clicker é comunicar o comportamento desejado. Uma vez que o cão entenda o comando e o execute de forma confiável, você pode eliminar o clicker. Você ainda pode recompensar o cão, mas com o tempo você pode mudar de uma recompensa alimentar altamente valorizada para uma recompensa alimentar menos desejável, então talvez para apenas uma recompensa verbal. Quando o comportamento é aprendido completamente, nenhuma recompensa pode ser necessária, embora cães e pessoas apreciem feedback por um trabalho bem feito.
O condicionamento operante é uma ferramenta poderosa para moldar o comportamento de quase todos os animais, incluindo cães. Um foco no reforço positivo ajuda todos a desfrutar do treinamento e aprofunda o vínculo entre o treinador e o aluno. O uso de um marcador ajuda a identificar com precisão o comportamento desejado e acelera muito o processo de treinamento. Quando um cão não consegue aprender alguma coisa, geralmente é por causa de uma falha na comunicação, e não por falta de vontade de cooperar. Um bom treinador pode ajudar a solucionar esses problemas. Os únicos limites reais desse tipo de treinamento são a capacidade do manipulador de identificar corretamente reforçadores significativos e de dividir o comportamento desejado em etapas gerenciáveis.
Para obter mais informações sobre condicionamento operante ou para encontrar aulas de treinamento com clicker perto de você, consulte nossos links úteis na próxima página.
Recompensas vs. Justiceiros
Por que usar recompensas em vez de punidores? Não há dúvida de que tanto as recompensas quanto os punidores podem ser reforçadores eficazes, mas as recompensas geralmente são mais fáceis de usar. Para ser eficaz, uma punição deve ser imediata, intensa, inevitável e consistente, o que é surpreendentemente difícil de alcançar na vida real [ref]. É muito fácil atrapalhar um punidor usando um timing ruim, força excessiva ou inadequada. Além disso, consequências desagradáveis são frequentemente associadas ao manipulador e não ao mau comportamento.