sunnuntai 24. huhtikuuta 2016

Miten toimia, jos koira tekee virheen?

Mun on nyt tosi vaikea suoltaa ulos tekstiä. Erityisesti haluaisin kirjoittaa Eva Bertilssonin koulutusviikonloppua koskevan kirjoituksen loppuun, mutta se ei ota onnistuakseen. Irrotin nyt muusta kokonaisuudesta tämän pätkän virheiden kanssa pelaamisesta, jotta saisin työtaakan itselleni pienemmäksi. Se on yhteenveto Evan ajatuksista ja omista pohdinnoistani, jotka ovat vielä hiukan lapsenkengissä.

MITEN TOIMIA, JOS KOIRA TEKEE VIRHEEN?

Lähtökohtaisesti pitäisi muistaa, että virheet eivät ole paras tapa oppia. Tai, no, miten sen nyt ottaa, oppimisen kannalta lienee tärkeämpää mitä tapahtuu virheen jälkeen. Puhtaassa sheippaamisessa koira kokeilee varsinkin alkuun kaikennäköistä, ja ihminen (yrittää) vahvistaa vain haluamaansa käyttäytymistä. Toki voisimme aina yrittää suunnitella sessiot niin, että koira onnistuisi joka yrityksellä alusta alkaen ja näin pääsisimme nopeammin tavoitteeseen, mutta tämä ei ole realistista. Siispä turvaudumme yritys-erehdykseen ja naksuttimeen, mikä opetustapana parhaimmillaan vahvistaa koiran omaa aktiivisuutta ja yritteliäisyyttä sammuttaen nopeasti ei-toivotut käyttäytymiset. Toki vahvistetiheyden tulee olla riittävä.

Virheen sattuessa saattaa helposti käydä niin, että koira joko passivoituu tai turhautuu ja kokee extinction burstin. Extinction burst on varmasti meille jokaiselle tuttu. Kyse on käyttäytymisen sammumiseen liittyvästä ilmiöstä. Esim. Saimaa pyytää rapsutuksia tönäisemällä kättäni päällään. No, jos en heti reagoi tähän pyyntöön, Saimaa alkaa töniä kättäni todella rajusti ja tiheään tahtiin saadakseen haluamansa = extinction burst. Jos en reagoi tähänkään, käyttäytyminen sammuu.

Mistä koira tietää milloin haluamme sen liikkuvan tai muuten muuttavan toimintaansa? 
Käytän esimerkkinä seuraamista, jota olen viime aikoina naksutellut Saimaalle. Saimaa seuraa herkästi turhan edessä, ja palkan suunnan muuttamisen lisäksi ajattelin ihan konkreettisesti naksutella taaksepäin siirtymistä. En kuitenkaan halunnut, että mulla on koira, joka koko ajan yrittää varioida seuraamistaan sen toivossa, että hei kohta tulee naksu ja maksu. Siispä päätin erotella ne tilanteet, joissa halusin koiran jatkavan samaa rataa niistä tilanteista, joissa halusin sen tarjoavan jotain muutosta. Oma versioni on nyt se, että kun olen hiljaa ja ryhdikäs, olen myös tyytyväinen (=koeminä), ja kun höpöttelen mitä sattuu, haluan Saimaan muuttavan jotain. Tämä on toiminut meillä loistavasti ja olen saanut seuruupaikkaa siirrettyä taaksepäin. Muita vihjeitä tarjoamistilanteista ovat meillä mm. mun kyykyssä tai lattialla istuminen sekä ympäristöön tuotu uusi esine.

Sitten siirrymmekin suosikkiini eli NRM:ään (no reward marker). Näitä ovat kaikki ne ihanat "oho"-, "hups"- ja "höpöhöpö"-lausahdukset, joita kuulee niin usein treenikentillä viljeltävän ja joitan itse käytän käytin varsin tiheään. Taustalla taitaa useimmilla olla ajatus siitä, että koiralle on reilua kertoa kun menee pieleen, jotta se ymmärtää lopettaa ja kokeilla jotain muuta. Ja kyllä, moni koira oppii asioita oikein kivasti, kun sekoitetaan RM:ia ja NRM:ia. Esim. Sätkän ohjattu nouto on alkuopetuksen jälkeen rakennettu niin, että minä huusin "oho" jos S lähti väärälle kapulalle ja "jes" jos lähti oikealle. Mutta. Jos haluamme optimoida oppimisen ja ennen kaikkea sen mielentilan, jossa koira oppii, on syytä miettiä NRM:n käyttöä hyvin tarkkaan. Lähes poikkeuksetta siitä tulee koiralle eräänlainen rangaistus, ja koira haluaa välttää rangaistuksia ja tilanteita, joissa rangaistus on todennäköinen. Esim. tässä tutkimuksessa 27 koiraa jaettiin kahteen ryhmään ja niitä opetettiin laittamaan etutassut maassa olevaan renkaaseen. Ensimmäinen ryhmä jätti huonot yritykset huomiotta ja palkitsi hyvät naksulla & namilla, kun taas toinen ryhmä käytti NRM:ia virheiden kohdalla ja palkitsi hyvät naksulla & namilla. Ensimmäisen ryhmän koirat oppivat tempun huomattavasti nopeammin ja olivat siinä parempia kuin toisen ryhmän koirat. Onnistumisprosentti oli ensimmäisen ryhmän kohdalla 60%, toisen ryhmän kohdalla taas 27%. Samalla tutkimuksessa todettiin, että monet toisen ryhmän koirat jättivät leikin kesken jo alkuvaiheessa. Eikö siis olisi kivempi opettaa koiralle mitä sen kannattaa tehdä ennemmin kuin mitä se ei saa tehdä?

"Oho" voisi periaatteessa toimia, jos sen merkitys ei olisikaan "teit väärin" vaan esim. "tule iloisesti kohti ohjaajaa". Se voisi myös olla vihje toiminnan muuttamiselle, mutta minä en ainakaan kykenisi arvioimaan riittävän hyvin toimiiko sana S(delta)na vai ei (mitä sen siis ei pitäisi tehdä). Siispä on turvallisempaa vain jättää koko roska pois.

Okei, eli NRM on out of the game. Mitä sitten saa tehdä, kun virhe sattuu? Ihan ensin pitää päättää, haluaako ylipäätään tehdä mitään. Monet virheet kannattaa vain jättää huomiotta, mikä on esim. uuden tempun sheippaamisessa homman juju. Toisaalta jos sama virhe toistuu samassa kohtaa useamman kerran, on riskinä se, että siitä tulee osa ketjua. Käytän tässä esimerkkinä Saimaan roskakäyttäytymistä sivulletulotreeneissä: leikin Saimaan kanssa ---> pyydän sitä irrottamaan ---> pyydän sen sivulle ---> Saimaa haukahtaa ---> Saimaa tulee sivulle ---> palkka. Lienee ilmeistä, että haukahtaminen on se roskakäyttäytyminen, joka on päässyt osaksi ketjua. Kun virhe on toistunut (nyrkkisääntönä) kaksi tai kolme kertaa peräkkäin, on meillä karkeasti kolme vaihtoehtoa.
  1. Keskeytetään treeni eli pyydetään koiralta taukokäyttäytyminen (Saimaalla matto). Sitten pohditaan kaikessa rauhassa miksi koira teki virheen eli mikä treenin suunnittelussa meni pieleen (tässä esimerkissä keksin itse kaksi virhettä: viive irrottamisen ja vihjeen välillä oli liian pitkä, mikä mahdollisti roskakäyttäytymisen, ja mun vaatimustaso oli turhan korkea, kun pyysin koiraa siirtymään koko matkan edestä sivulle). Sen jälkeen tehdään uusi ja parempi suunnitelma (yritän sanoa "kiitos" ja "sivu" ihan peräkanaa, ja irrotus tapahtuu niin, että koira on jo valmiiksi lähempänä mun vasenta jalkaa eli matka on lyhyempi). Sitten vain toteutetaan tämä hieno suunnitelma!
  2. Pyydetään koiralta jokin helppo ja varma käyttäytyminen, jolla parhaassa tapauksessa saadaan koira asemoitua uutta, parempaa toistoa varten (Saimaa haukahtaa ---> pyydän käsikosketuksen tai kaksi, joiden avulla siirän koiran lähemmäs vasenta jalkaani eli lyhennän sivulletulomatkaa ---> palkkaan käsikosketuksen ---> annan uuden "sivu"-vihjeen). Käsikosketus on kyllä ihan kuningastemppu, joka on koiralle helppo mutta ei liian hauska ja joka aktivoi passiivistakin koiraa oikein kivasti! Helppoa temppua pitää muuten tehdä myös ilman virhettä, jotta siitä ei tule NRM.
  3. Toistetaan vihjesana tai annetaan jokin haluttua käyttäytymistä tukeva sana, esimerkiksi noutovihje, jos koira tiputtaa kapulan kesken pitotreenin. Tämä tapa sisältää muutaman sudenkuopan: koira voi nopeasti liittää apuvihjeet osaksi ketjua, ja toisaalta voi olla, että ensimmäinen toisto meni pieleen koska vihjesana ei ole tarpeeksi vahva, ja uusi vihje ei ainakaan paranna vihjeen toimivuutta.
Kakkonen kulkee nimellä LRS (least reinforcing stimulus), jonka periaate on, että kun koira epäonnistuu jossain vaikeassa asiassa (low-probability behavior), siltä pyydetään yksi tai kaksi helppoa asiaa (high-probability behavior). Helppo asia toimii "reset"-painikkeena, jonka jälkeen voidaan taas pyytää vaikeampaa asiaa. Oikein käytettynä LRS vähentää koiran turhautumista, ennaltaehkäisee extinction bursteja ja pitää treenitilanteen sujuvana. Sen voi yhdistää ykköskohdan keskeytysmalliin, jos ei halua palkata koiran huonoa toistoa vaan haluaa sen sijaan pitää tauon uudelleensuunnittelua varten (huonon toiston sijaan siis palkkaa sen helpon tempun).

Mutta mitä jos koira keskeyttää tekemisen häiriön takia? Vaihtoehtoja on.
  1. Odotetaan, että koira tekee (toivottavasti hyvän) valinnan.
  2. Reagoidaan niin kuin reagoitaisi arkielämässä (luopumisvihje voi mielentilan kannalta olla parempi kuin luoksetulovihje).
Ykkönen on tavallaan parempi, koska sen kautta koira tekee ratkaisun itse ja näin oppiminen on parempaa (sheippaaminen vs. houkuttelu). Aina emme kuitenkaan voi vain odotella, että koira tekee hyvän valinnan. Esim. treenihallilla on ehkä vähän vaikea selittää halliin tulleelle vieraalle ihmiselle koirineen, että hei sori kun mun koira juoksi suoraan sun koirias päin, mä vaan odottelin että se tekis hyvän valinnan mutta toisin kävi. Siksipä suunniteltu häiriö on niin hieno homma! Kontrolloidussa tilanteessa on helppo odottaa sitä hyvää valintaa ;) Jos hyvää valintaa ei näy eikä kuulu, on treenin keskeyttämisen sijaan ehkä parempi turvautua helppoon temppuun.

Häiriöiden treenaamisessa häiriön tulee alkuun olla jatkuvasti läsnä. Jos vinkuva lelu houkuttaa koiraa, vingutuksen tulee alussa olla jatkuvaa ja sen tulee olla ympäristössä jo ennen kuin toisto alkaa. Jos koira katsoo tai lähtee kohti vinkuvaa lelua, vinkuminen loppuu. Vähitellen vinkumista harvennetaan, jolloin häiriö on yleensä koiralle vaikeampi. Yksittäisen vinkaisun voi ajoittaa heti palkan jälkeen, jolloin koira oppii, että häiriö onkin vihje uuden toiston aloittamiselle.

Toki voidaan myös treenata niin, että vahvistetaan vain parhaita toistoja, mutta tätä varten on oltava tarkka suunnitelma (kriteerit, vahvistetiheys jne). Toistojen välinen sujuvuus tulisi treenata erikseen, jotta siitä ei tule treenin kompastuskiveä. Käytän esimerkkinä taas Saimaan sivulletuloa. Haluan koiran istuvan etujalat mun päkiöiden tasalla, mutta koira on usein liian edessä. Voidakseni poimia sivulletulojen joukosta vain ne päkiätoistot, on Saimaan osattava tulla sivulle kerta toisensa perään sujuvasti, ja myös toistojen välin tulee olla sujuva. Siksipä en pääse tekemään valikoivaa treeniä ennen kuin olen palkannut lukuisia toistosarjoja ja sekä koira että minä tiedämme miten toimia niiden aikana.
Eva itse käytti esimerkkinä agilityn keppejä, joissa hän ei halua palkata virheellistä pujottelua. Sen sijaan hänellä on käytössä useammat kepit, jotta uusi toisto päästään aloittamaan nopeasti virheellisen toiston perään (ja toivottavasti palkkaamaan).

Virheet eivät siis ole mikään vakava asia, mutta on hyvä olla jonkinnäköinen toimintasuunnitelma niiden varalle! Koska hei, sellaista sattuu :)


3 kommenttia:

  1. Todella hyvä tiivistelmä, kiitos!

    VastaaPoista
  2. Moikka!
    Linkkasin tämän omaan blogiini, koska kirjoittelin ajatuksiani agilityssa tapahtuviin virheisiin. Tässä oli hyviä pointteja, joten laitoin jakoon. :)

    VastaaPoista