Cetreriargentina
¿Quieres reaccionar a este mensaje? Regístrate en el foro con unos pocos clics o inicia sesión para continuar.

Cetreriargentina


No estás conectado. Conéctate o registrate

La Cetrería y el Condicionamiento Operante (Clicker)

Ir abajo  Mensaje [Página 1 de 1.]

franco Boccignone


Admin

La Cetrería y el Condicionamiento Operante/Instrumental Moderno.
Por Karen Pryor el 01/Abril/1997

Este articulo fue publicado por primera vez en Abril de 1997 HAWK CHALK


En años recientes, se han introducido nuevos métodos al entrenamiento y condicionamiento de aves para cetrería. Estos nuevos métodos de entrenamiento dependen de un concepto llamado "Condicionamiento Operante" basado en las teorías del profesor de psicología B.F Skinner. Cuando recompensas tangibles no pueden ser dadas en el instante exacto que un animal realiza un comportamiento deseado (como volar pico a viento mientras nos sobrevuela), estas se substituyen por promesas de recompensar mas tarde (tales como un silbido o una señal manual). Introducir un programa de recompensas intermitentes fortalece el comportamiento.

Estos conceptos fueron hechos comprensibles para entrenadores animales por Karen Pryor en su libro Don't shoot the dog, y los usó para entrenar delfines, perros, pericos y eventualmente muchos otros animales. Son descriptos mas simplemente con ejemplos en su librillo A Dog and a Dolphin. La aplicación del condicionamiento operante en aves de cetrería fue introducida por Steve Layman en su artículo de Abril de 1994 en la revista HAWK CHALK , "Saltos Verticales al Puño."

Karen Pryor hablo en la reunión de 1996 de la NAFA en Lamar, y observo la práctica de cetrería durante la reunión. Después de la reunión se comprometió a proporcionar especificaciones acerca de como entrenar aves de cetrería usando el condicionamiento operante.

Estableciendo el Reforzador Condicionado como una Herramienta de Comunicación
Cuando estaba aprendiendo a usar el condicionamiento operante para entrenar delfines allá en los 60s, supe que la herramienta más crucial que teníamos era el reforzador condicionado (RC), la señal que significa "La comida está en camino." En los últimos cinco años de haber entrenado miles de personas, la mayoría dueños de perros, a usar el condicionamiento operante creativamente, me he percatado que el RC es más importante y útil de lo que pensaba, y que tiene muchas funciones además de decirle al animal que se ha ganado un premio. Todas estas funciones se pueden aplicar a la cetrería para hacer tu vida más fácil, tu ave más contenta, tu control más confiable, y tu cacería y otras interacciones más exitosas y agradables.

¿Que es un RC? Puede ser cualquier señal arbitraria que pueda ser fácilmente percibida por el animal, que es diferente de todo lo demás en el ambiente, que es de duración corta para que así no se "empalme" con otros comportamientos que no quieres, y que no tiene un significado intrínseco para la criatura. Los elogios, por lo tanto, no son un buen RC, toman demasiado tiempo, y (algunas veces) ya significa alguna otra cosa para el animal.

Un RC puede ser una caricia, un sonido, algo visual, e incluso un olor. Para rapaces sospecho que el RC debería ser un sonido o algo visual, o ambos. Analizando la cetrería, voy a escoger un clic hecho por un clicqueador manual, o hecho con la lengua, para un RC audible de cerca y un silbido o silbato sonoro de lejos. Para un RC visual sugeriría un destello de una luz de una linterna parpadeante de mano para trabajar de cerca, y una luz estroboscópica para trabajo a distancia: un flash de cámara operado con pilas funcionara perfectamente. Si estas usando un destello, o un chasquido, en lugar de un clic, mientras lees estas sugerencias de entrenamiento, solo sustituye mentalmente nuestro RC por mi clic. (Ah, pero usas un silbato para otras cosas en el campo. Está bien, encuentra un silbato diferente para este propósito; o parcialmente opercula el silbato para que suene diferente. Los pastores Neozelandeses tienen en la boca silbatos que pueden hacer una variedad infinita de sonidos; un silbato de "alarma de depredador" es otra posibilidad.)

Mantén tu clicqueador contigo siempre que estés con tu ave. Cada vez que le des comida, clicquea PRIMERO, después premia. Las picaditas son algo común en cetrería, entonces clicquea, da la picadita. Clicquea, da la picadita. Cuando el ave empiece a buscar la picadita después de escuchar el clic, entonces sabrás que la asociación Clic, pausa, después premio, ha sido hecha. Muéstrale al ave que el premio vendrá, pero quizás no instantáneamente. Empieza clicqueando en diferentes lugares, y a diferentes intervalos. ¿Estás de cara al norte? Voltéate y encara el sur; las aves saben la diferencia (Esto de ir variando el entrenamiento sirve para erradicar comportamientos supersticiosos que se puedan generar, el ave puede empezar a creer que los saltos al puño, por ejemplo, solo los debe hacer en determinada habitación, a determinada hora, sin más compañía que tu y el ave, solo cuando usas un guante color amarillo, etc. Por eso es importante variar lo más posible el escenario del entrenamiento y todos sus componentes, para que el ave entienda que eso que tu quieres hacer se debe hacer cuando tú quieras, sin importar dónde o con quien estés, que hora sea, que sea en el patio en lugar de en un cuarto, etc.).

Has esto solo por un corto tiempo, una o dos sesiones son suficientes. Después, escoge un comportamiento que quieras, y empieza a clicquear cuando suceda, NO elijas algo que estés tratando de componer, y no elijas algo difícil, o sobre la marcha. Solo clicquea por que se pare en tu mano; o por clicquea por que voltee hacia ti, o por que baje las alas, o por que levante un pie, algo que el ave ya sepa hacer. Siempre premia después de cada clic. EL punto de este ejercicio no es lo que parece, enseñar al ave algo que ya sabe hacer, sino enseñar al ave que por sus propias acciones, puede HACERTE clicquear.

Si tienes a un ave bebe, puedes enseñarle a que persiga una pelota, o que persiga la punta de una vara apuntadora (esta se usa mucho en perros). Esto puede ser MUY práctico después para introducir a un ave en una caja transportadora, o conducirla a una percha extraña/nueva, o lo que sea.

Puedes trabajar en dos o tres pequeños comportamientos en la misma sesión: voltea la cabeza, agáchate, levanta una pata, abre las alas, ven a mi mano; cada una puede ser moldeada a su propio ritmo. Cuando un comportamiento dado está mejorando, deja de clicquear cada vez; Ej.: clicquea cada segunda vez, o cada tercera vez, después dos veces en una ronda, después espera por cuatro veces. Veras que el comportamiento se intensifica. Variando el esfuerzo requerido para hacer que el clicqueo suceda tiende a incrementar el esfuerzo.

Ahora ya has enseñado al ave dos o tres formas de hacerte clicquear, para que el ave comprenda de qué se trata el juego. Esto no debería de tomar más de una docena de sesiones de entrenamiento de dos o tres minutos. Ahora ya puedes ir directo a usar tu clic (o tu destello o silbido, etc.) para poner en práctica el excelente programa de Steve Layman para poner a una rapaz mudada en condiciones de vuelo (Ver el HAWK CHALK, de Abril de 1994 y Abril de 1995. También, puedes usar tu clic para empezar a deshacerte de comportamientos indeseables, sustituyéndolos por comportamientos que quieras.

Por ejemplo: digamos que tu ave cubre con sus alas la comida. Retrocede hasta que el ave se relaje un poco; clicquea. Lanza una picadita. Repite. Aun si el ave esta parada en la comida, el clic y el premio reforzaran el comportamiento de calmarse, hasta que puedas acercarte y recoger el ave sin disgustarla. (La primera vez que haces esto, por supuesto, deberías de darle un "jackpot", como cuando ganas mucho dinero en las maquinitas de un casino en las vegas de una sola vez (se refiere a premiarlo con mas picaditas de lo normal, pero no se debe abusar de este medio, solo es cuando logra hacer algo excepcional, o tentarlo al principio de un nuevo comportamiento a que lo siga haciendo como dice el texto). Algunos cetreros le dan al ave que acaba de cobrar una presa e hígado y el corazón, en el puño, mientras esta en el campo, ese es un buen jackpot.

¿Que hay acerca de piar? Ese es un comportamiento que enfurece a los dueños de muchas aves, no solo rapaces. Es difícil deshacerse de el porqué, para el ave, piar significa obtener comida. Cada vez que el ave percibe una señal de que la comida está en camino – la puerta abriéndose, tu sombra, tus pisadas, el sonido del coche, etc., -- y sucede que el ave esta piando en ese momento, ¡bingo! el piar es reforzado. Si estas señales no SIEMPRE significan comida, sino únicamente algunas veces, adivina que: el piar es reforzado variablemente, y el comportamiento se intensifica porque un reforzamiento variable tiene un efecto más fuerte que el reforzamiento continuo (cada vez que se realiza un comportamiento) Algunos comportamientos se “extinguen” si no son reforzados, pero solo intentando esperar al ave, a que el piar se detenga por sí solo, no es muy eficiente porque todas las “cues” (se refiere a señales, ordenes, comandos, etc. (lo traduciré como “orden”, porque se supone que es una señal premeditada para que un animal realice un comportamiento condicionado, aunque como dice el texto pueden ser “enseñadas accidentalmente” al animal el cual las comprende a su propia manera) accidentalmente condicionadas (al igual que los perros que ladran en las perreras); es comúnmente un accidentalmente pero muy fuerte comportamiento condicionado así que usa tu nuevo RC. Tomate un momento cuando el ave no esté piando –cuando haya acabado de comer, talvez, o cuando estés limpiando la muda -- y clicquea. Premia. Clicquea. Premia. Trabaja en esto. (El ave tiene que respirar; si eres rápido, puedes clicquear entre piídos.) Tu meta es enseñar al ave todas las OTRAS órdenes son insignificantes. La información significante es el clic, y puede hacerte clicquear callándose. No te preocupes se pía justo después de que tu clicqueas, y antes de que coma; eso se detendrá cuando descubra que los clicks, y no los piídos, significan comida, y que estando en silencio hace que los clicks sucedan.

Mientras tanto, empareja el clic (*o destello, silbido, etc.) con LO QUE SEA que tengas disponible que sea placentero para el ave; ampliando el significado de tu RC, para que incrementes su poder de informar al ave acerca del silencio. Trabajar con un RC real puede eliminar el apego por todos los demás RCs supersticiosos – y ayudar a mantener en silencio a tu ave.

Ahora es un buen momento, también, de usar tu clic para enseñar al ave cosas que necesitara saber en el campo. ¿Quieres que el ave utilice sus pies? Clicquea cuando los use (esto se puede usar cuando se le introduce por primera vez un conejo muerto, por ejemplo, cuando lo agarre con el pie, clicquea y premia, así sabrá que además de que es comida, lo debe atrapar). ¿Para que vuele al guante? Clicquea por saltos pequeños, después incrementa la distancia. Tal vez puedas añadir una señal, menear tu brazo sobre tu cabeza: menea, salto al guante, cliquea, premia… estas construyendo una secuencia muy útil.
Perseguir el señuelo es un gran comportamiento por el cual clicquear. Es maravilloso ver que rápido un ave entrenada con clicks puede aprender lo que se desea, incluso si esta no encuentra instantáneamente la comida en el señuelo. Puede que veas como ahora CUALQUIER tipo de señuelo puede convertirse en algo deseable para el ave el cual recibe un clic y después le es arrojado un premio por haber aterrizado en el. Tal vez no necesites incrementar la tentación, después, balanceando un pájaro muerto (aunque un jackpot de un pájaro muerto es una buena sorpresa) porque la oportunidad de ganar un clic es extremadamente motivante. El girar el señuelo en el aire se convierte en una señal, u orden, de que la oportunidad está disponible.

Llevando tú RC al Campo

Ahora has entrenado a tu ave para que reconozca un reforzador condicionado –un clic, un destello – de cerca, en la mano o en la muda. El ave ha aprendido a ofrecer un comportamiento con el fin de que hagas clic. Puede que haya aprendido, también, algunas señales de ti: un llamado, para venir al guante, o un movimiento para seguir un blanco o el señuelo. ¿Qué es lo que podría todo este trabajo de cerca hacer por nosotros, en comparación, con las tremendas distancias del campo de caza?

Primero, necesitas un RC de larga distancia, una señal arbitraria que pueda ser percibida desde lejos. Para aves, sugiero un silbato de “alerta de depredador” o una luz estroboscópica (tales como el de un flash (*como el de las cámaras) operado a batería). En la reunión de Lamar cuando me dirigí a la NAFA en 1996, Nick Fox me explico que los sonidos se propagan muy bien a través del aire. En un planeador, en un día calmado, uno puede claramente escuchar conversaciones debajo mientras se está a cientos de metros arriba, mucho más lejos que estando en el suelo con todos sus arbustos y baches que desvían el sonido.

Tomar el clima en consideración, señales acústicas, particularmente las señales no difusas y de alto tono/frecuencia, deberían propagarse muy bien, pero una luz estroboscópica debería ser buena también, y no hay razón alguna por la que no puedas establecer ambas, y usar la que te parezca más practica o funcione mejor para ti y tu ave.

Los reforzadores condicionados, una vez establecidos, son fácilmente transferibles. Con un clicqueador, ya le has enseñado al ave el RC. Ahora, simplemente toma ventaja de cualquier oportunidad que se presente, y empareja el NUEVO RC con los reforzadores primarios: alimento u otros premios. El ave rápidamente registrara la información de que el NUEVO RC significa exactamente lo que el viejo significaba: la comida está en camino, además: estás haciendo lo correcto, además: lo que estás haciendo hizo a tu persona (o sea el cetrero) clicquear, así que ahora recibirás tu premio. Información muy poderosa. De aquí en adelante, cuando yo diga “clic” me refiero a tu RC, cualquiera que este sea.


Para establecer un Nuevo RC, puedes comenzar con picaditas en tu puño, justo como lo hiciste en casa: Silba. Premia. Silba. Premia. El ave ya conoce el juego, lo cual es muy ventajoso: una nueva señal de “Bingo” (*expresión que indica que se ha solucionado o acertado algo) es una buena noticia, y rápidamente adquirida, una vez que el concepto está en su lugar. También se puede, por supuesto, usar el nuevo RC junto con el viejo RC, para ayudar al ave a comprender eficazmente.

También hay muchas nuevos tipos de premios disponibles una vez que tu ave esta volando. El simple hecho de dejarla volar es una de ellas: yo empezaría emparejando mi RC de larga distancia con el acto de mostrar el señuelo, siempre que alimente al ave en el campo. Cuando sea posible, activaría mi silbato de larga distancia o destello en el instante en el que el ave capture una presa. Sobre todo, me prepararía cuidadosamente para emparejar mi RC de larga distancia con el hecho de hacer salir las presas de sus escondites.

Con un RC que es captado y entendido a distancia, tienes una herramienta ponderosa no solo para reforzar el comportamiento deseado del ave (si es que te da alguno) sino, más importantemente, para enseñar ordenes. Tomemos por ejemplo una orden que todos necesitan en el campo: “Regresa a mí,” la cual nosotros los entrenadores de delfines en océano abierto le llamamos “recall” (*significa “señal de llamada”).

Escoge la señal que usaras para llamarlo. Note que las señales con los brazos y los gritos eran algo popular en Lamar. Eso servirá, las aves pueden ver señales de brazos desde muy lejos. Yo podría añadirle un trapo para ondéalo en la mano, o de colores, o ambos. Solo estate seguro de ser consistente y dar una orden clara que sea diferente de todo lo demás que hagas. Cuando quieras que tu ave regrese, da la señal.

Gira en el aire el señuelo (señolear) también, si lo necesitas, para tentar al ave; pero esta debería ser una medida de entrenamiento, temporal, únicamente. (Yo aconsejo desvanecer/desaparecer el señuelo después de dos o tres regresos “cliqueados” exitosos.

Cuando “cliqueas” esta en tus manos juzgar el desempeño del ave. Algunas veces el ave no realizara el regreso completamente, y algunas veces no obtendrá el premio; pero está bien. Al principio, deberías clicquear por que venga a ti a una distancia corta; después por regresar un poco más lejos de ti, después por volver de un lugar aun más alejado, todo el camino hasta ti; después solo por empezar a volver a ti de distancias muy lejanas. Estas, por decir, poniendo dinero en el banco. Cada vez que logras clicquear al ave por que se dirige hacia ti, después de haber hecho la señal, y entonces regresa todo el camino para obtener su premio, estas fortaleciendo las oportunidades de que responda a la orden en el FUTURO.

Varía la distancia, varia la dificultad. SIEMPRE cliquea si el ave regresa al guante, y Siempre recompensa. Puedes y debes ampliar las capacidades del ave, decidiendo cuando clicquearas y que le darás de premio; pero no le mientas con la luz estroboscópica o con el silbato. Un mensaje de “¡Lo hiciste bien!” necesita valer la pena.

Me gustaría desaparecer gradualmente el hecho de girar el señuelo en el aire, que es como una carnada, casi inmediatamente. Tan rápido como pueda, lo substituiría con mi señal de brazo o con una bandera de “ven aquí”, y clicquearia por el comportamiento de acercarse hacia mi cuando de esa señal. Después clicquearia de nuevo cuando el ave este muy cerca, y libremente le daría el señuelo, con su delicioso premio en el, como el reforzador primario, a la vez que el ave llega abajo a donde estoy. Como un soborno, cuando constantemente giras el señuelo en el aire estas ofreciéndole comida ya sea que se la haya ganado o no. Lo mas rápido que puedas cambiar al uso exclusivo de la señal de llamada, con el señuelo presentado después del RC, lo menos probable será que desarrolles un ave que se posa en un poste telefónico y se te quede mirando como giras la comida en el aire. Y aquí yace otra trampa de condicionamiento (como el condicionamiento accidental de piar descrito en la Parte I): una trampa hábilmente descrita por Steve Martin (HAWK CHALK de Agosto de 1996). Cuando el ave ha aprendido que la señal significa “Haz X y serás recompensado,” la señal misma se vuelve reforzante. ¿Acaso no te sientes aliviado cuando la luz se cambia al verde? (del semáforo supongo) Las aves, también, son reforzadas por señales de “sigue/continua”. ENTONCES: se cuidadoso cuando des la señal. Lo más seguido posible, da tu señal (o gira el señuelo en el aire) cuando el ave este dirigiéndose hacia ti. Si caes en el hábito de tratar de HACER regresar al ave, por medio de girar el señuelo en el aire, cuando, digamos, esta acurrucada en lo alto de un poste, en realidad estarías moldeando el comportamiento de “aterrizar en algún lugar y quedarse ahí.” No deseas una excelente ave “posa postes”, pero habrás hecho una. La mejor manera de evitar esto es teniendo en mente la pregunta del entrenador moderno: “¿Qué es lo que en realidad estoy reforzando?” Tu objetivo no es deshacerte de los comportamientos que no quieres, sino asegurarte de que lo que estás haciendo es FORTALEZER los comportamientos que si deseas.

Otro comportamiento que los cetreros necesitan en el campo es el comportamiento de “mantenerse en espera”, o cernirse sobre nuestras cabezas esperando a que hagamos salir a las presas de sus escondites. Hablando como una etóloga y entrenadora animal, una de las más grandes emociones de mi vida laboral, igualmente de excitante que trabajar con delfines entrenados en mar abierto, ha sido ver a un halcón peregrino, un halcón gerifalte, y un halcón mexicano cada uno “manteniéndose en espera”, observando a sus dueños a la expectativa de que sería lo que ocurriría después, mientras cazábamos muchos tipos de presas en Lamar en la reunión de la NAFA de 1996. El problema de entrenar a “mantenerse en espera” es que uno necesita que el ave se encuentre a suficiente altura para que así tenga una oportunidad decente de atrapar la presa cuando esta sea levantada. El paso más simple, el cual solo requiere de autocontrol, es tratar de no levantar las presas hasta que el ave vuele a suficiente altura. Con un ave nueva o joven, uno puede interpretar a la primera presa levantada como un reforzador por el simple hecho de que el ave se mantenga en espera, después la segunda presa levantada seria por que el ave se mantenga en espera a mayor altura, y así ayudar al ave, en tres o cuatro experiencias, a aprender a ascender (*esto también se puede hacer con escapes para tener un mayor control, pero solo durante esta fase inicial del entrenamiento).

El RC, sin embargo, puede ser insertado fácilmente aquí. Prepárate, con las presas dispuestas. Cuando el ave se eleve, utiliza el silbato, DESPUES espanta a los patos o manda al perro hacer su trabajo (como ya dije también se pueden usar escapes). Como todos los predadores, (y esto lo aprendí en Lamar) estas aves son expertas en aprender algo de una sola vez. El RC solo intensifica esta experiencia de aprendizaje. “¡Eh, Aja!” piensa el ave, “Tengo que hacer algo con eso.”

Mucha gente me ha recalcado que sería imposible “clicquear” al ave por mantenerse en espera, porque entonces tendría que volver abajo por su premio, lo cual es incompatible con volar alto. Yo espero que ahora puedas ver que hay dos maneras de lograr esto: primera, lo que el ave estaba haciendo cuando recibió el clic es el comportamiento que repetirá de nuevo: no lo que estaba haciendo cuando comió. Entonces, ocasionalmente, podrías querer clicquear por su altitud y después traer al ave abajo. Aun mas importante, con el hecho de levantar las presas obtienes un magnifico reforzador primario, es un acontecimiento que el ave ansia enormemente, el cual puedes presentar como el premio por el comportamiento cliqueado sin importar que tan elevada se encuentre el ave.

¿Por que no solo usar las circunstancias, las presas levantadas, para entrenar el comportamiento, en vez de usar todas estas tonterías de señales artificiales? Bueno, si puedes. Mucha gente lo ha estado haciendo así por siglos, y funciona. El “clic” solo lo hace funcionar más rápido y mejor. Estas aves están hechas para aprender rápido. En vez de esperar el éxito aleatorio y los errores para enseñar a un ave a ascender más alto, puedes usar tu RC y levantar las presas para notificarle al ave que ascender es algo bueno. Entonces cuando empieza a ascender a propósito poco después de haber sido liberada (lo que hará) puedes empezar a usar tu RC para decirle al ave que altitud te gusta. También puedes usar otros tipos de situaciones para comunicarle al ave que es lo que quieres. Entonces, por ejemplo, si no encuentras presas, pero tu ave se encuentra a buena altura, clicquea por su altitud, da tu señal de llamada, clicquea por que regresa al guante, y dale un buen premio. Entonces, hoy no fue un buen día: el ave tuvo una buena experiencia de aprendizaje, de todos modos.

Hay algunas herramientas aun más sofisticadas dentro de las usadas en el condicionamiento operante: por ejemplo, la señal de “sigue así”, la cual NO está atada a un reforzador primario (premio), y que aun así es extremadamente útil para mantener comportamientos agotadores, y de larga duración que el animal debe hacer por sí mismo.

https://cetreriargentina.foroargentina.net

Volver arriba  Mensaje [Página 1 de 1.]

Permisos de este foro:
No puedes responder a temas en este foro.