Condicionamiento instrumental / operante

Ay el instrumental… el operante… sin duda el tipo de condicionamiento preferido por la mayoría de adiestradores y estudiosos del comportamiento.

No podemos negarlo, nos encanta enseñar trucos y habilidades a nuestras mascotas, especialmente a los perros. Disfrutamos recompensando con comida o snacks el momento en que aprenden a sentarse o a darnos la patita. Y en muchas ocasiones, pensamos que ahí queda todo. Nada más… ¡y nada menos!

Pero este tipo de aprendizaje va mucho más allá. Tanto, que en no pocas ocasiones son ellos los que nos adiestran a nosotros. Hoy veremos las primeras pinceladas sobre él.

Skinner y Thorndike son los padres indiscutibles del condicionamiento operante. Skinner completó la descripción del condicionamiento operante y terminó de acuñar el concepto de refuerzo, basándose en la «Ley del efecto», de Thorndike, que postula que toda acción seguida de una consecuencia agradable o beneficiosa tiende a repetirse, mientras que una que no la tiene tiende a desaparecer.

Las claves para entender este tipo de aprendizaje asociativo se basan en:

El comportamiento que realiza el individuo es consciente y voluntario.
Se asocia un evento (comportamiento del individuo) con su consecuencia.

Como ves, ya no se asocian dos estímulos aparentemente inconexos, como ocurría con el condicionamiento clásico, sino que es necesaria la proactividad del sujeto, de forma que su conducta se asocia con unas expectativas. Según la naturaleza de esta consecuencia, el comportamiento asociado tenderá a repetirse (reforzarse) o a inhibirse y eventualmente desaparecer. Ahora necesito que te olvides un poco de los significados habituales que damos a ciertas palabras, porque en psicología no siempre se usan de la misma manera que en un contexto social, moral o cultural.

Cuando la consecuencia produce un aumento de la conducta, decimos que hemos aplicado un refuerzo. Cuando la consecuencia produce una disminución o desaparición de la conducta, decimos que hemos aplicado un castigo. En otras palabras; un refuerzo es todo aquello que aumenta la probabilidad de aparición de una conducta, mientras que un castigo es todo aquello que disminuye dicha probabilidad.

Por otro lado, para aplicar tanto refuerzos como castigos, usamos un segundo parámetro: positivo o negativo. Usamos la palabra «positivo» cuando hemo añadido un estímulo, y «negativo» cuando lo hemos retirado, de manera que tanto un castigo como un refuerzo pueden ser positivos o negativos.

Así, ni un refuerzo es siempre algo agradable, ni un castigo es siempre algo desagradable, sino que ambos dependen del contexto y, lo más importante, del individuo. Para reforzar una conducta, puedo tanto añadir (+) algo agradable cuando la realizas, como retirar (-) algo desagradable en el momento en que la llevas a cabo. En el primer ejemplo, el reforzador viene después de la conducta. En el segundo, el reforzador estaba presente antes y desaparece al llevarse a cabo el comportamiento deseado. Son dos formas totalmente diferentes de reforzar un comportamiento (es decir, de aumentar su probabilidad de aparición).

Fácil, ¿no?… Veamos algún ejemplo.

Si eres una persona a la que le encantan las patatas fritas y recibes una pequeña ración cada vez que friegas los platos, probablemente tu conducta friegaplatos se verá incrementada por la expectativa de recibir unas patatillas (refuerzo positivo). Por el contrario, si eres una persona que detesta el olor a brócoli hasta la náusea y descubres que cuando friegas un plato el olor desaparece, probablemente también se reforzará esa conducta (refuerzo negativo). De ambas maneras conseguimos, teóricamente, aumentar la frecuencia de limpieza de vajilla.

Por otro lado, si eres una persona, digamos, malhablada, y decidiéramos que queremos inhibir o extinguir tu conducta de soltar palabrotas frecuentemente, igualmente podríamos hacerlo de dos maneras. Una de ellas, podría implicar darte ráfagas de luz con una linterna cada vez que pronunciaras un taco (castigo positivo), mientras que la otra, tal y como hace mucha gente, consistiría en «donar» unas monedas cada vez que saliera un reniego (castigo negativo, te quitamos algo que te importa o te resulta agradable).

Como ves, tanto los refuerzos como los castigos son subjetivos y dependientes del individuo, pues salvo ejemplos más extremos (como puede ser la aplicación de dolor físico, lo que queda fuera de las recomendaciones de este artículo) tenemos bastante claro que no a todos nos gustan ni disgustan las mismas cosas, que para gustos (y disgustos) los colores.

Sentando las bases para el ejercicio de inmovilidad mediante refuerzo positivo. Para los alumnos avanzados: ¿cuántos y qué tipo de condicionamientos ves en este vídeo de apenas 5 segundos?

Por una mejor convivencia

con nuestras mascotas

Etología y adiestramiento canino en Gipuzkoa

Condicionamiento instrumental / operante

Relacionado

1 comentario en «Condicionamiento instrumental / operante»

Deja un comentarioCancelar respuesta