B.F. SKINNER

El condicionamiento operante: ley del refuerzo

No todas nuestras conductas se basan en respuestas reflejas, como en el condicionamiento clásico de Paulov. De hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad, como levantarnos para ir al trabajo, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase, etc..

El condicionamiento operante o instrumental, referido al comportamiento voluntario, es el aprendizaje en el que una respuesta voluntaria se refuerza o debilita según sus consecuencias sean positivas o negativas. Para aprender a realizar ciertos comportamientos son fundamentales los premios o refuerzos y los castigos.

Un premio o refuerzo es cualquier estímulo que aumenta la probabilidad de que cierta conducta sea repetida por el sujeto. Un castigo es cualquier estímulo que disminuye la probabilidad de que cierta conducta sea repetida. Pero para Skinner el refuerzo no es una conexión necesaria entre el estímulo y la respuesta, sino la probabilidad de la emisión de una determinada respuesta.

Refuerzo positivo Refuerzo negativo
El refuerzo positivo, el más efectivo, ocurre cuando una respuesta se fortalece porque se acompaña de un estímulo reforzador. El nivel de motivación es fundamental en el aprendizaje.

El alumno se esfuerza más si el profesor le pone un comentario positivo sobre su trabajo en el boletín de notas.

Los animales aprenden a presionar palancas para obtener comida.

 

El refuerzo negativo se produce cuando una respuesta se fortalece porque va acompañada de la eliminación de un estímulo no deseado o desagradable.

El niño deja de morderse las uñas porque le han aplicado a los dedos una sustancia de sabor desagradable, o el alcohólico deja de beber porque.... La niña llega a tiempo a casa porque el día siguiente puede ser aciago.

Las vacas aprenden a no tocar el pastor eléctrico para evitar descargas eléctricas.

 

Castigo

Dos cualidades, sobre todo, lo diferencian del refuerzo positivo y del negativo.

El castigo es en sí un evento que resulta desagradable (doloroso, lastimoso) a quien lo recibe.

 

El propósito fundamental del castigo es evitar que una conducta se repita. Reprime conductas, no busca incentivarlas.
Un ejemplo de castigo muy conocido es el hecho de recibir una multa por exceso de velocidad.
Y, aunque el condicionamiento operante de la conducta de los animales permite al hombre utilizar sus habilidades (olfato de los perros para combatir el contrabando de ciertas mercancías, por ejemplo), su principal aportación se encuentra en el terreno de la educación. En este campo la motivación y el refuerzo de la conducta resultan indispensables. Lo mismo se puede decir de la importancia de la modificación de la conducta en el comportamiento social a través de refuerzos positivos y negativos.

Skinner empleó animales (ratas y palomas, sobre todo) en sus experimentos. Ideó la conocida como "caja de Skinner", un mecanismo dispuesto de tal manera que cada vez que se presiona cierta tecla se tiene acceso a la trampilla donde se encuentra la comida, que en este caso es el refuerzo que consigue la consolidación de una conducta en el animal.

Video en el que Murray Sidman, importante pionero del conductismo, habla sobre Skinner.

Skinner