Capítulo 1: Aprendizaje y teorías del aprendizaje




descargar 1.1 Mb.
títuloCapítulo 1: Aprendizaje y teorías del aprendizaje
página13/31
fecha de publicación26.01.2016
tamaño1.1 Mb.
tipoDocumentos
b.se-todo.com > Biología > Documentos
1   ...   9   10   11   12   13   14   15   16   ...   31

5. El aprendizaje según Skinner
B. Skinner (n. 1904) es reconocido como uno de los más conspicuos representantes de las teorías ambientalistas que destacaron el refuerzo como factor fundamental del aprendizaje. Aunque trabajó independientemente de Thorndike, tiene con él en común el hecho de, no sólo haber destacado el refuerzo como condición del aprendizaje, sino también en haberse interesado en las aplicaciones educacionales del refuerzo y en haber minimizado la importancia de los constructos teóricos, especialmente acentuada en Skinner. En 1931 recibe su doctorado de filosofía en psicología en Harvard, regresando nuevamente como docente a esta universidad en 1948 luego de haber enseñado en Minnessota e Indiana.

Interesado especialmente por los problemas educacionales, contribuyó a la psicología del aprendizaje en cuestiones tales como la conducta operante libre y su formación, los programas de refuerzo, la conducta supersticiosa y la 'caja de problemas' de Skinner. La siguiente exposición se basa fundamentalmente en Hill (1985).
6. Conducta respondiente y conducta operante según Skinner
Por empezar, aclararemos que para Skinner existen dos tipos de aprendizaje: el aprendizaje de conductas respondientes y el aprendizaje de conductas operantes. Como veremos, Skinner ha desarrollado su teoría fundamentalmente en relación a estas últimas.

a) Conducta respondiente.- Este concepto equivale al de condicionamiento clásico o respondiente, de Pavlov o de Watson. Una conducta respondiente es aquella producida por un estímulo específico, que generará una respuesta también específica (la visión de la comida y/o el sonido de la campana producen salivación).

Skinner reconoce la existencia de este tipo de conductas. Simplemente agrega que en estos casos, el 'reforzador' de la conducta no es otra cosa que el estímulo incondicionado original: si no está presente con cierta frecuencia la comida cuando se hace escuchar la campana, el nexo entre sonido de la campana y salivación tenderá a extinguirse, es decir, no quedará reforzado.

b) Conducta operante.- Sin embargo, para Skinner las conductas son en general de otro tipo: no son pasivas o simples reacciones a estímulos, como las conductas respondientes, sino activas por cuanto se proponen 'operar' sobre el ambiente, es decir, son conductas operantes. Por ejemplo: caminar, hablar, trabajar y jugar.

La conducta operante es emitida por el sujeto más que producida por estímulos específicos y bien identificados, con el fin de obtener algún tipo de beneficio, que puede ser obtener una recompensa o evitar un castigo. Así, lo que interesará a Skinner no es tanto la multitud de estímulos que están presentes cuando se da una conducta operante (de hecho, a veces no puede identificarse ninguno en especial), sino qué clase de reforzador aumenta las probabilidades de que dicha conducta se produzca.

Por ejemplo, no hay ningún estímulo específico tan bien identificado -como en la conducta respondiente- que provoca la respuesta de 'caminar' o 'jugar'. Se trata en realidad de conductas operantes: buscan obtener un beneficio (por ejemplo caminar para ir a buscar comida, o para dar un rodeo y evitar un acreedor).

El esquema 1 muestra las diferencias con la conducta respondiente. Vemos allí que si la ocurrencia de una respuesta operante es seguida por un reforzador, aumenta la probabilidad de que ocurra de nuevo (por ejemplo, si la respuesta de estudiar es seguida por una recompensa, aumenta la probabilidad de que la conducta de estudiar ocurra de nuevo).

En el caso de las conductas respondientes o reflejos, también hay un reforzador, pero de índole diferente: el reforzador es en estos casos el estímulo incondicionado, que deberá estar presente (periódicamente o siempre, según se trate de un reflejo condicionado o de uno incondicionado) para que ocurra la respuesta.
Esquema 1 - Conducta respondiente y conducta operante


Estímulo incondicionado (reforzador)

-------->

Estímulo condicionado

-------->

Conducta respondiente


































Estímulos diversos

-------->

Conducta operante

-------->

Recompensa o castigo (reforzador)


El pensamiento de Skinner se asemeja al de Thorndike, en particular en relación con la llamada ley del efecto de este último (si un estimulo es seguido por una respuesta y esta a su vez por un 'factor de satisfacción' -o recompensa para Skinner- se fortalece la conexión estímulo-respuesta).

Tanto las conductas respondientes como las operantes se aprenden, y Skinner dedicó gran parte de sus investigaciones a indagar el proceso de aprendizaje de las conductas operantes.
7. Reforzadores positivos y negativos
Antes de abordar este tema, aclaremos la diferencia entre tres conceptos muy similares: refuerzo, reforzador y reforzamiento.

Un 'refuerzo' puede ser considerado un estado en que una conducta operante se encuentra en un momento dado. Así, habrá conductas más reforzadas y conductas menos reforzadas. Un 'reforzador' es el agente capaz de reforzar una respuesta, como una recompensa o un castigo. Finalmente, la expresión 'reforzamiento' alude al proceso en virtud del cual se refuerza una conducta mediante un reforzador. Generalmente se alude con este término al proceso inducido por el investigador cuando intenta generar experimentalmente situaciones de aprendizaje de conductas operantes (a través de los llamados 'programas de refuerzo').

Tanto el refuerzo, como el reforzador y el reforzamiento pueden ser positivos o negativos. El esquema 2 habla por sí mismo, y nos permite visualizar rápidamente las diferentes combinaciones posibles entre estos elementos. Por ejemplo, la columna correspondiente a reforzamiento positivo nos indica que un refuerzo puede resultar tanto de la presentación de un reforzador positivo como de la terminación de un reforzador negativo.
Esquema 2 - Reforzadores, refuerzos y reforzamientos positivos y negativos





REFORZAMIENTO POSITIVO

(Programa para producir una conducta, o sea, para producir un refuerzo positivo)

REFORZAMIENTO NEGATIVO

(Programa para extinguir una conducta, o sea, para producir un refuerzo negativo)

Usando un REFORZADOR POSITIVO

Ejemplo típico: comida

PRESENTAR EL REFORZADOR POSITIVO

Ofrecer comida después de la conducta a reforzar

RECOMPENSA

QUITAR EL REFORZADOR POSITIVO

Si realizas esta conducta no te voy a querer más

Usando un REFORZADOR NEGATIVO

Ejemplo típico: shock eléctrico

QUITAR EL REFORZADOR NEGATIVO

Enseñar a manejar en un lugar tranquilo ('quitar' el tránsito)

PRESENTAR EL REFORZADOR NEGATIVO

Dar un shock eléctrico para que no vaya a cierto lugar

Ridiculizar a un niño para que aprenda a no hacerse encima

CASTIGO


Otro detalle importante es que los reforzadores -positivos o negativos- pueden ser también reforzadores condicionados. Así, un reforzador positivo condicionado es un estímulo que al ocurrir repetidamente con un reforzador positivo, tiende por sí mísmo a reforzar la conducta (un cartel que dice "restaurante" actúa como reforzador positivo condicionado porque fue asociado repetidamente con comida, que es el reforzador positivo original). De la misma forma, un reforzador negativo condicionado es un estímulo que al asociarse repetidamente con un reforzador negativo, termina reforzando negativamente la conducta (el quemarse con una estufa hace que el niño aprenda a evitarla, aún estando fría).

Otra cuestión apunta a dilucidar qué debemos entender por castigo. Si nos fijamos en el esquema 2 (en la columna correspondiente a reforzamiento negativo), podríamos entender como castigo tanto la presentación de un reforzador negativo como la eliminación de un reforzador positivo. Por ejemplo, un castigo podría ser tanto pegarle a un niño cada vez que hace una travesura, como quitarle el derecho a ir al cine. Sin embargo, Skinner parece llamar castigo solamente a la presentación de un reforzador negativo.

Pero más allá de esta convención, interesa destacar que Skinner asigna más importancia a las recompensas que a los castigos a los efectos de inducir conductas. En efecto, "Skinner señala que el castigo no es un medio muy confiable para evitar que ocurran las respuestas. El refuerzo [positivo] aumenta la probabilidad de una respuesta, pero el castigo no reduce necesariamente la probabilidad" (Hill, 1985:179). Por ejemplo, castigar a un niño porque comió caramelos sin permiso no reduce necesariamente la probabilidad de que siga comiendo caramelos.

Hay tres casos, sin embargo, donde el castigo reduce de alguna forma la probabilidad de la ocurrencia de la conducta, pero citemos uno como ejemplo típico, y que es el siguiente:

El castigo puede tener efectos emocionales que son incompatibles con la respuesta castigada, de modo que reducen su probabilidad de ocurrencia. Si al castigar al niño con una reprimenda que come caramelos lo hace llorar (efecto emocional), es probable que también deje de comer, pues es difícil comer y llorar al mismo tiempo. Sin embargo, tan pronto desaparecen las reprimendas, cesará el efecto emocional y el niño volverá a comer sus caramelos. En conclusión: el castigo produce aquí un efecto temporario.

Este caso y algunos otros no alcanzan, para Skinner, para invalidar su opinión acerca de la inconveniencia de emplear el castigo. El castigo es un método pobre para controlar la conducta porque a) en algunos casos sólo produce un efecto temporario (como hemos visto en el caso citado); b) en otros casos el castigo sólo engendra otras conductas igualmente indeseables. Por ejemplo, reemplazar la mala conducta por el llanto o el enojo rara vez es una buena solución; c) finalmente, "las respuestas emocionales pueden llegar a ser condicionadas por estímulos distintos a los que desea el castigador, incluidos los estímulos del propio castigador" (Hill, 1985:80).
Sintetizando: un estímulo es un reforzador si aumenta la probabilidad de una respuesta. Hay dos clases de estímulos que actúan como reforzadores: 1. Reforzador positivo: todo estímulo que sumado a una situación aumenta o fortalece la probabilidad de una respuesta operante. Ej: comida, contacto sexual, etc. 2. Reforzador negativo: todo estímulo que, si se elimina de una situación, aumenta o fortalece la probabilidad de una respuesta operante. Ejemplos: ruidos fuerte, calor o frío excesivo, choque eléctrico, etc. Nótese que el reforzador siempre “aumenta” la probabilidad de la respuesta. El castigo es algo más amplio que reforzador negativo, pues puede tanto referirse a presentar un reforzador negativo como a suprimir uno positivo (Hilgard y Bower, 1983).
El sistema de Skinner se refiere también a reforzadores primarios, secundarios, y generalizados (Hilgard y Bower, 1983). Un estímulo que provoca o acompaña a otro ya reforzante adquiere por ello un valor reforzante propio, y se lo llama reforzador condicionado, secundario o derivado. Este reforzador puede ser extinguido cuando se aplica repetidamente a una respuesta para la cual no haya un reforzamiento primario final. Un reforzamiento secundario es positivo si el reforzamiento con el que se correlaciona es positivo, y lo mismo para los negativos. Existen también reforzadores generalizados: esta generalización se efectúa debido a que algunos reforzadores secundarios tienden a acompañar a diversos reforzadores primarios. O sea, mediante la generalización muchos estímulos, además del correlacionado con el reforzamiento, adquieren valor reforzante.
8. Premios y castigos
Como puede apreciarse, los reforzadores tienen que ver con premios y castigos. De acuerdo a Rachlin (1985), los instrumentos más sencillos para medir premios y castigos son la caja de Skinner con un único mando (por ejemplo una palanca), y el ‘corredor recto’, por donde el animal circula. Este último evalúa más el comportamiento en el espacio, y la caja de Skinner en el tiempo. Por ejemplo, el primero muestra cuánto se desplazó la rata, y la segunda cuánto tardó en apretar la palanca.

Se citan dos parámetros de premios o castigos: la tasa o cantidad de premio, y el retraso del premio.

Tasa o cantidad de premio: puede ser la mayor o menor cantidad de bolitas de comida, o también cuanto tiempo se lo deja comer una vez que se le dio la comida, o también variar la concentración de azúcar (cuanto más dulce, más premio). Se comprobó que sin premio, la respuesta el cero o cercana a cero; luego, cuando se incrementa el premio, se incrementa también la tasa de respuesta al principio rápido, pero luego lentamente.

Retraso del premio: la tasa de respuesta de la rata varía con el retraso del refuerzo positivo (bolas de comida) y del refuerzo negativo (reducción de la descarga). La rata deja de correr (o bien de pulsar la palanca si está en la caja de Skinner) inmediatamente al principio pero luego en forma más gradual. El retraso del premio es importante en la vida diaria, como cuando una persona hace dieta pero el premio (bajar de peso), tarda en aparecer.

En cuanto a la relación entre estos parámetros, ellos son independientes en el sentido de que se puede variar la tasa o la cantidad de premio sin variar su retraso, y viceversa. Pero en la práctica se influyen mutuamente, y entonces a veces no se puede saber qué influye más en la conducta: si el retraso del premio o su tasa.

Respecto de la relación entre tasa y cantidad, ella es constante: si se varía la tasa (se le da poca comida a intervalos frecuentes) esto equivale a darle una sola comida grande (cantidad). Pero esto no significa que ambas cosas influyan de la misma forma en la conducta, porque quizás una comida grande sea menos premio porque el animal se siente más pesado.
Huída (refuerzo negativo).- El experimento típico consiste aquí en darle a la rata un estímulo aversivo pero sólo hasta que el animal realiza cierta conducta (llamada entonces conducta de huída). Según la teoría de las necesidades, todo refuerzo es negativo: comer sería ‘huír’ del hambre, beber ‘huír’ de la sed, etc. Sin embargo las conductas de animales sometidos a descargas (estímulo aversivo) es distinta al que actúa porque tiene hambre o sed, quizás porque el estímulo aversivo en la descarga es externo al organismo, y además no aparece gradualmente. Una forma de estudiar esto es con la dosificación, donde se aumenta de a poco la intensidad del estímulo aversivo, y las respuestas del sujeto reducen la descarga cuando llegan a cierta cantidad (Rachlin, 1985).
Castigo.- Es posible que el castigo no forme un condicionamiento instrumental. Con refuerzos positivos buscamos que el animal ‘haga’ algo, pero con el castigo tratamos de que ‘no haga’ algo. Sin embargo muchos investigadores dijeron que desde cierto punto de vista el castigo sí produce condicionamiento instrumental: el castigo dado independientemente de la respuesta del animal tiene algún efecto supresivo de la misma, pero no tanto como cuando depende de la respuesta. En la medida en que hay una diferencia entre los efectos de las respuestas producidas por castigo y las respuestas independientes del mismo, éste será una forma de condicionamiento instrumental (Rachlin, 1985).

El castigo puede actuar de dos formas (Hilgard y Bower, 1983): debilitando el hábito o conexión (entonces actúa como reforzamiento negativo, o como factor que acelera la extinción), o bien suprimiendo solamente la respuesta (dejando el hábito intacto). Las primeras experiencias de Skinner confirman esto último, pero para otros ambas posibilidades pueden darse. Suprimir la respuesta puede ser, por ejemplo, reprimirla, aunque la tendencia siga existiendo (hábito intacto).

Se comprobó también que el castigo está asociado más íntimamente con los estímulos que con la respuesta. Si el castigo fuese un agente reforzante similar al premio, actuaría sobre las respuestas según el principio de Skinner del condicionamiento tipo R. Pero se comprobó que su correlación más significativa se daba con el estímulo discriminativo.

Se comprobó también que el castigo intermitente es más efectivo que el castigo a cada respuesta. Si el castigo se administra cada vez que se presenta la respuesta, la tasa de respuestas baja considerablemente (Hilgard y Bower, 1983).

Se comprobó también que el castigo es poco eficaz para el control práctico de la conducta. Si uno quiere suprimir una respuesta debilitando la conexión, esto se logra cuando se deja de reforzar la producción de la respuesta, proceso que puede ser entorpecido si el castigo suprime la respuesta. Las respuestas no se eliminan sino hasta que se expresan libremente, o sea cuando puede comenzar a redirigirse de una manera adecuada. Pero el castigo puede ser también útil, como por ejemplo para mantener baja la fuerza de la respuesta, o también usar el periodo de supresión posterior al castigo para fortalecer alguna otra respuesta (Hilgard y Bower, 1983).
Evitación.- La evitación es una huída pero no del castigo sino de la situación donde este se presenta. Evitar la lluvia es huír, pero ir a un lugar donde no llueve es evitación. El problema es: ¿qué condiciona al sujeto a correr? Huír de la lluvia o ir hacia donde no llueve? La evitación fue estudiada con dos procedimientos: la evitación discriminativa (se avisa de antemano con un señal que vendrá el castigo), y evitación no-discriminativa (no se da una señal previa). En el primer caso, por ejemplo, se vio que ante la señal los perros pasaban rápidamente de la huída a la evitación, mientras que en otros el paso fue más gradual.

Extinción de la evitación: cuando se intenta extinguir la evitación dando siempre castigos (de forma que no los pueden evitar), las conductas evitativas se reducen más rápidamente. Pero resultados opuestos se consiguen si es retirado el castigo a ser evitado: aquí la conducta de evitación tarda más en desaparecer (Rachlin, 1985).
1   ...   9   10   11   12   13   14   15   16   ...   31

similar:

Capítulo 1: Aprendizaje y teorías del aprendizaje iconReporte de lectura: teorías del aprendizaje y su aplicación en el...

Capítulo 1: Aprendizaje y teorías del aprendizaje iconLos procesos de enseñanza-aprendizaje: análisis didácticos de las...

Capítulo 1: Aprendizaje y teorías del aprendizaje iconHay varios sistemas de clasificación. Si se elige la clasificación...

Capítulo 1: Aprendizaje y teorías del aprendizaje iconIntroducción a las teorías del aprendizaje

Capítulo 1: Aprendizaje y teorías del aprendizaje iconActividad de Aprendizaje Planteamiento del diseño de estrategias...

Capítulo 1: Aprendizaje y teorías del aprendizaje iconTeorías sobre el aprendizaje de idiomas

Capítulo 1: Aprendizaje y teorías del aprendizaje iconAportaciones de las principales teorías de el Aprendizaje

Capítulo 1: Aprendizaje y teorías del aprendizaje iconExisten dos principales teorías de Aprendizaje. La teoría del condicionamiento...

Capítulo 1: Aprendizaje y teorías del aprendizaje iconEvaluación del aprendizaje

Capítulo 1: Aprendizaje y teorías del aprendizaje iconPrograma aceleracion del aprendizaje




Todos los derechos reservados. Copyright © 2019
contactos
b.se-todo.com