Condicionamiento Operante

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Condicionamiento Operante as PDF for free.

More details

  • Words: 1,087
  • Pages: 5
Condicionamiento operante También llamado condicionamiento instrumental, el condicionamiento operante es una forma de aprendizaje distinta del condicionamiento pavloviano. Se puede distinguir de este último porque el condicionamiento operante concierne al aprendizaje de la respuesta, mientras que el condicionamiento pavloviano se enfoca al aprendizaje del estímulo. Tarpy (1941) La experimentación del condicionamiento operante establece sus inicios en los experimentos de Thorndike. En estos experimentos se colocaba a los gatos en una caja truco, cuando se manipulaba el pestillo de la caja, la puerta se abría, entonces, el gato podía acceder a la comida que se encontraba en el exterior de la caja. Cuando se colocaba al gato por primera vez en la caja, se registraban conductas aleatorias hasta que por casualidad golpeaban el pestillo que abría la caja. Cuando finalizaba un ensayo, el gato era introducido de nuevo a la caja. Thorndike observó que con el paso de los ensayos se apreciaba un claro incremento el la eficiencia para abrir la caja, midiendo esto por ejemplo, en el tiempo que al paso de los ensayos se volvía menor. El condicionamiento instrumental debe definirse en función de los procesos utilizados para fortalecer una respuesta instrumental. En el condicionamiento instrumental se utilizan términos similares a los del condicionamiento pavloviano, sin embargo podemos observar diferencias notables: Estímulo: Un estímulo condicionado es aquél que sigue a la respuesta, no hace falta que los estímulos sean explícitos. Estímulo discriminativo: Es el estímulo que indica si el reforzador está disponible o no. Respuesta Incondicionada: Respuesta refleja provocada por el estímulo incondicionado.

Respuesta Instrumental: Respuesta motora relativamente arbitraria, como presionar una palanca.

Podemos apreciar que el condicionamiento operante consta también de diversas fases, cuando la respuesta ya está establecida se dice que hay una adquisición, mas cuando la respuesta deja de presentarse estamos hablando de una fase de extinción El condicionamiento instrumental se puede emplear con cuatro tipos fundamentales de aplicación: El condicionamiento de recompensa, el cual es el más común y se emplea presentando ante una respuesta del sujeto, un resultado deseable o estímulo apetitivo. Existe también el entrenamiento por omisión, en el cual el resultado contingente una respuesta es la supresión de un estímulo apetitivo. Otra forma de condicionamiento instrumental es el castigo, en este procedimiento, el resultado de la respuesta es un estímulo aversivo o no deseable, esto, provoca una disminución en la tasa de respuesta. La última de las formas del condicionamiento operante es el reforzamiento negativo, en el cual la respuesta es contingente a la supresión de un estímulo aversivo. En este condicionamiento se presentan fenómenos como el escape y la evitación, refiriéndonos al escape como la interrupción de un estímulo condicionado aversivo, y la evitación como la respuesta que un sujeto emite para evitar la presentación de una situación aversiva cuando ya se encuentra en ella. En el condicionamiento operante se define reforzador como aquel estímulo que eleva las tasas de respuesta y siendo así, el castigo el estímulo que reduce o anula las tasas de respuesta del sujeto. El principio Premack nos ilustra cuando una actividad preferible es contingente y refuerza la ejecución de otra con menos preferencia.

Para el condicionamiento operante debemos tener en cuenta ciertas especificaciones, como la clase y la topografía de respuesta. El sujeto debe emitir la respuesta deseada antes de recibir el reforzador. La técnica más frecuente es el modelamiento por aproximaciones sucesivas a la respuesta, en este moldeamiento se refuerzan las aproximaciones sucesivas a la respuesta que queremos como criterio. Debemos tomar en cuenta también factores como la contigüidad y la contingencia del reforzador, que probablemente nos llevarán a obtener a tasas de respuesta deseadas. En el ambiente natural del sujeto rara vez se refuerzan todas las conductas que emite, por lo cual las respuestas se estudian también con programas intermitentes, es decir, que no todas las conductas del sujeto son reforzadas. En los programas de razón se refuerza al sujeto por el número de conductas tipificadas que emite, en el programa de razón fija (RF), el sujeto recibe el reforzador por realizar determinado número de respuestas, se puede presentar un fenómeno denominado tensión del programa, en el cual existe una aceleración negativa al incrementar el valor del programa de razón fija. En el programa de razón variable (RV), el número de respuestas para obtener el reforzador varía de un reforzamiento a otro y viene definido por el número medio de respuestas requeridas, la tasa de respuesta de este programa suele ser alta y estable. En los programas de intervalo la recompensa se presenta después de presentarse la respuesta si y solo si ha pasado un tiempo determinado antes impuesto por el experimentador. En un programa de intervalo fijo (IV) se refuerza la primera respuesta después de un tiempo constante establecido, en este programa se presenta un efecto de pausa después del reforzador y un fenómeno definido como explosión al acercarse la entrega del reforzador.

En el programa de intervalo variable (IV) el tiempo entre la presentación de un reforzador y otro varía. En el programa RDB, el sujeto tiene que refrenar su respuesta hasta cierto periodo de tiempo, si hace esto, se refuerza la siguiente conducta. La diferencia entre los programas de razón y los de intervalo es que en los programas de razón se obtiene una probabilidad mayor de tasas más altas, además que los TERs son más acentuados en los programas de intervalo. En los programas combinados la recompensa solo es contingente si el sujeto emite respuestas acordes a los dos programas impuestos. También existen los programas denominados tándem, en los cuales el sujeto cumple los requisitos de programas individualmente sucesivos para obtener el reforzador. Podemos emplear también, los programas encadenados, donde cada programa va seguido de una clave externa. Los programas mixtos se definen por presentar varios programas en orden aleatorio y el sujeto puede obtener el reforzador por cada uno de estos, por último, en los programas múltiples los programas componentes son señalados por estímulos discriminativos Se puede hablar de autocontrol cuando observamos una conducta de elección, es decir que el sujeto puede responder ante un reforzador con una magnitud importante, pero no ante uno pequeño. En los programas de reforzamiento intermitente podemos apreciar u fenómeno común; el aumento en la resistencia a la extinción, aunque también existe el factor saciedad, el cual impide que las tasas continúen en aumento o constantes. Otro factor a considerar es la indefensión aprendida la cual se presenta cuando las consecuencias aversivas no son contingentes a la respuesta del sujeto.

Aura Gabriela Camacho Trejo Universidad Nacional Autónoma de México Grupo 2211

Related Documents