This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA
N-puede transitar a otro posterior 'donde . que no contienen parámetros MC-teóricos, contienen sólo parámetros cinemáticos; mientras que los modelos potenciales incluyen además los parámetros dinámicos, los propiamente mecánico-teóricos.
f
por el incremento de temperatura T, - z: . l , = L; + u ( T , - Ti). De ahí se deriva que el cociente (L,-Li)I(T,-ír,) es constante para cada metal, pero es dudoso que esto se pueda presentar como una ley de coexistencia genuina, pues ese valor constante involucra esencialmente estados sucesivos. La segunda distinción es entre leyes probabilistas y leyes no probabilistas, también IIamadas a veces detenninistas. Una ley probabilista es aquella cuya expresión hace referencia explícita a la probabilidad. De nuestra lista inicial, (6), (7), (10) y (1 1) son leyes probabilistas. Algunas de ellas son aplicaciones particulares de leyes probabilistas más así, por ejemplo, (7) es un caso particular de la siguiente ley general sobre desintegración radiactiva:
(33) La probabilidad de que un átomo de cierta sustancia permanezca estable durante el intervalo temporal t es igual a e-A*,siendo A la constante de desintegración radiactiva de la sustancia.
/1 f
1 1 i
1
!i
1
Las leyes probabilistas establecen la coexistencia o transición entre estados sólo con cierta probabilidad p (O c p < 1). Por tanto, y contrariamente a lo que ocurre con las leyes deterministas, es nómicamente posible que aun siendo la ley verdadera se den las condiciones antecedentes y no se den las consecuentes. Ello hace que algunos autores rechacen que en las leyes probabilistas se pueda hablar dz N-necesidad en sentido propio. En tercer lugar, podemos distinguir entre leyes estrictas y leyes no estrictas o interjeribles. Las leyes no estrictas son leyes tales que puede darse la condición antecedente y no la consecuente (y ello independientemente de que sean probabilistas o no). El motivo es que las leyes no estrictas incluyen las llamadas cláusulas ceteris paribcis (CP), que equivalen a condiciones antecedentes adicionales más o mecos indefinidas. Estas cláusulas son del tipo "si todo lo deinás permanece igual", "si nada interfieie", "si no intervienen factores adicionales", etc. Una ley no estricta o CP tiene pues la siguiente forma: "Todos los A son, ceterisparibrts, B"; los ejemplos (9), (lo), (12). (13) y (14) de nuestra lista inicial son claramente leyes no estrictas. Si, como es usual, por condición antecedente entendemos s ó l ~la condición principal A, entonces las leyes no estrictas se pueden calificar de integeribles, pueden tener "excepciones": dándose A se puede interferir la ocurrencia de B si las condiciones CP no se satisfacen. O más precisamente: la relación nómica entre antecedente y consecuente se altera al añadir al antecedente nuevas condiciones. Esta formulación deja claro, como se mostrará más adelante, que puede haber leyes probabilistas tanto estrictas como no estrictas, el carácter estricto o no estricto de una ley es en principio independiente de su carácter probabilista o no probabilista (en principio, pues como veremos en las secciones 4 y 5 , a veces se intenta reducir unas a otras). Normalmente las cláusulas CP se incluyen explícitamente en la formulación de la ley, pero puede ocurrir que leyes que se formulan sin tal cláusula, y que parecen por tanto estrictas, en realidad sean interferibles. Por ejemplo, la ley de Kepler, (2). no contiene cihusula CP explícita y sin embargo es claramente interferiblr (p.ej. por presencia de otros astros). Esto ocurre en general con las leyes aparentemente estrictas que contienen idealizaciones, pues las idealizaciones equivalen a cláusulas CP
implícitas. Veremos que es una cuestión abierta si hay leyes verdaderame~~te estrictas, conlo parecen en principio (1) y ( 5 ) . Por último, se suele distinguir también entre leyes causales y leyes no causales. Las leyes causales son regularidades nómicas que contienen o expresan un vlítculo causal entre condiciones antecedentes y consecuentes. En principio, y dejando de momento de lado la problematización filosófica del concepto de causa, (S), ( l l ) , (12) y (14) son claramente leyes causales, y (2) y (3) claramente no lo son. Las leyes cinernáticas de Galileo no contienen elementos causales; tampoco las de Kepler (al menos en su formulación usual, pues tal como él Ias formuló sí contenían un elemento causal, a saber, el ailirna /liotr-ix que atribuía al Sol). Por otro lado, es inmediato que las leyes causales han de ser leyes de sucesión, pues los efectos suceden temporalmente a sus causas. Por ello, si se considera causal una ley de coexistencia es porque se reformula en términos de sucesión; por ejemplo, la ley de gases ideales se puede considerar causal en su versión como ley de sucesión: determinado incremento de temperatura produce, a volumen constante, determinado aumento de presión. Sobre las leyes de coexistencia y sucesión volveremos brevemente en el capítulo 10 cuando examinemos las versiones de la concepción semántica de las teorías en términos de espacios de estado. Algunas nociones causales básicas, y su relación con las leyes, se introducirán brevemente en la sección 3 y se retomarán en el capítulo 7 dedicado a la explicación científica. De las leyes no estrictas nos ocuparemos en la sección 4, y de las probabilistas en la 5. Antes de ello, como anunciamos, vamos a ver con más detalle la diferencia entre leyes y regularidades accidentales.
2. Leyes y regularidades accidentales Para simplificar la exposición, ignoraremos de momento las complicaciones debidas a la probabilidad y a la interferibilidad, y vamos a restringir las consideraciones de esta sección a leyes estrictas no probabilistas. Tanto las regularidades accidentales como las nómicas (estrictas no probabilistas) son "hechos" generales "que ocurren" del tipo "Todos los A son B" y la cuestión es elucidar su diferencia, determinar qué distingue unas regularidades de otras. Esta elucidación se puede llevar a cabo de dos modos. Se puede intentar dar condiciones necesarias y suficientes para que una reguIaridad sea una ley, esto es, dar un análisis completo del concepto de lq.Esto no es lo que vamos a hacer aquí; parte de ello será el objeto de la última sección, en la que revisaremos las líneas generales de los principales análisis de las leyes, sus méritos y dificultades. Nuestro objetivo ahora es mucho más modesto y propedéutico. Se trata sólo de señalar una serie de propiedades que intuitivamente distinguen a las leyes de las regularidades accidentales. Pero ni individualmente, ni conjuntamente, se pretende que constituyen un análisis del concepto le),, son s61o condiciones a las que todo análisis debe en prirzcipío adecuarse; en principio, pues no todas tienen la misma fuerza inruitiva y quizá las menos fuertes pueden cuestionarse en algunos análisis (mencionaremos también alguna condición que, aunque a veces se ha propuesto, hay buenas razones para desestimar).
En lo que sigue vamos a suponer que las leyes que manejemos como ejemplos, y en general las leyes que hoy aceptamos, son verdaderas. Ese es un supuesto claramente discutible, y casi seguro falso, pero no afecta a nuestra actual tarea. Quizá todas las regularidades que hoy creemos que son leyes no lo sean, por ser falsas, pero eso no afecta en general al concepto de ley. La cuestión es la siguiente: si esas cosas fuesen efectivamente leyes naturales, ¿qué podríamos decir de ellas que no podemos decir de otras regularidades, y en especial de las meramente factuales?
A veces se ha propuesto que las leyes, a diferencia de las generalizaciones accidentales, no pueden contener referencia alguna (ni implícita ni explícita) a objetos particulares, lugares o momentos específicos, esto es, deben ser piiramente generales (nótese que esta generalidad pura excluye también predicados que encubren implícitamente referencia a particulares, como 'barcelonés' o 'venusiano'). La regularidad sobre las monedas del bolsillo de Quine, o la de que todos los barceloneses aman su ciudad, violan esta condición y no son por tanto leyes. Sin embargo esta condición es excesiva, pues excluye leyes claramente aceptadas como tales, p.ej. las de Kepler, que hacen referencia al Sol. La respuesta (cf. Hempel y Oppenheim, 1918) es aceptar algunas de estas generalizaciones no puras como leyes si son derivables de otras puras; a éstas se las considera las leyes jilndatnentales y a aquéllas leyes derivadas. Pero esta estrategia no es viable por dos motivos, uno histórico y otro lógico: primero, las leyes de Kepler eran consideradas leyes genuinas antes de la existencia de las leyes fundamentales de las que se derivan (las leyes de Newton); y segundo, es obvio que de generalizaciones puras solas no se pueden derivar generalizaciones no puras, hacen falta además afirmaciones particulares pues las generalizaciones no puras hablan implícitamente de objetos particulares. Una condición con espíritu semejante, pero más débil, es que la generalización sea irrestricta (cf. p.ej. Nagel, 1961, cap. 4, $1). Tanto las leyes de Kepler como p.ej. la generalización accidental "Todos los tomillos del auto de Srnith, a mediodía del Año Nuevo de 1990, están oxidados" contienen referencia a particulares. La diferencia radica en que el ámbito de aplicación de la segunda está restringido a una región espaciotemporal y e1 de la primera no, pues aunque los planetas estén de hecho en determinada región ello no está presupuesto por la ley. Pero esta condición sigue siendo parcialmente insatisfactoria. En primer lugar, es discutible que no pueda haber leyes genuinas que involucren esencialmente regiones espaciotemporales particulares (p.ej. sobre los tres primeros minutos del universo, o quizá algunas leyes geológicas sobre la Tierra no generalizables a otros planetas). Y en segundo lugar, muchas generalizaciones accidentales satisfacen esa condición; por ejemplo, las generalizaciones sobre la inexistencia de grandes esferas de oro y uranio son ambas irrestrictas, pero sólo la del uranio es nómica.
FL!MD,4\IE\TOS DE F I L O S O F ~DE ~ L.4 CIENCIA
Otra condición propuesta a veces es que las leyes, a diferencia de las generalizaciones accidentales, no pueden ser vacuamente verdaderas. "Todos los minotauros son mamíferos" es vacuamente verdadero, pues su antecedente no se aplica a nada, pero ello no afecta en absoluto a su carácter de mera regularidad; sin embargo, no aceptaríamos ese tipo de regularidades como leyes. Tampoco esta condición es clara. "Todo hilo de cobre a -270 "C es buen conductor" es seguramente vacuamente verdadera y no es evidente que no sea una ley, pues sí lo es "Todo hilo de cobre es buen conductor". Se puede proponer que una generalización vacuamente verdadera es aceptable como ley siempre y cuando se derive de otra ley no vacuamente verdadera. Nótese que esto incluiría (Lcontraintutivamente?) como casos específicos aquellos en los que la no aplicación del antecedente se deriva de una ley, p.ej. "Toda esfera de uranio de más de 1 km de radio es inestable". Pero esta modificación no parece suficiente debido a las idealizaciones. Las leyes genuinas contienen a menudo idealizaciones, p.ej. superficies sin fricción o espacio vacío, que pueden no ser nunca satisfechas. Por otro lado, es poco plausible aceptar como ley cualquier generalización vacuamente verdadera consecuencia de una ley, p.ej. (1) "Todo varón embarazado tiene branquias", que se deriva de la ley (2) "Ningún varón queda embarazado". Éste es un caso particular del problema que hemos comentado más arriba sobre el eventual carácter legal de las consecuencias lógicas de las leyes. Pero es un caso particular muy especial. De (2) se sigue lógicamente tanto (1) como (3) "Todo varón que toma pastillas no se queda embarazado", y mientras es discutible si (3) es una ley, parece claro que (1) no lo es dado que su antecedente es nómicamente imposible.
Las regularidades nómicas se consideran confirmadas por sus instancias, las accidentales no. La constatación de que una moneda del bolsillo de Quine es dorada no confirma por sí sola el que las restantes lo sean. Para confirmar esto hay que haber comprobado todas y cada una de las monedas, y hasta la última moneda no podemos, por así decir, pronunciamos sobre la regularidad. Sin embargo, si la regularidad es una ley, la constatación de instancias particulares se acepta como confirmación de la ley; eso sí, confirmación parcial, y tanto mayor cuanto mayor sea el número de instancias constatadas. Es cierto que es un difícil problema filosófico precisar esta noción de confirmación (que ya usamos en el capítulo 3), pero ahora no necesitamos ocuparnos de él (cf. el capítulo 12 dedicado al problema de la inducción), nos basta una preconcepción intuitiva de la confirmación. Y relativamente a esa preconcepción, la cuestión es que, en la inedida en que una generalización se considere nómica, se estará dispuesto a considerarla confirmada (en cierto grado) a través de sus instancias concretas. Si la generalización es considerada accidental, "hasta la última instancia" no podemos decir nada, ni siquiera de grado (por elIo, si hay generalizaciones accidentales cuyo antecedente se aplica a un número infinito de objetos, tales regularidades son inconfirmables por principio). Es cierto que en
LEYES CIE>T~FICAS
139
cualquier regularidad, incluidas las accidentales, si se examina p.ej. el SO % de los A y resulta que todos ellos son B. podemos decir algo, a saber, que la regularidad probabilista "La probabilidad de que un A sea B es al menos de 0,8" está bien confirmada. Pero esa es una regularidad diferente de "Todos los A son B", que era de la que se trataba. Sobre estas cuestiones volveremos en el capítulo 12.
Tanto las leyes como las meras regularidades accidentales sirven para "predecir" sobre los casos ya conocidos. Si todos los A conocidos son B, desde luego que si este objeto es uno de los A conocidos entonces "será" B. Pero por supuesto a la ciencia no le interesa este tipo de "predicción". La que interesa es la predicción sobre casos desconocidos, y en ella leyes y regularidades accidentales se comportan de modo muy diferente; con las primeras estamos justificados al hacer predicciones sobre nuevos casos, con las segundas no. No está justificado predecir que la próxima moneda que entre en el bolsillo de Quine será dorada, pero sí lo está predecir que el próximo trozo de metal que se caliente se expandirá. Esta diferencia está relacionada con la anterior relativa a la confirmación, pues podemos hacer predicciones sobre nuevos casos en la medida en que la regularidad esté confirmada.
Las leyes son explicativas, las regularidades accidentales no. Si queremos una explicación de por qué esta moneda particular es dorada, no es una buena respuesta decir que es dorada porque estaba en el bolsillo de Quine en cierta ocasión y que en tal ocasión todas las monedas de su bolsillo eran doradas; una buena explicación es, por ejemplo, que la moneda es de oro puro y que todas las piezas de oro puro son doradas. En ambos casos el hecho a explicar se deriva de otro hecho particular y de una regularidad verdadera, pero sólo el segundo proporciona genuina explicación, pues sólo la segunda regularidad es nómica. Sobre esta cuestión tendremos ocasión de extendemos en el capítulo 7 dedicado a la explicación científica.
A veces se ha sugerido que la legalidad-nomicidad descansa en la causalidad. En las regularidades nómicas, contrariamente a lo que ocurre en las accidentales, hay una relación causal entre las condiciones antecedentes y consecuentes. Esta condición tiene un interpretación débil y otra fuerte. La interpretación fuerte es que toda ley contiene explícitamente elementos causales. Así interpretada es claramente incorrecta. Como mencionamos más arriba, hay leyes genuinas, como las de Galileo o Kepler, que no son causales en L
este sentido fuerte. En su interpretación débil, afirma que toda ley que no sea directamente causal se subsume en, o deriva de, otras que sí lo son; p.ej. las mencionadas se derivan de las leyes de hTeulton. Si ello significa que no se consideran leyes sin disponer de tal derivación, sigue siendo incorrecto, pues aunque, p.ej., las leyes de Kepler recibieron un fuerte respaldo al derivarlas Ne\vton de su sistema, fueron consideradas leyes perfectamente legítimas antes de que A'ei{.ton desarrollara su mecánica. Se puede debilitar todavía más y decir que las leyes no causales son "en principio" o "en última instancia" derivables de leyes causales. Pero esto sólo se puede defender proporcionando una teoría sustantiva y muy específica de la causalidad. discutible filosóficamente y, en cualquier caso, no inmediatamente coincidente con nuestras intuiciones preteóricas.
Si bien es dudoso que las leyes son siempre causales (en el sentido intuitivo preteórico), no lo es que siempre suponen cierto tipo de necesidad entre las propiedades involucradas. Como vimos, este elemento de necesidad es sobre el que descansa un tipo específico de modalidad, la nómica. Las leyes son esencialmente modales. Una de las manifestaciones de su naturaleza moda1 es que soportan o apoyan cierto tipo específico de afirmaciones modales, las afirmaciones condicionales contrafácticas. Un condicional contrafáctico, o subjuntivo, es una afirmación del tipo "si hubiera ocurrido a, habría ocurrido P", o "si ocurriera a, ocurriría p.Contra lo qua a veces se sugiere, no toda afirmación de este tipo presupone que el antecedente de hecho no ha ocurrido; eso puede sugerirlo la primera forma, pretérita, pero desde luego no la segunda (y nada realmente esencial de la semántica de los condicionales subjuntivos depende de ello). Pues bien, las leyes dan apoyo a este tipo de expresiones, las regularidades accidentales no. El que todas las monedas que de hecho hay en cierto momento en el bolsillo de Quine sean doradas no nos permite afirmar que si esta moneda estuviera en tal momento en ese bolsillo también sería dorada; de que todos los que vinieron de hecho a cenar fuesen varones no se sigue que si Rosa hubiese \.enido, sería varón. Contrariamente a lo que ocurre con las regularidades accidentales, las leyes sí permiten afirmar sobre su base situaciones contrafácticas. Puesto que es una ley que los metales se dilatan al calentarse, podemos afirmar que si caleríráse~ííoseste trozo de metal se dilataría; puesto que es una ley que la madera flota en el agua, si El Moisés de Miguel Ángelfiese de madera,floraría en el agua. Este hecho es el que está detrás de las diferencias anteriores relativas a la predicción y la explicación. La predicción no es más que la aplicación de un contrafáctico en el que el antecedente puede no haberse dado todavía pero se dará. Si una ley explica es justamente porque contiene el elemento de modalidad expresado en el contrafáctico que apoya. Tal como dijimos en términos informales en la anterior sección, la modalidad, que se manifiesta en su capacidad de apoyar contrafácticos, es esencial a las leyes. Incluso si una ley "Todos los A son B" es tal que la condición antecedente nunca se da de hecho, sigue siendo cierto que si se diera tal condición, se daría también la condición consecuen-
te. Éste es un motivo adicional para matizar la importancia a la discusión sobre la vacuidad. No hay especial problema en que una ley sea vacuamente verdadera contemplada corno generalización condicional material, pues lo que importa es su aspecto modal, que no queda explícito si se la contempla así. En realidad, es inadecuado contemplar las leyes como siendo sólo generalizaciones materiales. Lo correcto es decir que iinplican generalizaciones materiales, pero entonces es claro que el que la generalización materia\ imp\icada sea vacuamente verdadera no tiene por qué afectar a la ley. El núcleo de la cuestión es que si ','Todos los A son B" es una ley, entonces esta generalización contiene esencialmente un elemento modal; es una generalización material "con algo más" y ese algo más es de carácter modal.
1
i
La capacidad de las leyes de apoyar contrafácticos es la expresión más manifiesta de su carácter modal, pero no la única. Ya hemos mencionado que su función explicativa y predictiva se deben en el fondo a lo mismo. Otra manifzstación especialmente clara de la modalidad de las leyes es su intensionalidad. Recordemos (cf. cap. 4, $1) que cierta característica aplicable a afirmaciones es e.rtensiorzal si siempre se preserva al sustituir un atributo por otro coextensional (e.e. que se aplique a los mismos objetos); si alguna de estas sustituciones coextensionales modifica la característica entonces decimos de ella que es intensional. En términos linpüísticos: el operador correspondiente a dicha característica es extensional si el enunciado que contiene dicho operador preserva el valor veritativo tras una sustitución tal; es intensional en caso contrario, esto es, si no vale la sustitutividad salva veritare de expresiones coextensionales. Pues bien, es fácil ver que la nomicidad es una característica intensional. Por ejemplo, 'humano' y 'bípedo implume' son predicados coextensionales (todo bípedo implume es humano y viceversa), "Todo humano es primate" es una ley pero "Todo bípedo implurne es primate" no lo es, pues es biológicamente posible la existencia de bípedos implumes no primates. Por tanto, el operador de nomicidad genera contextos intensionales: en los enunciados del tipo 'es un ley que todos los A son B' no rige la sustitutividad salva veritate de expresiones coextensionales: la sustitución p.ej. de 'A' por otro predicado coextensional 'C' puede modificar su valor veritativo (entiéndase bien, puede variar el valor veritativo del enunciado 'es una ley que todos los A son B', no el del enunciado 'todos los A son B'). Es sencillo ver que el valor veritativo se altera justamente cuando la coextensionalidad de los atributos no es nómica sino accidental, esto es, cuando la regularidad bicondicional "Todo es A si y sólo si es C'es meramente fáctica. Eso es lo que ocurre en nuestro ejemplo, pues "todo bípedo implume es humano y viceversa", aunque verdadero, no es una ley. Si la coextensionalidad es ella misma nómica, .entonces la sustitución preserva la nornicidad. La intensionalidad es una de las características distintivas de cualquier tipo de modalidad, por ejemplo la conceptual. El operador de C-necesidad es intensional: 'es C-necesario que todo animal racional es racional' es verdadero, 'es C-necesario que todo
142
FUND.-~SIE\TOS DE FILOSOFL-~ DE L.\ CIENCIA
bípedo implume es racional' es falso. La intensionalidad de las leyes no es más que consecuencia de que éstas involucran otro tipo de modalidad, la modalidad nómica. Las expresiones 'es una ley que ...' y 'es N-necesario que ...' no son más que \miantes estiiísticas del mismo operador modal. Recuérdese que de momento estamos identificando las leyes con las generalizaciones nómicas. Si por los motivos discutidos más amba (el discutible carácter legal de algunas consecuencias lógicas de las leyes) no los identificamos. entonces el primer operador sería modalmente más restrictivo que el segundo; ambos sen'an intensionales, pero el segundo, a diferencia del primero, se preservaría bajo relaciones lógicas de implicación. En adelante, cuando queramos enfatizar el aspecto moda1 de las regularidades nómicas utilizaremos ocasionalmente como abreviatura de 'es una ley (es una regularidad nómica, es N-necesario) que todos los A son B' la expresión ' A N-implica B'. Por lo dicho hasta aquí, debe quedar claro que. en los casos de leyes estrictas y no probabilistas a los que ahora nos restringimos, de "A ,AT-implicaB" debe seguirse el universal material "Todos los A son B", pero no a la inversa. Éste es un hecho básico al que debe atenerse cualquier análisis filosófico del concepto de ley (cf. la última sección).
Este aspecto está estrechamente relacionado con los relativos a la predicción de nuevos casos y a la confirmación por instancias. Decimos que una regularidad observada es proyecrable si estamos justificados a proyectarla hacia el futuro. Así, por ejemp1o;todas las esmeraldas observadas hasta la fecha son verdes y parece que podemos proyectar esta regularidad: las futuras esmeraldas que se observen serán verdes. Goodman (1955) mostró con un famoso ejemplo que esta cuestión es más complicada de lo que parece. Digamos que algo es 'verdul' syss es observado antes del año 2000 y verde, u observado después del año 2000 y azul. Tenemos entonces otra regularidad observada, a saber, que todas las esmeraldas observadas hasta la fecha son verdules, y sin embargo parece que ésta no se puede proyectar. 0, en otros términos, parece que la experiencia observada permite confirmar la regularidad "Toda esmeralda es verde" pero no "Toda esmeralda es verdul". La cuestión es por qué. En esta cuestión están implicados los problemas centrales de la inducción (el principio de regularidad de la naturaleza, inferencia a la mejor explicación, etc.), que estudiaremos en su momento. De momento sólo nos interesa mencionar su conexión con las leyes. Una posible respuesta a este problema es decir que verde es proyectable y verdul no porque verde interviene en leyes mientras que verdul no. Pero si definimos los atributos proyectables como aquellos que intervienen en leyes, entonces el problema es especificar qué distingue a las leyes. Una posibilidad a la que se suele recumr es distinguir entre clases (géneros, atributos, propiedades) lzaturales y clases no naturales. Podemos agrupar las cosas en las clases que queramos, pero no todas esas agrupaciones corresponden a divisiones eiz la izaturaleza. Podemos formar una clase con los objetos verdules, o quizá otra con objetos que son caballos o pinos, pero estas colecciones no corresponden a
divisiones objetivas en la naturaleza. Contrariamente, y según los defensores de las clases naturales, la clase de los objetos verdes, o la de los caballos, o la de las moléculas de agua, si son clases naturales. Pues bien, la idea es entonces que las leyes sólo deben involucrar clases naturales, con lo que se termina identificando las propiedades proyectables con las naturales. Sin embargo, esta condición parte de nociones, como la de clase natural, que requieren tanta elucidación como la noción misma de ley, por lo que no se puede tomar como condición intuitivamente exigible a las leyes sino como alternativa (debatible) para un análisis filosófico sustantivo de las leyes. Una de sus principales dificultades es afrontar el problema ya mencionado de la implicación lógica: si las consecuencias lógicas de leyes son leyes, entonces dadas dos leyes "Todo A es B y "Todo C es D" también será una ley "Todo A o C es B o D , pero no siempre que A y C (o B y D) son clases naturales su unión también lo es. Nótese que esta cuestión se complica, pues los predicados resultan o no proyectables no aisladamente, sino "en grupos", relativamente unos a otros, y 'A-o-C' y 'B-o-D' son proyectables relativamente entre sí. Por ejemplo, 'verde', 'azul', 'esmeralda', y 'zafiro' son proyectables relativamente entre sí, pero 'verdul', 'azuerde' (azul antes del año 2000 y verde después), 'esmefiro' (esmeralda antes del año 2000 y zafiro después) y 'zaralda' (zafiro antes del año 2000 y esmeralda después) también son proyectables entre sí, pues, p.ej. todo esmefiro es verdul (y por supuesto podríamos haber partido del segundo grupo y definir los del primero a partir de ellos). Por tanto, no se puede identificar sin más proyectabilidad y naturalidad.
La apelación a Ias clases naturales es un modo específico, y particularmente comprometido, de imponer una condición a las leyes que, formulada en términos más generales, parece ineludible. Nos referimos a la objetividad: qué regularidades son nómicas depende del mundo, no de nosotros. Las leyes son objetivas y por eso se pueden desciibrir; las leyes no se "crean", existen independientemente de nosotros y nosotros, en todo caso, las descubrimos. Puede haber leyes que no hayamos descubierto todavía; en realidad, todas las leyes que hemos descubierto eran de ese tipo antes de descubrirlas. Esto se corresponde con la diferencia intuitiva que mencionamos más arriba entre:la necesidad nómica y la epistémica, a saber, que la primera, a diferencia de la segunda, "está en la naturaleza", no depende de los sujetos cognoscentes. Esta exigencia de objetividad es inapelable planteada en términos intuitivos o preteóricos. Otra cosa es si sigue siendo tan obvia cuando se formula con mayor precisión en términos más comprometidos. por ejemplo recurriendo a clases naturales. Ésta es sin duda una de las cuestiones centrales de la familia de problemas que conforman el problema del realismo científico. Éste es un tema recurrente en la filosofía de la ciencia y que, aunque no recibe un tratamiento explícito, recorre gran parte de esta obra, principalmente los capítulos dedicados a la estructura de las teorías, a la explicación y a la inducción.
n'SD.4frlE\TüS DE F l L 0 ~ 0 ~ i DE . 4 L.4 CIENCIA
La última exigencia es la de sistematicidad, y es relativa a la relación de unas regularidades con'otras. Las rezularidades accidentales pueden "vivir aisladas". Más allá de sus relaciones puramente lógicas, las regularidades accidentales no están relacionadas entre sí. A diferencia de ellas, las leyes mantienen relaciones orgánicas de dependencia que no son sólo relaciones lógicas. Dos o más le)-es pueden estar vinculadas de cierto modo que no es reducible a que unas se infieran lógicamente de otras. Y no sólo es una posibilidad; es característico de ellas que se integren conformando sistemas, ello es un hecho constitutivo de su identidad. Es cierto que caracterizar apropiadamente la naturaleza de estos sistemas, y de las relaciones que vinculan a sus constituyentes, es extremadamente difícil, pero ahora no vamos a ocupamos de ello (cf. caps. 8,9 y 10).
3. Acaecimientos, causalidad y leyes causales En esta sección vamos a presentar muy someramente algunas nociones básicas relativas a la causalidad y las leyes, sin entrar en problemas filosóficos sustantivos. En particular, no vamos a decir nada aquí de las principales concepciones filosóficas de la causalidad (humeana, realista, etc.) y muy poco de los problemas con que todo análisis de la causalidad se debe enfrentar (asimetría. prelación, redundancia, etc.). Casi todas las nociones que vamos a introducir son fuente de numerosos problemas filosóficos y, por más neutra que intente ser la presentación. es inevitable comprometerse con algunos supuestos discutibles que aquí no se van a cuestionar, y muchas veces ni siquiera a explicitar. En particular, la referencia en esta sección a la causalidad no pretende sugerir la imprescindibilidad de esta noción en el análisis de la ciencia en general y de las leyes en particular; y tampoco esta advertencia se debe interpretar en sentido contrario, favoreciendo la tesis de su eliminabilidad por otras nociones menos discutibles, como la de con-elacióiz fulzcio~zal.La finalidad es meramente propedéutica, esto es, presentar algunos conceptos causales que se utilizan o presuponen más adelante en este y otros capítulos, y en las discusiones metacientíficas actuales, sin problematizarlos filosóficamente (algunas referencias ya clásicas en el análisis contemporáneo de la causalidad son Mackie, 1974; Beauchamp y Rosenberg. 1981, y Sosa y TooIey (eds.), 1993). Puesto que las relaciones causales se dan entre acaecimientos, es preciso detenerse antes brevemente en ellos.
Los acaecimientos (sucesos, eventos) son determinada especie de entidades particulares. Un objeto particular es cualquier entidad espacial o temporalmente localizada; p.ej. el auto de Adela, esta pantalla de ordenador, el cuerpo calloso del cerebro de Quine, la "imagen" de la estatua de Colón en el córtex de Pedro ayer a las 13,30, etc. Un evento o
acaecimiento es cualquier cosa que ocurre o srtcede en cierto lugar durante cierto intervalo temporal; p.ej. la batalla de Waterloo, el último partido de fútbol Barcelona-Madrid, la salida de Juan de la carretera ayer en la Costa Brava, la caída el martes pasado de un rayo sobre la estatua de Colón de Barcelona, etc. Entre los acaecimientos se distinguen los procesos de los estados. Los procesos son acaecimientos variables (el partido de fútbol, la gripe de Rosa); los estados son eventos constantes (el estar eI Iector sentado este rato, el estado de afonía de Claudia). La distinción entre proceso y estado es parcialmente vaga y depende de cuán finamente identifiquemos los cambios (el acaecimiento-estado de estar sentado, mucho menos el de estar afónico, no son totalmente invariables). Los objetos y acaecimientos son entidades particulares que pueden tener o ejemplificar propiedades. Un mismo objeto particular puede tener muchas propiedades diferentes. Esto que está aquí abajo tiene la propiedad de ser una silla, pero también las de ser azul, ser cómoda, estar aquí debajo, o ser mencionada en este libro. También un mismo acaecimiento particular puede tener diversas propiedades. Eso que ocurrió el martes sobre la estatua de Colón de Barcelona tiene la propiedad de ser la caída de un rayo, pero también las de ocurrir de día, asustar a Rosa, producir un cortocircuito en el funicular, salir en primera página del diario El País del miércoles, ocurrir sobre'la estatua de Colón, o ser mencionado en este escrito. La relación causal es una relación que se da entre eventos particulares. Tanto objetos como acaecimientos particulares pueden estar relacionados de diverso modo; p.ej. el coche de Eduardo es más grande que el de Adela, la batalla de Witerloo es anterior al último partido Barcelona-Madrid. La anterioridad es una relación que se puede dar entre acaecimientos, la causalidad es otra. Podemos preguntar, p.ej., por la causa del accidente de Juan, o de la amnesia de María, y las causas son otros sucesos particulares. Por ejemplo, son causas del accidente de Juan ayer en la Costa Brava: el particular*estado mojado de la calzada, el estado gastado de las ruedas, la velocidad superior a 80 krnh del vehículo, la somnolencia de Juan, etc. Un mismo evento puede tener innumerables causas. Una causa o factor causal de un cierto suceso particular e, el acaecimiento-efecto, es otro suceso particular c, acaecimiento-causa, tal que si no hubiera ocurrido c, permaneciendo todo lo dernús igual, no habría ocurrido e. Por ejemplo, todos y cada uno de los sucesos mencionados son causas del accidente de Juan en este preciso sentido pues (supongamos): si la calzada no hubiera estado mojada, ocurriendo lo demás igual, no se habría salido de la carretera; y si no hubiera estado somnoliento, permaneciendo lo demás igual, tampoco se habría salido de la carretera; si el auto no hubiera ido a más de 80kmíh, etc. Se notará que, entonces, el accidente también tiene otras muchas causas. Por ejemplo, que Juan cogiera esa carretera, pues si hubiera cogido otra, y aunque hubiera tenido un accidente, no sería ese accidente; o que Juan se levantara de la cama ese día; o que Juan se sacara el permiso de conducir; o que sus padres le concibieran; o (presurniblemente) que los primates evolucionaran en cierta dirección determinada; etc. En todos estos casos también es cierto que si no hubiera ocurrido ese acaecimiento (permaneciendo lo demás igual), tampoco habría ocurrido ese accidente. La multiplicidad de causas derivada de esta caracterización contrafáctica de la causa-
lidad requiere dos advertencias. En primer lugar, no se sigue de ella que todo es causa de todo, que cualquier acaecimiento anterior al accidente es causa del accidente. Por ejemplo, que cuando Juan nació, el Sol estaba en Tauro, no lo es, pues simplemente no es cierto que si Juan no hubiera nacido bajo el signo de Tauro, permaneciendo todo lo demás igual, el accidente no habría ocurrido. Este ejemplo es ilustrativo, pues muestra que, como cabe esperar, e1 carácter contrafáctico es e1 núcIeo de la noción de causa también cuando tenemos creencias de hecho erróneas sobre causas. Las presuntas causas en las que erróneamente creen los supersticiosos son consideradas causas precisamente en ese sentido. Los que creen en la astrología creen en la causalidad astral en ese preciso sentido, a saber, creen que nuestra última afirmación contrafáctica "no es cierto que si Juan no hubiera nacido en Tauro, permaneciendo todo lo demás igual, el accidente no habría ocurrido" es falsa. En segundo lugar, no se debe confundir la multiplicidad de las causas con la de las explicaciones. Aunque el hecho de que Juan se sacara el permiso de conducir es una de las causas del accidente, no es una buena explicación decir que Juan se accidentó porque se sacó el permiso de conducir (o, más drásticamente, porque los primates evolucionaran en cierta dirección). Como veremos por extenso más adelante (cf. capítulo 5, $3, la explicación causal de un suceso no tiene por qué referirse a todas sus causas, sino por lo general sólo a aquella o aquellas más destacadas en el particular contexto explicativo. Así pues, y con estas advertencias, cada acaecimiento tiene por lo general múltiples causas o factores causales. "La" causa, o causa total, de un suceso e es la suma o conjunción de todos los eventos c,, c2, ..., c, tales que, de cada ci (1 5 i 5 n), es cierto que de no haber ocurrido c;, y permaneciendo lo demás igual, tampoco habría ocurrido e. La causa total del efecto e es entonces el acaecimiento complejo ci&c2&... & c, y la ausencia (eliminación o bloqueo) de cualquiera de los factores basta para que no se produzca el efecto e. La relación causal se da entre sucesos particulares, entre acaecimientos-ejemplar, pero gracias a que tales sucesos son de cierto tipo, ejemplifican cierta propiedad. Esto es, la causalidad se da entre acaecimientos-ejemplar elz virtud de que corresponden a ciertos acaecimientos-tipo. Tomemos una de las causas del accidente, p.ej. el acaecimiento consistente en que el auto iba a más de 80 k m , , y supongamos que este acaecimiento es una de las causas, en el sentido indicado, del accidente: permaneciendo todo lo demás igual, si él no se hubiera dado, el accidente tampoco. Ese suceso particular tiene la propiedad de ser un movimiento de vehículo a más de 80 kmh, pero también tiene otras, p.ej. ser recogido por un radar policial, ser mencionado en las noticias locales, o ser mencionado en este libro. Si ese suceso causa el accidente, es en virtud de que tiene la primera propiedad, no las otras. Sucesos de ese tiyo, "ser movimiento a más de 80 km/h",causan accidentes como ése en esas circunstancias, no los causan sucesos del tipo "ser recogido por un radar". Así, aunque ese mismo suceso particular que causa el accidente tiene ambas propiedades, causa el accidente en virtud de que ejemplifica una de ellas, no de que ejemplifica la otra. Otro suceso particular que fuese del tipo "ser recogido por el radar" pero no del tipo "ser movimiento a más de 80 M,podría no haber causado, en esas mismas circunstancias, el accidente (no lo causaría si, p.ej., si fuese del tipo "ser movimiento a 20 M').
La finalidad de las presentes consideraciones es sólo mostrar la conexión conceptual entre las nociones de causalickid y depeizdencia contrajúctica; no pretendemos dar un análisis de la primera mediante la segunda. Se puede dar tal análisis (para dos modos diferentes de hacerlo, cf. p.ej. hlackie, 1971 y Lewis, 1973n), para lo cual es preciso complicar considerablemente la caracterización simple que aquí hemos dado. La principal dificultad consiste en dar cuenta de determinadas situaciones en las que parece haber dependencia contrafáctica sin haber relación causal, y de otras en las que parece haber relación causal sin haber dependencia contrafáctica. Lo primero ocurre típicamente en los casos de efectos independientes de una causa común. Consideremos, por ejemplo, un sistema tal que al accionar un único botón (causa comlín c ) dispara dos cohetes, uno de los cuales explota a los seis segundos (efecto el) y el otro a los nueve (efecto e?),y supongamos que siempre funciona bien disparando los dos cohetes, o que cuando funciona mal no dispara ninguno. En este caso es cierto que, todo lo detncís igual, si no ocurriera el no ocurriría e2 (nótese que hemos supuesto que el sistema funciona igual de bien, o igual de mal, para ambos cohetes) y sin ernbarso no diríamos que e l causa e2 (sobre este tipo de ejemplos volveremos cuando estudiemos la relación entre carisalidad y e.rplicación). La segunda situación se da típicamente en los casos de causas independientes confluyentes. Contemplemos un dispositivo con dos botones tal que al accionar cualquiera de los botones, o al accionar ambos simultáneamente, dispara una bala, y que en cierto momento dos personas accionan simultáneamente los botones ( e l y c,) disparando una bala que mata a otra (e). En este caso es falso que. perrnnnecieizdo lo ciembs igual, si la primera persona no hubiera accionado el botón no se hubiera producido esa muerte por bala; y exactamente lo mismo respecto del accionamiento de la segunda persona. Pero entonces, según la caracterización simple dada, iziizgluzo dz los accionamientos causa la muerte, lo cual contradice nuestras intuiciones (quizá no diríamos que cada iuio causa la muerte, pero como mínimo sí que al menos uno lo hace). No podemos detenernos aquí en estos y otros problemas de los análisis contrafácticos de la causalidad (para un buen compendio, cf. Sosa y Tooley (eds.), 1993).
Esta idea de que la causalidad es una relación entre sucesos particulares, pero que lo es en virtud de que éstos ejemplifican ciertas propiedades generales, es la que recogen las leyes causales. Las leyes son generales, y las leyes causales expresan la relación catisal entre propiedades, 'causal' no en el sentido de que unas propiedades causen otras, sino de que sucesos de un tipo causan sucesos del otro. Las leyes causales son acerca de las propiedades o acaecimientos-tipo en virtud de los cuales se dan las relaciones causales entre los acaecimientos-ejemplar. Esto explica la intensionalidad de las leyes, al menos de las causales. Puede ocurrir que ' A N-implica B' sea verdadero y 'C N-implica B' falso, aunque los acaecimientos particulares de tipo A sean de hecho los mismos que los acaecimiento~de tipo C, esto es, aunque las propiedades A y C sean de hecho ejernplificadas por exactamente los mismos acaecimientos particulares. El motivo en las leyes causales es
148
R;NDASfE%TOS DE F I L O S O F DE ~ ~ LA CIENCIA
claro: no vale la sustitución si los acaecimientos particulares de tipo A causan acaecimientos particulares de tipo B. en virtud de tener la propiedad A y no en i'irrud de tener la propiedad C; si, por otro lado, la coextensjvjdad de A y C se debe a alguna relación nómica entre ambas propiedades, entonces sí valdrá la sustitución en contextos nómicos. La intensionalidad de las leyes causales es pues consecuencia de que las relaciones causales se dan enrre acaecilnie~zrosparriculares en vimrd de qrre son eje~nplaresde detenninado ripo. De los diversos elementos vistos hasta aquí parece derivarse una consecuencia extraña relativa a las leyes causales estrictas. Si a ) los sucesos tienen múltjples causas, b) las leyes causales deben recoger en su antecedente los diversos tipos de causas involucrados, y c ) las leyes estrictas deben contener condiciones antecedentes estrictamente suficientes, entonces d) las leyes causales estrictas deben contener en su antecedente la causa total, esto es, deben referirse en su antecedente a todos los tipos de factores causales (o al menos todos los simultáneos). Sin embargo, a la luz de los ejemplos usados hasta ahora, esto parece muy implausible. Bien, en parte es así y en parte no. En parte no es así, pues los ejemplos de generalizaciones nómicas causales ordinarias son en parte desorientadores. Las leyes cie~zt@casse centran muchas veces en tipos de sucesos con relarivameizte pocos factores causales, o incluso a veces tratan de efectos debidos a un únjco tipo de factor causal. Pensemos por ejemplo en la ley de gravitación universal. A los actuales efectos podemos formularla como ley causal del siguiente modo: "Sobre un cuerpo x de masa m, la presencia a una distancia d de otro cuerpo y de masa 172' produce sobre el primero una fuerza atractiva de magnitud Gmln'lE'. Aquí, la causa de que x esté sometido a esa fuerza es un acaecimiento que ejemplifica la condición antecedente. En otras ocasiones las leyes se ocupan de sucesos con muchas causas pero a la ley le interesa el efecto conjunto de todas ellas y, en ese sentido, se trata de una única causa. El ejemplo paradigmático es la segunda ley de Newton: "La suma Cf; de fuerzas incidentes sobre un cuerpo de masa m produce en éste una aceleración a de magnitud 'IfJln". En ambos casos parece en principio que se expresan los factores causales completos. esto es, que se trata de leyes causales estrictas (cf., sin embargo, la próxima sección y, específicamente sobre el peculiar estatuto de la segunda ley de Newton, la sección 5 del capítulo 10). Pero en parte la anterior conclusión d) sí es válida, pues hay fenómenos con múltiples factores causales que son objetos genuinos de investigación científica. Quizá no es éste el caso de los accidentes de automóvil, pues no hay, y quizá no haya nunca, teorías científicas socialmente reconocidas como tales c u ~ objeto o sean los accidentes de automóvil en general (aunque, en un sentido laxo de 'científico', el estudio de este fenómeno que involucra nomicidad causal múltiple es sin duda científico). Pero hay ejemplos parecidos pertenecientes a ámbitos reconocidamente científicos. Por ejemplo, el estudio de la esquizofrenia, y en general de los desajustes psíquicos, cuya multiplicidad causal es pri~nafacie incuestionable. Ejemplos parecidos se pueden encontrar también en las ciencias sociales (economía, sociología, antropología) y también en ciencias naturales (biología, geología). Así, la ciencia, y la ciencia reconocida como tal, también se ocupa de tipos de sucesos causalmente complejos. La consecuencia es la división social del trabajo, la diversidad de la tarea investigadora: la existencia de diversas teorías-leyes cada una de las cuales trata de
I
j
uno o algunos de los factores causales. Cada una proporciona sus explicaciones apelando a causas distintas, pero estas explicaciones no tienen por qué ser inconlpatibles, antes al contrario, cada una es válida en su contexto y, consideradas conjuntamente, cornplementarias. En situaciones de este tipo, relativamente comunes en ciencia, la existencia de leyes estrictas que contemplen la totalidad de factores causales de un fenómeno es efectivamente muy implausible, a no ser que se pruebe la redrtcción de unos factores causales a otros. De cuestiones relacionadas con ésta vamos a tratar en la próxima sección y en la sección 5 del capítulo 1 1. Queda pendiente la discusión sobre la existencia o no de leyes no causales. En un sentido inmediato, es obvio que las hay, por ejemplo las de Kepler, la de Galileo sobre la caída libre o la del péndulo. Otro grupo de casos proviene de los fenómenos de causa común mencionados más arriba. Por ejemplo, la correlación entre el descenso brusco del barómetro y las tormentas es sin ninguna duda nómica, pero no es causal: tanto el descenso del barómetro como la tormenta son efectos independientes de una causa común, el descenso brusco de la presión atmosférica. Eso proporciona una vía de escape a los partidarios de la necesaria intervención de la causalidad en las leyes. Algunas leyes no son direcro)ne~itecausales, pero éstas se derivan siempre de otras que sí lo son; esto es lo que ocurre en el caso del barómetro y la tormenta, en los ejemplos cinemáticos mencionados y, en su opinión, en todas las leyes aparentemente no causales. Sin embargo, es un hecho que regularidades nómicas no causales como las mencionadas se han reconocido y aceptado como leyes antes e independientemente de su derivación de otras causaIes. Hoy mismo, p.ej. en mecánica cuántica, se aceptan muchas leyes sobre cuyo supuesto carácter causal se suspende el juicio, no sólo por parte de los científicos sino también de los metacientíficos. Esto no refuta la tesis procausalista radical, pero la divorcia de la explicación de la práctica científica; o al menos muestra que el uso que de hecho hacen los científicos de la noción de ley no presupone la de car~salidad(aunque el procausalista puede concluir, simplemente, que los científicos no usan siempre correctamente el primer concepto). 4.
CIáusulas ceterisparibrrs y leyes no estrictas
Muchas de las leyes científicas son interferibles, presentan excepciones. En algunas casos ese carácter se hace manifiesto al incluirse explícitamente cláusulas ceteris paribus, cláusulas del tipo "salvo factores extraños", "si nada interfiere", etc.; ése es el caso, por ejemplo, de las leyes (9). (lo), (12), (13) y (14) de nuestra lista inicial. Pero en la mayoría de ocasiones la cláusula CP está sólo implícita, por ejemplo, en el caso mencionado más arriba de la ley de Kepler. O, para tomar un ejemplo claramente causal, como sucede en la siguiente ley biomédica: (34) Una dosis de 10 mg de benzodiacepina produce somnolencia. b
i l
!
Lo característico de estas leyes es que son leyes con excepciones. Puede ocurrir el suceso antecedente y no darse el suceso consecuente, y ello sin que se trate (al menos
150
FUNDAhlEXTOS DE F I L O S O F DE ~ L.4 CIENCIA
aparentemente) de una ley probabilista. Otro modo de expresarlo es diciendo que son leyes inretferibles, pero ha de quedar claro que con ello no se quiere sugerir que son interferibles "por nosotros", esto es, por agentes humanos. Quizá a veces la interferencia pueda producirla una acción humana (p.ej. en (34) ingiriendo alguna sustancia inhibidora), pero eso es irrelevante. Son interferibles en el siguiente sentido: la ocurrencia del suceso particular de tipo A implica nómicamente la ocurrencia del suceso de tipo B sólo si se dan ciertas condiciones adicionales, por lo que en caso de que tales condiciones resulten interferidas por ciertos factores inhibido)-es, se da el suceso antecedente y no el consecuente. En las leyes causales, en las que la relación nómica es la relación causal, el efecto es interferible por la posible no ocurrencia de alguna de las causas coadyuvantes, el factor inhibidor impide que se dé alguna de tales causas complementarias; por ejemplo, en (34) se puede interferir el efecto de la sustancia debido a un estado de extrema excitación, o a la ingestión de otra sustancia, etc.
DE LAS LEYES NO ESTRJCTAS 1.1. AKÁLTSIS
Hay principalmente tres modos de analizar este tipo de leyes. El primero, y más inmediato, es en términos de leyes estrictas. Según este análisis, las leyes no estrictas fon7luladas; en términos causales, son leyes cuya son leyes estrictas i?zco~npletaine~zte formulación no incluye todos los factores causalmente relevantes. La incompletud puede ser, y a menudo es, relativamente indefinida o desconocida. La particularidad de estas leyes no se corresponde con hechos brutos de la naturaleza sino que es consecuencia de nuestra ignorancia. La naturaleza sólo contiene leyes estrictas, la "no estricticidad" es una característica epistémica, no metafísica; no nos informa de algo relativo al mundo sino sólo de algo relativo a nuestro conocimiento, a saber, de su incompletud en cierto ámbito. Según este análisis, "A, cp, N-implica B" tiene en realidad el siguiente contenido: a) no ocurre que A N-implica B y b) A & H N-implica B, para cierta propiedad H total o parcialmente no identificada y tal que ella sola no N-implica B. H es el (desconocido) complemento de la condición antecedente A .y ambas propiedades tomadas conjuntamente constituyen el antecedente de una ley estricta. La ley con cláusula cp es interferible porque la ocurrencia de A no N-implica la de H; es N-posible que se dé A sin darse H y, por tanto, sin darse B. En general H puede ser muy compleja e incluir factores tanto positivos como ?1egativos.Los factores positivos consisten en la ocurrencia de cierto hecho (p.ej. que la sustancia pase a la sangre), los negativos en la no ocurrencia de ciertos otros (p.ej. que no haya una sustancia química inhibidora en el cerebro). Esta diferencia es, metafísicamente considerada, origen de algunas dificultades filosóficas en las que no vamos a detenernos ahora; a los actuales propósitos, los factores positivos y negativos que constituyen H se encuentran al mismo nivel. Eso es así incluso si la cuestión se plantea en términos causales, pues si un factor causal ci es interferible por, digamos, la ocurrencia de un factor interferidor cj, entonces una condición causal antecedente adicional es la no ocurrencia de ci. Y la no ocurrencia de un acaecimiento es otro acaecimiento con perfecta potencia causal
(p.ej. que Juan no viniera :i la fiesta es parte de la causa de que no hubiera vino, pues él era el encargado de traerlo). A esta redi(rrcció11epistétrzicn de las leyes no estrictas a las leyes estrictas se le pueden hacer dos objeciones. Una de ellas, específica sólo de algunos casos de leyes CP, tiene que ver con la relación entre las ciencias especiales y la ciencia básica y la comentaremos después. La otra objeción, más general, se deriva de los aspectos metafísicos debatibles que hemos obviado. Como veremos en la última sección, algunos autores defienden que las leyes expresan cierta relación moda1 primitiva entre universales o propiedades naturales. Desde esta perspectiva, el complemento H representa un problema, pues contiene condiciones negativas y las condiciones negativas no se pueden asimilar plausiblemente con universales, o propiedades naturales. Para simplificar, supongamos que H es sólo "que ahí no ocurra un acaecimiento de tipo C'. La no instanciación de C es ciertamente un acaecimiento ("negativo"), pero es muy implausible defender que ese acaecimiento involucra una propiedad diferente de C, a saber, la propiedad no-C. No es plausible sostener que dicho acaecimiento ejemplifica un supueSto universal no-C, como tampoco es plausible, de un acaecimiento que ejemplificara algunos de los universales D y E, decir que ejemplifica un supuesto universal D-o-E; no toda combinación lógica de universales es otro universal. Ésta es la objeción de Armstrong a la reducción de leyes no estrictas a-las estrictas y el motivo de la alternativa que propone (cf. 1983, cap. 10, 54). La propuesta de Armstrong es seguir el camino opuesto, esto es, tomar como relación nómica primitiva la expresada por las leyes no estrictas y obtener las estrictas como caso especial. Así, la relación nómica básica entre universales es en sí misma interferible. La relación nómica entre A y B es interferida si existe de hecho una propiedad I tal que "Todos los A & I son B" no es una ley. Una relación nómica concreta entre A y B es interferible si es posible la existencia de una propiedad I que la interfiera. Toda relación nómica es C-interferible, esto es, para toda relación nómica concreta es conceptunlinente posible la existencia de una propiedad que la interfiera. Pero de ello no se sigue que toda relación-nómica sea N-interferible, esto es, no se sigue que para toda relación nómica concreta sea nómicnmerzte posible la existencia de una propiedad que la interfiera. Eso depende del mundo. Quizá algunas relaciones nómicas son tales que no es N-posible la existencia de interferencias. Pues bien, caso de haberlas, ésas serían las leyes estrictas. Las leyes estrictas son relaciones nómicas que no tienen, ni N-pueden tener, interferidores. Nótese que esto no puede pretender ser una definición de "relación nómica interferible", pues en tal caso sería circular. Se trata a lo sumo de un intento de elucidación de dicha noción primitiva. Por otro lado, tanto la propuesta como la objeción que la motiva dependen esencialmente de.la concepción de las leyes como relaciones entre universales. La tercera alternativa es interpretar las leyes no estrictas en términos probabilistas (10 que por supuesto exige a su vez no interpretar después, ni abierta ni encubiertamente, las leyes probabilistas en términos de condiciones cp). Según esta alternativa, "Todos los A son. cp, B" sería una variante estilística de "La probabilidad de que los A sean B es (muy) alta". La motivación para usar tal variante consistiría en que, en los casos en que se usa, el valor exacto de la probabilidad es desconocido. Así, en lugar de decir algo pro-
152
FUXD.LIIIE\TOS DE FILOSOFÍ.~DE L.\ CIENCIA
babilísticamente indefinido como que los A son "en general" o "con bastante" probabilidad B. diríamos que ceteris paribus los A son B. La dificultad principal de esta alternativa es proporcionar después una elucidación de las leyes probabilistas que sea coherente con esta reducción de leyes no estrictas a leyes probabilistas. Por otro lado, según cómo se analicen las leyes probabilistas, esta propuesta se puede acabar convirtiendo en alguna de las anteriores. En particular, si la probabilidad de que se habla es subjetiva o epistémica, reducir las leyes no estrictas a leyes probabilistas es otro niodo de reducirlas a leyes estrictas incompletas, esto es, a leyes con condiciones antecedentes desconocidas.
El contexto metacientífico en el que más se debate sobre la naturaleza de las leyes no estrictas es el de la relación entre ciencia especial y ciencia básica y la posibilidad de reducir, total o parcialmente, la primera a la segunda. El debate se ha planteado sobre todo en filosofía de la psicología (cf. p.ej. Schiffer, 1991 y Fodor, 1991), pero afecta igualmente a otras ciencias, como la economía, la sociología, la biología o la geología. La cuestión de la relación entre ciencias especiales y ciencia básica tiene que ver con el viejo anhelo fisicalista de situar a las teorías físicas en la base de todo nuestro conocimiento. Para el fisicalista (o fisicista) la realidad es en última instancia, y primariamente, realidad fisica; lo (micro)físico constiruye todos los demás niveles de realidad. Aunque las demás ciencias, llamadas usualmente en este contexto cieltcias i:o básicas o especiales, proporcionen explicaciones legítimas, tales explicaciones descai~sanen última instancia en las que proporciona la física. La causalidad involucrada en los fenómenos macroscópicos descansa sobre las relaciones causales de los procesos microfísicos que constituyen aquéllos. Las leyes macroscópicas tielle11su base o jimdamer~toen leyes microfísicas. Así, la psicología tendría su base en la neurociencia; la biología, lo mismo que la geología, en la química y en la física; y la química en la física. Análosamente, aunque de modo más insospechado, ocurriría p.ej. con ciencias especiales todavía más alejadas de la física, como la sociología, la economía o la lingüística. La versión más radical de este programa fjsicalista es el reduccionismo. Como veremos (cf. capítulo 11 $5), la posibilidad de redilcciólt en sentido estricto parece inviable a causa de la rnúltiple realizabilidad, pero los fisicalistas pueden defender su viejo anhelo con una versión menos ambiciosa centrada en la noción de sirpen.eniencia, más débil que la de reducción. No podemos detenernos ahora en esta cuestión, que estudiaremos más adelante. Aquí nos interesa tan sólo apuntar el motivo por el que las leyes no estrictas están en el centro de este debate.' 1. Como se ha indicado, el debate se centra inicialmente en el fisicalismo, en la tesis de que la "realidad básica" es del tipo estudiado por las teoríasfl.~ica.s. Sin embargo, la idea de que en la ciencia algunas leyes. 1corls 0 explicaciones "descansan" en o t r x m i s bisicas es general e independiente de si el nivel básico es siempre. o no. el estudiado por las teorías físicas. Par ello, para no prejuzgar la cuestión del fisicalismo, y sipiendo a la ~iie~3tun. para referimos a ambos niveles no usaremos 'ciencia física' y 'ciencias no-físicas' sino 'ciencia bkica' y 'ciencias no-básicas' o, mis brevemente, 'ciencias especiales'.
t
[ L
F
i.
La mayoría de las leyes de las ciencias especiales, si no todas, son no estrictas, contienen implícita o explícitamente cláusulas ceteris paribus (p.ej. las leyes (lo), (12), (13) y (14) de nuestra lista) y uno de los motivos de ello es que son interferibles por procesos más básicos. Tomemos como ejemplo (13): si alguien desea algo, cree que haciendo otra cosa lo logrará, cree que su acción es posible, y no desea más otra cosa que sea contraria a su acción, entonces, ceteris paribus, realiza la acción. En este caso hay factores interferidores claros, y los más inmediatos no son "psicológicos" sino más básicos, neuronales o bioquímicos. Por ejemplo, deseo dejar de sentir dolor en el zapato, creo que se debe a una piedra, creo que sacándome. sacudiendo y volviendo a calzarme el zapato lograré mi deseo, creo que eso es posible y que no se opone a ningún deseo en competencia, y a pesar de todo no realizo la acción pues, por ejemplo, mis facultades motoras se han visto afectadas por efectos de una droga o por un repentino shock neuronal, o endocrino, o lo que sea. Éste es un ejemplo paradigmático de interferibilidad de una ley psicológica. El fisicalista sostiene que este tipo de situación, común en todas las ciencias especiales, proporciona plausibilidad a su tesis. Si la causalidad se da entre acaecimientos particulares en virtud de ejemplificar ciertas propiedades, y el factor interferidor es, digamos, neuro-bioquímico, entonces las propiedades en virtud de las cuales el acaecimiento particular causa determinado efecto cuando no es interferido, deben ser también neuro-bioquímicas, pues de otro modo la causación no sería interferible por sucesos neuro-bioquímicos. La idea que hay detrás es que la causalidad se realiza mediante ciertos mecanisinos y que, por tanto, todas las propiedades causalmente relevantes (tanto las efectivas como las inhibidoras) tienen que estar al mismo nivel, el nivel del mecanismo. Si las propiedades interferidoras son neuro-bioquímicas, las responsables de la causación en ausencia de interferencia también deben serlo. Y así, en opinión del fisicalista, hasta llegar eventualmente al nivel más básico. De lo anterior se deriva la objeción específica a la reducción de las leyes no estrictas a leyes estrictas que anunciamos más arriba. Si las leyes no estrictas se reducen a leyes estrictas incompletas, entonces su eventual formulación completa debe mencionar las propiedades causalmente relevantes. Si todas las propiedades causalmente relevantes deben ser del misnio nivel, entonces todas las propiedades que menciona la eventual ley estricta formulada completamente deben ser del nivel de los factores de interferencia. Pero si es así, puede objetarse, entonces no es ya una ley (no estricta) de la ciencia especial sino una ley (estricta) de la ciencia básica. En el caso de la psicología, las leyes CP psicológicas serían formulaciones incompletas de leyes estrictas de la neurociencia (o lo que sea). Y el caso de la psicología es sólo un ejemplo, lo mismo ocurriría en las restantes ciencias especiales con sus correspondientes bases de factores interferidores. Independientemente del análisis de las leyes no estrictas, la idea misma de los mecanismos causales inspira a los fisicalistas el descenso hacia la microfísica. El funcionamiento de un mecanismo que consta de partes depende del funcionamiento de las partes que lo constituyen y del modo en que se combinan las partes. Puesto que todo fenómeno consta en última instancia de partículas básicas (o lo que la física básica diga) con ciertas Propiedades, "funcionando", combinándose y recombinándose de cierto modo, la explicación en cualquier nivel descansa en última instancia en la explicación en el nivel básico.
Estas consideraciones son independientes del análisis de las leyes no estrictas, pues la idea de los mecanismos sugiere el descenso incluso si las leyes especiales fuesen estrictas. Dejaremos por el momento sólo planteadas estas cuestiones y volveremos sobre la relación entre ciencia especial y ciencia básica cuando nos ocupemos de las relaciones interteóricas (cf. cap. 11 $5). 4.3. LEYESNO ESTRICTAS Y CIENCIA BÁSICA
Aunque la discusión sobre leyes no estrictas se suele encontrar especialmente vinculada a la de la relación entre ciencia especial y ciencia básica, conceptualmente no depende de ella. Los factores interferidores pueden ser todos del mismo nivel que el de las propiedades que se mencionan en la formulación no estricta de la ley, en cuyo caso la eventual formulación completa de la ley no supone ningún descenso ontológico. Es difícil, en principio, encontrar ejemplos claros de ello en las ciencias especiales, aunque quizá algunas leyes económicas como (14) pudieran coi~espondera una situación tal. Quizá los factores que pueden impedir que un aumento de la oferta produzca un descenso del precio del producto sean todos económicos; aunque si somos muy estrictos no, pues siempre parecen ser posibles interferencias "catastróficas", por ejemplo puede caer un meteorito, o sin ir tan lejos, los consumidores pueden volverse todos locos y, siendo todos los demás factores económicos iguales, pagar más cuanto más haya. Sea de ello lo que fuere, el lugar más apropiado para plantear la cuestión de las leyes no estrictas, independientemente de la relación entre ciencia especial y básica, es el de la (supuesta) ciencia básica, pues simplemente ella no tiene otra más básica a la que se pueda apelar para dar cuenta de las interferencias. El problema en este caso es si existe tal cosa, actual o potencialmente. En el presente contexto, y por mor de la exposición. supondremos que así es y tomaremos como ejemplo la ciencia que paradigmáticamente así se ha considerado por los defensores de la ciencia básica, la mecánica (para facilitar la exposición, nos referiremos a una teoría mecánica parcialmente incorrecta, la Mecánica Clásica, y no a las actualmente en vigor, la Mecánica Cuántica y la Mecánica Relativista). Muchas de las leyes de la familia mecánica son claramente leyes no estrictas, aunque no contengan explícitamente cláusulas cetei-isyai-ibus.Los casos más manifiestos, algunos de los cuales ya hemos mencionado, corresponden a las leyes cinemáticas resultado de aplicar las leyes mecánicas a situaciones específicas; por ejemplo, la ley de Kepler sobre el movimiento de los planetas, la ley de Galileo sobre la caída de graves en entomos próximos a la superficie terrestre o la ley del péndulo que correlaciona la velocidad angular (o el período) con la longitud. Todas estas leyes, y muchas otras, son claramente interferibles, y de hecho interferidas. Los planetas no se mueven exactamente como afirma (2) pues están sometidos a fuerzas de otros astros; los cuerpos no caen con la aceleración que afirma (3) pues están sometidos a otras fuerzas además de la gravitatoria, al menos la del rozamiento del medio, y análogamente con (4). En todos estos casos, los factores interferidores no provienen de otros niveles supuestamente más básicos, sino del propio nivel cuyas propiedades (magnitudes) son mencionadas en la formulación de la ley. La
interferibilidad de este tipo de leyes "básicas" no estrictas se debe en general a que en su formulación se realizan ciertas idealizaciones sobre su ámbito de aplicación, p.ej. que no hay fuerzas de rozamiento del medio, que no hay otros astros, etc. Este tipo de leyes no estrictas se pueden completar entonces de dos modos diferentes. El primero, incluir explícitamente una cláusula CP que mencione las idealizaciones. Éste es el caso de algunas formulaciones de la ley de Galileo en las que se explicita que la aceleración es "en el vacío"; o de la del péndulo, cuando se explicita, además de que el movimiento es en el vacío, que el hilo no tiene masa; y quizá fuese posible algo parecido también en la ley de Kepler. El inconveniente principal de este expediente para convertirlas en leyes estrictas es que se trataría de leyes estrictas vacuamente verdaderas, pues una vez explicitadas las idealizaciones e incluidas como condiciones antecedentes adicionales, el antecedente de la ley no se cumpliría en ninguna situación empírica real (aunque recordemos que eso no afecta a su naturaleza contrafáctica). El segundo procedimiento consiste en mantener el antecedente sin idealizaciones y refinar entonces el consecuente para que tome en cuenta los efectos derivados de los factores interferidores. En este caso tenemos una ley de caída de graves, mucho más complicada, que incluye como parámetros adicionales la fricción del medio, etc. Obviamente, la mayor dificultad de este procedimiento es que resulta difícilmente realizable de modo pleno hasta conseguir leyes estrictas. La existencia de leyes físicas básicas no estrictas podría explicarse por su carácter no jiindnmental. Estas leyes serían siempre leyes derivadas,es decir, el resultado de aplicar a situaciones particulares leyes mecánicas más fundamentales que tratan directamente de los elementos dinámicos causalmente responsables de los efectos cinemáticos. No es esencial que las leyes cinemácicas no estrictas se formularan originalmente como aplicación de las dinámicas (p.ej., ello no fue así en los ejemplos mencionados), basta con que acaben siendo derivables cuando se identifiquen las leyes causales. Éste sería un modo de "eliminar" las leyes no estrictas de la ciencia básica, mostrar que las leyes no estrictas son siempre aplicaciones con idealizaciones de leyes más básicas a situaciones específicas. P a n que ello pueda considerarse una cuasi-eliminación de las leyes no estrictas es necesario que las leyes más básicas sean estrictas. La idea es que las leyes fundamentales no contendrían idealizaciones, las idealizaciones sólo se precisarían en aplicaciones particulares. Así, por ejemplo, en dinámica, las leyes fundamentales expresan determinaciones de dos tipos. En unos casos, se determinan efectos cinemáticos globales debidos a factores dinámicos conjuntamente considerados. Un ejemplo sería la Segunda Ley de Newton, a = B l r n , que determina la aceleración total debida a la resultante de las fuerzas incidentes, sean éstas cztales sean. Así considerada esta ley no parece contener idealizaciones y, como sugerimos en la sección 2, sería un caso de ley estricta. Es cierto que por sí sola es de poca utilidad, que sólo tiene contenido empírico aplicada a situaciones específicas y que tal aplicación supone idealizaciones, pero todo ello no la convierte, al menos sin argumentos adicionales, en una ley interferible. En otros casos, se determina el valor de ciertas magnitudes dinámicas dependientes de otras propiedades dinámicamente efectivas. Ejemplos de esto serían la ley de gravitación universal, o la ley de Coulomb que determina la magnitud de la fuerza eléctrica entre cuerpos
156
FUND,ASIE.\TOS DE FILOSOF~ADE LA CIENCIA
cargados, o la ley de Hooke que determina la magnitud de la fuerza de recuperación de un cuerpo elástico. La ley de gravitación, tal como la formulamos anteriormente, establece que sobre un cuerpo x de masa m, la presencia a una distancia d de ctro cuerpo y de masa m' produce sobre'el primero una fuerza atractiva de magnitud Gnun'ld-. En esta versión, esta ley es claramente una ley estricta, y Jo mismo ocurre con las otras dos formuladas análogamente. Si advertimos explícitamente que este segundo tipo de leyes se pueden considerar leyes estrictas únicamente en estas versiones de las mismas, es porque a veces se han formulado de modo que su estricticidad se torna cuestionable. Así, por ejemplo, Cartwright (1983 cap. 3) objeta al presunto c.arácter estricto de la ley de gravitación interpretándola como afirmando que la fuerza (total) con la que se atraen dos cuerpos es Gi~tln'/&.Así interpretada se trataría obviamente de una ley falsa, esto es, con excepciones, pues "la" fuerza con que se atraen puede no ser esa si, por ejemplo, los cuerpos están además cargados eléctricamente. Según esta interpretación, la ley versa sobre la-fuerza atractiva total, y en tal caso es claramente no estricta, contiene la idealización de que no hay otras fuerzas atractivas actuando. Sin embargo, es discutible que ésta sea una interpretación legítima de ley, y en cualquier caso no es la adecuada para dirimir la cuestión que nos ocupa. Si este tipo de interpretaciones estuviera siempre disponible, sería difícil siquiera concebir una ley cuantitativa mínimamente específica que fuese estricta: toda ley que especifique la cantidad de cierto efecto producido por un factor causal específico incluiría, en esa interpretación, una cláusula cp afirmando que no hay otros factores que producen el mismo tipo de efecto.
5. Probabilidad y leyes probabilistas
Las leyes probabilistas son aquellas regularidades nómicas cuya formulación contiene esencialmente expresiones probabilísticas o estadísticas, como las leyes (6), (7) y (1 1) de nuestra lista inicial. Damos en este caso una caracterización en términos intencionadamente lingüísticos puesto que, como veremos, es una cuestión especialmente debatible que haya algo como probabilidades objetivas en la naturaleza. A las regularidades estadístico-probabilistas se aplica también la distinción entre nómicas y accidentales. Nómicas son, por ejemplo, las tres recién mencionadas, mientras que la siguiente regularidad estadística (supongamos que verdadera) es claramente accidental:
(35) El 80 8 de las monedas del bolsillo izquierdo de los pantalones de Quine en el Año Nuevo de 1990 son doradas. Que tal porcentaje de monedas del bolsillo izquierdo sean doradas es tan accidental como que todas las del derecho lo sean. Si se entiende el sentido en que (30) es
¡ I
i
'
1 1
!
i
¡
¡
1
I
accidental, se debe entender igualmente que (35) lo es. Por lo general, las regularidades accidentales de esta clase se suelen formular en términos estadísticos, no en términos probabilistas. Las expresiones probabilistas suelen reservarse sólo para regularidades nómicas, pero nada esencialmente incorrecto hay en decir, sabido que (35) es accidental, que la probabilidad de que una de tales monedas sea dorada es 0,s; aunque menos común, también se expresan a veces regularidades accidentales en términos probabilistas. Un ejemplo más interesante es (36): (36) Los consumidores de café tienen una probabilidad más alta de padecer cáncer de pulmón que los que no lo consumen. Ésta es una regularidad verdadera, pero (seguramente) accidental. Lo que produce cáncer de pulmón no es tomar café sino fumar, y lo que ocurre es que tomar café está nccidentafineilte correlacionado con fumar (al menos a nivel biomédico, quizá la correlación entre tomar café y fumar sea una regularidad estadística nómica de la sociología, en cuyo caso (36) resultaría ser nómica después de todo). Entre las leyes probabilistas también se pueden distinguir las estrictas de las no estrictas. Si bien tanto en las leyes probabilistas como en las no estrictas ocurre que, aunque la regularidad nómica sea verdadera, pueden satisfacerse las condiciones antecedentes y no las consecuentes, el carácter probabilista o no es en principio independiente del carácter estricto o no. Al igual que hay leyes no probabilistas estrictas y no estrictas, también las leyes probabilistas pueden ser estrictas o no estrictas. Otra cosa es que, si se defiende una determinada concepción epistémica de la probabilidad, toda ley probabilista resulte ser en el fondo una ley (no probabilista) no estricta. Pero en principio, y antes o independientemente de dicho análisis, es claro que puede haber leyes probabilistas tanto estrictas como no estrictas. Por ejemplo, la ley (7) sobre la desintegración de los átomos de radio es seguramente estricta, mientras que (37) y (35) son claramente no estrictas:
(37) La probabilidad de que te interrogue la policía en Barcelona paseando por la calle es muy baja. (35) La probabilidad de curarse de una infeccióii tomando antibióticos es muy alta. Ambas regularidades nómicas son verdaderas, pero claramente interferibles: si además de pasear por Barcelona se tiene aspecto norteafncano, la probabilidad de que te interroguen pasa a ser alta; si se toma alcohol después de los antibióticos, la probabilidad de cura disminuye considerablemente. Nótese que la interferibilidad no consiste ahora en que se pueda dar el antecedente sin el consecuente, eso es siempre así en las leyes probabilistas. La interferibilidad consiste en que, al añadir nuevos factores (interferidores) al antecedente, puede alterarse la probabilidad aseverada. La diferencia entre leyes probabilistas estrictas y no estrictas tiene pues que ver con la relevancia estadística de las nuevas condiciones que se pueden añadir al antecedente: si tales nuevas condiciones son estadísticamente relevantes para la ocurrencia del consecuente, entonces la probabilidad
varía y la ley resulta interferida. Las leyes probabilistas estrictas se caracterizan por la Ito~nogeneidadde la propiedad o clase de referencia antecedente. La clase de referencia antecedente A es homogénea respecto de la propiedad (clase de referencia) consec~centeB si en todas las subclases de A la probabilidad de ser B es la misma, esto es, si para cualquier propiedad C,la probabilidad de ser B es la misma siendo A q u e siendo A & C. Así, si A es B-homogénea no hay posibilidad de interferencia probabilista y la ley es estricta. Cuando en el capítulo 7 nos ocupemos de las explicaciones estadísticas, volveremos sobre esta noción. Las leyes probabilistas se suelen denominar también Nzderennirzistas. Pero aquí hay que ir con cuidado para no confundirse por cuestiones terminológicas. Si por 'indeterminista' se entiende una ley tal que aunque se satisfaga el antecedente no está rotalinerlre deter~ni~zodo o asegurado que ocurra el consecuente, entonces las leyes no estrictas, probabilistas o no, también serían indeterministas. En ese sentido son indeterministas todas las probabilistas y las no probabilistas interferibles, y son deterministas sólo las no probabilistas estrictas. Si por 'indeterminista' se entiende simplemente probabilista, entonces las interferibles no probabilistas serían deterministas. Por último, se puede quizá pensar en un sentido débil de 'determinista' que incluya a las probabilistas estrictas. En este sentido débil, una ley es determinista si está dererrnirzado qué es lo gire Iza de pasar. En una interpretación amplia, en las leyes probabilistas estrictas está determinado qué es lo que ha de pasar, a saber, que se dé determinada probabilidad; si la ley probabilista es estricta, pasa lo que ha de pasar, la probabilidad está determinada. En este sentido débil, 'indeterminista' es simplemente sinónimo de 'no estricta'. Así pues, hay tres interpretaciones posibles de 'ley determinista': a) ley estricta no probabilista, 6) ley no probabilista (estricta o no) y c) ley estricta (probabilista o no). Puesto que los otros casos tienen ya sus propias denominaciones, aquí usaremos la expresión, salvo advertencia en contrario, en el primer sentido (este uso coincide además en general con el de la literatura, pues casi siempre se distingue entre leyes deterministas e indeterministas sin tomar en consideración las leyes no estrictas). Antes de presentar brevemente las diferentes concepciones sobre la probabilidad, y con ello sobre la naturaleza de las leyes probabilistas, vamos a explicitar el modo en que se van a transcribir estas leyes en el resto de esta obra y a comentar lo que se dirime en otras alternativas que no vamos a seguir. Las leyes estadístico-probabilistasmás sencillas tienen una de las siguientes formas: (i) "La probabilidad de que los A sean B (o la pro-habilidad de ser B condicionada a ser A) es r", "El r % de los A son B"; (ii) "La probabilidad de ser B siendo A es mayor que siendo C', "El porcentaje de Bs que son As es mayor que el de Bs que son Cs"; (iii) "Ser A aumenta la probabilidad de ser E'. Para estas afirmaciones itómicas estadístico-probabilísticas vamos a usar, respectivamente, las siguientes transcripciones: 'p(B/A) = r', 'p(B1A) > p(B/C)' y 'p(B1A) > p(Blno-A)' (es inmediato que con la primera bastaría, pues ' ~ ( c x>) p(B)' equivale a 'hay r, s tales que p(a) = r, p(P) = S y r > S ' ) . Aquí tomaremos la expresión 'p(B/A) = r-' como abreviatura de "v'.~(p(Ax -+ Bx) = r)'. En principio podrían imaginarse dos interpretaciones alternativas, pero es fácil ver que no son viables. Una primera posibilidad es analizar 'p(B/A) = r' mediante 'V.x (A.x
+ p(Bx) = r ) ' . Pero esta opción no es aconsejable, principalmente por dos motivos. El primero es que este análisis es inconsistente si hay leyes probabilistas no estrictas y si el predicado 'probable' se puede usar en lógica de primer orden estándar. Como mencionamos en el capítulo 2 (S3), entre proposiciones probabilistas no vale en general la inferencia (*) de "p(B/A) = r" a "p(B/A&C) = r". Esta inferencia sólo es válida si A es B-homogénea, esto es, si p(B/A) = r es una ley estricta. Por otro lado, en Iógica de primer orden estándar siempre es válida la inferencia (**) de " V x (Ax +y(x))" a " V x (Ax A Cx 4 y(x))". De ambos hechos se sigue que la opción considerada conduciría a inconsistencias. Puesto que no es razonable sostener que todas las leyes probabilistas son estrictas, el único modo de defender esta opción es rechazar que el operador 'p' se pueda usar en lógica de primer orden (quizá por ser intensional), de modo que si este operador aparece en 'y', entonces la inferencia (**) no se puede considerar de primer orden. Pero esta respuesta es poco plausible pues, primero, (**) es válida incluso si 'y' contiene predicados claramente intensionales, p.ej. modales o epistémicos, y segundo, la teoría matemática de la probabilidad se formula usualmente en lógica de primer orden. El otro motivo para no seguir esta opción, independiente del anterior, es que, según algunas concepciones de la probabilidad, no tiene sentido hablar de probabilidad absoluta; sólo tiene sentido hablar de probabilidad condicionada, por lo que 'p(Bx)', si no tiene implícita una paráfrasis condicionada, no siznifica nada. Por tanto, si se usa este análisis se está prejuzgando la falsedad de dicha concepción. La segunda posibilidad es aplicar 'p' a implicaciones materiales generales, esto es, analizar 'BIA' mediante 'V,r (A.r -+ B.r)' y, con ello, 'p(B1A) = r' mediante ' p ( V x (Ar -+ Bx)) = r' (esta opción presupone aceptar que tiene sentido aplicar la probabilidad a proposiciones generales). La principal dificultad de este análisis es que, si aceptamos que 'p' se aplique a generalizaciones, hay casos de generalizaciones materiales falsas cuya probabilidad es razonable considerar nula, o al menos muy baja, y sin embargo la generalización nómica probabilista asigna una probabilidad relativamente alta (análogamente con generalizaciones verdaderas). Supongamos que es una regularidad nómica que la probabilidad de que un átomo de radio permanezca estable durante 1.600 años es 0,5. Ello no quiere decir que la probabilidad de que todos los átomos de radio permanezcan estables durante 1.600 arios es 0,5. Se diría que esta segunda probabilidad es O, aunque quizá eso sea discutible según la concepción de la probabilidad que se defienda. Pero en cualquier caso no es obvio que esta segunda probabilidad sea también 0,5, y así sería si se aceptara este segundo análisis.
LÓGICA,PROBABIL1D.A.D 5.2. PROBABILIDAD
SUBJETIVA Y PROBABILIDAD OBJETIVA
Para concluir, vamos a ver muy brevemente las principales concepciones sobre la naturaleza de la probabilidad y su aplicación a las leyes probabilistas. Estas concepciones no son siempre incompatibles, pues en alsunos casos se defiende que el término 'probabilidad', como 'banco' (o 'necesario') es equívoco, esto es, que tiene diferentes significados y que por tanto no se trata de un único término sino de varios. Así, por ejemplo,
160
FCND.\S1E>TOS DE FlLOSOFI.4 DE LA CIENCIA
Camap sostiene que hay que distinguir entre probabilidadi o probabilidad lógico-inductiva y probabilidad: o probabilidad estadística. Por otro lado, no todos los análisis pretenden dar una definición de 'probabilidad' en función de otros térniinos no probabilistas supuestamente más claros. En muchos casos el análisii se detiene en algún concepto probabilista que se considera primitivo y del que se derivan el resto de conceptos probabilistas, y presenta sus conexiones no definicionales con otros conceptos. Por último, todos los análisis deben satisfacer al menos dos condiciones de adecuación: en primer lugar, deben ser coherentes con los principios fundamentales de la teoría matemática de la probabilidad (cf. p.ej. Kolmogorov, 1950); y en segundo lugar, deben mostrar cómo se evalúan las proposiciones probabilistas, o cómo se determinan los valores probabilistas, a partir de frecuencias observadas. Éstas son exigencias que todo análisis debe satisfacer en principio; para rechazar alguna de ellas hay que ofrecer motivos muy fuertes. El tema de la probabilidad es especialmente complejo, tanto técnica como conceprualmente. Ninguna de las concepciones en liza ha mostrado por ahora ser plenamente satisfactoria, el debate sigue abierto y dista mucho de resolverse pronto. Por la coniplejidad del tema y las lin~itacionesde espacio vamos a presentar sólo las líneas generales de las principales alternativas y cómo afectan a la naturaleza de las leyes probabilistas. Sobre algunas de ellas ~~olveremos más adelante cuando nos ocupemos de la explicación (cap. 7) y, especialmente, de la inducción (cap. 12). Se pueden distinguir en general tres familias de concepciones sobre la probabilidad: la lógica, la subjetivista y la objetivista. Según la primera, los enunciados de probabilidad son acerca de relaciones lógicas (inductivas) entre proposiciones. Según la segunda, los enunciados de probabilidad son acerca de las creencias que tiene el sujeto sobre cieno ámbito; el contenido de tales enunciados, en tanto que probabilistas, no tiene que ver con estados del inundo objetivo sino con estados epistémicos de los sujetos, esto es, con el estado de conocimiento o ignorancia, por parte del sujeto, de regularidades no probabilistas, las únicas que hay objeti\.amente. Según la tercera, los enunciados de probabilidad son acerca de propiedades empíricas objetivas independientes del sujeto de conocin~iento.Esta caracterización es extremadamente superficial y parcialmeiite inadecuada, pero la tomaremos como punto de partida para presentar las diferentes alternativas. Probabilidad Iógica. La interpretación lógica de la probabilidad se inicia con Keynes (1921), Ramsey (1926) y Reichenbach (1935) y es desarrollada por Jeffreys (1957) y, sobre todo, Carnap (cf. especialmente 1950), cuyos trabajos continúa Hintikka (1966). En esta interpretación, las afirmaciones de probabilidad condicionada (al menos en una de las nociones de 'probabilidad') expresan relaciones de inferencia lógica, no deductiva sino inductiva; las afirmaciones probabilistas son por tanto, como todas las afirmaciories lógicas, a yriori. La afirmación "P es consecuencia deductiva de U" expresa una relación Iógica objetiva, a saber, que la verdad de P está implicada por la de a. Cuando la probabilidad es Iógica, 'p(P/a) = r' significa "P es consecuencia inductiva de u en grado J', y esto expresa una relación Iógica tan objetiva como la anterior que, igual que aquélla, depende sólo del contenido de cr y de P . El problema, claro está, es precisar en qué consiste esa relación. En el caso de la inferencia deductiva es sencillo precisar cuál es
LEYES C I E ~ T ~ F I C A S
161
esa relación y los patrones inferenciales correctos a que da lugar. No ocurre así con la inferencia inductiva y todavía hoy se sigue trabajando en el desarrollo de un sistema de lógica inductiva satisfactorio (tarea que para los críticos, como Popper, está condenada al fracaso, pues según ellos simplemente no existe una Iópica inductiva). En e l capítulo 12 ($3) volveremos sobre esta cuestión. Como veremos, una posibilidad es subjetivizar la Iópica inductiva y sostener que sus leyes no son sobre relaciones 'objetivas que mantienen las proposiciones independientemente de los sujetos cognoscentes, sino sólo sobre las creencias de los sujetos. En este caso, la noción lógica de la probabilidad acabaría reduciéndose a alguna de las versiones de la probabilidad subjetiva. Incluso si se acepta este sentido lógico 0. inductivo de la probabilidad. es poco plausible aplicarlo a las leyes científicas probabilistas. Ello supondría interpretar las leyes concretas de tipo p(BIA) = r como afirmaciones lógicas que expresan casos concretos del esquema argumentativo inductivo (1), y las leyes concretas de tipo p(B/A) > p(B1C) como afirmaciones en que se establece que un caso concreto de (110) es una inferencia inductiva mejor que el correspondiente caso concreto de (IIb).
Nótese que los argumentos inductivos involucrados no tienen por qué ser "buenos" o "fuertes". En el primer caso r puede ser bajo, y ello no debería afectar en absoluto a su legitimidad en tanto que ley probabilista (cf. p.ej. la lzy según la cual la probabilidad de que un electrón atraviese una barrera de potencial es 0,I). Las leyes probabilistas del primer tipo serían pues reglas de inferencia inductiva para pasar de unas afirmaciones a otras, con mayor o menor garantía inductiva según sea la probabilidad aseverada en la ley. Análopamente en el segundo caso, tanto (IIa) corno (IIb) pueden ser muy débiles mientras (IIa) sea menos débil que (IIb). Las leyes del segundo tipo establecerían comparaciones entre pares de tales reglas de inferencia. Esta interpretación de las leyes es, además de poco natural, implausible prinin fncie pucs convierte a las leyes de la ciencia empírica en afirmaciones lógicas (de la lógica inductiva) y por tanto a priori. Defender que las leyes naturales (probabilistas) son verdades lógicas (inductivas) es identificar la necesidad nómica con la necesidad Iógica. Esta consecuencia es prirnn fncie inaceptable, es un precio demasiado elevado a pagar por el esclarecimiento de la noción de ley, probabilista o no. Independientemente de la implausibilidad de esta eventual aplicación de la probabilidad lógica a las leyes probabilistas. y suponiendo, como pretenden los inductivistas, que es una noción aceptable, la noción lógico-inductiva de la probabilidad no puede ser la única. Al menos por uri motivo, a saber, los argumentos inductivos usan en muchos casos en las premisas afirmaciones probabilistas o estadísticas. Es cierto que hay argumentos inductivos, p.ej. los de inducción por enumeración, cuyas premisas no usan expresiones probabilistas o estadísticas, pero otros sí. Y quien pretendiera que esta noción de probabilidad es la única debería mostrar que todos los casos de argumentos inductivos con premisas probabilistas se pueden reconstruir sin hacer intervenir afirmaciones probabilistas. Como hemos mencionado. Carnap mismo no pretendía (y p.ej. Ramsey tampoco)
162
FUSDA)IE>TOSDE FILOSOF~A DE LA CIENCIA
que la noción lógica fuese la única y aceptaba además una noción estadística o frecuencialista de la probabilidad.
Probabilidad sitbjetii-a. Veamos ahora el núcleo de otra de las interpretaciones, la subjetivista. Para las interpretaciones s~bjetivistas~ la probabilidad no se refiere al muitdo sino a nuestro corlocilniento. El lema de estas concepciones es: la probabilidad es una medida de nuestra ignorancia. La diferencia entre una afirmación probabilista y una no probabilista no tiene que ver con el mundo objetivo sino con el estado de conocimiento o ignorancia del sujeto. La idea es que, cuando el sujeto no tiene toda la evidencia relevante para a, le asigna un valor entre O y 1 (y distinto de ambos) que expresa la "intensidad" de su creencia en a dada la evidencia de que dispone. La probabilidad, así entendida, es grado de creencia ( o cor?fiartza) racional (la exigencia de racionalidad es esencial para que esta probabilidad satisfaga los principios de la teoría matemática). Entre los defensores de esta noción, en alguna de sus diversas versiones, se cuentan Bemoulli (1 7 13), Bayes (1763), Laplace (1795), Ramsey (1928), de Finetti (1937) y Savage (1954) (para una buena antología, cf. Kyburg y Smokler (eds.), 1961). Las creencias son susceptibles de gradación o, cuando menos, de ser sostenidas con mayor o menor intensidad, y la probabilidad subjetiva es una medida de dicho grado, mide la confianza del sujeto en la ocurrencia del hecho en cuestión. Puesto que la creencia, y sus grados, son relativos a la evidencia disponible, desde una perspectiva subjetivista lo natural es considerar la probabilidad siempre condicionada. Así, p(ple) n i d e el grado o fuerza de la creencia de cierto sujeto s en cierta proposición p a la luz de la evidencia e de que dispone el sujeto. Es cierto que el cálculo de probabilidades contiene también probabilidades absolutas o incondicionadas p(u), pero en esta concepción las probabilidades incondicionadas se deben interpretar como probabilidades condicionadas encubiertas relativizadas todas ellas a cierta evidencia-base e. común tijada en cada contexto. De este modo se debe entender la forma en que se determinan experimentalmente las probabilidades subjetivas mediante experimentos de apuestas o preferencias. Se puede determinar la probabilidad subjetiva de un individuo sobre varias opciones haciendo que apueste por cada una de ellas o que las ordene aisladamente y en combinación. En estos procedimientos, el sujeto parte de cierta evidencia-base en relación a la cual establece sus apuestas o preferencias. En algunos casos no tiene evidencia positiva discriminatoria y entonces considera todas las alternativas equiprobables (éste es el fundamento del principio de indiferencia laplaciano, al que corresponde el dicruin "probabilidad igual a casos favorables entre casos posibles"); en estos casos es razonable considerar que se acepta como evidencia de fondo la no existencia de factores que discriminarían unas opciones frente a otras. La diferencia entre las nociones lógica y subjetiva es sutil y se puede prestar a confusión. Lo que puede motivar su confusión es que en ambos casos se caracteriza la probabilidad como el grado de apoyo que una información proporciona a cierta proposición. Lo esencial para mantener la diferencia es que dicho grado de apoyo es objetivo en el primer caso y subjetivo en el segundo. Así, si se identifica probabilidad con grado de creencia, pero se caracteriza éste en términos objetivos o ideales, se está pasando de la
i
noción subjetiva a la lógica. Por ejemplo, si se apela al grado en que la creencia resulta ot>jetivameníeju~tificndn,esto es, si por grado de creencia raciona1 en p sobre la base de la evidencia e se entiende grado de justificación que objetivamente e confiere a p en virtud del contenido de ambas, entonces estamos ante la probabilidad lógica o inductiva. Y 10 mismo si identificamos probabilidad con grado de creencia racional ideal, si con ello se sugiere que todos los sujetos racionales deben coincidir idealmente en los grados de creencia en una proposición p dada cierta evidencia e . El hecho distintivo de la probabilidad subjetiva frente a la lógica es, entonces, que diferentes individuos o comunidades, siendo todos ellos racionales, puedan diferir en sus probabilidades subjetivas básicas aun disponiendo de la misma evidencia. Esto es, si todos los sujetos deben idealmente coincidir en la probabilidad de p dada la misma evidencia e, entonces es que ese valor de apoyo de e a p depende sólo del contenido de e y de p, que es justamente lo que caracteriza la probabilidad lógica. Nótese que lo distintivo de la interpretación subjetivista es que diferentes individuos pueden diferir en las probabilidades básicas, no en el modo de combinar las básicas para obtener valores derivados. Esos valores derivados se obtienen operando con los básicos mediante los principios de la teoría matemática de la probabilidad y, recordemos, todas las interpretaciones, y tambiin por tanto la subjetivista, aceptan la validez de tales principios. Así, si dos individuos difieren en los valores que asignan a p(ple), será porque difieren en los valores que asignan a pr\e o a e , pues ambos aceptan el principio del cálculo de probabilidades según el cual p(ple) = p(p A e)/p(e). Si la probabilidad subjetiva se distingue de la probabilidad lógica por la posible discrepancia ante la misma evidencia, de la probabilidad objetiva se diferencia por desclparecer en situaciones epistémicamente ideales, esto es, en situaciones en las que se dispone de roda la evidencia relevante. iSo puede ocurrir que tengamos a nuestra disposición toda la evidencia relevante de que idealmente se puede disponer y que a pesar de ello la probabilidad se mantenga por debajo de 1 y por encima de O'?, ¿que sigamos siendo incapaces de garantizar plerlarrterlre qué va a pasar? Si se trata de probabilidad epistémica, no. Si la probabilidad es epistémica, entonces tiende a decrecer con la disminución de ignorancia, es decir, con el aumento de evidencia relevante, e idealmente desaparece si la evidencia disponible es toda la relevante. Si se cree que a pesar de disponer de toda la evidencia relevante tiene sentido que la probabilidad esté entre O y 1, sólo puede ser porque se cree que hay probabilidades objetivas, incertidumbres objetivas debidas a la naturaleza del mundo y no a nuestro estado de carencia de información. Por ello, según esta concepción subjetivista, las leyes probabilistas dejarían de ser probabilistas, serían sustituidas por otras deterministas, si dispusiéramos de todo el conocimiento posible. Las leyes probabilistas son, en realidad, sernsjantes a las lejes ceteris paribus, o mejor, una forma más precisa de las mismas. Las leyes probabilistas son sustitutos provisionales de leyes no probabilistas estrictas más complicadas de las que se desconocen algunos componentes. "p(BIA) = r" (O c r < 1) es una regularidad estadística que sustituye provisionalmente a la verdadera ley "A & C N-iniplica B", donde C es una propiedad complementaria que todavía desconocemos. Según la interpretación subjetivista de las leyes probabilistas, la probabilidad (no lógica) no está en la naturaleza, no informa del mundo sino que sólo es
1 64
Fv.iD.i\3lE\TOS DE ~ 1 ~ 0 ~ 0DE F íLA . l CIENCIA
indicio de nuestra falta de evidencia. Como desconocemos todos los factores nómicamente relevantes. debemos contentarnos pro\lisionalmente con regularidades estadísticas sobre frecuencias obsenadas. Pero estas regularidades no son verdaderas leyes; en una situación epistémica ideal sen'an reemplazadas por regularidades no probabilistas, las Gnicas a las que cabe considerar propiamente leyes de la naturaleza. En sentido estricto, no se plantea entonces la cuestión de la relación entre frecuencias obsen~adasy leyes probabilistas. No hay. propiamente hablando, tales leyes, y las generalizaciones sobre frecuencias observadas son simples sustitutos provisionales, en situaciones de incertidumbre epistémica, de las verdaderas leyes (deterministas). Esta interpretación subjetivista de las leyes probabilistas se puede aplicar con cierta plausibilidad a algunas de ellas, como la que correlaciona el fumar con el cáncer de pulmón. Cuando sepamos todo lo que hay que saber sobre el origen del cáncer de pulmón podremos sustituir la actual ley estadística por otra estricta y no probabilista (suponiendo que haya leyes biofisiológicas estrictas, dejamos de momento de lado esta cuestión). Quizá se puede proponer lo mismo de las leyes sobre los mecanismos de azar, p.ej. que la probabilidad de que salga número primo al lanzar un dado cúbico regular y homogéneo es 213. Si pudiéramos computar toda la información física sobre el dado y el lanzamiento, lo que actualmente no podemos hacer por motivos tanto teóricos como técnicos, tendríamos leyes mecánicas (estrictas) no probabilistas que predecirían los resultados de cada lanzamiento sin incertidumbre. Las leyes de algunas teorías científicas estadísticas, como la mecánica estadística o la genética de poblaciones, se interpretan'an de la misma manera. Pero incluso si esta interpretación es aplicable a algunas leyes probabilistas, ello no supone que se pueda aplicar a todas. De hecho, actualmente se acepta de modo prácticamente general que esta interpretación es inaplicable al menos a las leyes probabilistas de la mecánica cuántica. Las probabilidades de las leyes cuánticas. como (6),(7) o (33), tienen que ver con el 1nu~id0,no con nuestro conocimiento de él y, por tanto, no se eliniinarían al cuIminar idealmente nuestro conocimiento. En los inicios de la teoría cuántica hubo quien defendió una interpretación subjetivista de sus leyes probabilistas. Einstein, entre otros, sostuvo la llamada iltrerpreració~z de las i.ariables ocultas: hay ciertos parámetros que provisionalmente desconocemos y que son los responsables del carácter indetemlinista de las leyes cuánticas, y cuando se conozca la naturaleza y comportamiento de dichos parámeuos la mecánica cuántica se podrá formular con leyes perfectamente detem~inistas.A pesar de la autoridad de algunos defensores de esta interpretación, se acabó imponiendo la interpreracióiz de Copenhague, según la cual las probabilidades de estas leyes son objetivas, son propiedades de la naturaleza independientes del estado de nuestro conocimiento.
Probabilidad 0bjerii.a. La opción más inmediata para caracterizar las probabilidades en~píricasobjetivas es identificarlas con, o a partir de, frecuencias relativas. Las frecuencia relativa de As que son Bs es un hecho objetivo del mundo (A es la clase o ~~ropiedad de referencia), y en relación a él se pueden caracterizar las probabilidades. Algunos defensores de esta interpretaciónj-ecue)~cialistade la probabilidad objetiva son, en diferentes versiones, Venn (1886), Peirce (1931-1958), Russell (1948), Reichenbach (1949), Braithwaite (1953) y \.on Mises (1957). La idea es analizar la noción de pro-
LEY
CIE~T¡FICI\S
165
babilidad objetiva en términos de la de freciiencia. Este análisis se encuentra con diversas dificultades que originan diferentes versiones del mismo hasta conducir a la teoría de las propensiones, que supone abandonar de hecho la posibilidad de tal aniílisis y aceptar las probabilidades objetivas como conceptualmente primitivas. Si la clase de referencia es finita, la probabilidad no se puede identificar con la frecuencia relativa pues una probabilidad dada p(BlA) es lógicninente compatible con cualquier frecuencia correspondiente a un número finito de casos (pasados o futuros). El caso más manifiesto es aquel en el que sólo hay un '4, pero en el fondo ocurre igual con cualquier número finito. Que p(A1B) sea p.ej. 0,5 es compatible con que todos los 10'OOOAs (pasados y futuros) que hay sean B; o para ponerlo (sólo aparentemente) menos drástico, con que lo sean el 99 % de los As; por ejemplo, que la probabilidad de sacar par al lanzar un dado no cargado sea 0,5 es conceptualmente compatible con que todas Ias veces que se tire salga impar. Esta posibilidad de desajuste entre las probabilidades y las frecuencias observadas es also que debe aceptar también el frecuencialista y por tanto no puede identificar directamente probabilidad con frecuencia en estos casos, a no ser al precio de negar dicha posibilidad. Se podría defcnder que la probabilidad sólo tiene sentido con clases de referencia efectivamente infinitas, identificándola con el límite de la secuencia infinita d e frecuencias. Pero esta opción es n) empíricamente arriesgada, pues es vacía si resultara que de hecho todas las clases de referencia de nuestro universo físico fuesen finitas, y b) conceptualmente problemática, pues tales límites varían con el modo en que se ordene la clase B (cf. von Mises, 1957 y Pollock, 1990, S 1.4). Una alternativa, puede pensarse, es identificar la probabilidad con el límite de la frecuencia de una secuencia potencialrnente infinita, esto es, de secuencias infinitas virtuales, hipotéticas o posibles. Pero ahora el análisis se toma circular, pues obviamente 'posible' significa aquífísicarnente posible, esto es, permitido por las leyes físicas, y en el caso que nos ocupa por las leyes físicas probabilistrrs. Si, como defiende el objetivista, hay leyes físicas objetivamente probabilistas, entonces de elIas depende qué secuencias son físicamente posibles. Por este motivo, y otros que no podemos examinar ahora, los objetivistas han acabado en general por renunciar a analizar o reducir la noción de probabilidad objetiva en términos de otras nociones previas, como la de frecuencia. La única salida es aceptar las probabilidades objetivas como entidades conceptualmente primitivas. Estas entidades, denominadas 'tendencias' o 'propensiones', son propiedades objetivas independientes de nuestro conocimiento, son propiedades que poseen las cosas. Así, igual que el electrón tiene la propiedad de tener carga eléctrica -1, tiene también la propiedad de tener la propensión 0,l de atravesar la barrera de potencial contra la que se dispara. Las leyes probabilistas tratan de estas propensiones al igual que las no probabilistas tratan de las propiedades que no son propensiones. Algunos representantes de esta versión del objetivismo probabilista son Popper (1935-1958, 1956), Hacking (1965), Mellor (1971), Fetzer (198 l), Suppes (1984) y Pollock (1990). Para muchos críticos, Ia principal dificultad de las teorías de las tendencias o propensiones objetivas es que estas entidades parecen metafísicamente misteriosas. La idea de una metafísica probabilista les parece inaceptablemente oscura o, simplemente. contradictoria. Pero estas objeciones son en parte retóricas, pues en cierto sentido todas
las entidades teóricas son metafísicamente oscuras y de lo que aquí se trata es de si éstas tienen una oscuridad especljSca. La verdadera dificultad, todavía no superada, es explicar satisfactoriamente cómo se determinan empíricamente estas propensiones, cómo se evalúan las hipótesis sobre ellas a partir de datos sobre frecuencias observadas dado que cualquier frecuencia sobre un número finito de casos es lógicamente compatible con cualquier propensión.
6. L a naturaleza de las leyes Concluiremos este capítulo con una breve presentación de las principales concepciones sobre la naturaleza de las leyes. Ahora nos centraremos exclusivamente en las leyes deterministas, en el sentido precisado más arriba. esto es leyes estrictas no probabilistas. En las dos secciones anteriores hemos visto las peculiaridades de las leyes no estrictas y de las leyes probabilistas, así como las principales concepciones sobre las mismas. Las diferentes alternativas presentan su concepción de la naturaleza de esos tipos de leyes por contraste con la de las leyes deterministas, considerada en esos contextos aproblemática. Sin embargo, dista mucho de haber un acuerdo sobre el modo de considerar las leyes deterministas. En esta sección vamos a examinar brevemente las principales posiciones al respecto. En la discusión sobre la naturaleza de las leyes se dirimen cuestiones filosóficas globales sustantivas muy probleináticas, como las del realismo, la modalidad, los universales, la relación entre epistemología y metafísica, etc., y por ello la simplificación resulta especialmente insatisfactoria. La riqueza e interés filosófico de cada posición concreta radica en el modo específico en que ella desarrolla la idea general y aquí no vamos a poder detenemos en estos desarrollos específicos. Lo que sigue debe considerarse sólo una caracterización muy general de las principales alternativas, insuficiente para evaluarlas en su justa medida; para un estudio más detenido se puede consultar, p.ej. Armstrong, 1983 y van Fraassen, 1989 (cf. también este último y Cartwright, 1983, para dos escepticismos acerca de cualquier noción de ley). En lo que sigue, y salvo advertencia en contrario, por 'ley' deberá leerse 'ley determinista'. Todo análisis satisfactorio de las leyes (deterministas) debe satisfacer dos requisitos. En primer lugar, la condición de iinplicación de r-egula~idadesfactuales ( I R F ) : el análisis debe mostrar cómo las leyes i~nplicanregularidades factuales; esto es, el análisis debe tener como consecuencia que de "A N-implica B" se derive ''Vx(Ar + Bx)". En segundo lugar, la condición de disriiición respecto de las regularidades factuales (DRF): el análisis debe mostrar cómo las leyes se distinguen de las meras regularidades factuales; esto es, el análisis debe tener como consecuencia que las leyes, y no cualquier generalización verdadera, tienen las propiedades que vimos en la sección 2 que distinguían las regularidades nómicas de las accidentales. En breve: todo análisis ha de mostrar que no toda regularidad factual es una ley, pero toda ley implica una regularidad factual. En general se pueden distinsuir tres tipos de análisis de las leyes: los I-egulai-itivisras hrrnieanos, los regulariririsras 1-ealistas, y los necesitativistas (o también unii~e~-salis-
tas). Debe quedar claro que ninguno niega, en principio, la diferencia entre regularidades accidentales y nómicas, todos pretenden dar cuenta de esa diferencia; la cuestión es los términos en los que lo hacen. Las concepciones regularitivistas analizan las leyes como regularidades de cierto tipo. Una ley es una regularidad verdadera que satisface ciertas condiciones adicionales:
y expresa la condición adicional que debe satisfacer la regularidad para ser ley (condición que a veces se formula como condición sobre el enunciado 'Vx(A.r -, Bx)'). La idea es sencilla: el análisis satisface (IRF) pues según él toda ley es una generalización material verdadera. y además puede satisfacer (DRF) pues no toda generalización material verdadera es una ley, sólo lo son las que satisfacen y. Que se satisfaga o no efectivamente (DRF) dependerá de que de se deriven o no las propiedades en cuestión (explicatividad, apoyo a contrafácticos, intensionalidad, etc.). 6.1. R E G U L . A R ~ ~ [HUMEASO V~S&~O Es común caracterizar los análisis regularitivistas de hurneanos, pues Hume fue el primer defensor explicito de esta concepción. Pero eso es parcialmente confundente pues la teoría de Hume se caracteriza además, yfitndcrmentalrnente, por otra tesis, a saber, la tesis según la cual no hay necesidades en la natura1e:a. Dentro d e los regularitivistas distinguiremos, entonces, los que están de acuerdo con esa tesis y los que no. La diferencia tiene que ver con la condición y. Si la condición y supone la aceptación de algún tipo de necesidad o modalidad en la naturaleza independiente de nuestro conocimiento, calificaremos dicho análisis regularitivista de realista. Si, contrariamente, la condición se da en términos que suponen la tesis antirrealista de Hume, si la única necesidad a que se apela es una necesidad proyectada por nosotros (nuestro conocimiento, la ciencia, etc.), lo calificaremos de humecno. Como es de esperar, Hume mismo es el primer regularitivista humeano. En su caso y es una condición "epistémico-psicoIó,oica", grosso modo: que los casos pasados observados están de acuerdo con la regularidad y que tengamos la tendencia de proyectarlos hacia el futuro. Una ley es una regularidad observada que, por hábito y otros mecanismos psicológicos, proyectamos hacia el futuro, esperainos que continúe igual. En cierto modo, todas las versiones posteriores del regularitivismo humeano son refinamientos de esta idea. Un intento de defender esta posición sin apelar tan inmediatamente a elementos psicológicos o epistémicos es el de Hempel (1965). Hempel pretende dar una caracterización de las leyes como cierto tipo de resularidades sin recurrir a una supuesta necesidad en la naturaleza, pero sin recurrir tampoco explícitamente a condiciones epistémicas. Este autor considera leyes los enunciados generales mismos y no lo que ellos expresan, pero podemos ignorar esto de momento considzrando que la condición y es relativa al enuncia-
do general 'Vx(As -+ Bs)' que expresa la ley. La idea de Hempel es que y imponga sólo constricciones sintácticas y semánticas, aproximadamente las siguientes: que el enunciado ceneral no contenga esencialmente réninos singulares y que los predicados sean predicados cualitativos puros (p.ej. 'oro'. 'agua'), esto es. que no encubran referencias implícitas a particulares (como 'barcelonés' o 'venusiano'). Pero esta estrategia no es viable pues no da cuenta de la diferencia entre pares de regularidades como las ejemplificadas por (25) y (26) relativas a las esferas de oro y de uranio. Estas dos resularidades no se diferencian por ningún hecho sintáctico ni semántica y sin embargo una es accidental y la otra nómica. Por tanto, nin~unacaracterización de y en términos exclusivamente sintácticos y semántjcos sirve para la distinción. En la línea humeana, si no se quiere apelar a necesidades naturales parece que no hay más alternativa que recurrir a condiciones epistémicas de aceptación e integración teórica. En este caso, y contiene sólo referencias al uso que hace la comunidad científica; es dicho uso el que constituye la regularidad en ley. Defensores de esta propuesta, en alguna de sus versiones, son Goodman (1955), Ayer (1956) y Mackie (1966). La idea básica es que la diferencia entre generalizaciones nómicas y accidentales no reside en los hechos sino en la actitud de quienes las exponen (Ayer), en el modo en que se utilizan (Mackie); no es que usemos una regularidad para esplicar y predecir porque es una ley, sino que la regularidad es una ley porque la usamos para explicar y predecir (Goodman). Una ley es, pues, una regularidad (presuntamente verdadera) que forma parte del Corpus científico, que pertenece a alguna de las teorías con las que explicamos y predecimos. En opinión de los hun-ieanos esto basta para dar cuenta de las propiedades de las leyes que vimos en la sección 2. Las propiedades relativas a su uso en la predicción y la explicación, y a su confirn~ación,son inmediatas dado este análisis. Su intensionalidad también, pues se deriva de que se usan en las explicaciones y de que Ias explicaciones son intensionales (cf. capítulo 7). En cuanto a la capacidad de apoyar contrafácticos, también se obtiene si, como es usual en esta concepción, los contrafácticos se analizan en términos de leyes. Con lo que tienen más dificultad los humeanos es con la objetividad. Si por objetividad se entiende que la diferencia entre leyes y regularidades meramente fácticas es independiente de nuestro sistema de conocin-iiento. obviamente no pueden explicar la objetividad de las leyes. Su tesis central es justamente que no son objetivas en ese sentido, y acusarles de ello es, en su opinión. viciar la cuestión pues es precisamente eso lo q u e está en juego. Pero esto no quiere decir que las leyes sean "inventadas" o que no se "descubran". E12 tanto que regulal-idades, son verdaderas o falsas dependiendo del mundo, independientemente de nuestro conocimiento. En este sentido son descubribles y objeti\'as. Lo que no es objetivo, lo que depende de nuestro conocimiento, es qué regularidades \'erdaderas son leyes, esto es, cuáles cumplen las condiciones vistas en la sección 2. Para el humeano la no objetividad en ese sentido no es objetable, pues según él tales condiciones, incluidas la intensionalidad y el apoyar contrafácticos, son en el fondo relativas eXclusi\'al?teizreal uso en la práctica científica. Esta concepción tiene una consecuencia que parece en principio inaceptable, pero que 10s humeanos están prestos a aceptar pues es justamente su bandera, a saber, la reducción de la modalidad nón-iica a la modalidad epistémica. No hay necesidad en la
-
LEYES CIE,W~FICAS
i 1
169
naturaleza, toda necesidad (no meramente lógica) es proyección de nuestro conocimiento. Y rechazan que esto contradiga flagrantemente nuestras intuicioneq pues éstas se limitan a las propiedades sobre explicación. contrafácticos, etc. Se trata de proponer un análisis que satisfaga esas intuiciones y el suyo lo hace, salvo en lo referente a una noción de objetividad que, para los humeanos, no es un dato de nuestras intuiciones sino teoría filosófica, parte de un análisis alternativo (y según ellos erróneo). En su versión más simple, sin embargo, esta concepción sí tiene una consecuencia que parece claramente contraintuitiva. Si (i) las leyes son las regularidades articuladas entre sí dentro del sistema teórico y (ii) el sistema teórico es el conjunto de teorías actzialmente aceptadas por la comunidad científica, entonces (iii) la diferencia entre leyes y regularidades puede variar de una comunidad a otra o, dentro de una misma comunidad, variar con el tiempo. Dicho crudamente, las leyes naturales serían mutables. No se trata de nuestras creencias sobre ellas, que son indudablemente cambiantes, sino que las leyes rnisrnas serían cambiantes. Hoy la naturaleza estaría regida por una ley y quizá mañana no. Los humeanos que no están dispuestos a aceptar esta consecuencia rechazan (ii). El sistema teórico en relación al cual algunas regularidades se constituyen en leyes no es el actual, sino "el" sistema teórico ideal, el correspondiente al estado de la ciencia en condiciones epistémicas ideales o, como se suele decir, a "la ciencia del Séptimo Día". Las leyes son las regularidades que pertenecen al mejor conjunto de teorías, al sistema epistémicamente ideal, y por tanto no cambian con el tiempo, siempre han sido, son y serán las mismas. Posiciones de este tipo se pueden atribuir a Sellars (1967) y al Putnam del realismo interno (1981) (aunque seguramente se resistirían a aceptar ser calificados directamente de humeanos; éste es quizá también el caso de Kitcher, cf. 1993 y más adelante cap. 7, $6). La principal dificultad con este humeanismo sofisticado es dar sentido a la noción de el mejor sistema te91.ico-e,~plicativode modo preciso, y hacerlo sin recurrir a necesidades o divisiones en la naturaleza objetivas independientes de nuestro conocimiento. Casi todos los que apelan al sistema teórico ideal coinciden en entender por tal "el" sistema que mejor combina sir~iplicidad y jilerza (adecztativn) ('strength'). Para hacer precisa esta idea, y que sirva la función para la que se recurre a ella, se requieren dos condiciones. En primer lugar, fijado urz lenguaje, dar criterios de simplicidad y fuerza que sean aplicables y que no varíen de una comunidad a otra o, en una misma comunidad, de un momento a otro. En segundo lugar, dar un criterio para sopesar simplicidad y fuerza que permita, en la comparación de cualesquiera dos sistemas por su "simplicidad+fuerza", determinar cuál es el mejor; un criterio que además no varíe, etc. Sólo así tiene sentido hablar de el sistema que mejor combina simplicidad y fuerza. Para 10s críticos la tarea es inviable pues consideran estas condiciones insatisfacibles. Los partidarios de esta idea reconocen que se está lejos de desarrollarla en sus detalles pero defienden su corrección conceptual y la legitimidad de su uso en la discusión filosófica general.
Aun aceptando su i~iabilidaden principio. el anterior programa se encuentra con una dificultad aparentemente insalvable si permanece fiel al principio humeano de no recumr a constricciones externas al conocimiento. La dificultad se deriva de la relatividad de los mencionados criterios a l i n lenguaje dado. pues afecta esencialmente la evaluación de la simplicidad comparada. Si en lugar de usar unos predicados (p.ej. 'verde' y 'azul') usamos otros (p.ej. 'verdul' y 'acerde'), un sistema muy simple se puede convertir en muy complejo y viceversa. Supuesto que se dé con un criterio universal de simplicidad, al comparar dos sistemas, el criterio puede dar resultados opuestos según formulemos los sistemas en un lenguaje u otro. Por tanto, caso de que existan tales criterios, sólo se garantiza que seleccionan un único sistema si se fija un lenguaje. Un modo de solventar esta dificultad es abandonar el humeanismo y aceptar constricciones externas al conoci~nienro,esto es aceptar algún tipo de necesidad o distinciones objetivas en la rzaturaleza en relación a las cuales fijar el lenguaje. Esto es lo que hace D. Lewis (cf. p.ej. 19733 y 1983, con anterioridad había defendido posturas con consecuencias semejantes a las de Sellars). Lewis analiza la causalidad en términos de contrafácticos, éstos en términos de leyes (y d e historias parciales de mundos posibles) y define las leyes como las regularidades verdaderas que pertenecen al sistema que mejor maximiza simplicidad y fuerza. Pero para resolver la crítica mencionada termina aceptando una constricción externa: la comparación d e sistemas es relativa "al " le~lguajecujlospredicados son "naturales ", esto es, predicados que denotan propiedades (clases, géneros) rzarurales; y acepta la distinción entre propiedades naturales y no naturales como una distinción primitiva y objetiva por completo independiente de nuestro conocimiento, es una distinción que radica exclusivamente en la ~zaturaleza.En este sentido, Lewis ya no es humeano pues acepta que la distinción entre regularidades nómicas y meramente fácticas descansa en última instancia, a través de las clases naturales objetivas, en la naturaleza; la necesidad natural no es algo proyecrado por nuestro conocimiento. A esta posición la denominamos regularitii*ismorealista, por adoptar una posición realista, o antinominalista, sobre los universales o géneros naturales. Aparentemente Kitcher defiende a veces una posición parecida, pues sostiene también que el lenguaje de la mejor teoría refiere a clases naturales, pero cae en el humeanismo en la medida en que aparentemente simpatiza con la idea de que "las divisiones de cosas en clases [...] son genel-adas por nuestros esfuerzos de organización" (1993, p. 172, cursivas nuestras). Éstos son los diferentes tipos de regularitivismo. Para el humeano radical, ycontiene condiciones de aceptabilidad epistémico-teórica variables. Para el humeano sofisticado, y contiene condiciones de aceptabilidad ideal invariables, pero que no recurren ni explícita ni implícitamente a distinciones objetivas independientes del conocimiento. Para el realista, la identidad del sistema ideal cuya pertenencia al mismo constituye algunas regularidades en leyes presupone la existencia de distinciones objetivas en la naturaleza. Pero para todos ellos las leyes son cierto tipo de regularidades, regularidades verdaderas que cumplen ciertas condiciones.
2 . 49
+ . , 2
*5' 3 % .
, i
$
> 2
P
;-%
Concluiremos este repaso con otra forma de realismo nómico, aparentemente más fuerte, el necesitativisrno. Esta concepción comparte con el regularitivismo realista su antihumeanismo: la necesidad nómica descansa en algún tipo de distinción objetiva que no es proyectada, que "está en la naturaIezaW.Pero se diferencia de éI por rechazar la idea de que las leyes son generalizaciones. Las leyes no son generalizaciones, las leyes consisten en relaciones singulares entre universales o propiedades naturales. Defensores de alguna versión de esta concepción son, p.ej., Dretske (1977). Armstrong (1983) y Tooley (1977). Los particulares son susceptibles de estar en ciertas relaciones, unas independientes de nosotros y otras no. Por ejemplo, entre las primeras, "ser más pesado que" o "haber comenzado a existir antes que"; y entre las segundas, "haber sido percibido antes que". Según esta concepción, los universales, que existen independientemente de nosotros, también pueden estar en ciertas relaciones. Un ejemplo del primer tipo, relaciones que mantienen independientemente de nosotros, es "ejemplificarse en más individuos que"; un ejemplo del segundo, "aparecer nombrado en el mismo escrito científico que". Pues bien, para el necesitativista, cada ley natural es un caso concreto de una determinada relación del primer tipo, de cierta relación objetiva que se da entre algunos universales independiente de nuestro conocimiento. Esta relación ha recibido diversos nombres, 'necesitación', 'conexión nómica' o 'conexión causal', pero la idea general es aproximadamente la misma. Si usamos para denotar esta relación, podemos expresar este análisis del siguiente modo.
,e g
.*g:.,. +2. es la principal objeción, pues se toma como primitivo lo que requiere explicación. A veces ..
Como el lector observará, esto no proporciona mucho análisis. Para algunos, ésta
,
- 3 el análisis se hace un poco más sofisticado, pero siempre se acaba en algún tipo de
':
1 .$ o":S
relación nómica o causal primitiva entre universales que se considera forma parte, como los universales, del mobiliario último del mundo. Pero ésta no es su principal dificultad. , . S a Todo análisis ha de partir de algunos primitivos y la cuestión es si su articulación con el u .. resto de nociones logra la finalidad pretendida. En este caso, la cuestión es si este análisis -. . ... satisface. al menos,.^ y cuanto a DRF, es sencillo ver que efectivamente se -. H :.< obtienen ... . las propiedades deseadas de las leyes. La relación 3 es, tal como se ha presentado, objetiva e intensional: se da o no entre ciertos universales independientemente de u nuestro conocimiento; y si se da entre dos universales concretos A y B no tiene por qué m 2-.; darse también entre otros coextensivos con ellos. El resto de propiedades se obtienen inmediatamente pues contrafácticos, explicación, confirmación y predicción se suelen caracterizar en esta concepción en términos de leyes. La dificultad mayor radica en IRF, en explicar por qué el que se dé la relación entre el universal A y el universal B tiene como consecuencia que todo particular que ejemplifica A también ejemplifica B. No podemos ver aquí los detalles de las diferentes versiones, pero casi siempre se toma ese hecho como coilstitrltivo de q,estrategia que los críticos consideran inaceptablemente oscura. Y
.,
DWE~ ,
%~
,
'-5
La acusación de oscurantismo no constituye una objeción en sí misma; después de todo, qué entidades nos parezcan oscuras o claras depende de qué filosofía profesemos. Pero tras ella sí se encuentra una verdadera objeción. Se trata de la vieja crítica de Hume según la cual este tipo de entidades (supuestas causas o necesitaciones "en la naturaleza") son empíricamente incontrastables y, con ello, inútiles para explicar el desarrollo de nuestro conocimiento y en ese sentido superfluas. La idea es que los enunciados 'Vx(RU + B-Y)'y 'A B' (suponiendo ahora que se satisface IRF y por tanto que el segundo implica el primero) son empírjca o contrastacionalmente equivalentes. Toda experiencia que confirma uno confirma el otro y viceversa. Por tanto. lo que de más contiene el segundo, a saber, referencias a supuestas necesidades en la naturaleza, es empíricamente incontrastable; la supuesta necesitación no se manifiesta en la experiencia más que como regularidad funcional. Apelar a cosas del segundo tipo no ayuda en absoluto a la hora de dar cuenta de la práctica científica. Por tanto, por lo menos desde el punto de vista del análisis de la práctica científica, esas supuestas entidades son para el humeano perfectamente prescindibles. Éste es en esencia el núcleo del argumento del humeano, y por ello defiende que las leyes son cosas del primer tipo, regularidades factuales, que se usan de cierto modo específico en nuestra práctica científica. Para ello debe sacrificar cierta intuición preteórica que el realista cree que el análisis debe salvar, a saber, que la diferencia entre regularidades nómjcas y accidentales es independiente del conocimiento. De otro modo, piensa el realista, el progreso científico resultaría inexpIicable. La respuesta del humeano es que la aceptación de supuestas necesidades en la naturaleza tampoco le sinle después de todo al realista para explicar el progreso cizntífíco, pues el progreso científico es progreso empírico y tales entidades son empíricamente incontrastables. Para el humeano, el realista no puede dar cuenta de lo que pretendía y su realismo se reduce por tanto a un realismo puramente testimonial. Éste es el núcleo del debate sobre el realisno científico, que recorre implícitamente diversas panes de esta obra.
CAPITULO 6 LA MEDICIÓN EN LA CIENCIA
En el capítulo 4 presentamos los conceptos métricos como uno de los tipos, el más elaborado, de conceptos científicos. En este capítulo vamos a profundizar en algunas cuestiones que entonces abordamos sólo parcialmente y a ver otras nüevas relativas a algunos aspectos de la medición que en aquel contexto no se examinaron. El presente capítulo también complementa el estudio de las leyes científicas que hemos realizado en el capítulo 5; en el capítulo anterior nos hemos ocupado básicamente de los aspectos cualitativos de las leyes, en éste nos centraremos en su dimensión cuantitativa. Como advertimos en el prólogo, gran parte de este capitulo (secciones 3 a 6) es un poco más técnico y específico que el resto de esta obra y puede saltarse sin grave perjuicio para el seguimiento de los capítulos posteriores. En primer lugar haremos algunas observaciones generales sobre la noción de magnitud y algunas distinciones previas importantes, en especial la distinción entre medición y metrización. A continuación, y tras un breve repaso a la función de la medición en la ciencia, examinaremos con detenimiento los tipos de metrización, fundamental y derivada, y los procedimientos de medición, directos e indirectos.
1 . Magnitudes. Medición y metrización
La medición constituye una práctica especialmente destacada de la actividad científica, aunque no de toda actividad científica, sino sólo de aquella asociada a teorías cuantitativas o matematizadas. La matematización de una disciplina, o parte de ella, es un logro fundamental que posibilita alcanzar niveles de rigor y desarrollo teórico muy superiores por lo general a los de la investigación cualitativa. Gran parte del progreso de una disciplina científica está asociado al desarrollo y perfeccionamiento de los métodos cuantitativos. El progreso que la ciencia en su conjunto ha experimentado en los últimos cuatro siglos se debe en gran parte a la generalización de tales métodos en las diversas discipli-
174
FUND.+4hlE\TOS DE FILOSOFL~ DE LA CIENCIA
nas. Las ciencias físicas, pioneras y paradigmas de ciencia cuantitativa, están desde hace tiempo totalmente matematizadas. Gran parte de las ciencias biológicas también, e incluso en otras partes fundamentalmente cualitativas, como la taxonon~ía,se usan algunos procedimientos cuantitativos. Las más avanzadas de las ciencias humanas, la economía y (partes de) la psicología, se distinguen por su alto grado de matematización, presente también en menor medida en otras como la sociología, la lingüística, la arqueología o, incluso, los estudios literarios. Aunque la matematización de una disciplina no supone necesariamente el uso de métodos cuantitativos, esto es, el uso del análisis matemático (a veces se pueden usar recursos provenientes del álgebra, o de la geometría, o de la topología), por lo general, y casi invariablemente en las teorías matematizadas más usuales, así es. Éste es el motivo de que la medición tenga un papel tan destacado en la actividad científica. Los métodos cuantitativos son cuaittitatii!os porque trabajan con cailridades, y a éstas se accede, o se las determina, en la práctica científica mediante la medición. La medición está pues indisolublemente ligada al uso de métodos cuantitativos en las teorías de la ciencia natural matematizada y desempeña por tanto un papel fundamental en los beneficios que se derivan de la matematización de la ciencia. Por ello, sobre la medición recae también uno de los aspectos más intrigantes de la ciencia cuantitativa, a saber, la aplicabilidad de las matemáticas (del análisis) al mundo físico: ¿cómo es que la naturaleza se deja tratar cuantitativamente?, ¿cómo es que los números se aplican a las cosas? Parte al menos de la respuesta a esta cuestión debe surgir del análisis de la medición, pues es mediante ella que primariamente aplicamos, o atribuimos, "números" a las cosas. Medir es asignar números a las cosas de modo que aquéllos expresen ciertas propiedades que Cstas exhiben. Pero no toda propiedad de un objeto se puede medir, expresar numéricamente. A las propiedades que son susceptibles de medición las llamamos nzagnitudes; son ejemplos de magnitudes la masa y la longitud de los cuerpos, la duración de los sucesos, la temperatura y la densidad de las sustancias, etc. El resultado de la medición es el valor de la magnitud para el objeto, o la cantidad de magnitud en el objeto. El valor o cantidad se expresa mediante escalas numéricas y se indica con un número seguido de la indicación de la escala; son ejemplos de cantidades los 8.848 metros (o 884.800 centímetros) de altura que tiene el Everest. o los 15 grados Celsius (o 59 grados Fahrenheit) de temperatura en Barcelona el día de Navidad de 1995 (sobre las escalas, cf. capítulo 4, $4 y también il?fi.a,secciones 3 y 5). Las magnitudes se caracterizan por ser propiedades o atributos que "se dan según un más y un menos", que se ejemplifican en diverso grado. Un objeto puede ser humano o no serlo, pero no puede ser más (o menos) humano que otro que también lo es; y lo mismo ocurre con ser varón, ser cangrejo, ser español, ser roble, etc. En cambio, de dos objetos másicos uno puede ser más másico que el otro, o una sustancia puede ser más densa que otra, o un suceso ser más duradero que otro, etc. Esto podría sugerir que las magnitudes son cualesquiera propiedades binarias o relacionales. Mientras que "humano" es una propiedad monaria, "ser más másico que" es una propiedad binaria o relación ("ser másicoi' O "tener masa" sería simplemente estar en el dominio de la relación). Aquí hay dos consideraciones a hacer, la primera sencilla y la segunda complicada. La primera es que
X I E D I C I ~EN N LA CIENCIA
175
simplemente no es cierto que tras toda relación se encuentre una magnitud. En la mayoría de los casos no es así: "ser padre de7',"ser múlti$o de", "ser del mismo país que" son relaciones que no expresan magnitudes. Las magnitudes son, o se expresan en, un tipo específico de relaciones binarias, las relaciones comparativas, relaciones del tipo "x es (tanto o) más ... que y" (transitivas, reflexivas y conexas, e.e, de orden débil ). Puesto que las magnitudes son propiedades que se dan según un más y un menos, las relaciones comparativas relacionan pares de objetos que poseen (en diversos grados) la misma magnitud estableciendo que uno la posee en mayor (o igual) grado que otro. Por tanto, toda propiedad relacional comparativa expresa prima facie una magnitud (esta afirmación se matizará más adelante, cf. especialmente las secciones 3 y 7). La segunda cuestión, que ahora sólo podemos mencionar, es mucho más compIicada. Tiene que ver con la "naturaleza última" de las magnitudes. Hemos dicho que, en principio, tras toda propiedad relacional comparativa se encuentra una magnitud. ¿Cómo hay que entender eso? Hay dos interpretaciones posibles. (1) Concepción relacional: la magnitud es ella misma la propiedad relacional cualitativa, no hay además una propiedad absoluta cuantitativa. (2) Concepción absoluta: la propiedad relacional es meramente un síntoma de 1s magnitud, acompaña a la magnitud, que es una entidad existente en el mundo además de la propiedad relacional. Según la primera concepción, "ser másico" no es más que pertenecer al campo de la relación comparativa "ser (tan o) más másico que"; y "tener una masa de 0,5 kg" no es más que la propiedad que tiene un objeto cuando dos objetos tan másicos como él son, conjuntamente, tan n~ásicoscomo cierto objeto específico que hay en un museo de París. Las "magnitudes" son sólo modos de representar cuantitativamente ciertas propiedades relacionales cualitativas; no existen "en el mundo" independientemente de nuestro sistema de representación. Lo único necesario para comprender el uso de las magnitudes y escalas en la medición es la existencia de tales relaciones comparativas cualitativas (que esto es así se mostrará en el curso de este capítulo); no hay por tanto por qué postular la existencia de otras entidades misteriosas, las propiedades cuantitativas mismas. Podenios, si queremos, denominar cuantitativas a esas propiedades relacionales comparativas que son de tipo tal que se dejan representar numéricamente (y, como veremos, no toda relación comparativa se deja, al menos no de modo interesante), pero lo esencial para esta concepción es, por decirlo así, que eso es todo lo que hay, no hay además propiedades cuantitativas. Según la segunda concepción, las magnitudes existen en sí mismas: existe una propiedad cuantitativa monaria que es "tener de masa 0,5 kg", y otra que es "tener de masa 3,4 kg", y así sucesivamente. Estas propiedades se ejemplifican igual que otras propiedades monatias; la pantalla de mi ordenador ejemplifica la segunda y no la primera, del mismo modo que la bandera rusa ejemplifica "ser roja" pero no "ser verde". Las propiedades relacionales comparativas son en realidad derivadas de éstas absolutas; un objeto será o no más másico que otro en virtud de las magnitudvs que ejemplifique cada uno. Esta concepción sigue el camino inverso de la anterior: aquélla "reduce" las cantidades a determinado tipo de cualidades, ésta considera primitivos los hechos cuantitativos absolutos e interpreta a partir de ellos los juicios comparativos. No vamos a discutir aquí
esta difícil cuestión, cuyo examen detallado excede los límites de esta obra; nos limitaremos a hacer en la sección final algunos comentarios muy generales tras completar el análisis de la medición. Antes de presentar los elementos en cuyo estudio nos vamos a centrar, concluiren~os esta introducción con una distinción clásica relativa a las ma+pitudes. Se trata de la distine i~íte~ísii~as. Esta distinción se ción entre mapitudes (atributos. propiedades) e~re~rsii.as presenta casi siempre referida a las escalas, pero ello es inadecuado pues, aunque, como veremos más adelante, guarda cierta relación con los diferentes tipos de escalas, ella tiene que ver primariamente con los efectos para las magnitudes de ciertas operaciones empíricas que se realizan entre los objetos que las exhiben. A veces, los objetos que exhiben cierta magnitud son susceptibles de agregarse, concatenarse o, más generalmente, combinarse de algún modo, y alguno de esos modos de combinación se puede considerar asociado a una magnitud específica. Por ejemplo, puedo combinar masas juntando dos cuerpos másicos; puedo combinar temperaturas mezclando dos líquidos; puedo combinar longitudes empalmando linealmente los extremos de dos varas, o lo puedo hacer ortogonalmente (en ángulo recto); puedo combinar duraciones haciendo que un suceso (tan duradero como el primero) suceda inmediatamente al otro; etc. El resultado de la combinación de dos objetos que tienen cierto grado de magnitud es un nuevo objeto que también tendrá la magnitud en cierto grado. ilzrensii~astiene que ver con el efecto La distinción entre magnitudes esre~tsivasy rnag~~intdes que la combinación produce en la magnitud. A menudo se caracterizan las magnitudes exte~uivascomo aquellas para las cuales existe un modo de combinación representable mediante la suma aritmética; por ejemplo, la agregación de masas (la masa del compuesto es la suma de masas de los componentes) o la combinación lineal de longitudes. A las magnitudes que carecen de un procedimiento de combinación representable mediante la suma se las por ejemplo, la temperatura, o la densidad (cuya mezcla da lugar a califica de i~zte~zsivas; cantidades intermedias, esto es, mayores que el menor de los componentes y menores que el mayor). Aunque a veces se afirma que las magnitudes extensivas dan lugar a escalas proporcionales y las intensivas sólo a escalas de intervalos, no siempre es así, puede haber atributos intensivos representables mediante escalas proporcionales (p.ej. las escalas derivadas para Ja densidad). La relación entre esta distinción y los tipos de escalas es más complicada y se aclarará más adelante. La distinción entre propiedades extensivas e intensivas está relacionada con otra más general y fundamental, relativa también a los efectos de la combinación en la magnitud. En general, tras cierto modo específico de combinación entre objetos que exhiben una magnitud en cierto grado, puede ocumr una de tres cosas: que el objeto resultante de la combinación tenga la magnitud en un grado (1) mayor que el de ambos componentes, (2) menor que el de ambos componentes, o (3) mayor que uno de los componentes y menor que el otro. Ejemplos de lo primero son la combinación de masas por agregación, las combinaciones tanto lineal como ortogonal de longitudes, la combinación de duraciones mediante consecución, o la combinación de resistencias en serie; un caso del segundo tipo es la combinación de resistencias en paralelo; ejemplos del tercer caso son la combinación de temperaturas y la de densidades mediante mezcla. Nótese que esta distinción es relativa a los atributos y a un ?nodode combi~zacióizespecijSco. Estas peculiaridades o comportamientos no las tienen las
magnitudes sin más, sino en relación a cierto tipo de combinación. Aunque en la mayoría de casos sólo hay un modo de combinación naturalmente asociado a cada magnitud, algunas pueden combinarse de diferentes modos (como la longitud o la resistencia), y puede ocurrir que una magnitud se comporte de diferente modo con diferentes combinaciones (como la resistencia, que se comporta de un modo con la combinación en serie y de otro con la combinación en paralelo). Si ocurre (1) diremos que una magnitud M es creciente respecto del modo de combinación C, si ocurre ( 2 ) diremos que es decrecienre y si ocurre (3) que es interna. En parte, la idea original de la distinción entre magnitudes extensivas e intensivas era capturar la diferencia intuitiva entre lo que aquí hemos llamado magnitudes crecientes e internas (con sus modos de combinación típicos). Pero en los términos en que se suele presentar, vistos más arriba, no lo hace exactamente. Las magnitudes extensivas (respecto de un modo de combinación) son sólo un tipo de magnitudes crecientes, las aditivas, aquellas en las que la combinación se puedz representar matemáticamente mediante la suma, habiendo magnitudes crecientes que no se pueden representar así. Pero entonces, tal como se habían definido, los casos intensivos no coinciden, contra lo que se pretendía, con los internos, pues hay magnitudes intensivas (e.e. no extensivas) crecientes (y también decrecientes). Dejaremos esta cuestión por el momento y volveremos sobre ella más adelante. Veamos ya cuáles van a ser las principales cuestiones a examinar en el estudio de la representación numérica de magnitudes. Son varios los aspectos relativos a la medición susceptibles de investigación. Los principales son los siguientes: a ) la función de la medición en la actividad científica; b) las condiciones empíricas que hacen posible la medición; c ) la naturaleza y tipos de los procedimientos de medición; d) el problema del error; e) problemas específicos de la medición en ámbitos científicos particulares, como la mecánica cuántica, y j) la ontología de las magnitudes. En este capítulo vamos a ocupamos principalmente de b) y c). Acerca de la función de la medición en la actividad científica nos limitaremos a algunas consideraciones muy generales en la próxima sección (el lector interesado puede encontrar un excelente tratamiento de esta cuestión en Kuhn, 1961, y una buena discusión de algunos puntos en Hackin;, 1983, capítulo 14). Sobre el problema del error haremos tan sólo una breve referencia al tratar de la función de la medición; en particular, no diremos nada de la llamada teoría dt!l error. Los problemas específicos de las diversas ciencias, y en especial el llamado "problema de la medición en la mecánica cuántica", quedan fuera del ámbito de una obra de filosofía general de la ciencia (para esta cuestión se puede consultar Cartwright, 1983, cap. 9). Sobre las diferentes concepciones ontológicas sobre las magnitudes, además de la breve presentación que hemos hecho, ya hemos anunciado que nos limitaremos a unas consideraciones finales muy generales (para una discusión detallada, cf. p.ej. Forge (ed.), 1987).
1.2. ESTRUC~URA DE LA MEDICIÓN: ?VIEDICIÓNDIRECTA E INDIRECTA; MEDIR Y METRIWR En el resto de este capítulo no vamos a ocupamos de lafilnción de la medición sino de su estructrrrn, entendiendo por ello sus elementos, condiciones, procedimientos y
178
JWND.~.IIE.WOS DE FILOSOF~.ADE LA CIENCIA
tipos. Vamos a presentar ahora las principales distinciones que articularán nuestro estudio de la estructura de la medición, principalmente las distinciones entre ntedición directa y iítedición i~tdirecray entre 17zedicióil y nterrizacióiz. Caracterizamos más arriba la medición como la asignación de números a las cosas de modo que aquéllos representen propiedades que éstas tienen, no cualquier propiedad sino aquellas que se pueden dar en los objetos en diverso grado, las magnitudes. Esta asignación, la medición, puede hacerse de modo directo o indirecto. En la medición indirecra asignamos valores a los objetos haciendo uso de valores previos, bien de la misma magnitud para otros objetos, bien de otras magnitudes para el mismo objeto, bien de ambas cosas a la vez. A partir de los valores-asignaciones previamente conocidos, se obtiene el valor buscado calculándolo a partir de aquéllos mediante ciertas leyes, o en general fórmulas, que correlacionan los valores conocidos con el desconocido. Puedo medir la longitud final de una barra que se ha calentado a partir de su longitud inicial, su temperatura original y final (junto con el coeficiente de dilatación para el material) y la ley de dilatación. O puedo medir la masa de un cuerpo celeste a partir de la masa de un cohete, de su trayectoria y de ciertas leyes mecánicas. Éste es el tipo de medición más común en Irt ciencia. Aunque la medición indirecta sea la más usual en la ciencia, es obvio que no puede ser la única. En la medición indirecta usamos valores previamente conocidos, esto es, medidos con anterioridad. Si la medición de estos valores se ha realizado también indirectamente, usa ciertas otras cantidades que se han debido medir con anterioridad, y así sucesivamente. Es claro, por tanto, que, en algún momento debemos poder asignar valores a los objetos sin usar otros previamente asignados, esto es, que no toda medición es indirecta. En algún lugar hentos de eazpezar. La medición directa es ese lugar donde comienza la asignación de cantidades a las cosas. En la medición directa asignamos, para una magnitud, valores a 10s objetos sin hacer uso de mediciones-asignaciones previas, sin hacer uso de datos cuantitativos anteriores, direcran~entea partir de datos puramente cualitativos (por ejemplo, que un brazo de una balanza desciende respecto del otro). Esto hay que entenderlo en un sentido amplio que dé cabida a la medición por comparación directa con un estándar; en sentido estricto, la única medición directa sería la que se realiza para el estándar, pues para asignar un valor a los otros objetos comparándolos directamente con él se usa el valor asignado al estándar. Aquí entenderemos la idea de medición directa en sentido amplio, pues es este sentido el que queremos contraponer a lo que hemos considerado medición indirecta. Son ejemplos de medición directa, mediante comparación con un estándar, la medición de la masa de un objeto de tamaño medio mediante una balanza de brazos, o la de la temperatura de una sustancia mediante un termómetro, o la de la longitud de un cuerpo mediante una cinta métrica. La diferencia entre medición directa e indirecta es relativa a los procedilnierttos de asiglzacióiz, no a las ~nagnirudes.Una misma masnitud se puede medir unas veces directamente y otras indirectamente. Pero, salvo que se trate de una magnitud que se introduce a partir de otras, al menos en algunos casos se ha de medir directamente. Así, aunque las mediciones indirectas son las más comunes en la ciencia, y prácticamente las únicas "cuando la cosa ya está en marcha", desde un punto de vista conceptual las mediciones
/ ,
directas son más fundamentales. Ello no quiere decir que las mediciones indirectas no sean importantes, o que sean prescindibles. Las mediciones indirectas son igual de esenciales para la ciencia pues, aunque al menos en algunos casos la medición ha de ser directa, no es posible en general hacerlo en todos los casos, para todo el rango de objetos que exhiben la magnitud. Mido directamente la masa poniendo objetos en una balanza, pero no todo objeto con esta propiedad se puede medir mediante este procedimiento, o mediante otro también directo; el único modo de medir la masa de algunos objetos (p.ej. estelares) es utilizar procedimientos indirectos. En estos casos, la medición directa entra en la ??zagnituda través de unos pocos objetos y se expande al resto mediante cadenas de medición indirecta a partir de aquéllos. En la medición, tanto directa como indirecta, es posible realizar la asignación de un valor a un objeto gracias a que ciertos hechos ocurren en la naturaleza, esto es, gracias a que se dan determinadas condiciones empíricas. Estos hechos empíricos constituyen las condiciones de posibilidad de la medición, las condiciones de mensurabilidad. La medición, en sentido amplio, incluye o presupone la determinación de dichas condiciones de mensurabilidad. Por tanto, en la medición se deben distinguir, de un lado, la asignación efectiva de valores a los objetos, y de otro, las condiciones que hacen posible tal asignación, condiciones que a la vez determinan el uso que podemos hacer de ella. Las asignaciones se realizan siguiendo ciertos procedimientos. Las condiciones que las hacen posibles y determinan su uso, se estudian. La realización de las asignaciones y el estudio de sus condiciones de posibilidad son ambas tareas o actividades que corresponden a la ciencia, pero son actividades de naturaleza diferente. La primera, para la que usaremos 'medir' (con su derivado 'medición') en sentido estricto, es básicamente una actividad práctica, cuyo resultado es la asignación de una entidad a otra mediante ciertos procedimientos. La segunda, para la que usaremos 'metrizar' (con su derivado 'metrización'), es una actividad eminentemente reórica, cuyo resultado es la afirmación de que ciertas cosas son de cierto modo. Puesto que en la metrización se investigan las condiciones empíricas que hacen posible la medición, y la medición es parte de la práctica científica, a veces tiende a presentarse la metrización como una tarea, no propiamente científica, sino rnetacierztl;fica.Pero aunque ciertamente (a diferencia de otras investigaciones empíricas) tiene algo de metacientífico, es propiamente un estudio de ciertos hechos que ocurren en la naturaleza, y por lo tanto una investigación empírica. Que tales hechos sean las condiciones para la práctica de la medición no elimina. el carácter empírico de su estudio. Esta distinción entre medición y metrización, presentada de forma abstracta en estos comentanos preliminares, deberá quedar clara en el transcurso de la exposición de las secciones 3 a 6. El análisis metacientífico de la medición, por tanto, debe tener dos partes: a ) el análisis de los procedimientos efectivos de medición o asignación y 6 ) el estudio metateórico de la investigación sobre las condiciones empíricas que hacen posible dichos procedimientos. Realizaremos ambas tareas en las secciones 3 a 6, distinguiendo en cada ámbito entre la medición directa e indirecta. A la investigación sobre las condiciones de posibilidad de la medición directa la denominaremos 'metrización fundamental', y se estudiará en la sección 3, y a la investigación sobre las condiciones de posibilidad de la medición indirecta, 'metrización derivada', y se tratará en la sección 4. De los procedimientos de
medición directa nos ocuparemos en la sección 5 y de los procedimientos de medición indirecta en la 6. Precedemos el estudio de la metrización al de los procedimientos de medición pues, como se ha indicado, éstos dependen de las condiciones que in~~estiga aquélla, por lo que en el análisis de los procediniientos haremos mención de tales condiciones. Como se trata de una presentación introductoria, en el estudio de la metrización fundamental haremos más énfasis en las condiciones mismas que en la naturaleza de su estudio. Para concluir estos comentarios introductorios, hagamos una breve aclaración terminológica referente al uso que hacemos del término 'metrizar' (y de su derivado 'metrización'). Cuando se usa este término en la literatura (y se usa muy escasamente) se suele querer significar "la introducción de un nuevo concepto cuantitativo o concepto métrico" (cf. Stegmüller, 1970, esp. cap. 1; otros lugares en que se usa son Hempel, 1952, $12; Berka, 1983, esp. cap. 6, $3, y Mosterín, 1978, p. 36)' entendiendo por ello, en el caso de la metrización fundamental, la especificación de un criterio que permita representar numéricamente un orden cualitativo. Esta tarea se considera en general que tiene dos partes. La primera, investigar las condiciones que debe satisfacer un sistema cualitativo cualquiera para que sea posible la representación, probar que ellas son efectivamente suficientes y estudiar qué uso es legítimo hacer de una tal representación. La segunda, determinar el procedimiento de comparación cualitativo y el estándar con el que arbitrariamente se comienza a efectuar la asignación. Estas tareas son esencialmente diferentes. El uso que nosotros hacemos del término 'metrizar (fundamentalmente)' corresponde sólo a la primera, pues la segunda es parte de lo que hemos llamado 'procedimientos de medición'. Es esencial distinguir ambas cosas. Una vez lo hagamos, qué palabras usemos para cada una es lo de menos. Aquí usaremos las expresiones mencionadas en el sentido indicado. Como anunciamos, antes de emprender el estudio detenido de los diversos tipos de medición y metrización, haremos unos breves comentarios sobre la función de la medición en la ciencia.
2. Función de la medición Sin duda, el lugar donde Ia medición tiene una mayor presencia no es la investigación científica teórica sino su aplicación práctica, la técnica. La medición, y los instrumentos para realizarla, se hallan omnipresentes en cualquier proceso de aplicación tecnológica mínimamente sofisticado. Desde los antiguos agrimensores mesopotámicos que parcelaban la tierra hasta las más modernas empresas de telecomunicaciones que ponen satélites en órbita, la historia de la humanidad está indisolublemente ligada a un sinnúmero de prácticas y técnicas que dependen de una forma u otra de la medición, prácticas o técnicas en relación a las cuales se han introducido la mayoría de los instrumentos de medición: balanza, reloj, sextante, astrolabio, bníjula, termómetro, barómetro, etc. Sin embargo, ahora nos interesa la función de la medición no tanto en la aplicación tecnológica cuanto en la investigación teórica, en el establecimiento y desarrollo de constructos teóricos. Y aunque en menor medida que en la técnica, la medición desempeña también
una función fundamental en el trabajo teórico, especialmente, aunque no exclusivamente, desde In(s) revolución(es) científica(s) de los siglos xvrr y xvrrr. La función de la medición en el desarrollo teórico tiene dos vertientes principales: su papel en la búsqueda y formulación de nuevas leyes y teorías. y su uso para contrastar otras ya existentes. La forma en que la medición opera en cada uno de estos ámbitos no es en modo alguno sencillo ni uniforme y depende casi siempre del particular estadio en que se encuentre la teoría o disciplina en cuestión. En estas consideraciones introductorias nos vamos a limitar a mencionar tan sólo los fenómenos más destacados. La recolección de datos cuantitativos es una de las tareas características de lo que Kuhn llama cierlcia nonnal (sobre esta noción, cf. capítulo, 9, $2), del trabajo cotidiano vinculado al desarrollo de una teoría. Parte del progreso científico en estos períodos consiste justamente en aumentar el caudal y precisión de los datos cuantitativos existentts. Ésa fue, por ejemplo, la principal contribución de los astrónomos geocéntricos árabes y tardomedievales (por ejemplo, las Tablas de Toledo del siglo XI) y también de personajes como Regiomontano y, sobre todo, Tycho Brahe, quien ocupa un lugar en la historia de la astronomía más por la increíble precisión de las mediciones astronómicas que realizó a simple vista que por su sistema geocéntrico mixto. La función que se da a esos datos es sin embargo muy variable. Casi siempre, su función en los períodos de ciencia normal consiste simplemente en ir aumentando la precisión en la aplicación de la teoría a la experiencia. Otras veces parecen desempeñar un papel más importante, sirviendo de guías para el descubrimiento. Aunque nunca propician directamente la generación de grandes constructos teóricos, sí parece que a veces desempeñan una función de p í a bastante inmediata en la formulación de leyes específicas. Tal es el caso, por ejemplo, de las dos primeras leyes de Kepler. La precisión de los datos obtenidos por Brahe acabó por convencer a Kepler de que los desajustes cuantitati~.os de1 sistema heliocéntrico copemicano no eran debidos a errores de observación, y tras arduos esfuerzos por mantener el dogma pitagórico de las órbitas circulares sostenido por todos los astrónomos durante dos mil años, acabó por abandonar y postular órbitas elípticas. También parece que hubo una dependencia muy directa de los datos en la formulación por Galileo de la ley de caída de los cuerpos, en el establecimiento por Boyle de la ley que relaciona presión y volumen en los gases, o en el descubrimiento de Hooke de la ley de expansión elástica. Sin embargo, no debe pensarse por ello que hay, siquiera en al_ounos casos, una especie de "camino directo de las mediciones a 12 ley cuantitativa". Un resultado formal elemental establece que cualquier secuencia finita de números es igualmente subsumible bajo infinitas ecuaciones numéricas diferentes, por lo que no hay algo así como una única ecuación implícitamente contenida en los datos numericos (sobre esto volveremos en el capítulo 12 dedicado al problema de la inducción). El viejo mito baconiano de un método que conduzca de los datos a la ley es eso. un mito que no se corresponde con la realidad. En el proceso de formulación de leyes intervienen esencialmente consideraciones de simplicidad, belleza, coherencia con otras hipótesis y, por supuesto, el genio creativo del científico. Se trata simplemente de que en ocasiones los datos cuantitativos parecen representar una guía particularmente importante en el proceso creador; el modo preciso en que desempeñan esta función queda
182
FCSD;55fEI\TOS DE FILOSOF~ADE L4 CIESCIX
fuera del ámbito de estudio de la filosofía de la ciencia. compete niás bien a otras disciplinas, principalmente la psicología de la ciencia. Otra función destacada de la medición es su papel como piedra de toque en los procesos de contrastación de leyes o teorías ya disponibles. En el capítulo 3 vimos que una de las virtudes de una buena contrastación era el p i d o de precisión, tanto de la predicción como de los datos. Que la predicción sea cuantitativa y que los datos no se recojan por simple observación sino por medición, es en principio una garantía de rigor de la contrastación, tanto más elevada cuanto más precisos cuantitativamente sean la predicción y los datos medidos. De todas formas, también aquí hay muchas salvedades que hacer. No se trata simplemente de que la deteminación de los datos mediante medición tenga un papel de criba inmediata en caso de desajustes cuantitativos con la predicción. Ya vimos en ese capítulo que la cosa es compleja, que casi siempre se dispone de salidas apelando a los supuestos auxiliares o incluso a las condiciones iniciales, las cuales en los casos cuantitativos también se establecen por niedición y son susceptibles por tanto de mayor o menor precisión en su determinación. Cuando la contrastación involucra medición, cobran especial importancia tres tipos de supuestos auxiliares relacionados: los que tienen que ver con la idealización de las leyes, los relativos a la fiabilidad de los instrumentos de medición y los que establecen más o menos implícitamente el margen de error admisible. Los datos cuantitativos nunca encajan perfectamente con la predicción y no siempre se considera eso un problenia. Sólo se considera así en caso de que el desajuste supere ciertos límites más o menos difusos de concordancia, el grado de error ad111isible.El margen de error que se considera admisible depende básicamente de la idealización de las condiciones empíricas reales contenida en las leyes involucradas en la contrastación y del grado de fiabilidad o sensibilidad de los instrumentos de medición empleados. La aplicación de las leyes siempre idealiza ciertas "condiciories de entorno", y en algunos casos esta idealización puede tener consecuencias cuantitati~amenteimportantes. Un caso típico es el del péndulo. donde se desprecia el peso del hilo de suspensión y la fricción del aire, que conjuntamente pueden tener efectos cuantitativos considerables. Otro caso es el de la aplicación de las leyes de Neiston a las predicciones astronómicas. Según dichas leyes, todos los cuerpos celestes se atraen entre sí. Sin contar ahora con la presencia de asteroides, polvo espacial, estrellas lejanas, etc., y suponiendo que en el sistema solar sólo están presentes el sol, los satélites y sus lunas, para el cálculo de una órbita deberían tomarse en cuenta los efectos simultáneos de dichos cuerpos. Pero, simplemente, ése es un problema matemático que no se ha resuelto (ni siquiera de modo totalmente satisfactorio para el caso de tres cuerpos a la vez). Lo que se hace es calcular la órbita de las lunas como si estuvieran atraídas sólo por sus planetas, o la de cada planeta como si estuviera atraído sólo por el Sol. Eso supone un margen de error que se suele considerar despreciable pero que a veces puede ser considerable, como vimos en el caso de la órbita anómala de Urano y el descubrimiento de Neptuno. A veces, establecer el límite de error es un trabajo teórico muy complejo. Durante mucho tiempo se pensó que los desajustes de las mediciones de la órbita de Mercurio estaban dentro de los límites de concordancia razonable; fue preciso el trabajo de los mejores matemáticos de los siglos xviri y XIX para mostrar que no era así; el movimiento anómalo de Mercurio no podía ser explicado en el
!
1 1
sistema newtoniano ni siquiera teniendo en cuenta el grado de error admisible; el fenómeno sería posteriormente explicado por la relatividad general de Einstein. Otra fuente típica de error cuantitativo tiene su origen en los límites de sensibilidad de los instrumentos y métodos de medición. Todos hemos experimentado que los velocímetros de nuestros vehículos son insensibles a pequeiias variaciones de velocidad, las balanzas no discriminan por debajo de ciertos umbrales, los galvanómetros no manifiestan pequeñas o muy rápidas variaciones de corriente, etc. La historia de la astronomía contiene ejemplos sencillos de los efectos de esta otra fuente de error. Durante la Antigüedad y la Edad Media se consideró que muchos desajustes del sistema tolemaico con los datos se debían a la imperfección de los sistemas de medición. A finales de la Edad Media y en el Renacimiento se fueron perfeccionando los métodos e instrumentos de medición a simple vista, mejora que culminó en la figura de Tycho Brahe, quien perfeccionó los antiguos instrumentos y diseñó otros nuevos. Después del trabajo experimental de Tycho, Kepler consideró que los desajustes cuantitativos del nuevo sistema heliocéntrico de órbitas circulares no podían ya ser explicados apelando a la escasa fiabilidad de los procedimientos y optó por proponer órbitas elípticas. Éste no es más que un ejemplo sencillo de un fenómeno común: el perfeccionamiento de los instrumentos de medición reduce el grado de error considerado admisible y pasan a ser problemáticos desajustes cuantitativos que hasta entonces se consideraban aceptables. No se piense por ello que la mejora de las técnicas de medición tiene siempre como consecuencia la puesta en cuestión de ciertas hipótesis. Con frecuencia ocurre lo contrario, simplemente porque la mejora observacional reduce el error cuantitativo por debajo de los nuevos límites admisibles. Durante el siglo xviii se observaba un persistente desajuste de aproximadamente el 20 % entre los valores predichos y los realmente medidos de la velocidad del sonido en el aire. A principios del siglo xrx, Laplace realizó una medición indirecta a partir de las propiedades térmicas de los gases, medidas mediante un procedimiento experimental que superaba las capacidades de otros métodos disponibles hasta entonces. El resultado de esa medición indirecta perfeccionada redujo el desajuste a menos del 3 %. Hemos dicho que el desajuste entre los valores predichos y los medidos se considera problemático sólo si supera los límites (más o menos difusos) de lo que se considera error admisible debido a ciertas idealizaciones o a las limitaciones de los procedimientos de medición. En ese caso tenemos lo que Kuhn ha llamado anomalías empíricas. Conviene advertir que las anomalías no se consideran siempre fatales, más bien ello ocurre pocas veces. A menudo se espera a que el progreso teórico o empírico las resuelva, o incluso algunas terminan simplemente por ignorarse aunque no se resuelvan si la teoría está bien asentada. Es más, como indica Kuhn, en ocasiones cuestionan únicamente al científico que ha realizado las mediciones, no a la teoría (recuérdese el caso de Millikan y las mediciones de Ehrenhaft presuntamente anómalas). Las anomalías tienen una función importante en los episodios de cambio teórico, donde un número elevado de desajustes, o la persistencia de algunos considerados especialmente importantes, puede propiciar la propuesta de hipótesis alternativas. En estos casos es particularmente interesante el hecho de que desde las nuevas hipótesis sea posible realizar nuevas predicciones y diseños experimentales, incluidos nuevos o mejores instrumentos de medición, que arrojan nueva
evidencia contraria a la antigua hipótesis (sobre estas cuestiones vol~eremosen los capítulos sobre la inducción y sobre el cambio teórico). Hasta aquí la revisión, muy supeficiai, de la función de la medición como guía de la in\.estigación y como piedra de toque en las contrastaciones. Antes de concluir, conviene insistir en que éstas son las funciones de la medición metodológicamente más interesantes, pero ni mucho menos las más usuales. Como dijimos, la finalidad más común, y por lo general anónima, de la medición en la práctica científica consiste simplemente en ir aumentando la precisión de la aplicación de la teoría a la experiencia dentro siempre de los límites de error admisible. Aunque en cieno sentido ello supone un refueno para la teoría, no se pueden considerar, en sentido estricto, ni intentos de descubrimiento ni de confirmación. No se trata de pretender poner la teoría en juego, de contrastarla con la experiencia, sino de una tarea mucho menos ambiciosa; se trata simplemente de ir mejorando su (incuestionada) aplicabiljdad empírica (sobre esto, cf. especialmente Kuhn, 1961, $2).
3. hletrización fundamental (*) Supongamos que tenemos un diamante frente a nosotros. Es pequeño, brillante, liviano, duro, bonito y caro. Si nos piden que precisemos un poco más, podremos decir que es muy pequeño, bastante liviano, muy, muy duro y extremadamente caro. Podemos seguir precisando nuestros adjetivos pero, por más que los refinemos, parece que siempre podremos hacerlo un poco más. Sin embargo, si respondiésemos dando las medidas del diamante para las propiedades que exhibe, no se nos exigiría ya mayor precisión. Pero ello no es posible para todas sus propiedades: puedo decir que su volumen es s, su masa y, incluso que su dureza es z, pero no que su belleza es v. ¿Por qué? Supongamos que tenemos también un trozo de yeso ante nosotros. Es pequeño, mate, liviano, blando, feo y barato. Ambos, el yeso y el diamante, son pequeños y livianos, aunque el yeso no lo es tanto. También ahora podemos precisar más hasta dar (cuando sea posible) sus medidas, y quizá nos interese además compararlas con las del diamante. Podemos decir entonces que la masa del yeso es cien veces la del diamante mientras que su dureza es sólo la décima parte. Pero mientras lo primero significa algo, lo segundo no. O, mejor dicho, ambas cosas significan algo, pero sólo lo significado por la primera depende de los dos objetos exclusivamente. Ambas expresan un hecho numérico (el cociente de las masas es 100, el de las durezas 0,l) pero sólo el expresado por la primera representa un hecho relativo exclusivamente a los objetos. ¿Por qué? 3.1. METRIZACI~N FUh'D.4MEhTAL
Y MAGNITUDES
La empresa teórica que hemos denominado nterrizacióii. fuf~nda~itenral responde a los interrogantes anteriores investigando los hechos o condiciones que hacen posible la medición de una propiedad y el modo en que es posible usar la medida obtenida para hacer afirmaciones sobre los objetos. Investigando tales condiciones, la metrización fun-
damental determina a su vez el uso que se puede hacer de las asignaciones para dar información de los objetos relativa exclusi~amentea la propiedad en cuestión, esto es, el uso que se puede dar a las escalas para expresar hechos matemáticos que dependan sólo de la magnitud en cuestión. Como vimos en el capítulo 4 (Sil), no tiene un sentido absoluto decir que Ia masa de un objeto es 6, se ha de especificar la escala que usamos (kilogramos, gramos, toneladas, etc.) pues ese valor matemático cambia de una escala a otra. Lo mismo ocurre con la temperatura termométrica. Pero en relación a la masa sí tiene sentido absoluto decir que el cociente de las masas de dos objetos es 2 (e.e. que la masa de un objeto es doble que la de otro), pues ese hecho se preserva en cualquier escala que usemos para medir la masa; si las medidas originales eran en kilogramos (p.ej. 6 y 3 respectivamente), el cociente se preserva aunque las transformemos a gramos (6.000 y 3.000) o a toneladas (0,006 y 0,003) o a cualquier otra escala. El cociente de masas es absoluto, independiente de la escala. Pero eso no es así con cualquier magnitud. Con la temperatura (termométrica) no pasa eso. No tiene sentido decir que la temperatura a medianoche de hoy es doble que la de ayer, pues dada la rnisrnn temperatura esa afirmación puede ser verdadera en una escala y falsa en otra; si las medidas originales eran en prados Celsius (p.ej. 10 y 5 respectivamente), el cociente no se preserva si las transformamos a grados Fahrenheit (50 y 41). El cociente de temperaturas no es absoluto sino que depende de la escala usada. Sin embargo, para la temperatura tiene sentido absoluto otra relación más débil, a saber, el cociente entre intervalos de temperatura. Si el cociente entre la diferencia de temperaturas al mediodía y a medianoche de hoy y la diferencia de temperaturas al mediodía y a medianoche de ayer es 112, medidas en grados Celjius (p.ej. 10 y 5, y 20 y 10 respectivamente), dicho cociente de intervalos (5110 = 112) se mantiene aunque las transformemos a grados Fahrenheit (50 y 41, y 68 y 50; el cociente de intervalos es 9/18 = 112) o a cualquier otra escala.' Como adelantamos en el capítulo 1,las escalas de masa son escalas proporcionales, los cambios de escala preservan los cocientes o proporciones de cantidades; las escalas de temperatura (termométrica) son escalas de intervalos o diferencias, los cambios de escala preservan los cocientes de intervaloj o diferencias de cantidades. Y todavía hay otros tipos de escalas. Puesto que las escalas no son más que las asignaciones numéricas que representan las magnitudes, esta diferencia en las escalas debe derivarse de las condiciones que hacen posible la representación numérica; si las condiciones fuesen las mismas, el tipo de asignación también sería el mismo (el otro sentido no es válido, puede ocurrir que diferentes tipos de condiciones posibiliten un mismo tipo de escala). Así, la metrización fundamental investiga los diferentes tipos de condiciones que hacen posible la representación ciiantitativa de magnitudes (sin usar otras mediciones previas) 5: haciendo eso, da cuenta de los diferentes tipos de asignaciones o escalas. Antes de ver algunos de los diferentes tipos de condiciones y las escalas a que dan lugar, es conveniente hacer algunas consideraciones generales. 1. Éste es el motivo dc que en las leyes fíjicris en que interviene la temperatura ternométrica, p.ej. las de dilatación de metales, no aparezca nunca la magnitud absoluta sino sus intrrvalos. En o t r x leyes, como la de los grises y, en general, en la Termodinimica, 3pxece la magnitud absoluta, pero no se tran entonces de la temperatura termométrica sino d e 13 trr>iprizrtlrrurrhsolr
186
F L ; S D . A S I E \ ~ SDE FILOSOFU DE LA CIENCIA
En pimer lugar, hablar de metrizar fundamentalmente (en el resto de este pará~rafo omitiremos, dándolos por sobreentendidos, 'fundamental' y sus derivados) una propie-
dad específica es un tanto extraño. Las propiedades se miden y al metrizar investigamos cómo ello es Ahora bien, las condiciones que se investigan en la metrización no se refieren esencialmente a ninguna propiedad concreta, son condiciones generales a satisfacer por una propiedad cualquiera para ser susceptible de medición. Si en algún sentido se puede hablar de metnzar rina propiedad concreta, por ello habría que entender, en todo caso, la investigación (empírica) sobre si tal propiedad satisface o no determinado grupo de condiciones. En segundo lugar, si la metrización consistiese simplemente en el análisis de las condiciones que hacen posible la asignación de números a objetos que exhiben una propiedad, no habn'a obviamente nada que analizar, pues bajo cualesquiera condiciones es posible asignar números a cualquier dominio de objetos. Es esencial añadir que se trata de condiciones que hacen posible una asignación numérica que exprese ~natelnáricalítentelos hccllos qrte se dan elttre los objetos por eje1ílplífica1-la propiedad. No toda asignación se considera una medición y la metrización debe hacer precisa esa restricción adicional. Los objetos conforman ciertos hechos, algunos de los cuales se deberá11a la propiedad que se desea medir. La asignación numérica debe represelztai-esos hechos, expresarlos numéricamente. Y además lo debe hacer de modo "interesante", esto es, sistelnático. No se trata meramente de asociar un número a cada objeto y después "reescribir numéricamente" los hechos conocidos entre objetos. Eso siempre se puede hacer con tal de que haya tantos números como objetos, pero no es medición genuina sino mera "renominalización"; por eso las "escalas" meramente ordinales, que en el fondo no hacen más que esto, no son realmente escalas de medición genuinas (cf. cap. 4, $4). En tercer lugar, y relacionado con lo anterior, los diferentes grupos de condiciones de mensurabilidad son los que deteminan qué propiedades son nmgnirudes. Más amba caracterizamos las magnitudes como aquellas propiedades que se dan en los objetos en diverso grado, según un más y un menos, y dijimos que las magnitudes no eran expresadas por cualesquiera relaciones, sino sólo por relaciones comparativas. Ahora conviene expiicitar un matiz que entonces dejamos implícito al afirmar que "toda propiedad relaciona1 comparativa expresa pri~ízafacie una magnitud". Sólo priina facie, pues, aunque toda magnitud es (o es expresada por) una relación cualitativa comparativa, quizá no toda relación comparativa sea (o exprese) una magnitud. Las magnitudes serán las propiedades relacionales comparativas que sarisfaceiz (algún grupo u otro de) coltdiciolles de l7teirsurabilidad. Qué relaciones comparativas constituyen magnitudes se descubre mediante la metrización, que es la que establece los diversos grupos de condiciones de mensurabilidad. Por último, hemos dicho que la representación numérica no lo es de todos los hechos conformados por los objetos, sino de aquellos hechos que involucran la propiedad a medir, de los estados de cosas que se dan entre los objetos por ejemplificar la magnitud. Dada la naturaleza relaciona1 y comparativa de las magnitudes, los hechos a representar que se dan entre los objetos por ejen~plificarla magnitud serán heclzos con~l~ara~ii>os. Por otro lado, estos hechos comparativos a representar deben ser pilranlente cualitativos, no pueden contener ninguna referencia implícita ni explícita a cantidades ya medidas pues la
M E D I C I ~ NEN LA CIENCIA
187
metrización fundamentai investiga las condiciones de posibilidad de la medición directa y ésta asigna cantidades a los objetos sin usar mediciones previas.
Hasta aquí la caracterización introductoria de esa actividad teórica que hemos Ilamado nietrización fiindamental. El resultado de esta actividad es, en un sentido amplio del término, una teoría, la teoría de la metrización Cfrrndamental),en adelante 'TM'. TM es, aunque peculiar, una teoría empírica en el sentido de que las condiciones de mensurabilidad que estudia son condiciones empíricas (algunas de ellas, como tanbién ocurre en las teorías usuales, con ciertas idealizaciones); esto es, son condiciones cualitativas que satisfacen sistemas cualitativos físicamente reniizados, como balanzas, varas, líquidos, etc. TM, por tanto, hace aserciones empíricas, dice o prerertde que tales y cuales sistemas concretos físicamente realizados satisfacen tales y cuales condiciones. Sin embargo es cierto que TM es peculiar pues, a diferencia de las teorías empíricas usuales, no parece ser explicativa sino meramente descriptiva. No podemos ver aquí en detalle esta peculiaridad, pero ella no elimina su carácter empírico en el sentido rníniino indicado. Este carácter queda patente en su desarrollo histórico, donde las modificaciones del formalismo, la determinación de condiciones alternativas de mensurabilidad, han respondido siempre al deseo de capturar situaciones empíricas nuevas que no satisfacían las condiciones estudiadas hasta entonces (cf. Díez, 1997a y 1997b para una historia actualizada de TM). Puesto que éste es un estudio introductono, y el contenido de Thl no es por lo común conocido. vamos a presentar los rasgos generales de TM haciendo énfasis más en el contenido mismo que en su estructura u otras peculiaridades metateóricas. Esta estructura se puede especificar, de acuerdo con el enfoque semántica que veremos en el capítulo 10, en términos de los modelos que la teoría define o caracteriza. Como aqui no nos interesa sino dar un esquema del contenido de TM, nos limitaremos a presentar informalmente el tipo de sistemas o estructuras de que se ocupa, el tipo de condiciones o leyes que definen tales estructuras y un tipo especialmente importante de consecuencias o teoremas que formula. Completaremos esta aproximación seneral abstracta con algunos ejemplos de modelos específicos. Acabamos de indicar que las condiciones de mensurabilidad que investiga TM, en tanto que teoría sobre las condiciones de representación numérica de magnitudes, son relativas a hechos comparativos y puramente cualitativos. Esto determina ya parcialmente la naturaleza de los sistemas de que se ocupa. Como los sistemas de que se ocupa expresan magnitudes, tales sistemas han de contener neccsnriarnerzte una relación cualitativa de comparación que exprese el orden o posición en que se encuentran los objetos que exhiben la magnitud de que se trate en cada caso. Estas relaciones comparativas cualitativas son generadas o determinadas por diversos procedimientos empíricos, por ejemplo la comparación mediante balanzas para la masa, o la comparación de varas rígidas para la longitud, etc. Así, 10s sistemas empíricos que investiga ThI han ser sistemas comparativos, han de estar formados, al menos, por un dominio A de objetos y una re1ació)t empírica cl~nlitarivnde comparación entre los elementos de A.
sauo!xpoo3 sc!.rcsassu uos 'sci!iei!iucns aiusrucu!nua8 'saluesaraiu! s ~ u o ! ~ c ~ r i a s a sour ~dal -a~atib!S .so,i!iereduros soida3rroa sa[dru!s so[ ap oi3adsa~[ea1 a ~ e upSu!u ~ e iiauo!~rodo~d ou (cza~npe[ crrrd s q o ap ~ e[ 0 ~ ~ 1 0 saleu!pJo 3) se[vDsa se[ !eu!nua5 cA!ici!iuen2 c[e3sa cun aslclap!suos apand seuade anb [r?u!p~oaiuaurelaur e ~ a x eun a sa '[!]y osod Á [!q?p ajuaur -cperuallxa sa u p e i u a s a ~ d a lvisa oJad 'soiafqo so[ ap up!:,m![eu!uroua~ elaur ap ope3y![e3 souiaq saiuc anb o[ sa !u?!3eiuasalda~ [el eun aa!xa a~dura!s(a[qe~aurnucas p. anb .@d) se)3!~1sari!aiuarue3u!dura Á sai!q?p Ánu sa[cuuoj sauop!puos obq ' s ~ u rcpcn sow!S!xa ou !S 'o:,od un ue3![druos as SESO3 se[ opucn3 sa eloye olad '(,Q,fz (SUSSÁS rCs,ta:a~durnz~ anb JH ua p. ap j uqpunj eun 'sa oisa 'S uaplo la eIuasard anb [el o!u!urop [ap soiafqo so[ c saleal solarunu ap u?!seuS!se eun sa e3y?iunu up!seiuasa~dal eun .eD!qrunu u?!~ciuas -aldar cun ap e!~uais!xa e [ uei![!q!sod anb 1C seurais!s soisa ua:,ejspes anb sel\!iei![en3 sm!~!dura sa,Ca[-sauo!3!prio~so[ reS!isaiiu! saDuolua sa k y ap ~ eamre] e? -ug!xxeduro3 ap o,\ -!iei![en3 03!qdnra oiua!w!pa3o~d upS1e ~ o epelaua0 d S [!q?p uaplo ap u?!xla~ cun 1C soialqo ap y onr!iuop un souaui le sand uaua!luos MJ, edn:,o as anb ap se~ni3n11sas q .o!u!rrrop Iap soia[qo so[ aliua [!q?p uaplo un e~aua8anb e~!iei![en3 eyjdura u?!:,eledruo3 ap oiua!ui!pa2o~d ope!do.~de [a aiuri!paw aiuaure3o~~uc ejrapasold as pni!u9e~u eun ap ci3ar!p u p p a r u clCcr[ anb ua sosc3 so[ sopo] u 3 .pni!Duo[ el epas epcrsn[o.iu! pni!uScur c[ osc3 alsa ua :.i ap orrraliua la 'eladns o 'u02 ap!su!os x ap ouralixa Ia 'aseq e1 ~ o d X a s l!p!:,u!o:, o p u a i ~ qssICs :Csw :o110 aisa alric!paur 'sep!S!r sclc,i ap o!u!ruop un sa v !S 'O - ~ e i rEIi (sa[vu0!3e[a~sapepa!do~duos o p s sapnl!uSew se[ anb sourapuajap !S 'sa anb o) esa~dxaanb [euo!De[al pepa!dold c[ c ope!2osc [a ejlas u?!2e~cdruo3ap oiria!ur!pa3old aisa !,C ap oic[d [ap obqap ~ o od clni[c curs!iir e[ e a3aueru~ad.Y ap oield [3 'sa[cns'! sozc~q ap cziir?leq cun ap soic[d sol ap oun ua oun epe3 soisand ssAs t C ~ :olua!ru!pa3o~d s aiua!nS!s [a alue!paur -13rraiqo apand as S 'o!paur oFe1ut.i ap sohan3 ap op~!uropopcu!urraiap un sa v !S 'o[duiab lod .a1qcz![ea1 aiuarue3!sg ai!iei!Ien3 up!~e~ediuo:,ap olua!ur!pa:,old rr?Sle ~ I U C ! P ~ L Lcu!rrrlaiap I as anb ~~IJ!uS!Seli!ici![en:, e~!~jdura u?!ae[a~eun eas S a n o '(2.p 'jap 'p .de3 y ) p. ua sexauo3 aiuauieiun[uo3 Á saiuaIín[:,xa aiuaur -eninru uos Á eli!i!sucll sa d 'e!~ua[e,\!nba ap uq!sclaJ eun sa )I :sepc!doldc sapcpa!dold se[ uaua!] ( 6 , ~ ~"'0 UCI 3 as,,) y , Á (,,anb seur aluaur~i3!.1isalas,,) d sepei\!rap sauo!sc[al se[ 'Y alqoq!q?p uaplo irn sa S oprien3 'jsv .p. sa odruea oÁn3 'exauo2 ñ ai!i!sucli 'c.i!xau3.1 'sa oisa 'l!q?p 113~-10ap u g ! ~ [ a reun sa anb 'aiuarue3!u:,?i 'esy!uS!s v ap soiakqo SO[ aJiua u?!~e~cdiuo3 ap u?!Dc[al cun cas S a n b ..q.C Á ,CS.Y ssLs L(yxt q . C ou ñ IC~.rssSs .i&-:e!~1ap!~u!o3ap Á (e13!ssa) e p u a p a ~ a ~ap d sauo!3c[a.1 se[ aiuaurelc!pauru! lauaiqo uapand as S ap ~!i.rede sand '~o!Jaiuc o[ e aiua[c,i!nba sa oisg '('2ia ',C anb aiua![e3 s ~ r u o oluei sa r 6.ianb oz~!sgiuSFLU O OIUCI sa x '[email protected]) ,',C anb .-.-SFLU o oiuei sa .Y,, ~eq!uS!s e e,\ 'Xs.t-,'!sv .,S, alue!paur souraniouap anb e[ e 'up!un e q x p ap l!ued aiua!ua,\uo~scur sa ' ( s a l ~ u o ~ 3 ~A)~soli!l!sodxa ou soisaja e u?!qurei 1C 'oixaiuo:, aiuasald [a u2 -yn d upun e1 u03 o,i!ie~cduio2 oidaz11.103[ap ug!suaisa e1 sorueqpyyuap! a 'y epuappu!o3 ap ello A d c!suapariald ap u p c ~ a Eun l aiue!paru o,\!icleduo3 curais!s [e sotuc.aja1 sou 'so,i!i -!sodxa sopaja c 'oixaluos asa U-J .(u?!~saseur!x?~de[ ua c1e~apcas o w o ~ 'oporu alsa ap usDnpoJiu! as ou anb so3!~1?rusoidasu03 deq anb asapran3al sand 'oses [a sa (ci o p u c n ~ ) o3!li?ur oidz3uo3 opcu!iiuaiap E aiua3e,Cqns o1i!icrcduro~oida:,uoa [ap u?!suaisa e[ e usp - u o d s a u o ~anb sour!(!p t. o[ni!dc3 [a ua anb se[ uos sc,\!iclr?duros sc~nisnl~s:, seis2
efectivamente restrictivas. Y aquí es donde aparece la complicación, pues no hay un único grupo de condiciones que garanticen la representación. Diferentes sistemas empíricos pueden satisfacer diferentes condiciones y todas ellas garantizar la existencia de cierto tipo de representación (interesante). Y lo que es más, esos grupos de condiciones requieren por lo general algún elemento adicional además de A y S. La representación se obtiene entonces con ayuda de alguna otra relación u operación sobre A, por ejemplo una operación de combinación asociada, que denotaremos mediante 'o', o exigiendo que A tenga algunas propiedades estructurales específicas, por ejemplo que esté formado por pares. Ahora la representación numérica no sólo debe preservar el orden S sino además determinados hechos relativos a esos nuevos elementos y, si ha de ser una representación interesante, si da Iugar a una escala no meramente ordinal, son necesarias condiciones efectivamente restrictivas. Vamos a ver a continuación cómo procede en general TM, es decir, en qué consiste en general la metrización fundamental. En primer lugar expondremos de modo abstracto este tipo de tarea y después ilustraremos la exposición con ejemplos concretos de la misma, esenciales para hacerse una idea precisa de la naturaleza de la metrización fundamental. En esta exposición volveremos sobre algunos de los aspectos que quedaron pendientes en el capítulo 4, que ahora deben quedar totalmente elucidados, en especial el relativo al motivo por el que podemos decir que determinadas asignaciones numéricas son escalas diferentes que midzn la nlisnzn propiedad-magnitud. Los sistemas de que se ocupa la metrización fundamental son pues, según las S, ...>, donde puede haber constituyenconsideraciones anteriores, estructuras dzl tipo 4, tes adicionales o A puede tener ciertas propiedades estructurales. Diversos grupos de condiciones o leyes sobre los constituyentes de los sistemas caracterizan diversos tipos de estructuras comparativas cualitativas efectivamente representables mediante escalas no meramente ordinales. Las leyes caracterizan o definen los diversos tipos de sistemas empíricos, y que tales sistemas son efectivamente representables numéricamente lo establece la teoría probando un teorerna de represerztaciórz (TR). Vamos ha llamar a partir de ahora 'métricas' a las estructuras cualitativas de que se ocupa TIVI.' TM define (caracteriza, determina) los diversos tipos de métrica mediante instancias particulares del siguiente esquema:
MET 4,S, ...> es una métrica - - - syssJcfCCi(A, S, ...), ..., C,(A, S,...). siendo Ci condiciones o leyes referentes al comportamiento de los componentes de la métrica. El teorema de representación establece entonces lo siguiente: TR Si 4, S, ...> es una métrica - - -,entonces existe f de A en Re tai que: para todo x, y de A: xSy syssfi) >AY); y ........ . 2. Este uso d e 'mítrica' no debe confundirse con lo que en matemáticas, y en especial en geometría. se denomina así. Mediante este nombre abreviamos la expresión 'sistema representable numéricamente' o 'sistema mensurable'. Puesto que el contexto evin confusiones, nos parece adecuado usar este nombre para connotar que aun siendo sistemas puramente cualit3tivos, es en ellos donde desccinsci en última instancia toda medición.
Los últimos puntos suspensivos indican el modo en que la representación presenra, además del orden, otros hechos cualitativos que involucran los demás elenientos de la niélrica. TR no recoge sin embargo todo lo que se debe probar. TR no indica cuán fuerte, estricta o, como se dice técnicamente, rriiíi!oca es la representación; esto es, no indica de qué tipo es la escala-representación. Usualmente hay níás de una representación posible, más de una función f de la que es verdadero TR, y es crucial saber cuán diferentes son las posibles representaciones para determinar el uso que podenios hacer de las mismas (recuérdese los casos de las escalas para la masa y la temperatura terniométrica mencionados más arriba p en el capítulo 4). Puede ocurrir que las representaciones se diferencien sólo en que unas son múltiples de otras, esto es, que se obtengan unas de otras multiplicando por un número; o puede que sean más diferentes, por ejenlplo que unas se obtengan a partir de otras multiplicando por un número y sumando otro. O todavía hay más posibilidades. Estos modos de pasar de unas representaciones a otras, y que deterníinan cuán diferentes son las diferentes funciones que satisfacen TR, son lo que en el capítulo 3 denoniinanios tra?rsfor-~liacioi~es entre escalas. El lector recordará que las más importantes son las siguientes(cf. cap. 4, 94):
Transformaciones si~i~ilarrs: una funcióii se obtiene a partir de otra n~ultiplicaiido por una constailte, e.e. g(.x) = a f i ) (a E Re-). Transformaciones lilieales: la nueva función se obtiene inultiplicando por una constante y sumando otra, e.e. g(s) = a&) + b (a E Re+,b E Re). Transformaciones lilreales silriyles: la nueva función se obtiene sólo sumando una constante, e.e. g ( s ) =fl-x) + b !O E Re). Transformaciones espoi~eiicialcs:la nueva fuilción se obtiene elevando a cierta potencia y multiplicando por una constante, e.e. g(.f) = a(f(x))"(ci, 11 E Re'). Transformaciones c.~~~otie~tciaIcs shnples: la nueva función se obtiene sólo elevando a cierta potencia, e.e. g(.x) = (fCr))"( 1 1 E Re'). Adeniás de TR es preciso kntonces probar un reol.cnla de ~~nicidad (TU) que establece cuán unívoca es la representación, esto es, el tipo de transfoniiación que relaciona las diferentes representaciones cuya existericia establece TR. Al tipo dado de transforniacióii se adrliisible, admisible en el sentido de que si tenemos una la denomina ~~~nri.~or~~iocióri funció~~-represeimción del sisteiiia, todas las funciones que se obtienen a partir de la primera n~edianteese tipo d e transforn~ación,y sólo ellas. son tanlbién una representación del siste1113, satisfacen también TR. El teorema de unicidad tiene siempre la siguiente foriiia:
TU Si es una métrica - - -,entonces cualesquieraf, g que satisfagan TR son tales que 8 es una transformación def. Conjuntamente toiilados, TR y T U (TRU) tienen la siguiente forma característica de los ieoremas de existencia u n í v ~ c a : ~ 3. Los tcorcin;is de cxisicncia unívoca son de la forma: "3.r (~,?(.r)A V y (qb)syss .rRy))" (o m5s
TRU Si uf,S,...> es una métrica - - -,entonces hay f de A en Re tal que: (1) Para todo x, y de A: xSy syssflx) 2 f i ) ;y ... . (2) Toda g que satisfaga (1) es una transformación d e $ O simplemente, de forma abreviada: "Hay f de A en Re tal que (l), y es única bajo transformaciones -". TRU determina el uso que podemos hacer de las representaciones, esto es, da cuenta de la naturaleza de los diferentes tipos de escalas (para los siguientes hechos, cf. cap. 4, 94): si las transformaciones admisibles para determinado sistema son las trctnsformaciones similares, la representación es una escala proporcional, el cociente de valores permanece constante al pasar de una función a otra; si las transformaciones admisibles son las transfor?naciones lineales, la representación es una escala de intervalos (o de diferencias), el cociente de valores no permanece necesariamente constante pero el cociente de intervalos o diferencias de valores sí; si las transformaciones admisibles son las transfonnaciones lineales simples, la representación es una escala de intervalos absolutos, permanece constante la diferencia de valores; si las transformaciones admisibles son las transformaciones exponenciales, tenemos escalas de irztenralos logarítmicos, permanece constante el cociente de diferencias de los logaritmos de los valores; para traizsformaciones e.uporrenciales simples obtenemos escalas de proporciones logarítmicas, caracterizadas por permanecer constante el cociente de los logaritmos de los valores; y así sucesivamente. Ésta es la explicación de los hechos aparentemente misteriosos relativos a los usos que se puede dar a las escalas de las diferentes magnitudes, como los que mencionamos para los casos de la masa y la temperatura. En el capítulo 4 vimos que las escalas para la masa y la temperatura eran de diferente tipo y que, por tanto, determinados cocientes que se preservaban en una no se preservan en otra. Eso estaba relacionado con el tipo de transformación mediante el que pasamos de unas escalas a otras de la misma magnitud, pero quedó abierta 13 cuestión de qué determina cuáles son las escalas de una maznitud, qué determina la extensión del concepto métrico (el conjunto de todas las escalas para dicha magnitud). Ahora podemos saber cómo se establece eso, se establece mediante el teorema de representación. Todas las funciones f de las que, dado un sistema comparativo cualitativo 4, S, ...>, sea verdadero TR, son escalas que miden la magnitud expresada por (o "contenida en") dicho sistema. Todas ellas representan numéricamente la magnitud y, por tanto, son escalas diferentes que miden (representan numéricamente) la misma magnitud. Y TU prueba cuál es tipo de transformación que las relaciona. Todó ello, cuáles sean las funciones y cómo se relacionan entre sí, depende, como se ve, de las condiciones C,, ..., C, que satisface el sistema empírico. Aquello en virtud de lo cual podemos considerar que diferentes asignaciones numéricas a los mismos objetos son asignaciones que representan la misma propiedad es el hecho de que todas ellas representan el sistema comparativo como TRU establece. abreviado "3 .r VJ ( y b ) syss .rRj)"), siendo R una relación de equivalencia (si R es la identidad, la existencia es estrictamente única, sólo hay una entidad que satisfaga y).
Éste es, muy resumidaiilente. el modo como TM investiga los diversos grupos de condiciones de mensurabilidad para sistemas enipíricos cualitati\~os,prueba después el tipo de representación que corresponde a cada uno y determina con ello el uso q u e se puede hacer de las escalas. Conviene señalar que, aunque se investigan y establecen diferentes grupos de condiciones. éstos no están totalrnente desconectados. Si se estudian con detenimiento los diferentes grupos de condiciones se observa que se pueden "estraiificar" de fornia natural, que hay algunas muy generales exigidas a todos los sistemas. otras más específicas exigidas sólo a un grupo de sistemas, hasta llegar a otras \válidas para un único tipo de sistemas. Es decir, se pueden agrupar 10s diversos grupos de condiciones en "ramas" de ii~odoque los modelos formen una típica estructura de red teórica, en el sentido estructuralista que veremos en el capítulo 10 ( $ 5 ) . Lo caracierístico de TM en tanto que teoría sobre las condiciones e~ttj~íi-icas que posibilitan la niedición fundamental es que cn cada una de las ramas de la red es posible probar al menos un teorenia de representación y unicidad: la existencia d e representación única bajo ciertas transforniaciones; las posibilidades representacionales de las diferentes nlétricas de la red serán niis o inenos fuertes según lo sea el tipo de transforníación, esto es, el grado de unicidad de la representación. No vamos aquí a resumir siquiera la estructura dc la rcd (cr. Alouliiics y Dicz, 1994, para la subrcd de las in6tricas combinatorias, y Díez, 1992, para una presentación esquemá~icade la red completa). En lugar de ello Presentaremos, para fijar, ideas dos inétricas específicas, las más comunes, junto con su correspondiente TRU.
3.3. Tiros DE MÉTRICAS Se pueden distinguir en general cuatro grandes tipos de estructuras métricas: las inétricas combinatorias, las n-iétricas de intervalos, las métricas conjugadas y las rnétricas algebraicas (llaiiíndas a veces 'probabilistas'). \'amos a ver aquí las dos primeras (en realidad algunos subtipos de ellas); de las dos últimas nos limitaremos a dar una idea general. A4ftl-icos co~~tbiiloto~.ias. Históricamente, los primeros sistemas que se estudiaron disponían, además del doniinio A y de la relación comparativa S, de una operación enipírica de concatenación o, en general, de cortzbiización, a la que denotaren~osmediante 'o', asociable de algún modo al procedin~ientode comparación; ejemplos de coinbinaciones, como mencionamos al presentar la diferencia entre magnitudes extensivas e intensivas, son la agregación de objetos, la rnezcla de sustancias, la concatenación de varas, la sucesión de espirales eléctricas, etc. Llamaremos a estos sistemas, que tienen la forma 4, S. métricas cor~zbiiza~orias. Hay muchos tipos de métricas conibinatorias dependiendo del coii~portaniientorelativo de S y El itiás conocido, y con el que se inició TAj, es el que corresponde a las nzérricas con~binafor-iase.~te~rsii~os positii~as.En realidad hay también varios subtipos de estos sistemas, y aquí vanios a presentar sólo el más sencillo (en adelante, P y K son, respectivamente, las relacioncs O>,
O.
de precedencia estricta ("estrictamente más ... que") y de coincidencia ("tan derivadas a partir de S del modo establecido más arriba).
... como")
'Definición6.1 :
La condición (2) exige que exista la combinación de cualesquiera dos individuos; esta exigencia es muy fuerte y se puede debilitar sin perder capacidades representacionales complicando el resto de condiciones, pero no lo vamos a ver aquí. (3) expresa la P-positividad de O,esto es, el objeto resultante de la combinación es estrictamente mayor que cualquiera de sus componentes. (4) expresa la K-asocinrividad de o. (5) es la S-monotorzía: el orden se przserva tras combinaciones con el mismo objeto (o en general con equivalentes). (6) es la condición de nrqliit?iedianidad, que afirma que ningún objeto es "infinitamente" mayor que otro, esto es, si uno es mayor que otro podemos superar el primero combinando el segundo consigo mismo (o en general con equivalentes de él) un número finito de veces. Éstas son las condiciones que definen este tipo de métricas y, simplemente, hay sistemas empíricos que las satisfacen y otros que no. Las satisfacen, por ejemplo, cuerpos de tamaño n?edio con la comparación mediante balanza y la agregación; sucesos con la comparación mediante coincidencia de inicios y la consecución; varas rígidas con la comparación mediante coincidencia de bases y la concatenación lineal; varas rígidas con la misma comparación y la concatenación ortogonal; espirales elkctricas con la comparación mediante galvanómetro cualitativo y la consecución en serie. No las satisfacen, por ejemplo, las espirales con la misma comparación y combinación en paralelo; los líquidos con la comparación cualitativa de temperatura y la mezcla; las sustancias con la comparación cualitativa de densidades y la agregación; los ángulos con comparación mediante coincidencia dz bases y la consecución; los bienes de consumo con la comparación según preferencias subjetivas y la conjunción. Todos estos sistemas violan, al menos, 1s condición de positividad (y con ella, otras): la resistencia resultante de la combinación en paralelo no es mayor sino menor que ambos componentes, esa combinación es negatiiv; la temperatura del líquido resultante de mezclar otros dos está entre la de ambos, dicha combinación es itzterna; igualmente ocurre con la combinación de densidades; la combinación de ángulos es a veces mayor a veces menor que los componentes, es periódica en cierto entorno. Nótese, como advertimos más
arriba, que una misma nin_cniiud.coiilo la resistencia. puede tener unas propiedades con una operación de cotubinacióii y otras diferentes con otra operación. Esto son, siitlpleriicnte, hecfios del mundo. La realidad es de modo tal que algunos fenómenos empíricos tienen estas características y otros no. Si un sistema empírico cualitativo las tiene, entonces es nun-iérican-ienterepresentable de cierto modo específico. se pueden asignar números a los ohjetos de n-ianera que representen sus propiedades cualitaiivas debidas a la masnitud exhibida mediante la relación de comparación. En este caso específico existe una representación numérica que preserva el orden, que representa mediante la suma y que es única bajo transformaciones similares. Estos sistemas son representables, medibles, mediante escala~proporcionales,y lo que hace posible que sean medibles, y lo sean de ese modo específico, es que ocurren para ellos los hechos empíricos expresados en Def. 6.1. Esto es lo que dice el siguiente TRU (que presentamos sin prueba pues excede los límites de este testo): 0
Si ul, S, es una ~nétriracan~binatoriae.rrer~sii~a positii.~,entonces hay f de A en Re tal que: (1) a ) Para todos, y de A: xSy syss f(x) 2fO,); 6 ) Para todo s,y de A : f(.ro?) =f(.r-) +AY). (2) Para toda que satisfaga (1) hay a E Re' ial que, para todo s de A , ~ ( x = ) nf(.s). O>
Algunas veces se expresa la parte (1) diciendo sin-iplemente que f es un lioinon-iorfisino de 4, S, o> en
MEDICI~N EN LA CIENCW
1 9.5
procedimiento de combinación si el orden cualitativo constituye junto con ese modo de combinación un sistema que tiene representaciones aditivas. Una magnitud es intensiva relativamente a un modo de combinación si la combinación es interna respecto del orden, esto es, si el objeto resultante está en el orden en una posición intermedia entre los constituyentes. Así precisada, la distinción no es exhaustiva ni excluyente. No es exhaustiva pues puede haber magnitudes que relativamente a cierto modo de combinación no sean extensivas ni intensivas (p.ej. la combinación de ángulos). No es excluyente, referida a las magnitztdes solas, pues podría ocurrir que una magnitud fuese extensiva respecto de un modo de combinación e intensiva respecto de otro; por supuesto que sí es excluyente referida a los sistemas enteros, incluyendo pues si una magnitud es intensiva respecto de un modo de combinación, seguro que no existen representaciones aditivas de dicho modo, y viceversa. Hemos visto que algunos sistemas combinatorios, como los de Def. 6.1, tienen representaciones aditivas, en las que 0 se expresa mediante Ia suma. Pero eso no quiere decir que sólo tengan representaciones aditivas. En realidad, es un hecho matemático simple que si una métrica combinatoria tiene representaciones aditivas, entonces sietnpre tiene también representaciones no aditivas. Por ejemplo, multiplicativas, que son aquellas representaciones en las que 0 se expresa matemáticamente mediante el producto: simplemente se aplica e' a la representación aditiva y se obtiene otra multiplicativa. Por tanto se puede probar otro teorema para estos mismos sistemas que sustituya en (1) la suma por el producto; en ese caso hay que modificar también (2): estas representaciones multiplicativas son Únicas, no bajo transformaciones similares, sino bajo transformaciones exponenciales simples, esto es, son escalas de proporciones logarítmicas. Es muy importante enfatizar que, en ese caso, la parte (2) de Teor. 6.1, la unicidad, cambia. TU no establece la unicidad de ccralqllier representación, sino de las representaciones de cierto tipo, aditivas, o multiplicativas, u otras. Esto no es una limitación, no quiere decir que después de todo la unicidad no sea tal. Lo que sucede es que simplemente no tiene sentido preguntarse por la unicidad de las representaciones si no sabemos cómo se representa O , dejar la representación matemática de abierta supone dejar sin precisar la representación: no podemos preguntar qué otras funciones hacen "eso" porque no sabemos del todo qué es "eso". Por tanto la unicidad expresada en (2) depende esencialmente de la representación de 0 que especifique (1). Es cierto que este hecho introduce un elemento de indeterminación, pero ésta no se refiere a Ia metrización sino a la medición. Ciertamente hay que eIegir entre las representaciones aditivas o las multiplicativas u otras, y en función de ello los valores asignados cambian. Esa elección corresponderá a los procedimientos de medición directa. Determinados procedimientos de medición directa (p.ej. los que efectivamente se usan en la física para la masa, la longitud y la duración), eligen una representación frente a las otras (p.ej. la-aditiva). Pero, como algunos autores han señalado (cf. p.ej. Ellis, 1966, pp. 79 SS.), toda la física se podría reescribir en principio usando representaciones multiplicativas, nada hay en el mundo de lo que ello dependa. Sobre las consecuencias de este elemento de arbitrariedad volveremos en la última sección. Las métricas combinatorias extensivas positivas son sólo un tipo de métricas combinatorias para las que existe representación numérica. Hay muchos otros tipos, negativas, O,
O
periódicas, internas, con sus correspondientes subtipos. Cada uno satisface determinadas condiciones empíricas que posibilitan su representación. esto es, que posibilita la prueba de un reorema análogo a Teor. 6. l . Algunos de ellos tienen también, como los de Def. 6.1, representaciones aditivas; otros no, su representación es esencialmente no aditiva (esencialmente, porque, como acabamos de ser, los que tienen representaciones aditivas tienen también otras no aditivas). No vamos a exponer ninguno de estos sistemas. La relación de comparación entre los objetos que exhiben una magnitud permite por sí sola, al ser un orden débil. escalas meramente ordinales, pero ya hemos visto que éstas apenas se pueden considerar genuinamente escalas cuantitativas (cf. cap. 4, 94). En las métricas combinatorias, con Iri ayuda de una operación empírica de conibinación con ciertas propiedades es posible encontrar representaciones más fuertes, con un grado mayor de unicidad. Eso no ocurre siempre que hay un procedimiento natural de combinación. Algunas magnitudes llevan naiuralmente asociado algún procedimiento de combinación, pero éste no satisface ningún conjunto de condiciones que permitan probar la existencia de una representación más fuerte que la meramente ordinal. Éste es el caso, por ejemplo, de la combinación.de temperaturas mediante mezcla. Esta operación empírica tiene algunas propiedades, p.ej. es intensiva en el sentido que heriios precisado (interna), pero no se complementa con la satisfacción de otras propiedades que conjuntamente constituyeran una métrica combinatoria interesante, e.e. con representación más fuerte que la meramente ordinal. No se piense que ello ocurre con todo sistema combinatorio intensivo, hay sistemas intensivos, como los sistemas de bjsección (cf. Krantz ct al., 1971. cap. 6, 56), con representaciones interesantes.
Afé~ricasde interi~alos. En algunos sistemas empíricos, aun cuando la magnitud no disponga de urí procedinliento de combinación útil a efectos métricos, es posible sin embargo establecer representaciones numéricas interesantes explotando otros hechos. El caso inás interesante, del que \.amos a ver un ejemplo, es el que explota ciertos hechos relativos a los pares de objetos que exhiben la magnitud. Hasta ahora sólo hemos mencionado casos en los que los procediniientos empíricos de comparación comparan un objeto con otro. Por ejemplo en la comparación de masas mediante una balanza. O la comparación de temperaturas de líquidos: un líquido está tanto o niás caliente que otro si al pasar un tubo con niercurio del primero al segundo la columna de inercurio desciende o se queda igual. Pero también se pueden comparar pares de objetos que expresen el inre~valo o diferrrlcin de magnitud entre ellos. Por ejemplo, podemos comparar pares de líquidos del siguiente 111odo: syS:iv syss el descenso de la columna de niercurio al pasar de x a es igual o menor que el descenso al pasar de z a 11: (con algunas coniplicaciones adicionales si incluiinos casos en que la columna asciende; intente el lector formularlo precisaniente para estos casos). O pares de bienes de consumo: ~-yS:io syss la preferencia de x a cambio de y es igual o tnayor que la de z a cambio de i v (también con algunas con.iplicaciones adicionales que aquí obviarnos). En estos casos la relación cualitativa de comparación compara, no las cantidades en las que los objetos tienen la magnitud, sino sus diferencias o intervalos. Pues bien, si esa relación cualitativa de comparación entre pares d e objetos satisface determinadas condiciones, son posibles también representaciones interesantes,
h l E ~ l C 1 EN 6 ~ LA CIENCIA
197
que por lo general son escalas de intervalos, esto es, únicas bajo transformaciones lineales. De nuevo, aquí no hay un único grupo de tales condiciones sino varios, cada uno con su propia especificidad pero todos suficientes para garantizar Ia existencia de una representación. Los sistemas ahora están constituidos por una relación comparativa sobre pares de objetos del universo, esto es, S ordena débilmente A A. Vamos a denominar a estos sistemas mérricas de intervalos. Presentaremos aquí, a modo de ejemplo, el tipo más sencillo de estos sistemas, las métricas de intervalos algebraicos: Definición 6.2: 4,S> es una métrica de intervalos algebrnicos syss
( 1 ) S reflexiva, trsnsitiva y conexa en A A. ( 2 ) Para todo ,Y, y, z, w de A: si q S z , v , entonces )vzSy.r. (3) Para todo x , x', y, y', z, z' de A: si ,rySx'yf y y:Sjtz', entonces xzSx'zt. ( 4 ) Para todo x, y, z, rv de A: si xyS_71v,entonces hay t, v tales que xtKz,vKvy. (5) Para todo .Y, y, z, rv dv A: si g P z w , entonces hay una serie finita de n intervalos (n E N) tit2,t2b,..., t , . , ~equivalentes a zbv y tales que tit, Pxy. (1) ya se ha explicado. ( 2 ) dice que el orden se invierte con los intervalos opuestos; esto es lo que hace a estos intervalos algebraicos, la diferencia en magnitud no sólo depende de la
"distancia" sino también, como en la temperatura, del "orden" de los objetos (otras métricas de intervalos, las de intervalos absolrlros, se caracterizan por el hecho de que la diferencia en magnitud es "absoluta", no depende del orden de los extremos). (3) es e1 análogo a la monotonía, el orden se preserva al "conectar" intervalos. (4) dice que es posible "reproducir" un intervalo en otro mayor, esto es, encontrar intervalos equivalentes al pequeño empezando por cada extremo del grande. Por último, ( 5 ) es la versión para intervalos de la arquimedianidad: ningún intervalo es infinitamente mayor que otro, podemos superar el mayor a partir del menor conectando un número finito de intervalos equivalentes al mencr. De nuevo, algunos sistemas empíricos satisfacen estas condiciones y otros no. Las satisfacen, por ejemplo, la temperatura y la utilidad. Cuando son satisfechas, existe entonces una representación numérica única bajo transformaciones lineales; por tanto estos sistemas son representables mediante escalas de intervalos. Eso es lo que dice el siguiente teorema: Teorema 6.2:
Si es una n~étricade intervalos algebraicos, entonces hay f de A en Re tal que: (1) Para todo x , y, z, w de A: .rySrw syss f(.r) -fb)2 A z ) -f(w). (2) Para toda g que satisfaga (1) hay a E Re+y b E Re tales que, para todo x de A, g(x) = a&) + b.
Hay otras métricas de inter\.alos diferentes a las algebraicas con propiedades representacionales interesantes (entre ellas las de intervalos absoluios mencionadas más arriba). No las vamos a exponer aquí. Concluirenlos mencionando brevemente otros tipos de métricas diferentes de las combinatorias y de las de inien.alos. A4éíi-icas coiijirgadns. En estos casos los sistenlas einpíricos "coniienen" dos nlagnitudes que, aunque son claramente distintas. se dun cor~unrame~~re, es decir. es la acción conjunta de ambas la que se refleja en el procedimiento empírico de comparación cualitativa. Un ejemplo paradigmático de magnitudes conjugadas lo constituyen la urilidad y el grado de creerlcia (probabilidad subjetiva) cuando se comparan mediante juicios de preferencia de una muestra de sujetos frente a un dominio de opciones. Se pide al sujeto que diga si prefiere una opción a otra, o si le es indiferente. Así, por ejemplo, si tenernos que decidirnos por o bien comprar una entrada para un concierto al aire libre, que 110sintcrcsa inucl~o,pcro cn u n día nublado en el que puede Ilo\lcr, o bien una entrada para una obra dramática en un local cerrado, que nos interesa algo menos, nuestra decisión resultará de una ponderación simultánea entre, por un lado, la mayor "utilidad" que representa para nosotros el concierto frente a la obra dramática y, por otro, la mayor o inenor "probabilidad" (subjetiva) que asignemos a la creencia de que va a llover. Otro cjcinplo lo constituycii pares dc valores (utilidades) ccoii6n~icos,como el i,alor iilo~retorio y el valor de uso. En este caso se pide al sujeto que diga si prefiere pagar determinada cantidad w por el objeto y a pagar otra cantidad z por otro objeto \v. En estos ejemplos, como en todos los dein3s casos dc sistenlas conjugados, combinamos dos don-iinios distintos de objetos. En el primer caso. un doitiinio A constituido por acciones (ir al concierto, ir al teatro, quedarse en casa, etc.) p un donlinio B constituido por acontecimientos (que llueva, que haga frío, que haga sol, etc.). En el segundo caso, un dominio A de cantidades de dinero y otro dominio B de bienes de consurilo. O por ejemplo, en otro caso, un dominio de destinos vacacionales y otro de medios de transporte. En general, pues, las métricas conjugadas se caracterizan por ser sisteiilas comparativos en los que la relación de comparación S se establece entre dos pares de objetos de diferentes dominios (a diferencia de las métricas de intervalos en las que los dos dominios son necesariante~tteel misino): hay A , B tales que S ordena débilmente A B. Por supuesto la condición de orden débil no basta para tener representaciones interesantes, y hay diferentes tipos de sistemas conjugados según cuáles sean los diferentes grupos de condiciones adicionales suficientes para la representación. Una de estas condiciones es la resolubilidad, que expresa la idea de que cada componente es "propectable" en el otro: dados un par ap de A B y un objeto b de A, existe un objeto q de B tal que apKbq (y análogamente con el otro coníponente). No vamos a detenemos aquí en esta ni en otras propiedades de los sistemas conjugados. Basta saber que cuando el sistema satisface determinado grupo de ellas, entonces se pueden representar niiméricamente las dos magnitudes involucradas, y lo esencial de esta representación es que se hace para ambas "a la vez". Esto es, el teorema de representación prueba que, si el sistema satisface ciertas condiciones, entonces hay$ de A en Re y f2d e B en Re tales que: apKbq syss F(fi(a),f:@))2 F(f,(b),ft(q)),donde F
9
4
j "r ,=
es una operación matemática binaria específica, como la suma, o la resta, u otra más complicada (p.ej. el producto del primero por el logaritmo del segundo). Las funciones f; y f2 son las escalas de cada magnitud, y Ja función F es la particular combinación matemática que "sopesa" las dos magnitudes. Los sistemas más sencillos son aquellos en los que F es la suma, a los que se denomina sistetnas conjugados aditivos. Como en los casos anteriores, también aquí se debe probar además un teorema T U que establece el grado de unicidad de las escalas, en este caso de cada uno de los dos grupos de escalas.
Métricas algebraico-conjwzristas. Este último tipo de sistemas corresponde a los que la literatura denomina 'sistemas de probabilidad' (cf. p.ej. Krantz er al., 1971, cap. 5). Preferimos darles una denominación más genérica porque, en principio, ningún tipo de métrica tiene por qué estar vinculado a un único tipo de interpretación empírica. Es una cuestión empírica abierta si las condiciones que caracterizan estos sistemas son satisfechas por magnitudes diferentes de la probabilidad (o de las probabilidades, si es que hay varias magnitudes probabilistas). Este tipo de sistemas se caracterizan por el hecho de que el dominio sobre el que se establece la relación cualitativa de comparación S es en este caso un álgebra de conjuntos, esto es, una colección de conjuntos cerrada bajo el complemento y la unión. En la interpretación probabilista, el universo A es un universo de sucesos, y la relación cualitativa S determina de entre la totalidad de los sucesos, mediante procedimientos empíricos (p.ej. frecuencias, para la probabilidad objetiva; o juicios de sujetos, para la subjetiva), cuáles son "tanto o más probables" que otros. Cuando estos sistemas algebraico-conjuntistas satisfacen determinadas condiciones, se puede probar un teorema TR que establece la existencia de una función numérica de A en [0,1] que cumple los axiomas de Kolmogorov. En este caso (TU) la representación es zitzica, cualesquiera dos funciones tales son iguales. La escala es por tanto una escala nbsolutn, su tipo de transformación es la función identidad.
1
4. Metrización derivada (*)
En la medición indirecta asignarnos números, o mejor cantidades, a las cosas utilizando otras cantidades ya conocidas (medidas) con anterioridad y ciertas fórmulas que relacionan las cantidades involucradas. Estz tipo de medición, como la directa, también es posible gracias a que se dan ciertas condiciones. La investigación de las condiciones que hacen posible la medición directa corresponde a la metrización fundamental; la investigación de las condiciones que hacen posible la medición indirecta es tarea de la metrizació~z derivada. La metrización derivada tiene sin embargo un carácter completamente diferente al de la metrización fundamental; no realiza una investigación empírica especíjca pues su tarea, o es meramente definicional, o es realizada ya por las teorías empíricas cuantitativas usuales.
DERIVADA Y TEOR~AS Cti.Ah'TITATI\'.4S 4.1. MFIRIZACI~N
Lo que hace posible la medición indirecta es, por un lado, la existencia de mediciones previas conocidas, tanto de la misma magnitud para otros objetos, como de otras magnitudes para el mismo objeto; y. por otro, la existencia de ciertas fórmulas que expresan correlaciones entre los valores conocidos y el que se desea medir. El estudio de las condiciones que hacen posibIe la medición indirecta se divide pues en a) el estudio de las condiciones que hacen posible las mediciones previas que en ella se usan, y b) el estudio de las correlaciones con cuya ayuda se obtiene el valor buscado. El primero nos retrotrae entonces a las condiciones de posibilidad de los procedimientos de medición con los que hemos realizado las mediciones previas. Si son procedimientos de medición indirectos, volvemos a empezar. Si son directos, el estudio de sus condiciones de posibilidad exige otro tratamiento, el que hemos visto en la metrización fundamental. La tarea de la metrización derivada se reduce pues al estudio y determinación de las correlaciones entre magnitudes que se usan en el "cálculo" de una cantidad a partir de otras. Pero en la medida en que esas correlaciones expresen Izechos del 1nund0, se tratará simplemente de leyes científicas investigadas y establecidas por las teorías científicas cuantitativas usuales. Así es en la mayoría de los casos. Por ejemplo, en la medición de la masa de un cuerpo celeste a partir de la variación de trayectoria de un cohete de masa conocida, la correlación cuantitativa consiste en una combinación de leyes dináinicas generales con la ley de gravitación universal; las condiciones empíricas que hacen posible esa medición son pues las estudiadas por la dinámica y expresadas por sus leyes. Análogamente ocurre con la medición de una masa mediante un dinamómetro. O con la medición de distancias inaccesibles mediante triangulación, que involucra determinadas leyes d e la geometría física. Así pues, en la medida en que las correlaciones usadas en la medición indirecta son del tipo indicado, su estudio no es tarea especijSca de cierta disciplina. El estudio y establecimiento de dichas correlaciones. las leyes naturales, corresponde simplemente a las diversas teorías empíricas cuantitativas. La metrización derivada es entonces una tarea realizada (parcialmente) por las teorías usuales, no tiene contenido en tanto que disciplina empírica específica diferente de las teorías cuantitativas usuales. Entiéndase bien, estas teorías, obviamente, no estudian tales correlaciones empíricas con el$n de establecer las condiciones que hacen posible la medición indirecta; lo que ocurre es que en esa medición empleamos las leyes que de hecho han investigado y descubierto previamente las diversas teorías. No hay pues un estudio específico de las leyes eit tanro que son aquello que posibilita la rnediciórz indirecra; simplemente, en la medición indirecta se usa el hecho de que ciertas cosas se comportan de cieno modo, cosas y modos de los que se ocupan las teorías empíricas usuales. La matización contenida en el párrafo anterior es fundamental. La metrización derivada es una tarea realizada de hecho por las teorías cuantitativas usuales, pero sólo pal-cialrnente, esto es, sólo en la ~í~edicla en que las correlaciones usadas en las medicioleyes empíricas. Puede ocurrir que algunas de las correlaciones nes indirectas expresen usadas para calcular el valor desconocido a partir de otros conocidos no expresen leyes naturales en sentido estricto. ¿Qué expresan entonces? ¿Qué estatuto les corresponde a
esas correlaciones? El de definiciones. A veces las correlaciones usadas en la medición indirecta son definiciones mediante las que se introduce una nueva magnitud a partir de otras, considerando entonces aquélla una magnitud derivada a partir de éstas, calificadas como primitivas en ese contexto (aunque alguna de ellas pueda haber sido introducida con anterioridad como derivada a partir de sus propias primitivas). Concluiremos el examen de la metización derivada con algunas observaciones sobre este tipo de introducción de magnitudes derivadas mediante definición; en algunos casos, sólo plantearemos la cuestión, que dejaremos abierta.
Definiciones que no presriponen leyes. El tipo de definición más sencillo es aquel que claramente no involucra ni presupone ninguna ley o hecho empírico, más allá de la mera existencia de las magnitudes primitivas usadas. De éstos, los casos más simples son los que usan sólo una magnitud primitiva, como en la introducción de la superficie o del volumen a partir de la longitud (aunque están limitados a superfícies y volúmenes regulares de formas específicas). Antes de continuar conviene dejar claro desde el principio que el que la magnitud sea.derivada no quiere decir que siempre que se mide indirectamente se use como correlación su definición. Por ejemplo, hay mediciones indirectas de volumen que usan su definición, en el casc; de la medición del volumen de un cubo a partir de la longitud de sus aristas; pero hay otras mediciones indirectas del volumen que usan leyes físicas, como la medición del volumen de un cuerpo irregular a partir del empuje sufrido en la inmersión en un fluido, o la del de un cuerpo celeste a partir de ciertos efectos dinámicos. Los casos de magnitudes introducidas mediante definiciones que involucran una única magnitud primitiva son muy escasos, por lo general la definición involucrará varias magnitudes. El ejemplo paradigmático es el de la velocidnd media. Esta magnitud, que es una propiedad de los cuerpos en movimiento (o de los movimientos mismos, si se prefiere), se define como el cociente entre la longitud o distancia recomda y la duración del movimiento. Aquí, como en la definición de superficie, no hay ninguna ley física involucrada. Podemos definir después un movimiento como uniforme si, dividiendo idealmente la duración en partes tan pequeiias como queramos, la velocidad media en cada parte es la misma (e.e. si el cociente no depende de la duración). Es un hecho físico que cierto movimiento será uniforme o no lo será, pero la definición de la veIocidad media no depende de la existencia o no de movimientos uniformes. Por otro lado, nótese que el que en un movimiento uniforme la velocidad media sea constante tampoco es una ley física, simplemente hemos definido así los movimientos que llamaremos uniformes; esto es obvio en este caso, pero se iznora a veces en otros casos análogos (como en el caso de la densidad). Prácticamente lo mismo se aplica a la aceleración media (con alguna complicación adicional). O a la intensidad media de corriente, que se define como el cociente entre la cantidad de carga eléctrica que atraviesa la sección de un conductor y la duración del proceso.
No todos estos casos involucran el tiempo. Un caso estrictamente análogo que no lo involucra es el de la densidad definida a partir de la masa y el volumen. La derzsidad (media), que es una magnitud de los cuerpos físicos (sóIidos o no), se define como e1 cociente entre la masa del cuerpo y su volumen. Podemos después llamar, esto es mediante definición, homogéneo a un cuerpo si la densidad de todas sus partes es la misma. Es un hecho físico que unos cuerpos son homogéneos g otros no, pero no es una lqlfísica que "en los cuerpos homogéneos el cociente entre masa y volumen es independiente del volumen" (cf. Krantz er al., 1971, p. 456, donde se afirma, erróneamente, lo contrario); esta afirmación es verdadera exclusivamente en virtud de nuestras definiciones. No es verdad, por tanto, que "la noción de densidad de un material es una medida derivada cuya existencia depende de la validez de una ley" (ibid.). Es importante no confundir este punto para no complicar más de lo necesario la relación entre definición de magnitudes derivadas y hechos físicos. Dimensiones. Hay muchas otras magnitudes introducidas de este modo: el. 1710inelzro liizeal como producto de la masa por la velocidad, el trabajo como producto de la fuerza por la distancia, y tantas otras. Cuando definimos una magnitud a partir de otras, éstas confieren cierta diinensiórt a la definida. En física, por ejemplo, hay seis magnitudes básicas: masa (M), longitud (L), tiempo-duración (7). ángulo plano (A), temperatura absoluta (R) y carga eléctrica (Q). Las dimensiones de las magnitudes básicas (simbolizadas entre paréntesis) son las dirne~tsio~~es básicas, y el resto de magnitudes tiene por dimensión una combinación de ellas. Así, por ejemplo. el volumen tiene dimensiones L3, la la densidad i\l'L-3, el trabajo M'L'T2, la entropía velocidad L'T', la intensidad QIT-', R'h4'L2T2, etc. El estudio de las relaciones entre las magnitudes y sus dimensiones es el objeto de una disciplina específica, el Análisis Di~nensioiral.Aunque determinar las dimensiones de cierta magnitud es en general sencillo, a veces hay problemas específicos difíciles e interesantes relativos a la coherencia dimensional de las leyes y al papel de ciertas constantes en las mismas. El análisis dimensional tiene también aplicaciones interesantes en la resolución de algunos problemas empíricos. Por ejemplo, si se sabe que cierta magnitud está vinculada legalmente a otras, pero se desconoce la forma matemática específica de la relación, a partir de las dimensiones de las magnitudes in\~olucradases posible determinar dicha forma específica (salvo por lo que se refiere a la posible presencia de coeficientes numéricos puros adimensionales). No podemos exponer aquí, ni siquiera brevemente, los principales elementos de esta disciplina; el lector interesado puede consultar con provecho Palacios, 1956 (cf. también, como texto pionero en el tema, Bridgman, 1931). Escalas. Las magnitudes introducidas a partir de otras se expresan en escalas que se derivan o componen de las escalas básicas. El tipo de escala de la magnitud derivada dependerá del tipo de escala de las originales y del modo de derivación. Por ejemplo, es fácil probar que si las escalas de las magnitudes originales son proporcionales y, como en los ejemplos vistos, la derivación involucra sólo productos y cocientes de las magnitudes primitivas, entonces la escala de la magnitud resultante también es proporcional (puede demostrar-
E
lo el lector como ejercicio). Hemos visto que las escalas de la longitud son proporcionales (metros, centímetros, etc.), ello hace que las escalas para el volumen (metros cúbicos, centímetros cúbicos. etc.) también lo sean. Eso, unido a que las de la masa (kilogramos, gramos, etc.) son también proporcionales, hace que las escalas para la densidad, en tanto que tnagnitrtd detivada, sean también escalas proporcionales. Éste es pues un caso en que una magnitud intensiva es representable derivadamente mediante escalas proporcionales. Introducción sin eliminabilidad. Las anteriores consideraciones sobre las dimensiones de las magnitudes no deben llevar a conclusiones reduccionistas erróneas. Hemos dicho que las definiciones confieren dimensiones a las magnitudes derivadas, y también que toda magnitud tiene dimensiones que son combinación de las dimensiones básicas. Pero eso no quiere decir que todas las masnitudes (p.ej. de la física), sean dejnibles como magnitudes derivadas a partir de las consideradas básicas. Hemos calificado las seis magnitudes mencionadas de bdsicas, no hemos dicho que eran prir?iitivas justamente para no sugerir que todas las demás son definidas a partir de ellas. Algunas lo son, pero no todas. Por ejemplo, la fuerza, o la entropía, tienen también por dimensión cierta combinación de las básicas, pero no son definibles a partir de ellas (ni de otras, cf. las observaciones de los capítulos 6 y 8 sobre la no eliminabilidad de los términos teóricos). Las magnitudes no básicas y no definidas adquieren sus dimensiones a través de las leyes que las vinculan con otras magnitudes y, aunque las leyes son coherentes con las dimensiones, no son definiciones. Éste es uno de los temas de que se ocupa el análisis dimensional y que no podemos tratar en detalle aquí. Definiciones que presriponetz leyes. Contrariamente a los ejemplos vistos hasta ahora, a veces la introducción de una magnitud derivada mediante definición parece involucrar algún tipo de ley física. Se trata de leyes de.proporcionalidad o de constancia del tipo "el cociente entre tales cantidades y tales otras es constante", e.e. mlrn' = K o, equivalentemente, m = Km'. Pero no son realmente leyes de constancia absoluta pues l a proporción o constante depende del objeto, matcrial o sustancia. Los siguientes son algunos ejemplos.
"La dilatación de un metal es proporcional al incremento de temperatura, el factor de proporción es el coeficiente de dilatación del metal." "El cociente entre la cantidad de calor suministrada y el producto de la masa por el incremento de temperatura es constante para cada sustancia, es su calor específico." "En un hilo conductor, el cociente entre el producto de la intensidad por'la sección y el producto de la diferencia de potencial por la longitud es constante para cada material (a una temperatura dada), es su conductividad eléctrica." "El cociente entre la fuerza externa incidente sobre un cuerpo y la aceleración que adquiere es constante, es su masa inercial." "La elongación de un material elástico es proporcional a la fuerza, el factor de proporcionaIidad es el coeficiente de elasticidad del material."
201
FUND.4hIESTOS DE FILOSOFL~ DE LA CIENCIA
De modo análogo ocurre en los casos de los coeficientes de conductividsd térmica, de conductividad caIórica, de permisividad eléctrica del medio, de refractancia, de compresibilidad, y otros. Estos coeficientes o factores de proporcionalidad no son constantes absolutas (como la de gravitación o la de Planck), dependen de las entidades involucradas y pueden tener diferentes valores. Son pues propiedades de los cuerpos que se pueden dar en diferentes individuos en diversos grados, o incluso pueden variar para un mismo individuo en momentos diferentes (pues algunas dependen, p.ej. de la temperatura). Esto es, son magnitudes. La cuestión es si se pueden o no considerar introducidas por definición mediante estas leyes. La respuesta puede variar de unos casos a otros y depende de la función que desempeñe la magnitud en otras leyes y teorías. Hay casos en los que claramente no se puede considerar que las leyes definen la magnitud, como el de la masa (al menos si ha de ser la misma que la gravitatoria). En otros casos claramente sí, como el del índice de refracción de una sustancia, que es como convenimos en llamar al cociente entre la velocidad de la luz en ella y en el vacío; quizá se pueden considerar igual, p.ej., las conductividades. En otros casos puede no estar tan claro. ¿Es la ley de Ohm, "diferencia de potencial entre intensidad es igual a resistencia", una definición de 'resistencia' o una regularidad entre magnitudes independientemente determinadas? Como hemos dicho, la respuesta depende de la función de la resistencia en el resto de la disciplina. Sea cual sea en cada caso la respuesta a esta cuestión, lo que debe quedar claro es que en los casos en que es correcto considerar que la magnitud se define propiamente mediante una ley, ello no implica en absoluto un elemento de convencionalidad en la ley, resultado que sería catastrófico para la empiricidad de la disciplina. Es cierto que la definición, y sus variantes, serán verdaderas por convención, en virtud del significado fijado; pero no lo es que todo es convencional, pues la definición presupone una regularidad natural verdadera o falsa no convencionalmente. Supongan~osque la ley de Ohm, AAZ = R, no define la resistencia sino que es una correlación entre magnitudes determinadas independientemente. No hay ningún riesgo, ni siquiera aparente, de convencionalidad. Pero supongamos que no es así y que se debe considerar una definición, en sentido estricto, de la resistencia. Es cierto entonces que la afirmación "la diferencia de potencial es igual al producto de la intensidad por la resistencia" es convencionalmente verdadera en virtud de nuestras reglas del significado. Pero eso no elimina el hecho de que la afirmación "el cociente entre la diferencia de potencial y la intensidad es constante" sea una afirmación 110 coizi~ei~cional, empírica y no analítica, verdadera o falsa (en este caso verdadera) en virtud de cómo es el mundo físico, no en virtud del significado. Quizá algunas de las llamadas leyes se pueden considerar definiciones, pero esas definiciones son posibles porque se dan determinadas regularidades e~npíricasde constancia o proporcionalidad. Es una regularidad empírica que cierto cociente de magnitudes es constante (para un material, objeto o sustancia), y gracias a ello podemos después convenir en llainar de cierto modo a ese cociente.
Iinplicacioites ontológicas. Por último, ¿existen las magnitudes derivadas?, ¿están en el mundo como propiedades que se ejemplifican en los objetos según un más y un menos? ¿Sor; las definiciones de magnitudes meras abreviaturas notacionales? ¿Son por el contrario
XIEDICION EN LA CIENCIA
I t
#
; !
5
!j
L
I
i
1
enunciados que expresan la reducción de una propiedad a otras? En principio parecería que en un sentido inmediato si existen, pero, sin necesidad de entrar en profundidad en la cuestión ontológica, hay casos en los que tenderíamos a dar una respuesta negativa. No podemos definir lo que queramos; o mejor, sí podemos, pero parece que no todo lo que definamos tendrá sentido enzpírico. Por ejemplo. podemos definir la masura, S, de un cuerpo como el producto de su masa rri por su temperatura T, pero no parece que eso sea una propiedad. El motivo es que de eso no hablan las leyes, éstas no incluyen un producto así. Quizá este ejemplo no es el mejor. Hay una ley que afirma que la cantidad de calor surninistrada a un cuerpo es igual a su calor específico por su masa y por el incremento de temperatura, Q = cm(T2 - Ti); pero como eso es equivalente a Q = c,(rnTz - mTi), se podría reformular entonces diciendo que el calor suministrado es igual al producto del calor específico por el incremento de masuras, Q = cs(S2- S , ) . ¿Existe entonces la masura, propiedad de la que nadie había hnblndo hasta ahora? ¿Qué decir de la cantidad de movi}rziento (o momento lineal) p, dz la que hablaban los físicos antiguos, y que ahora se dejne como el producto de la masa por la velocidad? Claramente hay leyes que "manejan" ese producto, en las que parece que eso está opertl~zdo.Si existe la cantidad de movimiento, ¿existe la masura? Quizá sólo se pueden descartar las "combinaciones" no presentes en leyes. Por ejemplo, el producto de la acelzración de un cuerpo por su volumen V no interviene (explícitamente) en ninguna Icy. Pero ése es un criterio difuso, pues siempre es posible reformular artificialmente las leyes para que incluyan las combinaciones que queramos. Por ejemplo, si d es la densidad, podemos reescribir la ley F = nla como F = dVa, con lo cual la fuerza resulta ser igual al producto de la densidad por esa cosa. Se pueden imponer constricciones adicionales, como que la ley sea simple, esto es, que no se pueda simplificar más. Pero qué simplificaciones son posibles depende en parte de qué combinaciones se acepten como magnitudes. Llamemos volución, C, al producto Va. Si la volución es una propiedad, ¿es más simple F = rna que F = dC? En el sentido en que lo es, también habría entonces expresiones más simples de las leyes que se refieren al momento lineal. Podemos optar por descargamos de todas, pero ¿no parece que, por ejemplo, el volumen o la velocidad son efectivamente propiedades? La respuesta a todas estas cuestiones ontológicas dependerá de cuál sea nuestra teoría para individualizar o identificar propiedades, uno de los temas actualmente más debatidos en metafísica, y en el que no podemos entrar aquí. Con la presentación informal de estas cuestiones concluimos el análisis de la metrización derivada y pasamos al de los procedimientos de medición.
5. Procedimientos de medición directa (*) i
i
S:
i
$ 3
f:
En la medición directa asignamos un valor a un objeto sin disponer de otros valores numéricos previos, directcr~nenrea partir de la experiencia cualitativa. Ya advertimos que esto se ha de entender en un sentido amplio, que incluya la medición por comparación directa con un estándar. El estándar es el primer objeto al que se le asigna el valor numérico y por comparación con él se asigna un valor a los demás. En este.sentido,
la asignación a los demás supone el uso de una asiznación previa, la del estándar. Ello es así en sentido estricto, y poco interesante puesto que la asignación numérica del estándar es arbitraria; en ese sentido estricto sólo habn'a medición directa para el estándar mismo. La medición directa se debe entender por tanto en el sentido amplio indicado, que es el interesante.
5.1.
EJEMPLOS DE PROCEDlhlIE3TOS DE ~.IEDICIÓN DIRECTA
Ejemplos paradigmáticos de medición directa son la medición de masas mediante una balanza, la d e longitudes mediante varas y la de la temperatura (termométrica) mediante termómetros. Las asignaciones resultantes en los primeros casos son escalas proporcionales, la del último es una escala de intervalos. El examen detenido de estos procedimientos debe aclarar el sentido preciso en que la metrización fundamental está presupuesta en los procedimientos de medición directa. Veámoslo. La medición directa de masas mediante una balanza procede, como el lector sabrá, más o menos d e la siguiente manera. Tenemos una serie de cuerpos de tamaño medio que se comparan cualitativamente mediante una balanza del modo indicado en la sección 2, cuerpos que podemos componer o combinar mediante agregación poniéndolos juntos en el mismo plato de la balanza. Este orden cualitativo y esta operación de agregación se comportan conjuntamente de cierto modo. Se elize un objeto cualquiera del dominio, por ejemplo un determinado objeto que está ahora en cierto lugar de cierta sala de un museo de París, y se le asigna un número real 12 arbitrario, p.ej. 1, o 1.000, 0,001 o el que se prefiera (14, 137, d2, x o lo que sea). Ese objeto es el estándar. Una vez asignado un valor arbitrario al estándar, los demás objetos del dominio tienen determiiiada su asignación. Los objetos equivalentes al estándar reciben el mismo número. Con los no equivalentes, mayores o menores, se procede como sigue. Por ejemplo, si el objeto es equivalente a la agregación de dos equivalentes al estándar, se le asigna 211; si es equivalente a la agregación de tres equivalentes al estándar, 312; y así sucesivamente. Si, en cambio, el objeto es menor, se procede de la siguiente forma: si su agresación con otro equivalente a él es equivalente al estándar, se le asigna 1212; si su agregación con otros dos equivalentes es equivalente al estándar, id3; y así sucesivamente. L o esencial de este procedimiento está, como habrá adivinado el lector, en el "y así sucesivamente". ¿Qué nos garantiza que poden-ios proceder así sucesivamente coi7 todos los objetos de ese dominio específico? Aquí es donde entra la metrización fundamental. Ese "y así sucesivamente" es posible, queda garantizado, porque el comportamiento de la relación comparativa y la agregación en ese sistema empírico cualitativo específico salisfaceil de lzeclzo ciertas condiciones empíricas. Que esas condiciones son suficientes para asegurar que mediante ese procedimiento podemos dar asignaciones a todos los objetos del dominio es lo que prueba TRU que, como vimos, establece además la relación entre las diversas series de asignaciones posibles. En este caso, las diversas series o escalas dependerán del número rz que se le asigne al estándar; para pasar de los valores asignados por una escala f a los asignados por otra f multiplicamos los primeros por el cociente de
[os números asignados al estándar porf yf, e.e. por n'ln. Por ejemplo, cierta escala asigna al mencionado objeto de París el 1, otra el 1.000 y otra el 0,001. Para distinguir entre estas asignaciones ponemos al lado del signo numérico un signo arbitrario, p.ej. 'kiIogramo' en e[ primer caso (escala MKS), 'gramo' en el segundo (escala cegesimal) y 'tonelada' en el tercero. Así, un objeto al que, por comparación con el estándar, la segunda escala le asigna 3.000, la tercera le asigna 0,003, esto es 3.000 x (0,00111.000). Por supuesto que se podría elegir cualquier otro número para ese objeto, como 14, 137, d2, K (escala "pitagórica") o 6,023 x lo2' (escala "avogadriana"), y nada cambiaría. Bueno, cambiarían desde luego los números asignados a los demás objetos, pero no el cociente entre cclalesquiera dos de ellos, pues pasamos siempre de una escala a otra multiplicando por cierto real. Y exactamente lo mismo daría coger como estándar cualquier otro objeto, como el zapato que Kruchev exhibió en la ONU. La medición directa de la longitud procede de un modo estrictamente análogo, y lo mismo ocurre en general con toda magnitud que satisfaga las condiciones de las métricas combinatorias positivas extensivas. Con la temperatura, cuyos sistemas empíricos cualitativos tienen propiedades diferentes, las cosas son un poco más complicadas. En este caso no se selecciona un objeto arbitrario que hace de estándar sino dos, por ejemplo, el agua cuando se congela y el agua cuando se hierve. A esos objetos se les asignan dos números n, m arbitrarios, por ejemplo O al primero y 100 al segundo, o O y 1, o 32 y 212, o los que sea. Lo que se elige no es pues una ejemplificación de la magnitud a la que se da un valor arbitrario, sino dos ejemplificaciones, esto es, un intervalo o diferencia de magnitud, al que se le da un valor arbitrario, a saber, m - n (100 en el primer caso, 1 en el segundo y 180 en el tercero). Para poder manipular ese intervalo se usa cierto instrumento. En este caso es un tubo con mercurio en el que la diferencia en temperatura de las dos ejemplificaciones se plasma en una diferencia entre las alturas del mercurio. Así, podemos decir que los dos objetos elegidos son el mercurio cuando, tras sumergirlo en agua, a ) está a la altura correspondiente al instante en el que el agua se congela, y b) está a la altura correspondiente al instante en el que el agua se evapora; a la primera altura le asigno n y a la segunda m. De este modo, coniparando intervalos o alturas, es posible asignar valores a todos los demás objetos de ese dominio. Si la columna correspondiente a otro objeto está justo en la mitad de las dos columnas estándar, al nuevo objeto le asigno n + [(m- rt)/2];si está a la tercera parte, n + [(rn- n)/3]:y así sucesivamente. Si supera el primer estándar el doble de lo que el segundo estándar supera el primero, le asigno n + [2(m- n ) ] ;si supera el primero el triple de lo que el segundo supera el primero, n + [3(m - n ) ] ;si supera el primero una vez y media lo que el segundo estándar supera el primero, n + [(3/2)(m- tz)]; y así sucesivamente. Como antes, el "así sucesivamente" es efectivamente posible para todos los objetos del dornittio si el sistema cualitativo de comparación de intervalos cumple ciertas condiciones empíricas, en este caso las de las métricas de intervalos algebraicos. El modo más sencillo de hacer 1s asignación es dividir la distancia entre las alturas de los estándares en jn - 11 intervalos iguales y extender la división por arriba y por abajo. Los límites de esos intervalos son los grados de temperatura. Las diversas series de asignaciones o escalas dependerán de los números n, m que se asigne a los estándares. Si los
dos estándares son los mencionados, con 11 = O y 171 = 100, tenemos grados Celsius; si con esos estándares I r = 32 y 112 = 212, grados Fahrenheit; etc. Si la escala f les asigna 11 y 111. y la escala f' les asigna 11' y in', es fácil ver que para pasar de los \lalores asignados por f a los asignados por f hay que n~ultiplicarlos primeros por (ríz' - n')/(1?1- n ) y sumarles (17112' - i ~ ~ ~ t ' ) l-( l nn): por ejemplo, para pasar de grados Celsius a grados Fahrenheit, multiplicamos por 91.5 y sumamos 32. Por supuesto que se podrían elegir cualesquiera otros números para ese par de objetos y nada cambiaría. Bueno, cambiarían desde luego los números asignados a los demás objetos, y también el cociente entre los valores, yero 110 cantbiaría el cociente enri-e pares o difereiícias de ilalot-es, pues pasamos siempre de una escala a otra multiplicando por cierto real y sumándole otro. Y exactamente lo mismo daría cocer como estándares cualquier otro par de objetos, como el vino congelándose y comenzando a hervir. GENERAL DE LOS PROCEDIh.IIENTOS DE L I E D I C I ~ NDIRECTA 5.2. FORMA
Hemos dicho que en los casos examinados, y en cualquier otro caso de medición directa, el procedimiento de asignación se puede con-ipletar para todos los objetos del dominio gracias a que los sistemas empíricos satisfacen ciertas condiciones cualitativas. algún grupo de las estudiadas por la teoría de la metrización fundamental. Éste es el orden de dependencia lógica de la medición directa respecto de la metrización fundamental. Pero no se piense por ello que es también el orden de dependencia práctica o de realización, esto es, que la medición directa no se realiza hasta que se ha determinado que el sistema satisface tales condiciones. Esto tiene una lectura fuerte, en la que es falso, y otra débil, en la que se puede considerar correcto. En la primera interpretación, fuerte, significa que las mediciones directas no se pueden realizar, y por tanto no se realizan, hasta que la investigación teórica desarrollada por TM establece los grupos de condiciones, los teoremas TRU con el tipo de transformación admisible, y comprueba que cierto sistema concreto satisface uno de esos grupos. Esto es claramente falso. Masa, longitud, temperatura y otras magnitudes se medían directamente con este tipo de procedimientos mucho antes de que se iniciara la investigación en metrización fundamental, que se remonta como mucho a finales del siglo xrx con Helmholtz. TM proporciona losfirildan~entosde esos procedimientos, e.e. investiga sus condiciones de posibilidad. Se procedía así pero, en cierto sentido, sin fufuiidanze~zto,sin estar teóricamente bien fundamentada la diferencia entre escalas proporcionales, de intenalos, logarítmicas, etc., que generaban los procedimientos. Ahora bien, es claro que se podía proceder de hecho así antes de esa investigación teórica pues, obviamente, esos sistemas cumplían de hecho esas condiciones antes de que nadie se pusiera a investigarlas y a probar teoremas de representación y unicidad a partir de ellas. Ésta es la interpretación débil, correcta. de aquella afirmación. La medición directa no es posible si no se cumplen ciertas condiciones; pero, si de hecho se cumplen, la realización efectiva del procedin~iento se puede considerar una determinación implícita de que así es, pues el procedimiento "usa" tales propiedades. Esto es así "antes" (e.e. independientemente) del desarrollo de TM, a no ser que se quiera
LIEDICIÓ'I EN LA CIENCIA
209
considerar que la realización de los procedimientos constituye un adelanto, implícito y parcial, de TM. Es mejor no considerarlo así pero, una vez aclarado el punto importante, lo demás es una cuestión terminológica. Esta aclaración tampoco debe hacer creer que TM no es de ninguna ayuda para la práctica de Ia medición directa. TM fundamenta Ias prácticas que ya existían con anterioridad, pero también ayuda a establecer otras nuevas para magnitudes para las que no existían procedimientos de medición directa con anterioridad. Gran parte de la investigación actual en TM está vinculada al intento d e dar con procedimientos de medición directa para magnitudes, principalmente psicológicas y económicas, tratadas hasta entonces de forma puramente cualitativa. Para concluir, y a modo de resumen esquembtico, representaremos formalmente la forma general o estructura de los procedimientos de medición directa y haremos algunas observaciones al respecto. La representación formal de la estructura de estos procedimientos ha de expresar los elementos o constituyentes que intervienen y el modo en que están relacionados. Hemos visto que la representación cuantitativa directa de un sistema cualitativo es posible porque éste satisface de hecho ciertas condiciones o leyes, que estudia y descubre TM. Los procedimientos de medición directa deben estar pues parcialmente constituidos por sistemas cualitativos que satisfacen algún grupo de condiciones de mensurabilidad, esto es, por métricas. Pero ello es así sólo parcialmente, esto es, no están constituidos sólo por estos sistemas pues éstos expresan sólo la mera posibilidad de medición, no la asignación efectiva. En tanto que asignación efectiva, el procedimiento elige o destaca iinn de las funciones-representaciones cuya existencia garantiza el (o mejor, uno de los) TRU de la métrica. Para ello se destacan iin número finito de objetos del dominio, los estándares del procedimiento (si la métrica es cornbinatoria, uno, si es de intervalos, dos, etc.), y la misma cantidad de números reales. los valores arbitrariamente asignados a los estándares y que determinan la función-representación f específica. Podemos representar entonces un procedimiento de medición directa del sizuiente modo: PIMD Un procediinietlto de medición directa es una estructura del tipo tal que: (1) <4, S, ...> es una métrica, e.e. un tipo de estructura caracterizado por TM. (2) a i A~y n i € Re(1 5 i I k ) . (3) Cierto TRU especij7co es verdadero para f respecto de . (4) Ani) = i z i ( 1 < i < k). La condición (1) expresa que un constituyente del procedimiento es un sistema cualitativo que satisface condiciones apropiadas de mensurabilidad. (2) indica que hay tantos estándares como números destacados. (3) requiere especial atención. Por ser 4, S, ...> una métrica tendrá algún teorema TRU asociado. Pero vimos que no sólo tiene uno sino muchos, p.ej. en el caso de las métricas combinatorias extensivas positivas había un teorema TRU que establecía la existencia de representaciones adirivas y su grado de unicidad, y otro análogo para representaciones milltiplicntivas; y hay muchos otros que no mencionamos. gijimos entonces que nado en el sistema crralitatirpo obliga a elegir un tipo de representación frente a
otro, que eso es una elección arbitraria que se realiza en los procedimientos de medición directa. (3) expresa este hecho. Al decir que de f es verdadero, entre los varios posibles. un teorema TRU espec$co, se está expresando el hecho de que cada procedimiento deteníziiía corn~e~tcio~~al~~le~zte u11 único tipo de representacióll de entre los dii~ersosposibles (aditivas, multiplicativas, etc.). (3) deternlina por tanto el tipo de representación, ahora bien, no la función f concreta. Aun satisfaciéndose (3), f puede ser todavía una de varias funciones posibles, aunque, eso sí, todas del mismo tipo (una de entre las aditivas, o una de entre las multiplicati~as,etc.), y el procedimiento debe elegir una de ellas. Eso es lo que expresa (4): de entre todas las funciones del rnisnlo tipo (que cumplen (3)), el procedimiento elige arbitrariamente aquella que asigna ciertos números a los estándares. Una vez se ha asignado arbitrariamente un número a cada estándar, entonces el valor de la asignaciCn para los otros objetos de A queda determinado, esto es, queda determinada in7a asignación f específica, la escala a que da lugar el procedimiento. Esta caracterización resume los elementos esenciales, y sus relaciones, de todo procedimiento de medición directa; el lector puede aplicar el esquema a los casos paradigináticos de la masa y la temperatura esbozados más arriba. Nótese que la medición directa contiene dos elementos de arbitrariedad o convencionalidad: qué tipo de representación elegimos (3), y qué valores elegimos para los estándares (4). Los ejemplos vistos mostraban explícitamente sólo el segundo, pero contenían también inzplícitaiízente el primero, más fundamental como veremos en las consideraciones finales. Además de la noción de procedimiento de ~ízedicióizdirecta, es conveniente disponer de otra más general, la de iírétodo de ~nedicióndirecta. Los procedimientos de medición que hemos caracterizado son específicos o singulares, cada procedimieilto es un caso concreto de asignación. Un procedimiento con ciertos objetos específicos de tamaño medio comparados mediante una balanza, combinación por agregación, ciertos estándares, etc., es un PMD; otro con otros objetos también comparados mediante una balanza, agregados, etc., es otro PMD; y lo mismo otro con varas rígidas, comparación por superposición, combinación lineal, etc. Sin embargo, aunque los tres mencionados son procedimientos particulares diferentes, los dos primeros comparten algo que no comparte el tercero. En un sentido más general de 'procedimiento', los dos primeros usan el mismo procedimiento, diferente al del tercero; en tanto que placedi~~rielitos particirlares son casos de un mismo procediittie~ztogeizeral. Llamaremos 'métodos' a estos procedin~ientosgenerales. Un método de medición directa (MMD) es entonces simplemente un conjunto de procedimientos de medición directa que comparten algo, vinculados o relacionados de cierto modo. Puesto que los métodos de medición son prácticas operacionales, diremos que lo que hace que dos procedimientos correspondan al mismo método es que estén en cierta relación de equi\~ale~tcia oyeracio~zal.En función de qué incluya dicha relación, de qué sea lo que consideremos que deben compartir, tendremos una noción inás o menos estrecha de MMD. Intuitivamente, lo mínimo que han de compartir dos procedimientos para corresponder al mismo método ha de ser el modo de comparación. Debemos exigir esto si querenios distinguir los dos primeros ejemplos del tercero. También debemos exigir que compartan las otras operaciones o demás elementos constituyentes de las métricas, para
1 !
i i
i 1
distinguir p.ej. los métodos para resistencias mediante combinación en serie y en paralelo. Ahora bien, han de compartir estas cosas intensionalmente, esto es, han de compartir el procedimiento de comparación, el de combinación, etc., intensionalmente considerados, la "idea" de los mismos. Exigir que los compartan (sólo) extensionalmente sería en parte demasiado y en parte demasiado poco. Sería demasiado, pues entonces dos PMD del mismo método deberían tener siempre los mismos individuos en el dominio, y eso da una noción de método demasiado estrecha; no queremos excluir que los dos primeros ejernplos sean del mismo método sólo porque se distingan en algunos objetos. Y sería a la vez demasiado poco, pues dos PMD intuitivamente diferentes podrían coincidir. Por ejemplo, para un determinado conjunto de varas rígidas de igual sección y material (homogéneo), 10s órdenes extensionales establecidos mediante una balanza y mediante superposición coinciden, y la combinación lineal es una forma de agregación, pero no por eso queremos decir que son el mismo método. Esto por lo que respecta a las exigencias relativas a los constituyentes de la métrica. Estas exigencias son las mínimas, y según ellas, los dos primeros ejemplos corresponden al mismo método. Pero se pueden hacer otras exigencias más fuertes, según alguna de las cuales esos dos procedimientos dejen de corresponder al mismo método. Se puede exigir a) que f satisfaga el mismo TRU, o ú) que los estándares sean los mismos, o c) que además se les asigne los mismos valores. Así se obtienen diferentes nociones más fuertes que la acepción mínima. La elección depende de qué consideramos que es esencial a los métodos. Si sólo los aspectos cualitativos, exigiremos lo mínimo; si también el tipo de representación, exigiremos además a); si además los estándares elegidos, incluiremos b); y si incluso se considera esencial los números asignados, también exigiremos c). Lo único claro es que estas exigencias deben ser acumulativas. S o tiene mucho sentido exigir que los valores de los estándares sean los mismos si el tipo de representación (aditiva, multiplicativa. etc.) es diferente. Un conservadurismo metodo1ó;ico general hace quizá preferible la exigencia mínima. Además, es ella la que está especialmente vinculada con la idea de magnitud, pues diferentes procedimientos de medición de un mismo método deben medir la misma magnitud (aunque quizá pudiera haber en algunos casos métodos, en este sentido mínimo. diferentes y que midieran directamente la misma magnitud). Sin embargo, aunque en general sea preferible la noción mínima, para ciertos fines puede ser útil alguna de las otras nociones más fuertes. Nótese que la última es extremadamente fuerte pues acaba identificando métodos con escalas, las mediciones directas de la masa en gramos y en kilos serían métodos diferentes. Eso parece excesivo, pero quizá haya un sentido de 'método' en que es así; si lo hay, esta caracterización hace preciso cuál es. En las consideraciones finales volveremos sobre estas cuestiones.
6 . Procedimientos de medición indirecta (*)
En la medición directa hemos visto que, una vez fijado arbitrariamente el tipo de representación y los valores para los estándares, los valores para los demás objetos quedan unívocamente determinados. Para el análisis general de la medición es fundamental insis-
212
FUND.43IE3TOS DE FILOSOFL~
DE LA CIENCIA
tir en un hecho cnicial, aunque obvio, a saber, que en la medición directa sólo quedan determinados los valores de los objetos del dol?tiltio del sisre~?la,de los que entran en la relación empírica cualitativa de comparación del sistema; o si se quiere, puesto que para una misma magnitud puede haber varios sistemas cualitativos con diferentes dominios, sólo queda determinado el valor de los objetos que están en el dominio de algzmo de esos sistenías comparativos. Ahora bien, es claro que no todos los objetos que exhiben una magnitud pueden pertenecer al dominio de algún sistema de comparación cualitativa; por tanto, como avanzamos al comienzo del capítulo, no todos los objetos que exhiben la magnitud se pueden medir directamente por comparación cualitativa con un estándar. Aquí es donde entra la medición indirecta. En la medición indirecta asignamos cantidades a los objetos utilizando otras cantidades ya conocidas con anterioridad (mediante medición directa o indirecta) y ciertas fórmulas que relacionan las cantidades involucradas. Ahora vamos a ver sólo los casos de medición indirecta en los que las fórn-iulas que correlacionan los valores expresan leyes naturales, no definiciones de una magnitud introducida a partir de otras. Sobre este segundo tipo de casos ya nos extendimos en la sección dedicada a la metrización derivada; los elementos estructuraIes de los procedimientos de medición indirecta para estos casos se puede colegir fácilmente de lo dicho entonces. La idea central para la caracterización de los procedimientos y métodos de medición indirecta (mediante leyes) es sencilla. Como en la medición indirecta obtenemos el valor deseado mediante otros valores ya conocidos y relacionados con el ignorado de cierto modo, este modo en que están vinculados los valores conocidos y el desconocido es lo que caracteriza el método de medición. Los procedimientos serán casos o aplicaciones concretas de esos métodos: una medición indjrecta concreta, un yroceJi17ziento de niedicióiz ilidirec~a,utiliza cierto modo de obtener el valor desconocido a partir de los conocidos, modo en el que puede coincidir con otras mediciones concretas conformando así un procedimiento general, un inétodo de inedición iildirecta. Por ejemplo, los diferentes casos concretos de medición de distancia mediante triangulación, independientemente de los diferentes datos que se manejen en cada caso, coinciden en que obtienen la distancia desconocida entre dos puntos con la ayuda de un tercer punto, con las nuevas distancias y ángulo conocidos, y de cierta Iey geométrica que relaciona todos estos valores y que proporciona, por tanto, el modo de obtener mediante cálculo el valor deseado a partir de los otros ya conocidos. Lo mismo ocurre con las diferentes mediciones de la masa de cuerpos celestes mediante desviación de la trayectoria de un proyectil controlado. O con las mediciones de la masa de cuerpos de tamaño medio mediante un dinamómetro. Y análogamente en los restantes casos de medición indirecta. Si ésta es la idea intuitiva, la caracterizricjón formal de los procedimientos y métodos de medición indirecta es senc~lla.¿Qué entidades van a representar los procedimientos concretos de medición indirecta? La respuesta está implícita en la caracterización intuitiva. Lo que hace a esos sistemas apropiados a fines de inedición es que "contienen" cierto vínculo entre el valor a medir y otros valores ya conocidos. Puesto que no nos ocupamos ahora de relaciones definicionales, ese vínculo es irit hecho físico, una relació~~ real entre los diferentes valores involucrados, esto es, una ley de la naturaleza. El mejor
modo de representar estos sistemas, de acuerdo con el enfoque semántica que veremos en el capítulo 10, es en términos de modelos. De momento nos basta una noción intuitiva de modelo de una teoría T como aquellos sistemas reales, formados por objetos y propiedades estudiados por T. en los que rigen las leyes de T(p.ej., en la mecánica, el sistema solar, o el sistema Tierra-Luna, o un cohete acercándose a la Luna, o un cuerpo suspendido de un muelle, etc.). Así, puesto que los modelos de las teorías cuantitativas contienen o expresan las leyes de la naturaleza usadas en los procedimientos de medición indirecta, estos procedimientos se pueden identificar por tanto con modelos de cierta teoría que satisfacen ciertas constricciones adicionales. No vamos a ver aquí en detalle las constricciones adicionales que han de cumplir los modelos de una teoría T para ser modelos de medición indirecta. En general, las constncciones se expresarán mediante cierta fórmula J3que deberin satisfacer los modelos de T y que permite determinar (con cierto grado de unicidad) el valor desconocido. La caracterización es en realidad un poco más complicada puesto que es posible que en la medición del valor sino leyes-puente buscado se usen leyes que no son estrictamente leyes de T (sólo de 0, entre T y otras teorías; esto es, es posible que en la medición entren indirectamente en juego modelos de otras teorías. A veces se puede reducir el caso complejo a una combinación de casos simples cada uno de los citales involucra sólo modelos de una teoría, pero la existencia de leyes-puente genuinas hace que no siempre se pueda proceder así (cf. la noción estructuralista de vírzclrlo itltei-teórico introducida en la sección 5 dzl capítulo 10). Ignoraremos provisionalmente estas complicaciones adicionales y presentamos la caracterización gzneral de procedimiento de medición indirecta sólo para los casos más simples, esto es, relativizada a una única teoría T. Así simplificada, la caracterización es, en líneas generales, la siguiente. Un procedimiento de medición directa determina el valor de una niagnitud 1b1 para un objeto a , M(a), usando valores conocidos de otras magnitudes Mi, ..., M, para a , o de LCI y M,, ..., M, para otros objetos a , , ..., al (o ambas cosas a la vez). En el caso más sencillo, en el que se usa una ley de una teoría, el procedimiento es un modelo de la teoría, que contiene entre sus funciones ICI y M I , .... Al,, y que es ampliado de cierto modo mediante R,, ..., R,>, los procedimienvalores destacados. Así, si los modelos dz T son del tipo a, tos de medición indirecta se pueden representar del siguiente modo:
PMI Un procediinienro de medicióiz indirecta. relativamente a T, de M(a) mediante !Mi, ...,M,,, ni, ..., ak,es una estructura del tipo
213
FLSD.451ESTOS DE FILoSOF~.L\ DE LA CIESCIA
cados que determinan el valor a medir; estos valores pueden ser, tanto de la misma magnitud para otros objetos, como de otras magnitudes para el objeto en cuestión además de para esos otros objetos. En realidad, en la determinación de M(a) no intervendrán todos los valores de todas las magnitudes destacadas para todos los objetos destacados, pero expresarlo así de modo preciso supone una complejidad notacional adicional considerable. Por ejemplo, en la medición indirecta de la masa de la Luna (1) mediante su acción mecánica sobre un cohete (c) enviado a sus proximidades, el valor a medir 111(I) se obtiene a partir de la masa conocida del cohete ni(c) y de las trayectorias conocidas de la Luna y del cohete, esto es, de los valores para ambos objetos de la función posición S durante cierto intervalo de tiempo t 2 - r,. A partir de m(c) y de los valores S , ( / ) y s,(c) (las trayectorias de ambos objetos durante t2 - r,) se puede obtener 1í1(1) suponiendo que cl sistema Luna-cohete satisface ciertas leyes mecánicas, al menos los principios de Newton y ]a ley de gravitación universal, esto es, que el sistema es modelo de (al menos algunas leyes de) la mecánica clásica. Éste es pues el esquema general de los procedimientos de medición indirecta. Así dice muy poco, y el análisis es filosóficamente interesante cuando se desarrollan sus detalles, pero no podemos hacerlo aquí (un análisis detallado en esta línea puede encontrarse en Balzer, 1985). Concluiremos con tres comentarios adicionales. En primer lugar, el análisis de la medición indirecta hace explícito el sentido principal en que los datos empíricos están cargados de teoría. Puesto que la medición indirecta no sólo es la más común en la ciencia, sino la única en procedimientos sofisticados de contrastación que involucran predicciones cuantitativas, los datos de estas contrastaciones dependen esencialmente de la validez de las leyes que se usan para su determinación. Pero veremos más adelante que, aunque a \.eces se ha sostenido lo contrario, esta carga teórica de los datos no socava la legitimidad empírica de las teorías. Sobre esta cuestión nos extenderemos en los capítulos 8, 9, 10 y 12. En segundo lugar, desaparece ahora cierta extrañeza que podía haber suscitado el análisis de la medición directa. El lector atento habrá advertido entonces que la medición directa sólo genera fracciones de los valores asignados a los estándares. Eso no quiere decir que sólo genere como valores número racionales, pues los valores asignados a los estándares pueden ser irracionales. Pero sí que, si a los estándares se les asigna racionales, o enteros como de hecho se hace en las escalas usuales, la medición directa sólo generaría valores racionales. Y sin embargo, aun usando en la práctica científica valores enteros para los estándares, la ciencia maneja usualmente valores irracionales. Nada hay de extraño en ello pues la medición directa es sólo uno de los modos de realizar asignaciones. Aunque ella genere sólo valores racionales, a través de la medjción indirecta obtenemos valores irracionales por efecto de las relaciones cuantitativas contenidas en las leyes (cf. Hempel, 1952). Por último, mencionaremos un fenómeno común en la medición que, aunque no suele tener consecuencias prácticas importantes, es conceptualmente interesante. Se trata de lo que a veces se ha llamado fallos sistentáticos (cf. p.ej. Balzer, op. cit.,cap. 5). Este fenómeno consiste, descrito en general, en que algunas veces los procedimientos para medir la magnitud de un objeto modifican dicha magnitud. Por ejemplo, al medir median-
te u n dinamómetro la fuerza de atracción gravitatoria de un objeto a una distancia d del centro de la Tierra, el valor finalmente obtenido en el punto de equilibrio no es el correspondiente a esa magnitud para la distancia d sino para otra distancia d' menor (debido a la elongación del muelle), siendo ambos valores diferentes. O al medir la temperatura de un líquido mediante un termómetro el valor obtenido no es la temperatura antes de introducir el termómetro sino después, una vez se han equilibrado la temperatura del liquido y fa del tert;tórnetro; ambos valores pueden no coincidir, de hecho no coinciden salvo que el termómetro estuviera ya a la temperatura del líquido. Como hemos indicado, las consecuencias prácticas de este fenómeno son casi siempre (pero sólo casi siempre) despreciables, pues ambos valores apenas difieren. Pero aunque a la mayoría de efectos prácticos se puedan identificar, eso no elimina el hecho de que son valores diferentes. Se trata pues dz fallos de medición, en el sentido de que el valor medido no coincide con el realmente buscado. Pero son también fallos sistemáticos, esto es, responden a una regularidad natural y son por tanto corregibles. Haciendo la medición un poco más larga, siempre podemos ir de los valores obtenidos a los realmente buscados mediante leyes físicas adicionales.
7. Consideraciones finales
1. A lo largo de este capítulo nos hemos ocupado de la medición como representación cuantitativa de magnitudes, propiedades que las cosas ejemplifican según un m6s y un rnenos. Pero en la ciencia parece haber otra clase de deter~nirtaciónttionérica. Se trata de la "medición" de las constantes universales. Antes que nada conviene aclarar lo que las constantes universales no son. Ko son valores de ciertas magnitudes destacadas para ciertos objetos destacados. Contrariamente a lo que a veces se sugiere (cf. Krantz et al., 1971, tabla de la página 457), valores como la masa de la Tierra, la masa o la carga del electrón, etc., no son constantes universales. Obviamente lo son en un sentido trivial, la masa del electrón es constanre, la masa de la Tierra es (más o menos) constante; pero en ese sentido la masa de la corona de la reina de Inglaterra también es una constante universal, pues también es (más o menos) constante. Las verdaderas constantes universacm3/gr . S'), la de los gases (R = 8,3143 x 1 0 ' les, como la gravitacional (G = 6,67 x er,o/mol-gr . O K j o la de Planck (h = 6,626 x lo-'' erg . S ) , no son de este tipo. Estas constantes son valores numéricos que intervienen en ciertas leyes naturales pero, a diferencia de otras mal llamadas también constantes que vimos en la sección 4 (coeficientes de dilatación, conductancias, etc.), no dependen de ningún cuerpo o material. No son pues valores que correspondan a ninguna magnitud y por tanto. aunque se determina su valor numérico, no se lnidetz en el sentido estricto del término. Es cierto que tienen dimensiones, y por ello, en función de qué escalas usemos para las magnitudes de las dimensiones, el coeficiente numérico de estas constantes puede variar (p.ej. h = 6,626 x lo-" jou1.s; por supuesto que eso no las hace menos constantes ni menos universales). Pero esas dimensiones no corresponden a ninguna magnitud. son simplemente producto de exigir la coherencia dimensional a las leyes en que aparecen. 2. Hemos dicho que la medición indirecta "completa" a la directa asignando
2 16
F L N D ~ I I E ~ T ODE S FILOSOFIA DE LA CIENCIA
valores a objetos que exhiben la magnitud pero a los que no se les puede asignar valores mediante comparación directa con estándares. Ahora bien, esta afirmación supone un hecho adicional no explicjtado hasta el momento, a saber, que "lo" medido indirectamente, mediante las leyes, es lo mismo que "lo" medido directamente a partir de sistemas puramente cualitativos. Brevemente: ;por qué lo medido directamente mediante una balanza es la masa, es esa cosa de la que habla la Mecánica Clásica? Análogamente con la temperatura. Desde luego que en la medición directa medimos alguna magnitud, pero ¿por qué es la misma magnitud que aparece como función numérica en los modelos de cierta teoría cuantitativa? Eso indica que nuestro análisis de la medición directa es incompleto. Hemos caracterizado los procedimientos y métodos de medición directa en general, pero no los procedimientos y métodos de "medición directa de la magnitud M". Para ello es necesario hacer explícito el vínculo entre ciertos procedimientos de medición directa y la teoría cuantitativa que incluye la función métrica M. El vínculo consiste, básicamente, en que el sistema cualitativo que constituye el procedimiento de medición directa satisface las leyes de esa teoría, es uno de sus modelos. Intuitivamente: lo que medimos con la balanza es la masa de la Mecánica porque la balanza satisface las leyes mecánicas, es un. modelo de esa teoría. La cosa no es tan simple pues ios modelos de la teoría son cuantitativos y 10s sistemas comparativos de los PMD son cualitativos. Expresar que el PMD satisface las leyes de la teoría requiere algunas complicaciones que no podemos discutir aquí (cf. Díez, 1994a), pero la idea es exigir determinados requisitos de coherencia entre 10s órdenes cualitativos y los valores numéricos que tienen los objetos del dominio de comparación en los inodelos cuantitativos de la teoría en cuestión. En el capítulo 10 ( $ 5 ) veremos que éste es el motivo por el que la masa, a pesar de poder medirse mediante procedimientos de medición directos, debe considerarse lo que allí llamareinos "mecánico-dependiente", esto es, la masa es tal que su determinación o medición presupone siempre la aplicación de alguna ley de la mecánica. 3. Por último, y después de este largo recorrido, ¿qué hay de la ontología de las magnitudes? ¿Son meras propiedades relacionales con condiciones específicas que permiten hablar de ellas cuantitativamente? ¿O existen efectivan-iente"las cantidades"? Aunque la cuestión es muy compleja y requiere una discusión detenida, tendemos a considerar que la posición más natural es la primera. Nada en todo este recorrido parece requerir la existencia objetiva de esas entidades cuantitativas; podemos dar cuenta de todo lo referente a la medición partiendo exclusi~amentede propiedades relacionales cualitativas. Esta tesis se ve reforzada por el elemento de arbitrariedad contenido en la cláusula (3) del esquema PMD, a saber, nada hay en el mundo que exija elegir entre diferentes tipos de representación cuantitativa (aditiva. multiplicati~~a, etc.), eso sólo depende de nuestras prácticas convencionales. Si reescribiéramos toda la física con, por ejemplo, representaciones multiplicativas de las métricas combinatorias (masa, longitud, duración, etc.) la forma cuantitativa de todas las leyes físicas cambiaría, pero el "contenido" sería el mismo. La interpretación más natural de ello es que ese contenido, lo que se dice realinente del niundo, es puramente cualitativo. Dicho esto, por supuesto, no hay ningún reparo en Ilainar cuanritatii!as a esas relaciones que satisfacen las condiciones empíricas suficientes para dejarse representar numéricamente. La cuestión permanece la misma: desde esta
perspectiva "relncionril", las relaciones dc comparación son lo básico y las "cantidades7' lo derivado. El partidario de la perspectiva no relaciona1 ve las cosas al revés, lo básico son las cantidades, y ellas expIican que se den ciertas relaciones de comparación. Nuestra posición es que IL? prinlera postura es metafísicamente más conservadora y que nada exige optar por la segiinda. Por tanto, el conservadurismo ontológico general deseable en filosofía hace preferible la perspectiva relacional.
1. Explicación y explicación científica
En el capítulo 3, donde estudiamos la metodología de la contrastación de hipótesis, vimos en los diferentes episodios históricos que las hipótesis sometidas a contrastación se introducían siempre para dar cuenta de determinados hechos; por ejemplo, un extremado crecimiento de mortandad infantil en una división de un hospital, una determinada distribución y forma de las placas de la corteza terrestre, el movimiento aparente de los astros, etc. Este "dar cuenta" es lo que en contextos metacientíficos queremos significar con el término 'explicar'. La ciencia, como se dice usualmente, no sólo describe sino que también explica,no se preocupa sólo del qué sino también del porqué. Esta dimensión explicativa, sin embargo, no es exclusiva de la ciencia. Gran parte de nuestro conocimiento del mundo es explicativo y la ciencia es simplemente el lugar donde dicho conocimiento encuentra su máxima expresión. Considerar el carácter explicativo como algo específico del conocimiento científico convertiría en científicas afirmaciones que usualmente no tomamos por tales, p.ej. "el auto se salió de la carretera porque había hielo en la calzada" o "Juan no vino a la fiesta porque se confundió de día". Esta cuestión es en parte sólo nominal, pues hay un continuo entre el conocimiento ordinario y el científico; podría considerarse que las explicaciones ordinarias corresponden a determinadas protociencias, en los ejemplos mencionados, a cierta protofisica la primera, o a cierta protopsicología la segunda. El límite es difuso, y hasta cierto punto arbitrario, pero todos reconocenios casos claros en que no calificamos una explicación de científica y casos claros en que sí. En este sentido mínimo de la distinción, el carácter explicativo no es exclusivo de la ciencia, también proporcionamos explicaciones en contextos ordinarios no científicos. Por otro lado, no sólo el carácter explicativo no es exclusivo de la ciencia, sino que tampoco es propio de toda ella. Ni sólo la ciencia es explicativa, ni toda la ciencia lo es. Ciertas disciplinas científicas, o partes de ellas, no son explicativas, al menos no lo son pritna facie. Ello es así típicamente en las disciplinas clasificatorias, por ejemplo en las taxonomías zoológicas o botánicas, aunque es cierto que las taxonomías se pueden integrar posteriormente en Corpus disciplinarios más amplios que sí son explicativos.
220
'
iTSD.L\31E\TUS DE FILOSOF~L\ DE LA CIENCIA
En estas consideraciones sobre la naturaleza explicativa de la actividad científica estamos entendiendo el término 'explicar' en un sentido específico. Las palabras castellanas 'explicar' y 'explicación' son parcialmente polisémicas y no todas SUS acepciones tienen que Yer con la noción de esplicaciórl que aquí nos interesa. Estas expresiones unas veces significan simplemente la narración de cierto suceso ("Pedro le explicó a Laura su viaje a la India", "explícale al policía lo que sucedió"). Otras el adiestramiento en ciertos procedimientos para alcanzar un fin ("Juan le explicó el funcionamiento de la cámara fotográfica", "el mecánico me ha explicado cómo reparar un pinchazo"). 0, relacionado con el anterior, la presentación de las reglas que rigen una determinada actividad colectiva ("Ana quiere que le expliques el reglamento del basket", "aquel invitado estúpido necesita que le expliquen cómo comportarse en una boda"). A veces se usan en el sentido de comunicar o explicitar el significado de una palabra ("mi primo físico me ha explicado el significado de 'espín"', "tuve que explicarle lo que quería decir 'insidioso"'). Este último uso da lugar a otro que tiende a ser específicamente filosófico, en el que 'explicar' tiene el sentido de elucidar un concepto o una distinción conceptual. Así lo usamos cuando decimos, por e.jemplo, que Frege dio una explicación del concepto de número, que Carnap la dio del de probabilidad, o que Kant explicó la diferencia entre alzalítico y siizlético. Este uso es un caso del anterior en el sentido de que elucidar ciertos conceptos no es sino establecer los aspectos fundamentales del significado de las palabras que los expresan. Este uso se puede generalizar y aplicarse a la presentación o elucidación de un problema o cuestión conceptual ("en el examen teníamos que explicar la paradoja de Russell", "hoy toca explicar el problema de los universales"). Para el sentido de 'explicar' como elucidación de un concepto, la jerga filosófica inglesa dispone de un término específico, 'explicariorz' (que a veces se aplica en general a la explicación de cualquier significado), mientras que para los restantes usa la misma expresión, 'explanatiorz'; la voz castellana 'explicación' traduce pues ambas expresiones inglesas. Éstos son los principales sentidos de 'explicación' en los que no nos vamos a detener. Además de ellos, hay otro sentido de 'explicar' que es el que aquí nos interesa, aquel que, aunque presente también en ciertos contextos ordinarios, es particularmente importante en los contextos científicos. Casos paradigmáticos de este uso son los siguientes: "el extremado descenso de las temperaturas explica que las cañerías de casa se ron~pieran","la fuga radiactiva explica las malformaciones genéticas en las poblaciones próximas a Chernobil", "que consumiera cuatro paquetes de cigarrillos diarios explica que Luis muriera de cáncer de pulmón", "la mecánica gravitatoria celeste explica las órbitas elípticas de los planetas", "la polarización de la luz se explica por su naturaleza corpuscular". Aunque haya diferencias importantes entre ellos, todos estos casos comparten algo. Qué es lo que comparten, y también en qué difieren, es lo que vamos a ver en este capítulo. El objetivo es pues dar una "explicación" (en el sentido del inglés 'explicatio~z') del concepto de explicaciór~ejemplificado en estos casos paradigmáticos; en realidad, más que proponer una, presentaremos y comentaremos las principales elucidaciones que se han propuesto. A partir de ahora, mientras no se indique lo contrario el término 'explicar' y sus derivados se entenderán siempre en el sentido ejemplificado por estos casos. Aunque no podemos presentar ahora un análisis preciso del concepto de explica-
ción, pues ésa es la tarea de las próximas secciones, sí es posible una primera aproximación intuitiva o preteórica al mismo. Según esta primera aproximación, lo que comparten estos ejemplos es que todos ellos podrían constituir respuestas a cierto tipo específico de preguntas, a preguntas del tipo ''¿por qut? ...?". ";Por qué se rompieron las cañerías de casa?" "Por el extremo descenso de las temperaturas." Análogamente en los demás casos. Si llamamos 'P-preguntas' a las preguntas de ese tipo, las explicaciones de las que estamos hablando parecen caracterizarse por ser susceptibles de constituir respuestas a P-preguntas. Insistimos en que no queremos con ello dar un análisis preciso y sustantivo de la noción. Como veremos, uno de los análisis propuestos explota esta idea desarrollándola en una dirección específica, esto es, propone que toda explicación es una respuesta a una P-pregunta en un sentido muy específico de 'respuesta' y de 'P-pregunta'. No queremos hacer eso aquí, ni prejuzgar la adecuación o no de tal análisis. Caracterizar preteóricamente el tipo de explicación contenida en estos ejemplos como respuestas a P-preguntas es únicamente un modo de expresar las intuiciones mínimas sobre el contraste entre este concepto de explicación y los restantes. En una primera aproximación, las explicaciones son pues respuestas a preguntas ''¿por qué?". Esto se debe entender por el momento en un sentido amplio. En primer lugar porque, como se ha indicado, no se pretende de momento ningún desarrollo específico filosóficamente preciso de esta idea. Pero, en segundo lusar, porque la idea genérica no se corresponde tampoco siempre con la forma gramatical específica de ese tipo de enunciados. Ni todos los enunciados interrogativos con la forma gramatical ''¿por qué ...?" requieren como respuesta una explicación del tipo indicado, ni sólo ellos las requieren. Muchas veces estas preguntas tienen un sentido retórico (''¿por qué tengo que seguir aguantando tus impertinencias?"), o desiderativo ("¿por qué no somos todos más tolerantes?"), o exclamativo (''¿por qué has tenido que estornudar justo cuando estaba grabando?"), u otro. En casos como éstos, aunque la oración tiene la forma interrogativa, el acto de habla no consiste propiamente en la formulación de una pregunta, sino la expresión de una afirmación ("no pienso seguir aguantándote"). un deseo ("ojalá todos fuéramos más tolerantes"), una queja u otras cosas, órdenes, solicitudes, propuestas, etc. En otro tipo de casos, mediante la oración se expresa propiamente una pregunta, pero la cláusula 'por qué (no)' es superflua, no añade nada (''¿por qué no venís a cenar el sábado?"; estos casos se parecen mucho a aquellos de los anteriores en los que se expresa una propuesta). Por último, en otros casos la oración interrogativa expresa una pregunta y la cláusula 'por qué' no es superflua, pero la respuesta que requiere no es una explicación en nuestro sentido sino una "explication", esto es, una elucidación o análisis (''¿por qué los contextos de creencia son intensionales?", ''¿por qué las leyes científicas no son meras generalizaciones?"). Éstas son las principales excepciones, aunque la pragmática de las preguntas ''¿por qué?", y de sus respuestas, es muy compleja y puede haber otras excepciones en contextos específicos. Así, en general, no todo enunciado interrogativo que incluye la cláusula 'por qué' expresa propiamente una pregunta que requiera explicación; pero si tal enunciado expresa una pregunta y la cláusula no es superflua, la pregunta en cuestión requiere por lo general como respuesta una explicación. Por otro lado, algunas preguntas que requieren una explicación como respuesta
no se expresan mediante enunciados interrogativos que incluyen cláusulas 'por qué'. El caso más destacado es el de las preguntas "¿cómo?", p.ej.: "¿cómo cogió Pedro el cólera?", "¿cómo te saliste de la carretera?", "icorno aparecieron los primeros seres vivos no acuáticos?", "¿cómo pueden volar los aviones?". Aunque estos enunciados interrogativos no incluyan cláusulas 'por qué', las preguntas que expresan se pueden considerar P-preguntas en el sentido amplio, pues las respuestas que requieren sí incluyen la cláusula 'porque' u otras análogas. Es cierto que también se pueden responder sin estas cláusuIas, p.ej. a la primera pregunta se puede responder "porque comió fruta sin pelar en la India", pero también simplemente "comió fruta sin pelar en la India". Lo que las hace P-preguntas en sentido amplio es que, aunque a veces se suprima dicha cláusula, sus respuestas apropiadas típicamente se expresan de la forma "porque ...". Esto es lo que hay detrás de la idea de que las explicaciones son respuestas a P-preguntas: son respuestas que se pueden expresar adecuadamente incluyendo cláusulas del tipo 'porque'. Por supuesto que todas estas características semiformales no son las deterrninantes, simplemente son el trasunto gramatical de hechos más profundos. Si las respuestas incluyen esas cláusulas es porque mediante ellas se da t-acón o sept-opol-ciona con~prerisión de algo. Ésos son los hechos más profundos, que ahora sólo mencionamos en un sentido muy genérico e impreciso. Especificar la naturaleza última de esos hechos, determinar el sentido exacto en que las explicaciones dan razón de ciertas cosas, es justamente la tarea de los análisis del concepto de explicacióiz que vamos a ver. El análisis de la explicación se remonta prácticamente a los inicios mismos de la filosofía. En la Antigüedad el precedente más notorio es Aristóteles, aunque ya en Platón se encuentran consideraciones de interés. La famosa teoría aristctélica de las cuatro causas o aitíai (material, formal, eficiente y final) es a la vez, o incluso primariamente, una teoría de la explicación (cf. p.ej. Ruben, 1990, cap. 3, y más abajo $4 los comentarios de van Fraassen al respecto). La palabra griega 'aitía' suele traducirse por 'causa', pero en Aristóteles parece significar primariamente una respuesta a una pregunta ''¿por qué?", hay tantas airíai como maneras de responder a esas preguntas (cf. Física, 11, 198 a 15). A la hora de explicar un cambio, su "por qué", podemos apelar a la materia constituyente, a la forma que se actualiza, al agente productor o a la finalidad del cambio (coincidiendo las tres últimas respuestas en los cambios naturales). No vamos a detenemos aquí en los detalles de la teoría aristotélica, íntimamente vinculada al resto de su física y de su metafísica. Aunque esta teoría ha sido muy influyente a lo largo de la historia de la filosofía, y partes de la misma lo continúan siendo en la actualidad, los análisis contemporáneos de la noción de esplicación se plantean en términos más afines a la investigación metacientífica general. Dentro de la filosofía de la ciencia, el punto d e partida de los estudios sobre la explicación científica se sitúa a finales de los años cuarenta con el trabajo fundacional d e Hempel y Oppenheim (1948). Aunque anteriormente autores como Mil1 y Popper habían realizado algunas contribuciones de interés, es en ese artículo, y en otros trabajos posteriores de Hempel que le siguen, donde por primera vez se aborda el tema de modo específico y se realiza un análisis detallado del concepto de explicación. En estos trabajos se establecen los términos en los que se va a desarrollar el debate posterior y se presenta una
propuesta en relación a la cual se van a posicionar las diferentes alternativas. La obra de Hempel es pues fundamental, proporciona los fundamentos tanto metodoló,'~ I C O Scomo conceptuales. Comenzaremos por tanto nuestro estudio con la presentación del análisis hempeliano del concepto de explicación (cient$ca) y veremos después las principales modificaciones y alternativas al mismo. En la presentación de los diversos análisis vamos a seguir aproximadamente el orden cronológico de aparición de los mismos. La función de esta revisión no es simplemente ir yuxtaponiendo diferentes teorías de la explicación conforme van apareciendo. Como en otros lugares de esta obra, en la medida en que la revisión conceptual de un tema sigue el desarrollo de las propuestas que históricamente se han dado, es porque la historia tiene algo que enseñamos. Como señalamos en el prólogo, en estos ámbitos Ias propuestas históricamente primeras no lo son en vano. Son las primeras, en cierto sentido, casi necesariamente, pues recogen las intuiciones más inmediatas y las expresan de la forma en principio más sencilla o natural, y las alternativas posteriores se encargan de corregir las eventuales deficiencias, poner de manifiesto aspectos más profundos y, si es necesario, reformar algunas de nuestras intuiciones. Pero casi siempre esos aspectos más profundos del problema sólo se pueden apreciar una vez las propuestas originales han comenzado a limpiar el terreno. Estas consideraciones son particularmente apropiadas en el caso de la explicación científica. Para poder apreciar cabalmente la naturaleza de los análisis más recientes es necesario comprender antes el núcleo de la propuesta hempeliana, y ver entonces en qué medida las modificaciones posteriores conservan o no dicho núcleo conceptual. En la próxima sección examinaremos el modelo de cobertura legal de Hempel y en las próximas, sucesivamente, el de relevancia estadística, el pragmático, el causal y el de unificación y subsunción teórica. Puesto que el espacio no permite una revisión exhaustiva, tras la exposición detenida del modelo de Hempel y de las principales cuestiones que abre, nos limitaremos en los siguientes a presentar los principales puntos de contraste (para un estudio detallado, cf. especialmente Salrnon, 1989; cf. también Kitcher, 1989; Ruben, 1990 y Sintonen, 1989). Los diferentes análisis son parcialmente contrapuestos y parcialmente complementarios. No son acumulables sin más, tampoco son alternativas que simplemente se aplican a diferentes casos. Cada uno surge como corrección conceptual, al menos parcial, a otros y con vocación de exclusividad. En la actualidad las espadas siguen en alto entre las dos principaIes alternativas, el modelo causal y el de unificación, y es una cuestión abierta si son integrables de algún modo. En la última sección nos ocuparemos brevemente de las explicaciones funcionales y teleológicas, que durante mucho tiempo han sido motivo de perplejidad; veremos un análisis de las mismas, el de L. Wright, que resuelve tal perplejidad. Antes de iniciar el análisis es preciso destacar un hecho general relativo a la explicación que conviene tener presente, incluso aunque en muchos de los análisis que vamos a ver no desempeñe un papel principal. Se trata del carácter irtrensiorlal de la explicación. Recuérdese (cf. cap. 3 S 1) que un contexto es intensional si no esta garantizada la sustitutividad salva verirare, esto es. si en él la sustitución de una expresión lingüística por otra que denote la misma entidad puede alterar el valor veritativo. Pues bien, el contexto '... explica - - -' es intensional. Por ejemplo, supongamos que el lechero del
224
FUNDA\~E'\TOS DE FILOSOF~ADE M CIENCIA
barrio es el amante de la mujer de Pepe, y que Pepe lo sabe. Y supongamos también que alguien, que no sabe que el lechero es el amante de la mujer de Pepe, nos pregunta por qué Pepe se pasó todo el día de mal humor. En ese caso, "porque Pepe se ha cruzado en la puerta de casa con el amante de su mujer" puede ser (en ciertas circunstanciac) una buena expIicación, mientras que "porque Pepe se ha cruzado esta mañana en la puerta de casa con el lechero" puede (en esas mismas circunstancias) no serlo. O supongamos que queremos explicar por qué un beduino, que ignora que el agua es H 2 0 , modifica su ruta para pasar por un oasis. Una buena explicación puede ser "porque tiene sed y en el oasis hay agua", mientras que "porque tiene sed y en el oasis hay H20" no lo es. No vamos a detenemos ahora en esta cuestión, en las secciones 4 y 5 haremos algunas consideraciones al respecto. Para concluir esta sección introductoria introduzcamos algo de terminología específica. En una explicación llamamos 'explanandum' a aquello que requiere de una explicación, y 'explanans' a aquello que proporciona la explicación del explanandum. Todo análisis del concepto de explicación debe dar pues una caracterización precisa del explanandum y del explanans. Pero no sólo de ellos. También debe caracterizar la relación que se da entre ambos. Llamaremos 'relación explicativa' a aquella relación que, por darse entre el explanans y el explanandum, hace que podamos considerar que el primero explica al segundo. Todo análisis debe caracterizar estos tres elementos: explanandum, explanans y relación explicativa; como veremos, los diferentes modelos alternativos se diferencian en su análisis de alguno de estos elementos. Aunque el objeto principal es la explicación científica, por los motivos indicados más arriba la discusión hará referencia a veces a explicaciones ordinarias pre- o protocientíficas, especialmente cuando sean fuente de intuiciones muy firmes.
2. Cobertura legal inferencia1
En Hempel y Oppenheim, 1948, se presenta el núcleo del análisis de la explicación que Hempel va a desarrollar posteriormente, principalmente en los años sesenta (Hempel, 1962, 1965, 1966a, cap. 5, y 1967). La idea básica es que las explicaciones son argumetzros en los que el expla1zar7dunise ilifiel-e del explanans. Hempel insiste en que esta idea no es original, y efectivamente sugerencias en este sentido se pueden encontrar al menos en Aristóteles, Mill, Campbell y Popper. Lo que sí es original es el desarrollo específico de la misma, que como dijimos constituye el primer análisis completo y preciso de la noción de explicacióiz. Antes de detenerse en los detalles es conveniente exponer el esquema general y las intuiciones que lo inspiran.
GENERAL DE LA EXPLIC.ACI~NMEDIANTE COBERTURA LEGAL INFERENCIAL 2.1. FORMA
Una explicación constituye una respuesta o solución a cierta situación de perplejidad. Lo que reclama explicación son hechos que en algún sentido nos causan perplejidad o
sorpresa. por ello preguntainos el porqui de los mismos: nos preguntamos por 13 explicación dc cosas cti cicrto setitirlo inesperada.. Por supuesto que podemos buscar explicación de hechos perfectaniente cotidianos que en ese sentido no son inesperados sino todo lo contrririo. Por ejemplo, queremos explicar por qué el Sol aparece todos los días en el horizonte. o por qué la Luna carnbia su apariencia. En un sentido, estos hechos no son inesperables, no nos causan sorpresa; mis bien lo sorprendente sería que el Sol no apareciera una mañana en el horizonte o que la Luna mostrase el mismo perfil una semana se_c~~ida. Pero hay otro sentido en el que jí son "sorprendentes" o "inesperados", a saber, mientras no tenemos explicación de los mismos, sabemos que pasan y creemos que seguirlín pasando, pero no tenemos moti~.opara justificar nuestra creencia: "¿,por qué pasan n15s bien que dejan de pasar?". "segiiro que el sol saldrá mañrinii, o eso creo, pero por todo lo que s i no hay n1otit.o para ello, es sorprendznte que de hecho niañana salga otra vez". Ésta es la idea que inspira el anilisis de Hsn~pel.Si una explicación es una respuesta 3 iin;l situación de este tipo, entonces la esplicaciGn de cierto hecho, "inesperado", consiste en nlostrar que se dan otros hechos que hacen rsperclble' la ocurrencia del primero. Así. In intiiición que quiere recoser Hempel es que en una explicación el explanans hace esperable el explananduni. Par:! hacer precisa esta intuición se debe especificar el sentido exacto en que el espl:innns ha:: esperable el esplanandum y el candidato mLís inmediato para la relación de "esperabilidad", el que toma Hempel, es la reltición de inferencia lógica: ciertos estados de cosas hacen espernb!? otro si el sesundo "esta contenido" en los prin~erossonsiderndos conjunr~inieiitz.E s ~ i i ~ ela rsegundo consiste en niostrar que efectivamente estii contenido en 10s priiiieros. .Así, el esplanans hace esperable el esplaniinduni en el sentido przciso de qu: del espliirians 5 2 infiere el esplanandum. Las esplicucio~iesson argiinientos en los que infiere el hecho a esplicar de los otros hechos que lo explican. Éste es el núslro del nnilisis hen~psliano.O nisjor. la parte 1115s bisica del mismo, pues Heiiipel añade i!n;i condición general para poder considerar iin argumento como esplicación. No toda inferencia constit~iytuna explicación. La condición adicional es que en el esplanrins in:erveriga al menos un hecho general de cierto tipo. Consideremos uno de los ejemplos iuencionados: "el extremo descenso de las temperaturas explica que las cañerías de casa se rompieran". Aquí, aparcntementc el esplanandum, la rotura de las cañerí~isde c ~ ~ s ano. se infiere del exp1an:ins (explícito:). el extremo descenso de las temperaturas. Si a pesar de eso Iri consideramos una explicación legítima es porque consideramos que el esplanaris incluye elíptica o implícitamente hechos adicionales, e s unii forniiilrición incompleta dz la a~itinticaexplicación. La esplicación completamenie formulada sería aproximadamente la siguiente: "111 rotura de las caíierírts de casa se esplica por cr) el dzscenso extremo de 111 temperatura, b ) las cañerías ds casa estaban llenas de agua, c) el extremo descenso dc la teniperatilra consela el agua y ciiando se congela el agua de las cañerías éstas se rompen". Ésa es la esplicación completa y, ahora sí, el explananduni ! . < . r , ~ ~ ~ r ( l l ~ ipor l i ~ \'espernble' .. y 'tspt1. Traducircinos. a frilt:i dc inrljor 31ter112:iia. .t,.r/~~(.r(ll~l~,. r.lbi!id;!d'. Sc'rí~flltllo: forzado usar 'prc'\.isiblt'. Fe;.) no c's a~onstj2blcpor su connotación temporal.
se infiere (deductivamente) del esplanans a) - d?. Y el explanans contiene al menos un hecho general, exactamente dos en este caso, c) y d). Se objetará que para que el explanandum se infiera del explanans no es preciso q u e el conjunto de las premisas, el explanans, contenga un hecho general. En efecto, supongamos que si viene Juan a la fiesta entonces no viene Rosa, y supongamos además que de hecho viene Juan. De estos hechos, ambos particulares, se infiere la no asistencia de Rosa a la fiesta. Hempel reconoce por supuesto la validez de la inferencia, pero rechaza que en tal caso el argumento constituya una explicación. De la premisa de que las pompas de jabón primero crecieron y después disminuyeron se infiere que las pompas de jabón primero crecieron, pero "es evidente que [esta inferencia] no puede considerarse una explicación de por qué las pompas de jabón primero crecieron, []]a misma observación se aplica a todos los otros casos de esre tipo" (1965. 52.1; cursivas nuestras). Hempel no da un argumento general al respecto y simplemente presenta como obvio que en todos esos casos, incluido por tanto el de nuestra fiesta, no se puede hablar de explicación. Aunque la cosa no es quizá tan obvia, la idea que hay detrás es que los casos en los que aparentemeiite todas las premisas son particulares y aun así parecen constituir propiamente una explicación, son argumentos que esconden en realidad subrepticiamente algún hecho general. Por ejemplo, si el caso de nuestra fiesta nos parece propiamente una explicación, es seguramente porque se interpreta de uno de los tres modos siguientes. A) La primera premisa no se interpreta meramente como el condicional material "si va Juan no va Rosa", sino como un condicional general? a saber, "siempre que va Juan nunca va Rosa". B) La primera premisa se interpreta como un hecho particular pero causal, e.e. "que vaya Juan hace que no vaya Rosa"; en este caso también hay generalidad, aunque ahora encubierta, pues las implicaciones causales particulares se fundamentan en hechos generales (nómiCOS).C) La primera premisa se interpreta como el siguiente condicioi~almaterial particular: "si Juan va entonces Rosa no piensa (no tiene la intención de) ir"; pero en este caso para que la inferencia sea válida hace falta como premisa adicional cierto hecho general sobre la relación entre las intenciones de Rosa y SUS acciones. Si no pensamos en ninguna de estas tres interpretaciones es difícil ver el sentido en que la ausencia de Rosa queda explicada, parecería entonces una situación semejante a la de las pompas de jabón. La esperabilidad del explanandum dado el explanans no es por tanto mera inferencia, sino inferencia de cierto tipo: el explanans debe incluir al menos un hecho general. Pero además, añade Hempel, tampoco vale cualquier hecho general, los hechos generales relevantes para las explicaciones han de ser de cierto tipo'. Supongamos que queremos una explicación de que cierta moneda determinada sea dorada. Y supon,uamos que e) esa moneda estaba la Nochevieja de 1990 en el bolsillo derecho de los pantalones de Quine y j ) que en esa noche todas las monedas del bolsillo derecho de los pantalones de Quine eran doradas. De e) y f) se infiere que la moneda en cuestión es dorada, y además f) es un hecho general, pero a pesar de ello no parece que estemos ante una genuina explicación del color de la moneda, esos dos hechos no lo explican. Los hechos generales que incluye el explanans no pueden ser cualquier regularidad, han de ser regularidades izólílicas, ¡ejes naturales. Esta inferencia no constituye una explicación porquefi es una mera regularidad accidental, no es una ley. En el capítulo 5 discutimos
a
i!
2
v
,i f&
la diferencia entre regularidades accidentales y regularidades nórnicas o leyes, y vimos que elucidar y fundamentar dicha diferencia es ciertamente difícil. El propio Hempel discute ampliamente el problema y propone su particular concepción de las leyes (cf. p.ej. Hempel y Oppenheim, 1948, $111, y Hempel, 1965, 752.3). Ahora no vamos a insistir más en este problema (para las referencias que en este capítulo se hagan al concepto de ley bastará remitirse a aquél). Supuesto pues que disponemos de la diferencia entre regularidades accidentales y leyes, la condición adicional que exige Hempel para que una inferencia constituya una explicación es que el explanans contenga al menos un enunciado general que sea una ley. Por supuesto que la exigencia es que el explanans contenga esencialrnenre al menos una ley, esto es, la ley ha de ser necesaria para la inferencia, el explanandum no se puede seguir del resto de las premisas solas. Eso es lo que ocurre en la formulación completa de la explicación de la rotura de las cañerías, los enunciados generales del explanans son leyes. La idea central es que la esperabilidad siempre ha de ser nómica. Las regularidades meramente accidentales no hacen esperable nada pues son justamente eso, accia'entales. Por eso toda regularidad que intervenga esencialmente en el explanans ha de ser nómica; si en la inferencia interviene esencialmente una regularidad accidental, eso "contamina" de accidentalidad toda la inferencia y la deslegitima como explicación. E.rplicatividad y accidentalidad son conceptos excluyentes. Estamos dispuestos a considerar una inferencia como explicativa, esto es, como "haciendo al explanandum esperable", en la medida en que consideremos que las generalidades quz intervienen son nórnicas. El patrón general del análisis de Hempel es pues el siguiente:
(1) El explanans contiene esencialmente al menos una ley, y todos los hechos generales que contenga esencialmente deben ser leyes. (2) Si el explanandum es un hecho particular, el explanans contiene también esencialmente al menos un hecho particular. Los hechos particulares que contiene el explanans son las condiciorzes antecedentes. (3) La relación de explicación es una relación de inferencia lógica, el explanandum se infiere del expldnans. Éste es el núcleo de lo que se conoce como modelo de cobertura legal ('covering law model'j. La idea que lo articula es la de la explicación como esperabilidad nómica ('nomic expectability'), entendiendo 'esperabilidad' en sentido inferencial. El nombre que hemos dado a este análisis, 'cobertura legal inferencial', resume pues sus rasgos característicos generales. Este patrón general se desarrolla despuSs de modo específico en los diversos tipos de explicación. Los tipos de explicación específicos se caracterizarán por determinadas condiciones adicionales refuentes a cada uno de los tres elementos de la explicación: que el explanandum sea particular o general: que el explanans incluya o no hechos estadístico-probabilistas; y que la relación explicativa inferencia1 sea deductiva o inductiva. Las diversas combinaciones posibles dan lugar a cuatro tipos de explicación: el nomológico deductivo particular, el nomológico deductivo general, el deductivo estadístico y el inductivo estadístico (como veremos, se excluyen las combinaciones con (i) infe-
228
FüSD.43fElTOS DE FILoSOFL\ DE LA CIENCIA
rencia inductiva sin premisas generales probabilistas y (ii) inferencia deductiva con conclusión particular y alguna premisa general probabilista). Antes de pasar a discutir cada uno de estos tipos es preciso hacer dos obsenraciones. En primer lugar, aquí hemos presentado las condiciones generales (1)-(3) en términos de hechos pero. según Hempel, dada la naturaleza argumentativa de la explicación lo apropiado es presentarlas referidas a eitiu?ciados:explanandum y explanans son enunciados o conjuntos de enunciados. Aunque Hempel sigue casi siempre esta práctica, a veces también habla como si la relación explicativa se diera directamente entre lo que los enunciados expresan, los hechos o, para ser precisos, las proposiciones. Hempel prefiere hablar de enunciados porque le resulta más conveniente para su caracterización de las leyes, pero lo mismo podría hacerse, si se formula con cuidado, hablando de hechos. Esta cuestión no es de momento demasiado importante mientras no tomemos en consideración los aspectos intensionales de la explicación que mencionamos más arriba. Aquí usaremos indistintamente ambas versiones, privilegiando ligeramente la primera por ser quizá más intuitiva; intuitivamente, lo que explicamos son "cosas que pasan" mediante "otras cosas que pasan", no enunciados mediante enunciados. La segunda observación se refiere a las condiciones generales adicionales que impone Hempel para considerar que una explicación es fácricameitte col-recra. Las condiciones (1)-(3) caracterizan sólo lo que es una explicacióli porel~cialo posible. En las explicaciones correctas ha de ocurrir además que el explanandum sea verdadero, que lo que explicamos sea algo que efectivamente ocurre. Eso hace a la explicación real, esto es, que no sea un mero ejercicio conceptual. Pero para que, además de ser real, sea fácricmnente correcta es preciso algo más, a saber, que el explanans sea también verdadero. Para tener una explicación correcta, el hecho que ocurre y que queremos explicar debe explicarse mediante hechos que también ocurren. Explicamos que pasa cierta cosa porque ciertas otras cosas también yasall. Como reconoce HempeJ, esta exigencia tiene algo de extraño pues descalifica como incorrectas explicaciones intuitivamente inuy buenas en cuanto se ha comprobado que parte del explanans, por ejemplo alguna ley, es falsa. Esta cuestión es en parte nominal, pero tiene también un elemento que no lo es y que se hará explícito cuando nos ocupemos más adelante de la explicación conlo unificación teórica.
2.2. EXPLICACI~N N O M O L ~ G I C ADEDUCTIVA PARTICCLAR (NDP) Éste es seguramente el tipo de explicación más usual. A él dedicaron Hempel y Oppenheim su primer trabajo y es el que ha guiado el análisis posterior. Se caracteriza por satisfacer, además de (1)-(3), estas tres condiciones adicionales: (4) El explanandum es un hecho particular. ( 5 ) Las leyes del explanans son estrictamente penerales, e.e. no son estadísticoprobabilistas. Por (2) y (4), el explanans incluye también como condiciones antecedentes determinados hechos particulares, las condiciones antecedentes. (6) La relación de explicación es la de inferencia lógica deductiva.
Se puede esquematizar este tipo de explicación del siguiente modo. El uso de minúsculas connota que el hecho (o enunciado) correspondiente es particular, la línea continua que la inferencia es deductiva (cf. cap. 2), y la letra 'L'que se trata de una ley no probabilista:
NDP
Las leyes no probabilistas L, y las condiciones antecedentes c, constituyen conjuntamente el explanans; el explanandunl e se deduce lógicamente de esas leyes y de esas condiciones antecedentes. A este esquema se ajusta nuestro ejemplo de la rotura de las cañerías: las condiciones antecedentes son el descenso extremo de la temperatura y que las cañerías de casa están llenas de agua; las leyes establecen que las bajas temperaturas congelan el agua y que, cuando se congela el agua de las cañerías, éstas se rompen; de todo ello se infiere deductivamente la rotura de las cañerías de casa, hecho que queda así explicado. Explicar un hecho particular es subsumirlo bajo una regularidad nómica, que por ser nómica lo hace, junto con las condiciones antecedentes, esperable. El esquema NDP es, según Hempel, aquél al que se ajustan todas las explicaciones de hechos particulares mediante teorías no estadístico-probabilistas. Es el modo típico en que estas teorías explican los fenómenos empíricos particulares, por ejemplo, la explicación por la mecánica newtoniana de la reaparición de determinado cometa en un lugar y momento específicos, la explicación heliocentrica de las fases de Venus, o la explicación por la mecánica relativista de la órbita anómala de Mercurio. El lector recordará que en el capítuIo 3 vimos los dos primeros ejemplos como casos de predicciones en episodios de contrastación. Esto ilustra la tesis hempeliana de la sirnetrín entre explicación y predicción. Según Hempel, la explicación de hechos particulares y la predicción tienen la misma estructura lógica, la única diferencia entre ambas es prasmática y tiene que ver con la relación temporal entre la ocurrencia del hecho particular y la construcción del argumento: "En un caso, se sabe que ya se ha producido el suceso descrito en la conclusión, y se buscan enunciados adecuados que expresen leyes generales y hechos particulares para explicarlo; en el otro, se dispone ya de estos enunciados y de ellos se deduce el correspondiente al suceso en cuestión antes del momento de su presunta aparición. [... Ésta es] la tesis de la identidad estructural (o simetría) de la explicación y de la predicción" (Hempel, 1965, $2.4). Las explicaciones son pues retrodicciones, "predicciones" de hechos conocidos; las predicciones, si llegan a confirmarse, son explicaciones "avanzadas". Ésta es la tesis de la simetría entre explicación y predicción: si abstraemos la relación temporal entre el hecho inferido y el argumento, no hay ninguna diferencia entre ambas. El modelo de explicación NDP ha sido objeto de numerosas observaciones, críticas y comentarios. Vamos a presentar ahora las principales objeciones que se le han planteado. La revisión de estas dificultades nos servirá además para hacer algunas observaciones adicionales. La mayoría de las objeciones que presentaremos ahora tienen que
ver con diversos motivos que, según los críticosl hacen que la caracterización de Hempel no se ajuste a las jntujcjones pues incluye como explicaciones inferencias que intuitivamente n o consideraríamos tales, y excluye otras que sí consideramos expiicaciones. Así, se objeta, las condiciones (1)-(3) más (4)-(6) no son ni necesarias ni suficientes. En ambos casos se i l u s ~ a]a situación con pretendidos contraejemplos. Ahora nos vamos a limitar en reneral tan sólo a presentar las objeciones; las propuestas de soluciones las examinaremos más adelante al presentar los análisis alternativos que estos problemas motivan. También dejaremos para más adelante las críticas a la idea de que las explicaciones son inferencias.
-
PI: Gerleralioaciones "esei~ciales"inesertciales. El primer problema es de naturaleza serniformal. Tal como se ha expresado, NDP tiene una consecuencia claramente indeseable: se puede explicar cualquier hecho particular mediante una ley completamente independiente del hecho, esto es, una ley sin relación alguna con las entidades involucradas en el hecho. En efecto, sea el explanandum p.ej. Pa y una ley cualquiera Vx(Ax + Bx) en la que no intervienen ni el individuo a ni la propiedad P. El siguiente argumento satisface NDP:
k ( A x + Bs) (Ac + Bc) + Pa
Es deductivamente válido, la ley ocurre esencialmente, etc. No sólo eso, sino que también es materialmente adecuado, pues si el explanandum es verdadero también lo es la segunda premisa. Pero es obvio que no se puede considerar una explicación de que a es P, pues la ley no tiene nada que ver con esas entidades. Hempel ya había advertido esta dificultad en su primer trabajo y había introducido una condición adicional que establece, aproximadamente, que las condiciones antecedentes no se deriven de la ley y del explanandum. En realidad es un poco más complicada para evitar otros casos semejantes, pero no la vamos a exponer aquí (cf. Hempel y Oppenheim, 1948, 56). Sin embargo, Eberle, Kaplan y Montague (1 961) mostraron que dicha condición no era suficiente para bloquear otros casos más sofisticados. Kaplan (1961) y Kim (1963) propusieron otras condiciones alternativas que, como Hempel reconoce, sí logran el efecto deseado (cf. su postscripruií~ de 1964 a Hempel y Oppenheim, 1948). P2: Precedencia teinporal de las condiciones unrecedentes. Explicamos la ocurrencia de un eclipse de Luna deduciéndolo de leyes mecánicas celestes y de determinadas posiciones del Sol, Ia Luna y la Tierra atztes del eclipse. Pero el eclipse se deduce igualmente de las mismas leyes y de posiciones de esos cuerpos después del eclipse, y no consideraríamos que eso constituiría una buena explicación. Para que la inferencia sea explicativa parece que las condiciones antecedentes han de ser anteriores en el tiempo al hecho a explicar.
t
l l
\
P3: Simetría. Explicamos la longitud de la sombra de un mástil en un momento dado deduciéndola de leyes de la óptica física y de la posición del Sol y la altura del mástil. Pero también podemos proceder a la inversa en la deducción, inferir la altura del mdstil de esas leyes, la posición del Sol y la longitud de la sombra, y no parece que en ese caso estemos dando una explicación de la altura del mástil. Explicamos el espectro Iumínico característico de un elemento químico por su estructura atómica, y no ésta por aquél. Hay pares simétricos de argumentos en los que lo que en uno hace de conclusión en otro hace de premisa, y viceversa, y ambos satisfacen NDP,pero sólo uno, y no el otro, se puede considerar explicativo. P4: Efectos de causa cornrín. Es una regularidad no accidental, nómica, que poco tiempo después de que un barómetro registre una caída extremadamente brusca, se sucede una tormenta en las proximidadrs. Podemos entonces infzrir la tormenta de la brusca caída del barómetro, junto con esa regularidad, pero ello no se puede considerar una explicación de la ocurrencia de la tormenta. Esta regularidad correlaciona dos efectos diferentes de una causa común, a saber, el brusco descenso de la presión atmosférica. Lo que proporciona la explicación de cierta tormenta particular es cierto descenso particular de la presión, no la bajada del barómetro. Otro caso parecido es el de las mareas. Existe una regularidad nómica (conocida desde la antigüedad) entre la intensidad de las mareas y las fases de la Luna: la intensidad es cíclica, máxima en luna llena y nueva, mínima en cuarto creciente y menguante. De esta regularidad, y de cierta fase específica de la Luna, se puede inferir (aproximadamente) la intensidad de la marea. Pero ello no es una explicación genuina, la particular intensidad de la marea no se explica por la particular forma aparente de la Luna. Ambos fenómenos están correlacionados por ser efectos de una causa común, las posiciones relativas de la Luna. la Tierra y el Sol: la variación de esas posiciones tiene como efectos ópticos las fases de Id Luna y como efectos dinámicos los cambios de intensidad de las mareas. Este tipo de casos se suelen presentar además como contraejemplos a la tesis de Hempel sobre la simetría entre explicación y predicción; podemos predecir la tormenta mediante el barómetro. o la rnarea mediante la fase lunar, pero se trata de predicción sin explicación.
P5: Irrelevancia. Supongamos que embrujamos terrones de azúcar profiriendo ciertas palabras mágicas en su presencia. Es un hecho general que los terrones embrujados se disuelven cuando se sumergen en agua, por tanto podemos inferir la disolución de cierto terrón embrujado particular a partir de su inmersión en agua y de ese hecho general. Pero esta inferencia no explica la disolución del terrón. Podemos inferir que Juan no se quedará embarazado del hecho particular de que toma pastillas anticonceptivas más el hecho general de que ningún varón que tomas pastillas anticonceptivas se queda embarazado. Pero ello no es aceptable como explicación de que Juan no se quede embarazado (en este caso el explanandum es un hecho negativo, pero ello no afecta a lo que ahora se discute). En estos casos la inferencia no es explicativa pues parte de las condiciones antecedentes, y con ello "parte" del hecho general, son intuitivamente irrelevantes para la ocurrencia del explanandum. Nótese que satisfacen plenamente NDP. Se dirá que hay algo
extraño en esos hechos generales. que no son regularidades nómicas. Pero, al menos desde la perspectiva de Hempel, no es así. Estos hechos son regularidades nómicas, no es en absoluto accidental que los terrones embrujados se disuelvan, ni que los varones que toman pastillas no se queden embarazados. Lo que de raro tienen estas "leyes" es que son en cierto sentido si~nplificables,alguna propiedad contenida en el antecedente es innecesaria, irrelevante a efectos explicativos, pues el resultado de "suprimirla" es un hecho general que también es una ley. Sin embargo, articular esta idea de modo preciso no es una tarea fácil (cf. cap. 5 $2). Nótese que estos casos también representan un contraejemplo a la identidad entre explicación y predicción, tenemos predicción pero no explicación.
P6: Explicaciones releológicas y fincioltales. Los casos anteriores son casos que se ajustan a NDP pero, por diversos motivos, no parecen poder considerarse explicaciones. Ahora ocurre lo contrario, las explicaciones teleológicas y funcionales parece que son explicaciones genuinas y que (en la medida en que explican hechos particulares) no satisfacen NDP. No lo satisfacen pues, aparentemente al menos, no se infiere el explanandum del explanans, sino que (parte de) el explanans se infiere del explanandum (y .del. resto del explanans). Explicamos el latido del corazón por su función en la circulación de la sangre; o las largas orejas de los conejos por su función en el control de la temperatura corporal; o el viaje de Rosa a Salzburgo por su finalidad de asistir a un determinado concierto. En estos casos parece que, si es que se pueden considerar inferencias, no sucede que el hecho explicado se infiere de las condiciones antecedentes, sino más bien lo contrario: del tamaño de las orejas de este conejo (y de otras cosas) se infiere determinado fenómeno particular de equilibrio térmico corporal; del viaje de Rosa (y de otras cosas) se infiere su asistencia al concierto; etc. Explicamos un hecho mediante otro que es su función o finalidad, pero parece que es éste el que se sigue de aquél y no al revés. En la última sección volveremos sobre esta cuestión que, como veremos, tiene cierta relación con la de la prioridad temporal planteada en P2. El lector habrá percibido que casi todos estos casos están relacionados de una forma u otra con la causalidad. Ello vale no sólo para P4, en cuya presentación hemos hecho ya referencia explícita a la causalidad. En P2, si se rechaza como explicativa la inferencia con condiciones antecedentes posteriores en el tiempo al explanandum es porque se considera que tales condiciones tienen que ser causalmente responsables del explanandum y que las causas siempre preceden temporalmente a los efectos. De modo parecido, en P3 se acepta como explicación sólo una de las inferencias simétricas porque la altura es causalmente responsable de la longitud de la sombra, no viceversa. En P5, determinada propiedad contenida en el antecedente de la ley se considera explicativamente irrelevante por ser causalmerzre irrelevante. Otro modo de apuntar en la misma dirección es distinguir entre regularidades nómicas y leyes, siendo éstas sólo un subgrupo de aquéllas. No toda regularidad nómica sería una ley y mientras que la nolízicidad se preserva bajo relaciones de inferencia y simetría, la legalidad no (cf. cap. 5 , $1 y $2). Estos contraejemplos dejarían de serlo si en NDP exigiéramos, dada esa diferencia, no sólo que las regularidades que intervienen esencialmente sean "no acci-
dentales", nómicas, sino que sean leyes. Los presuntos contraejemplos no serían tales
pues las regularidades involucradas (entre los descensos de barómetros y las tormentas, entre las sombras y las alturas, entre los terrones embrujados y la solubilidad, etc.) serían nómicas pero no leyes. Esta estrategia, por lo general, no es sino otro modo de apelar a la causalidad pues, en general, quien defiende la diferencia entre regularidades nómicas y leyes lo hace en términos de causalidad: las Ieyes serían aquellas generalizaciones nómicas en las que se dan las apropiadas relaciones causales entre (las ejemplificaciones de) las propiedades involucradas. Hempel, por supuesto, percibió desde el comienzo que hay.una estrecha relación entre explicación y causalidad, pero considera que el análisis de la explicación no debe hacer referencia explícita a la causalidad. Reconoce el carácter causal de muchas explicaciones y defiende que, cuando tal es el caso, eso queda incluido en su modelo mediante la referencia a las leyes, pues en tales explicaciones causales las leyes que intervengan serán de hecho causales (como típicamente ocurre con las leyes de sucesión). Pero sostiene que hay también explicaciones NDP no causales. Ello ocurre típicamente cuando se usan leyes de coexistencia, como la ley de Ohm ("en cada material, el cociente entre la diferencia de potencial y la intensidad de un conductor es constante") o la del péndulo (T = Z K ~ ( L / ~ ) ) . Respecto de esta última, por ejemplo, Hempel sostiene que nadie diría que el período de un péndulo es causado por su longitud (cf. 1965, cap; XII, 92.2). Pero ello no sólo ocurre con las leyes de coexistencia, también es dudoso el carácter causal de algunas leyes de sucesión, como la ley de caída de los cuerpos de Galileo. Ahora vamos a dejar de momento el problema tan sólo planteado, volveremos sobre él más adelante.
2.3. EXPLICACI~N NOMOL~GICADEDUCTIVA
GESERAL
(NDG)
A veces aquello de lo que se da explicación no es un hecho particular sino uno general. Explicamos determinadas leyes derivándolas de otras, en cierto sentido que hay que precisar, más generales. Por ejemplo, las Ieyes de Kepler sobre la forma y período relativo de los planetas se explican por las leyes de la mecánica gravitatoria newtoniana; la misma teoría ~ewtonianaexplica también otros regularidades nómicas, como la ley de caída libre de Galileo, o la ley que correlaciona la intensidad de las mareas con las fases de la Luna; la ley de Boyle queda explicada en la teoría cinética de los gases; etc. Cuando, como en estos ejemplos, la ley explicada es una generalización estri'ctá, no estadísticoprobabilista, Hempel denomina también estas explicaciones nomolúgico-deductivas. Aunque Hempel utiliza la misma denominación para ambas, hay que diferenciar estas explicaciones de las anteriores; las diferencias entre ellas se derivan del hecho de que en aquéllas el explanandum es particular y en éstas general (no probabilista). Es inmediato constatar entonces que las explicaciones nomológico-deductivas generales se caracterizan, además de por (1)-(3), por las siguientes condiciones adicionales: (7) El explanandum es un hecho general nómico, una ley, no estadístico-probabilista.
(8) El explanans contiene esencialmente sólo leyes no estadístico-probabilistas.
Ninguna de las leyes del explanans es el explanandum mismo. (9) La relación de explicación es la de inferencia lógica dedz4crii.a.
Se puede esquematizar este tipo de explicación, siguiendo las convenciones establecidas anteriormente, del siguiente modo:
NDG
E es la ley (no probabilista) que se deriva de las leyes explicativas L;. h'ótese que (7) excluye la posibilidad de explicar hechos generales que no sean leyes. ¿No pueden explicarse regularidades accidentales? No, pues por ser accidentales no son "esperables", esto es, explicables. Si se aceptaran como explanandum regularidades accidentales entonces podrían aceptarse también en el explanans; por tanto, en la medida en que, como vimos, haya buenas razones para exigir que todos los hechos generales que intervienen esencialmente en el explanans de una explicación sean regularidades nómicas, en esa misma medida se excluyen como explanandum hechos generales accidentales. Otra cosa es que se sostenga que no hay en última instancia regularidades accidentales, que todas las regularidades son nómicas y que el que algunas parezcan accidentales se deriva sólo de nuestro actual desconocimiento. Ésta es otra cuestión que ya tratanlos en el capítulo 5 y sobre la que no vamos a volver ahora. Pero si hay regularidades meramente accidentales, no pueden ser explicadas. Como dijimos anteriormente, accidellralidad y e-~plicarividad son conceptos excluyentes. E1 principal problema para un análisis satisfactorio de las explicaciones NDG es, como reconoce Hempel, el de ofrecer una noción precisa y adecuada de i~zclusividadque excluya los casos de autoexplicación:
P7: Autoe.~plicacióiz. En ( 8 ) se exige, además del carácter nómico del explanans, que el explanandum mismo no sea una de las leyes del explanans. De otro modo contarían como explicaciones inferencias de una ley a partir de sí misma, 10 que evidentemente es inaceptable; por supuesto que es una iizferencia válida deducir cierta ley L de ella misma, pero eso no es una explicacióiz de la ley. Ahora bien, esa exigencia resuelve el problema sólo en su versión más burda, pero esencialmente el mismo problema reaparece inmediatamente. En efecto, si el explanans contiene una ley que es la conyunción del explanandum con cualquier otra, se da también el tipo de autoderivación que no se puede considerar inferencia explicativa; por ejemplo, de la ley K A B que es la conyunción de las leyes de Kepler, K, con la de Boyle, B, se infiere deductivamente K, pero ello no explica las leyes de Kepler (cf. Hempel y Oppenheim, 1948, 56, nota 33). Ésta es según Hempel la principal dificultad para llevar a cabo un análisis satisfactorio de las expljcaciones NDG. Las explicaciones de leyes no pueden ser autoinferencias de ese ripo, y sin embargo en cierto sentido toda deducción es una autoinferencia pues la ley que se infiere "ya está" en
las premisas. Claro que no está en "esa" forma, pero determinar cuáles son las formas admisibles como explicaciones y cuáles no, no es sencillo. De hecho Hempel lo considera un problema irresuelto. El criterio debe tener que ver, afirma, con la mayor inclusividad de las leyes explicativas, como las de Newton respecto de las de Kepler, pero el problema surge de la dificultad de "establecer criterios bien definidos para la distinción de niveles de explicación o para comparar oraciones generalizadas en cuanto a su inclusividad; [la] formulación de criterios adecuados para este propósito es un problema aún no resuelto" (ibid.). Más adelante, cuando veamos el modelo de unificación teórica, vo\veremos sobre esta cuestión.
2.4. EXPLICACI~N DEDUCTIVO ESTAD~S~C,\ (DE) En la explicación NDG el explanandum es una ley que es una regularidad estrictamente general, en el sentido de no ser una ley estadístico-probabilicta. Cuando el explanandum es una regularidad nómica, pero no estrictamente general sino una ley estadística, tenemos una explicación que Hempel denomina explicación deductivo estadística. Por ejemplo, a partir de las leyes estadísticas que afirman que la probabilidad de que un varón occidental desarrolle alguna modalidad de cáncer es de 0,2 y que la probabilidad de que sea soltero es de 0,1, y del hecho, supongamos, de que ambos sucesos son independientes, se explica que la probabilidad de que un varón occidental sea soltero y desarrolle cáncer es de 0,02. Hempel afirma que estas explicaciones se caracterizan porque en ellas se deduce una ley estadística a partir de un explanans que contiene indispensablemente al menos una ley tambiín estadística, realizándose la deducción mediante la teoría matemática de la probabilidad (cf. p.ej. 1965, $3.2). Ello hay que entenderlo en el sentido de que en la deducción, y por tanto en la explicación, se usan como premisas ocultas adicionales determinados principios del cálculo de probabilidades, por ejemplo en nuestro caso el principio que afirma que la probabilidad del suceso compuesto de otros dos independientes entre sí es el producto de sus probabilidades. Hay que considerarlos incluidos en el expIanans, pues (salvo que se considere, implausiblemente, que son parte del cálculo deductivo) de lo contrario no se puede completar la deducción y la inferencia sería deductivamente inválida. Esta última observación plantea una cuestión que hemos obviado hasta ahora. Este ejemplo muestra que a veces el explanans puede incluir (quizá elípticamente) leyes matemáticas, como el principio probabilista mencionado acerca de la probabilidad de la conyunción de sucesos independientes. Pero algunas de esas leyes no pueden ser calificadas de regularidades nótnicns. Quizá la del ejemplo sí sea una regularidad nómica, si es que la teoría de probabilidades es empírica. Pero podría ser que la inferencia explicativa use como premisas p.ej. principios matemáticos del análisis, que parece difícil calificar de nómicos. En ese caso se estaría incumpliendo la condición que venimos imponiendo de que todos los hechos generales que intenienen esencialmente en el explanans sean regularidades nómicas. Hay que matizar pues esa exigencia y limitarla a los hechos empíricos; esto es razonable, pues las leyes matemáticas no se pueden calificar de regularidades
236
F U N D A L I E A ~DE S FILOSOF~.+DE LA CIENCIA
nómicas, pero tampoco de accidentales. La condición es pues que todo hecho general empírico que intervenga esencialmente en el explanans debe ser nómico. La idea es que el explanans no puede contener esencialmente ninguna regularidad e~npiricaaccidei~ral, pues ella contaminaría, por así decir, de accidentalidad el resto y m i n a r í a su pretendido carácter explicativo. De lo dicho se desprende que las explicaciones deductivo-estadísticas se caracterizan por satisfacer, además de (1)-(3), las siguientes condiciones adicionales: (10) El explanandum es una ley estadística. (1 1) El explanans contiene esencialmente sólo hechos generales. Estas regularidades (cuando no sean puramente matemáticas) son todas nómicas, y al menos una de ellas es una ley estadística (diferente del explanandum mismo). (12) La relación de explicación es la de inferencia lógica deductiva. Que el explanans contenga esencialmente al menos una ley estadística es necesario si el explanandum es estadístico y la inferencia deductiva, pues de regularidades no probabilistas no se deducen regularidades probabilistas. Como habrá percibido el lector, el esquema que corresponde a este caso es muy parecido a NDG. En realidad las explicaciones DE y las NDG son esencialmente del mismo tipo, a saber, explicaciones en las que se explica determinada regularidad nómica mediante otras deduciendo aquélla de éstas. Si usamos la letra 'P' para connotar que la correspondiente ley del explanans es probabilista, entonces podemos esquematizar este tipo de explicación del siguiente modo (nótese que, aunque no lo connotemos explícitamente en el esquema, el explanandum es ahora un hecho general probabilista):
L,, L" P,, Pk ,.s
e..,
En la explicación NDP explicamos un hecho particular subsurniéndolo bajo ciertas leyes, donde por subsunción se entiende la derivación deductiva del hecho a partir de las leyes y de determinadas condiciones antecedentes. En ese sentido la ocurrencia del hecho particular se muestra (nó~nicamente)esperable o predecible: el explanandum se predice (si todavía no ha ocurrido), o se hubiera podido predecir (si ya se ha producido), a partir del explanans. Ésta es la razón de la identificación que (salvo a efectos pragmáticos) hace Hempel entre explicación y predicción. En las explicaciones NDP la esperabilidad es total, pero el núcleo de esta idea, la explicación de hechos particulares como esperabilidad nórnica, se puede aplicar también según Hempel a casos en los que la esperabilidad no es
meramente accidentales no. Que esta moneda sea dorada no se explica porqce estuviera en hTocheviejade 1990 en el bolsillo derecho de los pantalones de Quine y que en tal ocasión el 95 % de las monedas en ese bolsillo fuesen doradas (aunque c.í se infiere inductivamente de ambas premisas). Las explicaciones IE se pueden esquematizar, siguiendo Ias convenciones anteriores, del siguiente modo:
Li, ..., L. ..., Pt
Pl,
Cl.
cm
--------- [J-1 , .e
e
Aquí '[I-1' denota el grado de soporte inductivo que el explanans confiere al explanandum. Nótese que en estos casos rz puede ser 0, esto es, el explanans puede contener quizá sólo leyes estadístico-probabilistas. Y en el caso más simple el explanans tiene una única ley. estadística; así, en el ejemplo del cáncer de Luis, si A es la propiedad de desarrollar cáncer de pulmón y B la de haber fumado tres paquetes diarios durante cuarenta años, tenemos el siguiente esquema: p(A/B) es próxima a 1 Ba ........................ Aa
[próximo a 11
Otro ejemplo que se ajusta a este patrón simple es la explicación de la cura de Juan de una infección por estreptococos a partir del hecho de que la inmensa mayoría de tales infecciones remite al tratarse con penicilina y de que Juan se ha infectado y se ha tratado con penicilina (cf. Hempel, 1965, $3.3). Un ejemplo de explicación IE un poco más compleja es el siguiente (ibid.). El hecho a explicar es la reducción, en 7,64 días, de una muestra particular de radón de 10 a 2,5 miligramos por desintegración radiactiva. Este hecho se explica porque: a ) la muestra es de radón, b) la probabilidad de que un átomo de radón se desintegre en 3,82 días es 0,5, c) las desintegraciones de diferentes átomos de radón son sucesos estadísticamente independientes, y 6) 10 miligramos de radón contienen un cantidad muy elevada de átomos (y, habría que añadir en el explanans, tales y cuales principios de la teoría de la probabilidad que se usan en la inferencia inductiva). Éste es el núcleo del análisis que hace Hempel de las explicaciones inductivas. Este análisis se enfrenta a muchas de las dificultades que vimos en las explicaciones NDP, o las versiones inductivas de las mismas, y además a otras específicas. Concluiremos con tres problemas principales. El primero cuestiona que la alta probabilidad sea un condición suficiente para la explicación. El segundo, que sea una condición necesaria. El tercero, la ambigüedad inductiva, lo presenta el propio Hempel y para resolverlo introduce una modificación sustancial.
1
i
i
P8: Irrelecntzcin itzd~lctiva. Es la versión inductiva del problema de la irrelevancia que vimos en las explicaciones NDP. Es una regularidad nómica que la mayoría de resfriados tratados con vitamina C remiten a la semana. De ella, junto con el hecho de que Ana tome vitamina C la primera semana de su resfriado, se infiere con alta probabilidad que su resfriado remitirá a la semana. Sin ernbarso, no se puede considerar una explicación de la cura de Ana pues la mayoría de resfriados remiten a l a semana también sin tomar vitamina C. Otro ejemplo típico es el de las neurosis. Que Pedro siguiera una terapia durante un año y que la mayoría de las neurosis tratadas con psicoterapia remiten al año implica inductivamente que la neurosis de Pedro remitiera al año, pero no lo explica, pues la mayoría de las neurosis remiten al año también sin psicoterapia. Así pues, la alta probabilidad de la inferencia inductiva no e s suficiente para obtener una explicación estadística genuina.
P9: E.rplicaciones indrtcriras con baja probabilidad. Un famoso ejemplo que ya mencionamos en el capítulo 2 (S3), y que se debe originalmente a Scriven (1959), pone en cuestión que la explicación requiera alta probabilidad. El ejemplo pretendía en principio cuestionar la tesis de la simetría entre explicación y predicción, presentando un caso de buena explicación que, dada la baja probabilidad, no se puede considerar buena predicción. Pero también presenta un problema para el análisis de la explicación inductiva que Hempel ofrecería poco después. Supongamos que el alcalde ha enfermado de paresis. Una buena esplicación de ese hecho parece la siguiente: la paresis es una forma de sífilis terciaria que se da sólo entre los individuos que no se han tratado con penicilina y han llegado al estadio latente de la enfermedad, aunque no se da en todos sino aproximadamenre en sólo un 23 % de ellos; el alcalde contrajo sífilis, no se trató con penicilina y ha llegado al esradio latente de la enfermedad. En opinión de Scriven, Salmon y otros, esto es una buena explicación, pero claramente es un mal argumento inductivo pues el soporte inductivo que confiere el explanans al explanandum es muy bajo. Hay explicación sin alta probabilidad, sin alta esperabilidad. Así pues, la alta probabilidad no parece tampoco una condición necesaria para la explicación estadística.
PlO: Ainbigiieliad inductivn. Hempel mismo menciona una dificultad del esquema básico IE que obliga a una modificación sustancial del mismo. Es el problema de la ainbigiiedad esplicativn de las explicaciones IE. El problema se deriva de ün hecho que ya comentamos en el capítulo 2 ($3). En esencia, consiste en que podemos tener dos explanans ambos verdaderos de los que se infieren con alta probabilidad inductiva dos explananda contradictorios. Supongamos que la probabilidad r de tener la propiedad A si se tiene la propiedad B, p(A/B) = r , es muy alta, próxima a 1; que la probabilidad s de ser A si se es C, p(AIC) = s, e s muy baja, próxima a O, de donde la probabilidad p(no-A/C) de no ser A si se es C es 1-S, por tanto muy próxima a 1; y que cierto individuo a tiene a la vez las propiedades B y C. Consideremos entonces los siguientes argumentos:
FL'ND;\b!E3TOS DE FILOSOF~ADE LA CIENCIA
Estos argumentos son inferencias inductivas válidas, y satisfacen además las condiciones para ser explicaciones IE. Parece entonces que puede haber explicaciones adecuadas con explanantes ambos verdaderos y explananda contradictorios. Volvamos a] ejemplo de Hempel de la infección con estreptococos. Si la infección es de una cepa especial resistente al medicamento entonces la inmensa mayona no se cura. Aquí, A es curarse, B es "infectarse (0 y tomar penicilina (P)" y C es "infectarse con la cepa especial (E) y tomar penicilina (P)". Supongamos que Juan tiene una infección por estreptococos y que toma penicilina, pero que los estreptococos son de la cepa especial. Entonces podemos explicar tanto que se cure como que no se cure. Así es como lo reconstruye Hempel (cf. 1965, §3.4.1), aunque sería más apropiado, como hace Salmon (1989, 92.4.2), considerar que B es infectarse y tratarse con penicilina y que C es B & H, siendo H que los estreptococos son de la cepa especial, pues eso parece una especificación a añadir a B. Este tipo de casos, en los que condiciones adicionales van invirtiendo la probabilidad, es muy común. La probabilidad de que no te moleste la policía en Barcelona es alta; pero si eres norteafricano, pasa a ser baja; si, aunque seas norteafricano, vas elegantemente vestido y con un acompañante europeo, vuelve a ser alta; pero si el acompañante tiene aspecto de drogadicto, se vuelve a invertir; etc. Conviene señalar, sin embargo, que el problema de la ambigüedad no se limita a estos casos, puede darse con condiciones no acumulativas; por ejemplo: la probabilidad de que un fumador de más de tres paquetes diarios muera antes de los ochenta años es alta; la probabilidad de que alguien con dieta equilibrada y que practica deporte asidua y moderadamente muera antes de esa edad es baja; Juan fuma esa cantidad, y también lleva una dieta equilibrada y practica deporte; tenemos dos explicaciones E con premisas compatibles de hechos contradictorios. Nótese que el problema no es que puede haber argumentos inductivos válidos con conclusiones contradictorias. Eso también pasa con los deductivos. El problema es que puede haber argumentos inducti\ios válidos con conclusiones contradictorias y tales que laspreinisas de ar?zbosson verdaderas. Eso no puede suceder con los deductivos, pues dos grupos de premisas de las que se deducen conclusiones contradictorias no pueden ser verdaderas a la vez, son también contradictorias. Esto no es un problema para las i~zfelmzcias inductivas en cuanto tales, pues es previsible que ello ocurra dado su carácter inductivo. En cambio es un problema si queremos considerar tales inferencias explicaciones inductivas, pues la noción de explicación excluye, a juicio de Hempel, que dos grupos de hechos puedan ser simultáneamente verdaderos y explicar cosas contradictorias. Podría argüirse que el supuesto problema no es realmente tal, pues de las dos explicaciones sólo una puede ser una explicación real en el sentido precisado más arriba, a saber, sólo en una el explanandum es verdadero, ocurre efectivamente. Pero esta escapatoria no es muy satisfactoria. El problema no es que haya de hecho explicaciones compatibles de hechos "que ocurren" incompatibles; ése no sería un problema pues no hay tales pares de hechos. El problema es que podría haber explicaciones compatibles de hechos "posibles" que L
fuesen incompatibles. Y eso parece un problema genuino independientemente de que por supuesto sólo pueda ser verdadero uno de los dos explananda. La solución de Hempel consiste en imponer un requisito adicional para poder considerar explicativa una inferencia inductiva. Como la ambigüedad se debe a que una explicación introduce información relevarrtr nueva respecto de la otra, la idea es imponer alguna constricción al respecto. La alternativa más radical es imponer el requisito de evidetzcia total (o de los eleinetttos de juicio rotales) a saber, que la inferencia sea tal q u e no haya evidencia disponible adicional que cambie el grado de apoyo inductivo. Aunque inicialmente Hempel pensó en esta alternativa (cf. Hempel, 1962), en seguida se dio cuenta de que es excesiva (1965, n. 73). Si se exige que el explanans contenga toda la evidencia relevante disponible, y puesto que a menudo el explanandum no sólo es verdadero sino que se sabe que lo es, entonces el explanandum mismo formará parte de la evidencia en el momento de la explicación y debería por tanto incluirse también en el explanans. Esto sería fatal pues convertiría la inferencia en deductiva, y ni siquiera en el modelo recogido en NDP (puesto que no se usaría esencialmente ninguna ley), se inferiría el explanandum trivialmente de sí mismo. Esta alternativa tendría pues como consecuencia el incumplimiento de una condición básica de toda explicación, tanto deductiva como inductiva, a saber, que en el explanans intervenga esencialmente alguna ley; por tanto, de exigirse, implicaría que no hay explicaciones IE. Hempel impone una condición más débil sobre la información disponible en el momento de la explicación, el reqciisito de mrí-cima especificidad (RLME).Sea K el conjunto de hechos aceptados (incluyendo sus consecuencias lógicas) en el momento de la explicación. El problema de la ambigüedad se da cuando K tiene subconjuntos que dan alto apoyo inductivo a conclusiones contrarias, lo que sucede básicamente cuando hay leyes p(A1B) = r, p(AIC) = s tales que r es cercano a 1, s es cercano a O, y la evidencia contiene tanto Ba como Cn. La idea es entonces no considerar explicativas estas inferencias inductivas en esa situación cognoscitiva. El RblE establece aproximadamente lo siguiente (cf. 1965, $3.4.2). RME Sea S el explanans, que incluye la ley p(A1B) = r y el hecho Ba: Si S A K implica que a pertenece también a alguna otra clase (tiene también alguna otra propiedad) D que es subclase de B (e.e. D = B & E, para alguna propiedad E), entonces S A K implica p(A1D) = p(A1B). Esto es, la clase de referencia B es, relativamente a K, (episté~nicamente)homogélzea; según el conocimiento expresado en K, B no contiene subclases en las que la probabilidad de ser A varíe respecto de la que se da en B. De otro modo: B no tiene, según K, particiones o especificaciones relevantes, todas las particiones que podamos hacer añadiendo otras propiedades a B son, según la evidencia disponible, estadísticamente inelevantes a efectos de qué sucede con A. Es en ese sentido que el explanans contiene toda la información relevante, el resto de información disponible es irrelevante a efectos explicativos, añadirla no cambia las cosai por lo que al hecho a e.rplicar se refiere. Ésta es la condición que va a exigir Hempel. Una inferencia inductiva se considera
232
FCNDARIEXTOS DE FILOSOFL~ DE LA CIENCIA
racionalinente aceptable coino explicación en la siriración cognosciti\~a represenrada por K si (además de las condiciones anteriores) satisface Rh4E. Es sencillo ver que esre requisito bloquea los casos de ambigüedad, que descarta las explicaciones intuitivamente insatisfactorias y preserva, en principio (cf. iitfra), las intuitivamente aceptables. El nuevo requisito es claramente violado en esos casos especiales en los que la sucesiva inclusión de nuevas propiedades en el antecedente de la ley probabiljsta provoca inversiones sucesivas de Ia probabilidad. Pero no sólo eso, es fácil ver que RME también bloquea los casos más generales. Supongamos que queremos explicar Aa a partir de Ba y de la ley p(A1B) = r. Relativamente a cierto K,tenemos que p(A/B) = r es cercana a 1, y además que para cierta propiedad C, p(AIC) = s es cercana a O, y que conjuntamente con Bu ocurre también Ca. Si se cumpliera RME, y puesto que de K se sigue Ba A Ca, tendríamos entonces tanto p(A/B) = p(AIB & C)como p(AIC) = p(AIB & C), de donde se sjgue p(A1B) = p(AIC), lo que es imposible en la situación supuesta. Así pues, ese tipo de situaciones, las que provocan los problemas de ambigüedad, no pueden satisfacer M E . Conviene notar que RME elimina la ambigüedad en un sentido todavía más general, no explicitado por Hempel. En efecto, la prueba anterior muestra que dos inferencias inductivas válidas que utilicen, respectivamente, las leyes p(A1B) = r y p(AIC) = S, siendo tanto r como S cercanos a 1, no pueden satisfacer RME si r y S son diferentes. Esto es, si hay dos inferencias inductivas alternativas del mismo hecho, ambas con elevada pero diferente probabilidad, ninguna de ellas puede considerarse racionalmente aceptable como explicación. En efecto, ninguna puede satisfacer RME pues éste exige (ya que a partir de K tenemos Bu A Ca) tanto p(A1B) = p(A/B & C)como p(AIC) = p(A/B & C), lo que es imposible si p(A1B) y p(AIC) son diferentes. Eso deja todavía cierto problema de ambigüedad a nivel más profundo, a saber, qué hacer en caso de que haya dos buenas alternativas inductivas que apelen a diferentes leyes (y por tanto a diferentes condiciones antecedentes) que asignan el mismo alto grado de probabilidad. Estos casos satisfarían RME, por tanto alízbas inferencias contarían como explicaciones racionalmente aceptables, por lo que se daría una situación de indeterminación explicativa. Aunque entonces no lo mencionamos, lo mismo ocurre con las explicaciones deductivas NDP. La cuestión de fondo aquí es en qué medida se da verdadera indeterminación. Se dará verdadera indeterminación en la medida en que los dos explanantes a que se apela sean verdaderamente diferentes, esto es, no estén nómicamente conectados. Las dos alternativas pueden ser sólo apareilfelneitre diferentes si una ley se sigue de la otra o ambas se siguen de una tercera. Esto vuelve a plantear las relaciones entre explicación y causalidad y, con ello, Ja adecuación del análisis de la explicación como mera esperabilidad nómica. Por último, y como señala el propio Hempel, RME introduce una asimetría fundamental entre las explicaciones 1E y las NDP pues tiene el efecto de relativizar epistérnicamente las primeras. Una inferencia inductiva es o no una explicación inductiva, no sin más, sino sólo relativame~ztea cierta situacióiz cogiloscitiva K. Por tanto, en estas explicaciones no interviene sólo e1 explanandum, el explanans y la relación explicativa, interviene además un cuerpo de evidencia disponible K: S explica e relativamente a K. Hempel episténzica de la eqlicación estadenomina esta característica la esencial relati~~izació)~ dística. Sobre esta cuestión volveremos más adelante.
I
I
1 j
1
ir z
+ i
3
I 1
1I
3. ReIevancia estadística El ejemplo de la paresis cuestiona que la elevada probabilidad sea una condición necesaria de las explicaciones estadísticas. Además de Scriven, otros autores como Jeffrey, Greeno, Salmon y Railton plantzaron críticas parecidas y desarrollaron sus propias propuestas. Jeffrey (1969) defiende que cuando un mecanismo estocástico da lugar a resultados con diferente probabilidad, unos muy probables y otros muy poco, comprendemos ig~talla ocurrencia de los probables que la de los improbables. Greeno (1970) desarrolla una teoría informacional de la explicación estadística centrada en el concepto de transmisión de información, analizado en términos de relevancia estadística. Según estos autores, las explicaciones estadísticas de sucesos particulares no son inferencias inductivas. Quien ha desarrollado una alternativa más elaborada en esta línea ha sido W. Salmon en una serie de trabajos iniciados en los años setenta (1970, 1971, 1977, 1978). Otra línea alternativa es la de Railton (1978, 1980), quien defiende que hay explicaciones de sucesos con baja probabilidad, pero a la vez que esas explicaciones sí son en parte inferenciales. Una explicación de un hecho probabilista particular consta de a ) una inferencia dedttcriva de que el hecho tiene cierta probabilidad, y b) un addendum que establece que el suceso ha ocurrido. La explicación contiene por tanto una inferencia, aunque no una inferencia inductiva que concluye con alta probabilidad el hecho, sino una inferencia deductiva que concluye que el hecho tiene determinada probabilidad, para lo cual no importa que ésta sea alta o baja. No vamos a examinar aquí los detalles de esta alternativa. Vamos a centramos en el análisis que más influencia ha tenido, el de Salmon, conocido como modelo de la relevancia estadística ('statisrical relevance'). La idea básica de este nuevo análisis es que, para tener una explicación estadística satisfactoria, las condiciones antecedentes no deben, con ayuda de una ley, hacer altamente probable el explanandum, sino que simplemente deben ser un factor estadísticamente releva~ztepara el explanandum. Por factor estadísticamente relevante se entiende un factor que modifica la probabilidad del suceso, e.e. tal que las probabilidades del suceso tomando en cuenta el factor y sin tomarlo en cuenta son diferentes. Si llamamos probabilidad anterior a la probabilidad sin tomar en cuenta el factor, y probabilidad posterior a la probabilidad tomándolo en cuenta, un factor es estadísticamente relevante si marca rtrza diferencia entre las probabilidades anteriores y las posteriores. Así, por ejemplo, explicamos la paresis del alcalde apelando a su sífilis latente no tratada pues ese factor es estadísticamente relevante, aunque no haga muy probable el suceso. Veamos las principales nociones con cuya ayuda se articula esta idea (cf. p.ej. 1984, cap. 2, y 1989, $3. l). El explanandum, según Salmon, no es simplemente del tipo "a es A", p.ej. que Peter es delincuente. La pregunta no es "¿por qué a es A?" sino "¿por qué a, que es B, es también A?", ''¿por qué Peter, un joven californiano, es delincuente?". La clase (o propiedad) B es la clase de referencia, y la explicación consiste en identificar un factor C que, en esa clase de referencia, es estadísticamente relevante para ser A, p.ej. "Peter, además de ser joven californiano, es un inmigrante ilegal", donde ser inmigrante ilegal es, entre los jóvenes californianos, estadísticamente relevante para ser delincuente (ahora identificaremos propiedades, clases, atributos y factores).
+
244
FUSDAMEXTOS DE FILOSOF~A DE LA CIESCIA
En la explicación se usa una cierta partición de la clase de referencia. Una partición es una subdivisión de esa clase en subclases no vacías excluyentes y que conjuntamente agotan la clase de referencia. El ejemplo dado es incompleto porque no se ha especificado la pmición. Puede ser que la clase de los jóvenes californianos se haya partido en dos, inmigrantes ilegales (BI) y no inmigrantes ilegales (B:); o en tres, inrnigrantes ilegales (B,), inrnigrantes legales (Bz) y no inmigrantes (B3). Otra partición, con otros atributos, seda: drogadicto de clase alta (8,). drogadicto no de clase alta (B-), no drogadicto y de clase alta (B3),y ni drosadicto ni de clase alta (BJ; otra estaría formada por las seis subclases resultado de combinar ser varón o ser mujer con ser de clase alta o ser de clase media o ser de clase baja. A las subclases ( B & B;) de una partición se las denomina celdas. Una partición de B es relevante respecto de cierto atributo A (A-releila~zte)si la probabilidad p(A1B & B,) es diferente en cada celda. Una partición de B es homogénea respecto de cierto atributo A (A-hoimgéitea) si sus celdas no tienen particiones A-relevantes, esto es, si no es posible subdividir Ias celdas A-relevantemente. La idea es que una partición de B es A-homogénea si no podemos refinarla introduciendo nuevos factores relevantes para A. La homogeneidad es epistéinica si no cortoceinos tales nuevos factores, es objetiva si no Izay tales factores. Así, la partición de jóvenes califomianos en inrnigrantes ilegales y no inmigrantes ilegaIes es delincuencia-relevante, pero no es ni objetiva ni epistémicamente delincuencia-homogénea. pues hay factores, y los conocemos, que la refinarían delincuencia-relevantemente(p.ej. renta anual, drogadicción, situación laboral, etc.). Con estos conceptos, Salmon puede formular su análisis de modo preciso. Por lo dicho hasta aquí, y por los ejemplos, cabría esperar que la propuesta consistiera en sustituir la elevada probabilidad por la relevancia estadística positiija, esto es, el explanans no tiene por qué hacer inuy probable el explanandum, basta con que lo haga más probable. La sífilis latente no tratada no hace miqi probable la paresis, pero sí la hace nzás probable que su ausencia; conocer ese factor positivamente relevante basta para comprender el hecho. Aunque al principio Salmon pensó su alternativa en estos términos, al desarrollarla llegó a la conclusión de que "no se requiere relevancia positiva, la relevancia negativa puede tener también alcance explicativo ('explanafoly ilnpol-t')" (Salmon, 1989, p. 67; como comentaremos más adelante, esto es parcialmente confundente). Las explicaciones estadísticas se caracterizan pues por las siguientes condiciones. (16) El explanandum es un hecho singular que establece que cierto individuo que
(P
pertenece a cierta clase de referencia B tiene cierto atributo A: "a, que es B, es también A". (17) El explanans consta de: (i) la probabilidad anterior p(AI3) = r; (ii) una partición B & Bi, B & Bz, ... de B, junto con las probabilidades posteriores p(AIB & BI) = ri,p(A1B & B:) = rz, ...; (iii) el supuesto de que la partición es A-relevante y A-homogénea; (iv) la condición antecedente de que a tiene además determinada propiedad Bk,e.e. que pertenece a una determinada celda B & Bi de la partición. Los hechos estadísticos relativos a las probabilidades anteriores y posteriores son generalizaciones nómicas, leyes naturales.
(18)
La relación explicativa es la de relevancia estadística: el explanas explica el explanandum syss p(AIB & Bk)# p(A/B).
Como se ve, éste es también un modelo de cobertrtra legal, se explica un hecho particular apelando a otros hechos particuIares y a ciertas hechos generales que son leyes naturales. Además, se impone un requisito equivalente al R i i E de Hempel, a saber, que el atributo Bk que usa el explanans no se pueda especificar más de modo relevante para la ocurrencia del explanandum. Puesto que la homogeneidad de la partición puede ser epistémica u objetiva, una explicación se considerará adecuada objetiva o epistémicamente en función del tipo de homogeneidad que satisfaga la partición del explanans. Aunque no podemos realizar explicaciones más que apelando a lo que conocemos, lajfinaliclod de la ciencia es proporcionar explicaciones objetivamente adecuadas. Por último, aunque de cobertura legal, éste no es un modelo inferencial. Las explicaciones no son argumentos. Propiamente, no son argumentos ni las explicaciones estadísticas, ni tampoco las que usan leyes no estadísticas y que Hempel reconstruía como inferencias deductivas. Cuando se usan leyes no estadísticas, lo que ocurre simplemente es, en términos de Salmon, que la partición relevante y homogénea contiene únicamente dos celdas y que la probabilidad posterior de la celda destacada es 1 y la de su complementaria es O (esto se deriva de que, por un lado, Vx(Bx 4 Ax) implica p(A/B) = 1 y p(no-AIB) = O; y por otro lado también implica Vx(Bx A ... +Ax), haya lo que haya en '...', y por tanto que p(AIB & ...) = 1, haya lo que haya en '...', de donde la partición homogénea contiene sólo las celdas de B y de no-B). En este caso, a diferencia de las explicaciones inductivas, no hay mucha diferencia en considerarIas así o "a lo Hempel". Salmon reconoce que la objeción más inmediata a que se enfrenta su análisis es la de que las meras relaciones estadísticas no explican nada, como sugerían los ejemplos del resfriado (irrelevancia) o el barómetro (causa común). Pero, en su opinión, justamente aquí se manifiestan los beneficios de su análisis, pues no sólo acomoda las explicaciones con baja probabilidad del explanandum sino que excluye casos como esos con alta correlación estadística pero no explicativos. Los casos de irrelevancia quedan claramente excluidos pues en ellos no se da la relación explicativa de relevancia: la probabilidad anterior p(AI3) (curarse, si se ha estado resfriado una semana) y posterior p(AIB & C) (curarse, si se ha estado resfriado una semana y se ha tomado vitamina C) son la misma. Pero también quedan excluidos los casos de causa común, como el del barómetro. Veámoslo. Sea la clase de referencia B los acaecimientos que ocurren en el entorno de casa, y las propiedades A "ser una tormenta", C "ser una bajada brusca del barómetro" y D "ser una bajada brusca de la presión atmosfgrica". La partición no puede ser sólo B & C y B & no-C; ésta no es una partición homogénea pues no contempla el factor adicional D. la bajada de la presión, q u e permite refinarla A-relevantemente. Pero si introducimos D, entonces C se toma irrelevante pues la probabilidad de la tormenta dada la b ~ j a d ade presión no varía porque el barómetro baje o no. Tenemos pues que p(AIB & C & D) = p(AIB & D) = p(AIB & no-C & D), y por tanto, si la partición incluye C (y no-C) entonces no es A-relevante pues hay dos celdas (la de C y la de no-C) con las mismas probabilidades posteriores. Así, C no puede entrar en la explicación dada Ia presencia de D.
246
FL'SDiiblEhTOS DE FILOSOFLXDE LA CIENCIA
Éste es el núcleo de la idea que Salmon reconstruye técnicamente de modo preciso mediante la noción de desplacai~iieiito('screeitiiig ofJJ, literalmente "tapar"). NO vamos a ver los detalles, pero la idea es la apuntada: D desplaza C en relación con A ea el sentido de que lo convierte en irrelevante. Se podría objetar que entonces tambiég se puede presentar la situación a la inversa, como si la bajada del barómetro desplazara la de la presión en relación con la tormenta. Salmon rechaza esta posibilidad aduciendo que, al menos en casos como éste, la correlación entre el barómetro y la tormenta no es exactamente igual que entre la presión y la tormenta. Por ejemplo, es posible que el barómetro a veces funcione mal, esto es, que a veces baje sin que baje la presión o no baje aunque baje la presión, sin que ello afecte para nada a la ocurrencia de la tormenta. Salmon tiene razón que en ese caso C no desplaza D respecto de A, pero hay que advertir que esa salida no vale en casos en los que las correlaciones estadísticas entre la causa y cada uno de sus efectos sean exacfa~nerzfelas rnismas (p.ej. que los barómetros siempre funcionaran bien, o que las "tormentas funcionaran mal" en las mismas ocasiones que los barómetros). Ésa es al menos parte de la motivación de este tipo de ejemplos, y esa parte queda sin resolver. Durante un tiempo, Salmon pensó que podía articular su concepción sin usar explícitamente conceptos causales, que podía capturar los conceptos causales mediante los estadísticos (cf. 1971). Ya hemos visto cómo aborda algunos contraejemplos "causales" a la teoría de Hempel mediante su aparato de particiones. relevancias estadísticas y desplazamientos. Sin embargo, como consecuencia de dificultades como la apuntada al final del párrafo anterior (cf. 1984, caps. 2 y 6), acaba desistiendo de esa idea y se convierte en uno de los principales defensores de los análisis directamente causales. Las relaciones de relevancia estadística seguirán siendo de interés, pero sólo como indicios o síntomas de las relaciones causales. Esta evolución es coherente con uno de los aspectos más controvertidos de su análisis, la caracterización de la relación explicativa como mera relevancia estadística, sin exigir que la relevancia sea positiva. ¿Podemos explicar que M. Thatcher, que es inglesa, haya sido Primera Ministra apelando a que es mujer? Quizá SaImon proteste y diga que la partición involucrada no es homogénea, pero ésa no es la cuestión. ¿Podemos explicar que John sea presidente de una multinacional apelando a que es hispano, inmigró ilegalmente, sus padres eran alcohólicos, sus hermanos drogadictos, vivió en el peor barrio de Los Ángeles, no fue a la escuela, estuvo en la cárcel, y añadiendo tantos factores negativamente relevantes como haga falta hasta que la celda resultante lo sea de una partición homogénea? Salmon insiste en que los factores negativos contribuyen a la comprensión tanto como los positivos. Cuando precisa algo esta idea, recurre a las sugerencias de Jeffrey sobre los mecanismos causales estocásticos (Salmon, 1989, p. 67). o a las de Humphreys sobre causas propiciariisas y resistivas ('contributing a ~ t dcounteracring causes', Salmon, 1984, p. 46; cf. más adelante sec. 5). Si se puede articular esta idea, será seguro en términos causales, no meramente estadísticos. Pero aun así no parece claro que se pueda explicar un hecho recurriendo como condiciones antecedentes sólo a causas resistivas, y eso es lo que permitiría la versión causal de la condición (17) de Salmon si, como él hace, exige sólo que la probabilidad posterior sea diferente a la anterior, no que sea mayor. Quizá la idea de Hempel de que el explanans hace total o altamente esperable el explanan-
dum es discutible, pero de ello no se sigue que explicación y esperabilidad no tengan nada
que ver entre sí. La presencia del explanans debe hacer al menos más esperable al explanandum que su ausencia.
4.
Pragmática de la explicación
En los análisis vistos hasta aquí, la explicación es independiente del contexto pragmático, es algo que se da o no en virtud de que entre ciertos hechos se dé o no una relación objetiva. Una posible excepción es el análisis que hace Hempel de la explicación estadística particular, pues las explicaciones IE están, debido al principio RME, esencialmente relativizadas al contexto cognoscitivo. Sin embargo, esta relativización al contexto es en cierto sentido débil pues el contexto cognoscitivo es demasiado "rígido" en cada momento, el conjunto de creencias aceptadas se puedz considerar (aunque vago) aproximadamente estable en los diversos contextos científicos en un momento dado. Vamos a considerar ahora un análisis de la explicación según el cual ésta es dependiente del contexto en un sentido mucho más radical, depende de elementos pragmáticos, como deseos e intenciones, que varían mucho más fuertemente de contexto a contexto. Sólo así, según los proponentes, se puede dar cuenta de los problemas que hemos venido discutiendo. Los principales autores que defienden este enfoque pragmático son Bromberger, Achinstein y van Fraassen. Bromberger (cf. 1962, 1966) realiza un análisis lingüístico del término 'explicar' como verbo de logro (frente a verbos de estado, p.ej. 'conocer', y de acción, p.ej. 'pasear'). A partir del estudio de la lógica de las preguntas "¿por qué?", establece las características que debe tener una respuesta para ser considerada una explicación adecuada. Achinstein (cf. 1983, 1984) desarrolla una teoría ilociiciorznria de la explicación. Explicar, como prometer o mentir, es un acto ilocucionario (en el sentido de J. L. Austin), un acto de habla cuyo logro depende de las intenciones del hablante. La misma proferencia con el mismo contenido proposicional, p.ej. 'anoche John bebió mucho', puede ser una explicación, proferida por el médico con la intención de explicar la enfermedad de John, o no ser una explicación, proferida por su mujer sin esa intención, p.ej. con la intención alternativa de recriminarle. No vamos a presentar ni siquiera superficialmente estos análisis, nos limitaremos a examinar las Iíneas generales del que más influencia ha tenido, el de van Fraassen (cf. 1977, 1980, cap. 5). Van Fraassen elabora su análisis pragmAtico de la explicación en conexión con los trabajos de Bromberger, la propuesta de B. Hansson (1974) sobre los elementos de contraste y la lógica erotética de Belnap (cf. Belnap y Steel, 1976), junto con una lectura particular de la teoría aristotélica de las cuatro aitíni. Un elemento central de su análisis, que atribuye a B. Hansson, es la idea de clase de contraste. Las explicaciones son respciesrns a P-pregcinras (recuerde el lector que una P-pregunta es una pregunta ''¿por qué?') y toda pregunta de ese tipo lleva asociada. explícita o implícitamente, una clase de contraste sin la cual no se pregunta propiamente nada. La oración interrogativa '¿por qué fue Juan a la fiesta?' puede expresar preguntas
248
FLi\\'D,4'\1E>TOS DE FILOSOFL~ DE LA CIENCIA
diferentes, p.ej. a ) "¿por qué fue Jzran a la fiesta?', o b) "¿por qué fue Juan a la fiesta?". En el primer caso se pide una razón de que fuera Juan, y no otra persona, a la fiesta; en el segundo, se pide una razón de que Juan fuera a la fiesta y no a otro lugar. Ambas son presuntas diferentes y requieren respuestas diferentes. Una P-pregunta. por tanto, debe incluir (aunque usualmente quizá sólo de modo implícito determinado por el contexto), una clase de alternativas frente a las que se contrapone el hecho por cuya razón se inquiere. La forma explícita de una P-pregunta es entonces la siguiente: ''¿por qué a, contrariamente a pl, p2, ...?". Van Fraassen denomina a a el reina de la presunta, y a la clase X = { a ,Di, P?, ...) de todas las alternativas, incluido el tema, clase de contraste. El tema y la clase de contraste no bastan, sin embargo, para identificar completamente una P-pregunta. El motivo es que incluso fijada X, puede haber vanos tipos de respuesta dependiendo de qué relación se considere en ese contexto que es la relevante para que la respuesta se considere una explicación. Por ejemplo, supongamos que pedimos razón de que Juan viniera a la fiesta contrariamente a que se quedara en casa o se fuese al cine. Una respuesta, de un tipo determinado, puede ser que Juan salió de su casa un rato antes, caminó en cierta dirección por cierta ruta, se detuvo en un portal, subió a un piso y el piso es donde tiene lugar la fiesta. Pero en muchos contextos eso, que es una respuesta, no se aceptaría como explicación. No se aceptaría porque se pedían razones de otro tiyo. Esa respuesta no es del tipo que el contexto considera relevante, mientras que sí lo sería, por ejemplo, que Juan quería ver a Luisa y sabía que Luisa iba a ir a la fiesta. Por tanto, hasta que no esté determinado el tipo de respuesta que se considera explicativa en el contexto, la pregunta está indeterminada, en cierto sentido no se sabe qué se pregunta. Van Fraassen denomina relaciólz de relevaizcia explicativa, R, a este elemento adicional necesario para identificar la P-pregunta. R es una relación que relaciona proposiciones (o hechos) y con temas junto con la clase de contraste: yR < o ~X> syss y es (considerada en el contexto) explicativamente relevante para que ocurriera a en lugar de p,, P:, ... Nótese que R sólo determina el tipo de respuesta considerada relevante, no la respuesta misma, pues hay varias respuestas que pueden ser relevantes en el contexto; p.ej. en el caso mencionado podría quizá considerase también relevante como respuesta el que Juan quiere ir al menos a una fiesta cada mes, que ese día es fin de mes y que ese mes todavía no ha ido a ninguna. Ésta es la enseñanza que van Fraassen atribuye a la teoría aristotélica de las cuatro aitiai. La teoría establece cuatro tipos característicos de relación de relevancia explicativa dependiente del contexto; en cierto contexto nos pueden interesar causas eficientes, en otro causas finales, etc. En realidad, las posibilidades son mayores pues p.ej. dentro de las causas eficientes, en un contexto se pueden considerar relevantes causas muy lejanas (p.ej. el Big-Bang) y en otro no pues sólo se aceptan como relevantes antecedentes cercanos. Así, una P-pregunta se identifica mediante el tema a, la clase de contraste X y la relación de relevancia explicati\.a R. Podemos representar entonces una pregunta Q mediante la tema Q = . X y R dependen del contexto, y aunque en algunos contextos, como los contextos científicos en períodos de ciencia normal, están fijados con bastante rigidez, en otros pueden ser muy variables. Hasta aquí los elementos que Constituyen las P-preguntas. Quedan por precisar las condiciones en que en el contexto se acepta la pregunta.
Toda pregunta Q supone ciertos presupuestos, y Q se aceptará en el contexto si tales presupuestos encajan en el cuerpo de información fáctica aceptada en el contexto. Una pregunta Q presupone tres cosas; a ) a es verdadera, b) las restantes alternativas Pi son todas falsas, y c ) existe al menos una proposición y tal que ;lR. Si K es el cuerpo de información aceptado en e[ contexto, la pregunta Q se prodrlce ('arises') en el contexto si K implica a ) y b) y no implica la negación de c). Esto es, para que una pregunta se acepte en un contexto como pregunta que requiere respuesta, la información aceptada en el contexto debe incluir que, de todas las alternativas de X , el tema y sólo él es verdadero, y además no debe excluir que exista respuesta. En caso contrario la pregunta simplemente no se produce, se rechaza. Si Q se produce en el contexto, entonces es posible, si se encuentra, darle una respuesta-explicación. Estas respuestas tienen la forma estándar "u, contrariamente a Bl, p2 ..., porque -i', que muchas veces se expresa en la forma abreviada "porque y" (y es el nzícleo de Ia e~plicación).En términos del análisis visto, estas respuestas dicen dos cosas: a ) u es verdadera, y b) yRcu. X>,e.e. y es relevante (en el contexto) para que ocurra cr en lugar de P1,P2 ... . Éste es el núcleo del análisis de van Fraassen. Nótese que aunque ios ejemplos de terna que usa son de hechos-proposiciones particulares, nada impide que los temas sean proposiciones generales, p.ej. "¿por qué las soluciones ácidas colorean el papel tornasol de rojo?", donde diferentes clases de contraste pueden contener colores alternativos, o papeles alternativos, o soluciones alternativas. Podemos esquematizar el modelo pragmático de van Fraassen del siguiente modo. (19) El explanandum es una proposición cr (singular o general). El explanandum lleva asociada una clase de contraste que incluye otras proposiciones alternativas pl, p:, ... (20) El explanans es una proposición y. (21) La relación explicativa es la de relevancia e'íplicativa R determinada por el contexto: el explanans explica el explanandum syss y es explicativamente relevante, según el contexto, para que ocurra u en vez de pi, J32, ... .
Con este análisis van Fraassen reconsidera algunos de los problemas que hemos visto en las secciones anteriores. Uno de ellos es el relativo a la expIicación de hechos poco probables, como la famosa paresis del alcalde. Para unos, tales sucesos no son explicables, para otros sí. La disputa se disuelve si tenemos en cuenta la clase de contraste: la pregunta de por qué el alcalde, en contraste con otro ciudadano general, contrajo paresis tiene una respuesta correcta verdadera: por su sífilis latente; pero la pregunta diferente de por qué la contrajo, en contrastz con otros miembros de su club de campo también sifilíticos, no la tiene (al menos de momento, cf. 1977, 311.6). Acabamos de ver que este análisis explica también los casos de rechazo de algunas P-preguntas. En cuanto a las irrelevancias, el cuerpo de información K aceptada en el contexto excluye simplemente que la vitamina C sea relevante para la cura del resfriado, o que tomar pastillas lo sea para el no embarazo de los varones, o someterse a una psicoterapia lo sea para la remisión de la neurosis. Por último, el supuesto problema de la simetría no es en realidad, según van
Fraassen, tal problema. Aunque en la mayoría de contextos es la altura del mástil la relevante para la longitud,de la sombra y no viceversa. puede haber contextos en los que la relevancia se invierta, por ejemplo si lo que se pretende construir es un enorme reloj de sol visible desde cierto lugar (1977, 8111.4; cf. también 1980, cap. 5, 93.2). Lo mismo se aplica a los restantes casos. Algunos elementos de la relativización pragmática propuesta por van Fraassen han sido generalmente aceptados. especialmente los relativos a la clase de contraste. El mayor problema lo representa la no restricción de la relación de relevancia. En un detenido estudio, Kitcher y SaJmon (1987) muestran las consecuencias a su juicio inaceptables d e esta liberalidad. Si no se impone ninguna constricción a R, podría haber un contexto en el que esa relación fuese cualquiera, con lo que clialquier proposición podría explicar cualquier . bastaría estipular R = {
bién mediante leyes naturales. Vamos a ver ahora dos nuevas propuestas, la que exipe que la relación sea causal y la que exipe que sea de subsunción o unificación teórica.
5. Esplicación y causalidsid j
i
t
f
5
$;
F*
.L
E a
'&
g $ ; i
. ;;
:I$ ,
1% íj i:
'
1 ,
'
; ft
5
En la sección 2 vimos que muchos de los problemas con los que se enfrentaba el análisis d e Hempel tenían que ver intuitivamente con la causalidad. Según muchos críticos, dicho análisis presenta como explicativas determinadas inferencia que intuitivaniente no se pueden considerar así por no incluir los elementos causales apropiados. En las dos secciones anteriores hemos visto dos intentos de afrontar esos problemas sin recurrir explícitamente a nociones causales, y las dificultades a que se enfrentaban. Para muchos, el único modo d e responder satisfactoriamente a estas dificultades es apelando directamente a nociones causales. Los principales autores.que defienden esta tesis son Brody (1972, 1974), Humphreys (1981, 1983, 1989). D. Lewis (1956) y Salmon en su segunda época (1980, 1984, 1989). Estos autores difieren sobre todo en su peculiar elucidación del concepto de cansa, pero comparten un núcleo común en su uso de este concepto para el análisis de la noción de explicación. La idea central es que en la explicación de un hecho el explanans no tiene por qué asegurar la ocurrencia del explanandum, tampoco hacerlo altamente probable, ni siquiera (en opinión de Salmon) incrementar su probabilidad. Todo ello est5 vinculado a la idea hempeliana de esperabilidad, pero la noción de explicación no tiene que ver,,al menos no directamente, con esa idea. Explicar un hecho no es mostrar que es (totalmente, mucho, o tan sólo más) esperable, es proporcionar información causal sobre su ocurrencia: "explicar un acontecimiento es proporcionar información acerca de su historia causal" (Lewis, 1986, p. 217). Quizá a veces, o incluso en muchas ocasiones, la explicación confiere cierta esperabilidad al explanandum, pero ello es así sólo derivativamente, consecuencia de que a veces la información sobre la historia causal, que es el objeto básico de la explicación, tiene ese efecto. Los hechos tienen una larga historia causal y una explicación no requiere informar acerca de toda ella. Cada hecho tiene muchos otros hechos antecedentes como causas; en cada momento del pasado de un hecho (p.ej. este accidente de automóvil) hay una multiplicidad de hechos (la carretera mojada, el cansancio del conductor, el estado de las ruedas, ...) que son causas parciales del mismo y que conjuntamente constituyen su causa totnl en ese momento (cf. cap. 5, 53). Además, en general dicha multiplicidad causal varía en cada momento del pasado de un suceso. Así, la historia causal completa de un hecho recoge el conjunto de todas las causas parciales antecedentes. Pues bien, una explicación no requiere informar sobre toda la historia causal, ni siquiera, generalmente, sobre la causa total en un momento antecedente dado. En general se exipe sólo información sobre akurzos factores causales. Cuáles son esos factores es algo que depende de cada contexto explicativo, el contexto determina qué antecedentes causales se consideran relevantes o destacados a efectos explicativos en esa ocasión. La relación de exp-licaciónes la relación de relei~anciacartsal; que es causal lo establece el análisis, pero cuáles de los innumerables antecedentes causales son los relevantes a efectos expliccttivos lo establece el contex-
252
FüND.4SlEhTOS DE FILOSOF~.~ DE LA CIENCIA
to. Éste es el núcleo de los análisis causalistas de la explicación, que podemos resumir del siguiente modo:
(22) El explanandum es un hecho particular e. (23) El explanans es un hecho particular c que pertenece a la historia causal antecedente de e. (24) La relación explicativa es la de relei)a~zciacausal, determinada por el contexto: el explanans explica el explanandum e syss c es, relativamente a ese contexto, un factor causal explicativamente relevante para e. Nótese que aparentemente este esquema no hace referencia a leyes, pero sólo aparentemente. No hay referencia explícita a las leyes pero sí irnplícita. El explanans está causalmente relacionado con el explanandum y, como vimos en el capítulo 5, las relaciones causales entre hechos particulares se dan ert virtud de que los hechos eje~nplifica~t ciertas propiedades (p.ej. "ser un accidente", "ser un pinchazo") y de que hay urta relación nómica entre esas propiedades, esto es, ciertas leyes que las conectan. Por tanto, la referencia a las leyes está implícita en (23). Ahora podemos ver que este análisis resuelve los problemas tradicionales. Prioridad temporal: las explicaciones en las que el explanans es posterior al explanandum (eclipse actual explicado por posiciones futuras) no son válidas, pues el explanans debe ser causa del explanandum y las causas preceden a sus efectos. Simetría: la sombra no explica la altura del mástil, ni el espectro lumínico la estructura atómica de un elemento determinado, pues las relaciones causales son de heclzo las inversas, el mástil causa la sombra y la estructura atómica el espectro, y la causalidad es una relación asimétrica (si x causa y, y no puede a su vez causar x). Efectos de causa común: el descenso del barómetro no explica la tormenta pues, aunque está correlacionado con ella, no es parte de su historia causal, la causa antecedente es el descenso de presión. Irrelevancia: que Juan tome pastillas anticonceptivas no explica que no se haya quedado embarazado, que el terrón esté embmjado no explica que se disuelva, que Luisa tome vitamina C no explica la remisión de su resfriado. El suceso que pretende ser explanans no está causalmente vinculado con el explanandum. Quizá se piense que el que Juan tome pastillas anticonceptivas sí forma parte de la historia causal de su no embarazo, pues ese mismo Juan, rnienrras se torna las pastillas es varórz, y ese su ser varón es causa de su no embarazo. Aquí hace falta hacer una observación sobre la metafísica de los hechos o acaecimientos. Los hechos, como otros particulares, se idem.$caiz al menos en pane por las propiedades que ejemplifican, de modo que puede haber hechos copresentes diferentes. El hecho consistente en que Juan toma (este mes) pastillas es diferente del consistente en que Juan es (este mes) varón, aunque ambos son copresentes, ocurren en la misma región espaciotemporal. Pues bien, de estos hechos particulares diferentes, el segundo y no el primero está causalmente relacionado con su no embarazo; por supuesto que con una mujer pasaría al revés, pero nada raro hay en eso, simplemente las relaciones causales que de hecho se dan en el mundo son en cada caso ésas. Este esquema básico es perfilado de modo parcialmente diferente por los diversos
i 1
1
1
autores. Algunos (Humphreys, Salmon) distinguen causas propiciarisas ('contrib~itirig') y resistivas ('counteracting'). Las primeras contribuyen positivamente a la ocurrencia del efecto, las segundas negativamente, e.e. contribuyen a su no ocurrencia; p.ej. fumar es una causa propiciativa del cáncer de pulmón, hacer ejercicio es una causa resistiva. Este carácter no es absoluto, puede alterarse por [a presencia de otras causas, p.ej. la arena es causa propiciativa de accidentes, pero en presencia de hielo es causa resistiva. Las explicaciones apelan a ambos tipos de causa, tienen la forma general "e porque X a pesar de Y', donde X es un conjunto de causas propiciativas e Y uno de causas resistivas. Humphreys permite que Y pueda a veces ser vacío. Por lo que comentamos en la sección 3 sobre la relevancia estadística negativa, Salmon parece comprometerse además con que también puede ocurrir lo contrario, que el explanans sólo contemple causas resistivas, pero eso parece más implausible. Otra variación afecta el tipo de elementos sobre los que actúa el contexto. Según algunos autores, los factores causrtles quz en el contexto se consideran explicativamente relevantes no dependen sólo de cuál sea el hecho antecedente sino además de cómo se describa éste. Un mismo hecho, antecedente causal, puede considerarse explicativamente relevante bajo una descripción y no bajo otra. Un mismo hecho puede tener más de una propiedad, no toda propiedad determina un hecho diferente.= Por ejemplo, eso que está sucediendo a mil metros sobre la estatua de Colón de Barcelona tiene la propiedad de ser un huracán, pero también, p.ej., la de ser comentado en primera página de la edición de mañana del diario El País, y también por cierto la de estar ocurriendo a mil metros sobre la estatua de Colón, y la de ser usado como ejemplo en este libro. Pues bien, esas diferentes propiedades que ejemplifica un mismo acaecimiento permiten dar descripciones diferentes de él, y puede ser que bajo una descripción sea explicativamente relevante y bajo otra no. Por ejemplo, el huracán y lo descrito mañana en primera página de El País son el mismo acontecimiento, pero mientras que "el accidente se produjo porque el avión intentó atravesar el huracán" sería explicativo, "el accidente se produjo porque el avión intentó atravesar lo qi:e describió al día siguiente en primera página El País" no lo sería. O, suponiendo que creencias y deseos sean acontecimientos particulares idénticos a acaecimientos particulares microfísicos, "Juan se compró el último libro de García Márquez porque d e s e a b ~leer un buen reportaje sobre el narcotráfico en Colombia" sería una explicación, pero "lo compró porque tales y cuales átomos estaban así y asá", no lo sería. Aunque los eventos particulares son el mismo, y por tanto de ambos modos se nombra un mismo hecho particulx que es causa del explanandum, en un caso se describe mediante la propiedad que está causalmente conectada con la propiedad con la que se describe el explanandum, y en el otro no. Así, entre los muchos modos en que se puede nombrar el suceso que es causa antecedente, el contexto determinaría cuál de ellos es el explicativo. Se puede exigir que sea siempre el que describe el suceso antecedente mediante una propiedad causalmente vinculada a aquella con la que se describe el explanandum; o, como Lewis, se puede dejar totalmente abierto considerando que el contexto puede privilegiar como explicativa cual2. Aunque algunos filósofos lo niegan (cf. p.ej. Kim. 1996, cap. 3, $7).
254
FCSD.AI\~E\TOS DE FILOSOF~ADE LA CIENCIA
quier descripción. Es importante notar que si la relevancia explicativa depende del modo en que se describe el antecedente causal, entonces no se puede hablar, corno venimos haciendo, del explanans y del explanandum como hechos; habría que presentarlos como enunciados o, alternativamente, como hechos más modos de presentación. Éste es el motivo último, según los causalistas, de los aspectos intensionales de la explicación que mencionamos al final de la primera sección. Concluiremos mencionando tres retos a los que deben enfrentarse los modelos de la explicación causales. Se trata de tres tipos de explicaciones que, en principio, parecen difíciles de analizar en los términos propuestos por el causalista. (A) Explicación de sucesos particulares probabilistas. Por ejemplo, que Juan tenga cáncer de pulmón (contrariamente a Rosa) o que un electrón disparado contra una barrera de potencial la atraviese (contrariamente a que se refleje). Aquí suelen distinguirse dos casos. Que el suceso sea sólo episrbnica~nertteprobabilista, como (quizá) el cáncer de Juan. En estos casos el suceso no está propiamente indeterminado, tiene causas tales que si se dan entonces se da necesariamente el efecto, pero no las conocemos cornpletainente; sólo conocemos "partes" de la causa total, p.ej. el hábito de fumar, y nos falta conocer los otros factores que, conjuntamente con los conocidos, determinan plenamente el suceso. Este caso se reduce pues al no probabilista, aunque con limitaciones epistémicas (quizá todas las explicaciones en las ciencias especiales son así, cf. cap. 5, $4 sobre leyes probabilistas y cláusulas cerer-is paribus). La segunda posibilidad es que el suceso sea objerivamente probabilista, como (quizá) el del electrón, que según la mecánica cuántica tiene una probabilidad de 0,9 de reflejarse y de 0,1 de atravesar la barrera. Se suelen' dar tres tipos de respuesta a esta situación. La primera es negar que existan sucesos objetivamente probabilistas, todos son como el del cáncer (la mecánica cuántica es pues una teoría incompleta). La segunda es aceptar que tales sucesos irreductiblemente aleatorios existen, pero rechazar que haya causalidad indeterminista, con lo que carecen de explicación. La tercera es aceptar que hay relaciones causales objetivamente probabilistas; estos sucesos se explican, como los deterministas, dando información sobre sus causas. Nótese que en este último caso, aun si hay causalidad probabilista, la información causal proporcionada en la explicación de su ocurrencia sería la rnisltza que en la de su no ocurrencia, consecuencia para muchos inaceptable. (B) Explicación de hechos generales (nómicos, esto es, de leyes). Aquí cabe distinguir tres casos. Primero: el explanandum es una regularidad nómica no causal, como la ley de caída libre de Galileo o las leyes de Kepler. En este caso la explicación consiste en su derivación a partir de leyes propiamente causales, como las de la mecánica newtoniana, leyes que introducen las entidades-propiedades teóricas causalmente responsables de la regularidad empírica (cf. caps. 8 y 10). Este tipo de explicación involucra siempre alguna forma de reorizaciórz (cf. cap. 11, 92). Segundo: el explanandum es una ley causal y se explica derivándola de otras leyes más básicas y de relaciones de constitución entre las propiedades que aparecen en el explanandum y las de las leyes más básicas. Por ejemplo, explicamos la ley causal "a volumen constante, el aumento de temperatura de un gas produce un aumento de presión", a partir de leyes causales de la teoría cinética de los
gases y la ley de constitución que dice que la temperatura de un gas es o consiste en la energía cinética media de sus moléculas. Análogamente se explican algunas leyes (causales) de la genética mendeliana a partir de las leyes de la genética cromosómica y de la relación de constitución entre genotipos y cromosomas. Este tipo de explicación involucra siempre alguna forma de reducción explicativa (cf. cap. 11, $5). Tercer caso: el explanandum es una ley causal y se explica derivándola de otras leyes más básicas que explican también otras leyes diferentes. En este caso se da cierta forma de un$cación causal, varias leyes causales se deben a una causa común, a una misma ley causal más básica. Por ejemplo, diversas leyes sociológicas sobre la influencia causal de factores religiosos, políticos, familiares, etc., serían explicadas, según el marxismo ortodoxo, por otras económicas más básicas; o las leyes en las que intervienen las cuatro fuerzas de la naturaleza serán explicadas, según los físicos que creen en la Teoría Unificada, por las leyes de una única fuerza, más básica. También puede haber casos en los que se mezclen los dos últimos tipos de explicación. (C) Explicaciones aparentemente no causales. La estrategia aquí es, o negar que tales casos constituyan explicaciones genuinas, o negar que no son causales. Vimos que Hempel ponía como ejemplos la explicación del período de un péndulo apelando a su longitud y a la ley del péndulo, o la de la posición y velocidad de un grave en cierto instante apelando a una posición y velocidad anteriores y a la ley de Galileo. Estos casos, se replica, así descritos no son explicaciones, y bien descritos son explicaciones causales. Ciertamente la posición y velocidad de un cuerpo en cierto momento explica su posición y velocidad en otro momento posterior, pero no por su conzxión, aunque nómica, no causal expresada en la ley puramente cinemática de Galileo, sino por su conexión causal a través de leyes dinámicas que involucran propiedades causales como fuerzas y masas; en este punto se aplica lo relativo a la explicación de leyes no causales a partir de otras causales que hemos visto en el apartado anterior. Análogamente para el péndulo. Railton (1980) ha presentado otros casos más complejos, especialmente algunos de los que denomina explicaciones estructurales, que apelan a leyes de coexistencia (como el principio de exclusión de Pauli) o de conservación (como el de la energía). La respuesta es similar a los casos más simples anteriores: en la medida en que sean propiamente explicaciones se aducen hechos causales antecedentes (cf. p.ej. Lewis, 1986, $111). Independientemente de estos retos. que siguen parcialmente abiertos, la principal dificultad de este tipo de análisis es que.depende de que se ofrezca previamente una e resultado elucidación satisfactoria de la noción de causa, que al menos desde ~ u m ha sospechosa a los filósofos de orientación empirista. Hemos visto que el análisis causalista resuelve los problemas tradicionales, pero ello no les confiere mucho mérito en sí mismo pues la solución es inmediata si aceptamos hacer uso del concepto de causa, asimétrico, unidireccional, etc. La cuestión es entonces analizar este último concepto, salvo que se quiera tomar como primitivo, algo para muchos inaceptable. Lewis lo analiza mediante contrafácticos y, en última instancia. leyes naturales. Salmon mediante las nociones de interacción, transmisión de información y la diferencia entre proceso y pseudoproceso. Humphreys mediante las nociones de estructura, de preservación y de contenido experi-
mental. Cada uno de estos análisis tiene sus propias dificultades y sigue siendo de momenuna cuestión debatida la posibilidad de elucidar las nociones causales de modo aceptable desde un punto de vista (moderadamente) empirista.
to
6. Unificación teórica La idea básica que hay detrás de los análisis de la explicación como unificación es que la comprensión del mundo que proporcionan las explicaciones consiste en la reducción de la cantidad de supuestos básicos independientes de nuestro cuerpo de creencias. La unificación consiste en mostrar dependencias, reduce pues la cantidad de supuestos independientes y es lo que proporciona verdadera comprensión. Aunque hay ciertas sugerencias anteriores en este sentido (cf. p.ej. Mill, 1904, pp. 229-30 y Feigl, 1970, p. 12), el primero en presentar un modelo elaborado de explicación como unificación fue Friedman (1 974). La idea central de Friedman es que la explicación científica consiste esencialmente en la reducción de la cantidad de leyes indepei~dienreineitreaceptables. Friedn-ian, que considera que los fenómenos a explicar son primariamente fenómenos generales, desarrolla esta idea en conexión con el problema de Hempel de distinguir, en las explicaciones de leyes, los casos espurios de los genuinos (cf. más arriba P7 de la sección 2). El núcleo de su propuesta para resolver el problema es que una regularidad es explicada por otras si se aceptasigue de ellas y además éstas reducen la ca~itidadde Izechos ilideyeiidieiire/?ze~zte bles. Las leyes de Newton explican las de Kepler porque, además de implicarlas, reducen la cantidad de regularidades que se aceptan independientemente unas de otras: antes de la explicación, las leyes de Kepler y, p.ej., la de Galileo eran aceptadas independientemente unas de otras, después no; la conjunción de las le1.e~de Kepler con la de Boyle no es una explicación de las primeras porque no produce ese efecto. Nótese que esta noción de explicación está esencialmente relativizada a un cuerpo K de creencias aceptadas en un momento dado, y exige una elucidación precisa de la relación de ilidepelidieiite acepfabilidad entre las creencias de K. Con ayuda de estas nociones, Friedman define a) una regularidad K-atóiizica como aquella que no equivale a una conyunción de otras independienremente aceptables entre sí, y 6 ) una K-parricióit de un conjunto Y de regularidades aceptadas como un conjunto de regularidades K-atómicas cuya conjunción equivale a la conjunción de los miembros de Y. Con este instrumental expresa su idea central aproximadamente del siguiente modo (esta versión omitz alzunas complicaciones importantes que no podenlos tratar ahora): el explanans, S, K-explica el explanandum, E, syss E se sigue de S y la cardinalidad de la K-partición más pequeña de K es menor que la de la K-partición más pequeña de K-{S}. La explicación es una iiferencia uitificadora, el explanans reduce la cantidad dz creencias independientemente aceptadas. El análisis de Friedman presenta algunas dificultades importantes. La principal, puesta de manifiesto por Kitcher, es que excluye explicaciones intuitivamente satisfactorias cuyo explanans está formado por leyes independientemente aceptadas, como la explicación de la ley de la expansión adiabática de los gases a partir de la ley de Boyle y el
primer principio de la termodinámica (Kitcher, 1976, p. 209 SS.).A pesar d e ello, Kitcher considera que el núcleo del análisis de la explicación como inferencia unificadora es esencialmente correcto y desarrolla su propio modelo del mismo (cf. 198 1, 1989), siendo en la actualidad el principal exponente de esta concepción. La idea central de Kitcher es que hay varios modos de sistematizar mediante inferencias un cuerpo de creencias aceptadas K, que sistematizaciones alternativas son comparables según la mayor o menor unificación que producen en K, y que una inferencia es explicativa si pertenece a la mejor sistematización de K (las creencias de K son sobre hechos generales, sobre regularidades). No podemos exponer aquí la elaboración que hace de esta idea en todos sus detalles; nos limitaremos a presentar someramente sus líneas generales. El concepto central es el de patrón argurnentntivo. Según Kitcher, para evaluar el carácter explicativo de una inferencia no cuenta sólo cuáles son las premisas y la conclusión, se debe tomar en consideración también "cómo las premisas conducen a la conclusión" (1989, p. 431). Kitcher denomina arg~itnentaciones,o también derivaciones, a las inferencias en este sentido, premisas más conclusión más el camino de aquéllas a ésta. Cada argumentación concreta está constituida por una secuencia de sentencias. Si en una sentencia sustituimos por variables algunas de (no necesariamente todas) sus expresiones no lógicas obtenemos un esqiiema sentencinl; por ejemplo en la Teoría de la Herencia: (*) "P es estable en el linaje que conduce de S a G" (nótese que este esquema sentencia1 contiene todavía algunas constantes no lógicas, p.ej. "linaje"). Un esquema nrguineiztal es una secuencia de esquemas sentenciales. Los esquemas argumentales se acompañan de iizstrrrcciottes de relleno que especifican las expresiones por las que se puede sustituir cada variable, p.ej. "P se debe sustituir por nombres de rasgos, G por nombres de grupos de organismos o poblaciones y S por nombres de especies". Los esquemas argumentales, secuencias de esquemas sentenciales, también van acompafiados de una clasificación, que especifica las características inferenciales de los elementos de la secuencia, esto es, cuáles son premisas, cuáles se infieren de cuáles otros, mediante que reglas, etc. Un esquema argumental, junto con un conjunto de instrucciones de relleno y una clasificación, constituyen un patrón argurnentntivo. Un patrón argurnentativo es más rigrrroso ('stringent') que otro si "las condiciones de sustitución [del primero] son más difíciles de satisfacer [que las del segundo]'' (1989, p. 433). La idea es que las sistematizaciones alternativas de K consisten en conjuntos alternativos de argumentaciones concretas que se pueden comparar en términos de los patrones argumentativos que tales argumentaciones concretas ejemplifican. Una sistematización de K, S(K), es cualquier conjunto de derivaciones concretas que obtienen como conclusión unos miembros de K a partir de los otros; una sistematización es aceptable, relativamente a K, si sus argumentos. que contienen como premisas miembros de K, son dedzrctivos (1989, p. 434; sobre la exigencia de deductividad vol~eremosdespués). Decimos que un conjunto P de patrones argumentativos geríern una sistematización S(K) si cada derivación concreta de S(K) es una instancia de algún patrón de P. Es obvio que puede haber diferentes conjuntos generadores para una misma sistematización. Un conjunto generador de S(K) no es más que un modo de esquematizar las derivaciones concretas de S(K) y hay por lo general más de un modo de hacerlo, Lo importante es que se
puede establecer un criterio para comparar el poder wzificador de los diversos conjuntos seneradores. El poder unificador de un conjunto de patrones que _genera un conjunto de derivaciones concretas depende directamente de a) la cantidad de conclusiones de las derivaciones y b) el rigor de sus patrones, e inversamente de c) el número de sus patrones. Esto es, un conjunto generador es tanto más unificador cuanto más conclusiones pueda generar, cuanto más rigurosos sean los patrones y cuantos menos patrones use. Pues bien, entre los diversos conjuntos generadores de S(K), denonlinamos base de la sistematiracióil S(K), B(S(K)), al conjunto generador con mayor poder unificador (nótese que si comparamos conjuntos generadores de la inisina sistematización, el criterio a) no tiene efecto, pues se refiere a la cantidad de conclusiones del conjunto generado). B(S(K)) da la medida del máximo grado de unificación asociable a la sistematización S del cuerpo de creencias aceptadas K, expresa la esquematización de S(K) máximamente unificadora. Ahora podemos comparar sistematizaciones alternativas de K. Simplemente, la mejor sistematización de K es aquella que tiene la mejor base. Sean Si(K), S2(K),... diferentes conjuntos de inferencias que sistematizan K, y sean B(S,(K)), B(S2(K)), ... sus bases: Si(K) es la sistematización más unificadora syss B(S;(K)) es la base más unificadora según los criterios a)-c). A la mejor sistematización la denomina Kitcher el alinacéiz esplicativo de K, E(K) ('explarzatoly store'). Intuitivamente, E(K) es el conjunto de derivaciones que sistematizan K que maximiza el número de conclusiones y el rigor de los patrones inferenciales y que minimiza el número de patrones (y por tanto también el número de premisas). Pues bien, una explicación no es más que una inferencia que pertenece al almacén explicativo, a la mejor sistematización de K. El lector habrá adivinado quizá que las diferentes sistematizaciones del mismo cuerpo K son en cierto sentido diferentes teorías sobre K. Efectivamente, las teorías científicas no son para Kitcher sino conjuntos de derivaciones que constituyen sistematizaciones en el sentido preciso indicado; con esta noción de teoría afronta las cuestiones principales de la dinámica científica (cf. 1989, $7, y especialmente 1993; para algunas dificultades de este programa cf. Díez, 1994b). Por tanto, una explicación no es más que una inferencia que pertenece a la teoría más unificadora. Nótese que de esta concepción se sigue que el carácter explicativo o no de una inferencia puede cambiar con el tiempo, la aparición de teorías más unificadoras puede desacreditar explicaciones anteriores. Pero esto es una consecuencia que Kitcher no considera un defecto de su modelo sino todo lo contrario. Éste es en líneas generales el núcleo del análisis de Kitcher. Se trata de un programa todavía en desarrollo y, por tanto, parcialmente abierto. Algunas de las principales cuestiones que requieren ulterior tratamiento son las siguientes.
(A) Explicaciones de hechos particulares. Mencionamos más arriba que para Friedman la explicación es básicamente de fenómenos generales. Como muestra implícitamente la presentación anterior, para Kitcher también. Lo que hay que explicar primariamente son regularidades empíricas, y se explican subsumiéndolas bajo (derivándolas de) sistemas teóricos unificadores. En cierto sentido también se pueden explicar hechos particulares, pero, por así decir, ello no constituye una tarea especialmente interesante además de la anterior. La idea es que explicar un hecho particular consiste en explicar el fenómeno general y en
constatar que el hecho particular es de ese tipo; la explicación básica es la de regularidades, y la de hechos particulares se obtiene inmediatamente al añadir que el hecho particular es del tipo especificado en la ley. "La pregunta '¿por qué este objeto particular se comporta de este particular modo?' es transformada en la pregunta 'jpor qué objetos ideales de este tipo general exhiben esas propiedades?"' (1989, p. 453). (B) Simetrías e irrelevancias. Kitcher acepta que toda teoría de la explicación debe dar cuenta de estos problemas, y en su opinión la suya lo hace de modo satisfactorio. La estrategia es mostrar que, dadas dos inferencias alternativas, será explicativa la que pertenezca a la sistematización más unificadora, y que esta comparación arroja en los casos en consideración los resultados intuitivamente esperados. La altura del mástil explica la longitud de la sombra y no al revés. Pensemos en las dos sistematizaciones, la que contiene inferencias que parten de la altura del mástil y conducen hasta la longitud de la sombra, y la que contiene inferencias que proceden al revés. La primera es más unificadora que la segunda. Si la segunda no tiene otro tipo de inferencias, pierde algunas conclusiones pues no puede establecer p.ej. la altura de mástiles de noche, o en días nubosos, etc. Y si recupera esas conclusiones es al precio de introducir nuevos patrones argumentativos. En cualquiera de los dos casos es menos unificadora según los criterios a)-c). Análogamente ocurre con la irrelevancia. Una sistematización que contiene derivaciones del no embarazo de Juan usando como premisa que Juan toma pastillas anticonceptivas no puede ser la mejor. Si también quiere explicar que otros varones que no toman pastillas tampoco se quedan embarazados, estas nuevas inferencias también se aplicarán a Juan, con lo que podremos prescindir de las inferencias anteriores, obteniendo una sistematización con menos patrones. sin perder conclusiones. Como reconoce Kitcher (1989, $7.2-3), estos argumentos presuponen que las sistematizaciones no usan predicados no proyectables, como 'verdul' (cf. cap. 5, $2). (C) Explicaciones estadísticas. Kitcher sostiene que las explicaciones son cierto tipo de inferencias y además que son inferencias deductivas, pero eso parece dejar de lado las explicaciones estadísticas de hechos particulares. Nótese que no se dejan de lado las explicaciones de hechos estadísticos generales pues, como ya vimos al tratar del enfoque de Hempel, también son deductivas. Y en cierto sentido, puede decir Kitcher, con eso basta, pues como hemos visto en (A) esa explicación de hechos generales es la básica. Se podría decir que hay explicaciones de hechos estadísticos particulares en el sentido de que hay explicaciones deductivas de regularidades estadísticas a las que se puede añadir la constatación de que se ha dado el hecho particular (esta línea de respuesta se parecería a la de Railton, cf. szcpra, sección 3). Pero en otro sentido más profundo no hay explicaciones de estos hechos. Kitcher es un abogado del deductivismo, piensa que no hay explicaciones inductivas, que seguramente los llamados hechos particulares probabilistas son todos probabilistas sólo epistémicamente, y que caso de haber hechos particulares objetivamente probabilistas carecerían de explicación (cf. 1989, $5). Éstas son en parte cuestiones todavía abiertas. Independientemente de ellas, la mayor dificultad del análisis de Kitcher es que la noción de poder unificador sobre la que descansa es de momento problemática. En primer lugar, en espera de mayores precisiones,
260
FUSD.4HEh"OS DE F I L O S O F DE ~ ~ L.4 CIENCIA
es extremadamente vaga. No se especifica cómo contrapesar de modo preciso los criterios a)-c) co~~jirrttamen~e. La situación es clara en los casos en que dos sistematizaciones coinciden en dos de los criterios y sólo se diferencian en el restante. Pero nada se dice del peso relativo de ellos, sin lo cual no se pueden resolver los otros casos, que son seguramente los históricamente interesantes. ¿Qué ocurre si una sistematización logra más conclusiones que otra pero mediante más patrones o patrones menos rigurosos? Por otro Iado, caso de que se precise el peso relativo de los diferentes criterios, nada garantiza que no pueda haber casos de genuina indeterminación, en los que después de contputar su poder unificador, dos sistematizaciones resulten equi~alentes.Eso confiere una notable indeterminación a la noción de explicació~tcomo inferencia perteneciente a la sistematización más unificadora. Esta cuestión se relaciona con otra. No está claro si ante varias inferencias lo que se pretende decir es que una es explicativa y las otras no, o sólo que unas son más explicativas que otras. Parece que la intención es distinguir entre inferencias explicativas y no explicativas, pero a la vez el aparato sólo parece poder aseverar que una inferencia es más o menos explicativa que otra. Si eso es así, ello conferirfa un carácter esencialmente cornpararivo a la noción de explicación, la eqdicatii.idad no sería una propiedad de ciertas inferencias sino una relación coinpal-arivaentre pares de ellas. Queda por último el tema de la causalidad. El análisis unificacionista podría en principio ser complementario del causalista. Quizá pudiera darse una síntesis entre ambos, o se podría quizá defender que el primero es aplicable a las explicaciones en unos ámbitos y el segundo a las explicaciones en otros. Ésta puede ser otra cuestión abierta. Pero claramente no es así para Kitcher. En primer lugar, piensa que hay explicaciones claramente no causales (aunque sus ejemplos preferidos son de la matembtica, y por tanto controvertidos, cf. 1989, $3.2). Pero aun cuando se pueden calificar muchas explicaciones de causales, la única síntesis que acepta es la del reductor: sí hay causalidad, pero las relaciones causales son derivativas de las relaciones de explicación y, en último término, de la unificación teórica. En diversos pasajes Kitcher insiste una y otra vez sobre ello: ''[E]] concepto de dependencia causal es derivativo del de dependencia explicativa"
(1989, p. 436). "El punto crucial es que el 'por qué' ['becairse']de la causación es siempre derivativo del 'por qué' ['because'] de Ia explicación" (ibid.,p. 477). "Los mecanismos básicos [causales] deben ser aquellos indicados en nuestra mejor unificación de nuestras mejores creencias. [...] Recomiendo rechazar la idea de que hay verdades causales independientes de nuestra búsqueda de orden en los fenómenos" (ibid., p. 497). "La noción de relevancia causal no tiene sentido independientemente de la noción de relevancia explicativa y no hay otro sentido de la noción de relevancia explicativa que el de figurar en la sistematización de la creencia en el límite de la investigación científica guiada por la búsqueda de unificación" (ibid.,p. 499). "[Lla estructura causal del mundo, las divisiones de cosas en clases, las dependencias objetivas entre fenómenos son todos generados por nuestros esfuerzos de organización" (1 993, p. 172). Desde la perspectiva causalista, la comprensión del mundo consiste en el conocimiento de los mecanismos causales, y la ciencia explica los fenómenos, los hace compren-
sibles, proporcionando información (contextualmente relevante) sobre su historia causal. Según el modelo rrnificacionista, la comprensión del mundo consiste en reducir el cuerpo de supuestos básicos independientes que es necesario aceptar, y la ciencia explica los fenómenos, los hace comprensibles, unificándolos. Para el causalista la explicación descansa primariamente en una relación ontológica, la de causalidad (aunque la cantidad y tipo de información requerida sobre ella dependa en cada contexto de elementos pragmáticos). Para el unificacionista, la explicación descansa primariamente en una relación epistemológica, la de unificación teórica. El causalista ontologiza la explicación, el unificacionista tiende, al menos así es explícitamente en el caso de Kitcher, a epistemologizar la causalidad. Las espadas siguen en alto y está por ver si es posible o no una síntesis entre ambas aproximaciones. Kitcher desarrolla su modelo desde una concepción claramente enunciativista dz las teorías. Recientemente se han propuesto análisis de la explicación como unificación en el marco de las concepciones semánticas de las teorías, en concreto partiendo de la noción modeloteórica y reticular de teoría que propone el estructuralismo (cf. Bartelborth, 1996). Como aquí aún no se ha expuesto con detalle esta concepción metateórica, enunciamos esquemáticamente sólo el núcleo de la propuesta (el lector puede volver sobre ella una vez familiarizado con los conceptos básicos de dicha concepción, cf. cap. 10, $5). La idea es que la noción estructuralista de red teórica, que estudiaremos más adelante, contiene los elementos necesarios para elucidar las relaciones explicativas como unificación o subsunción en términos modeloteóricos. Los fenómenos empíricos a explicar son los modelos de datos (aplicaciones intencionales). Estas regularidades empíricas se explican mediantz leyes teóricas, subsumiéndolos bajo modelos ampliados teóricamente. Esta subsunción por extensión teórica captura el elemento causal de la explicación de los fenómenos empíricos, pues las entidades teóricas introducidas (p.ej. dinámicas) "dan cuenta" del comportamiento de los sistemas de datos (p.ej. cinemáticos). Por otro lado, las leyes teóricas mismas están orgánicamente estructuradas y unificadas en una red, red en la que las leyes más específicas se derivan de, y en ese sentido se explican mediante, otras más generales; en este caso la regularidad explicada es ella misma causal, aunque de bajo nivel. Por último, sistemas completos orgAnicos de leyes se pueden explicar mediante otros más Unificados, en el sentido preciso que proporciona el concepto de reducción estructural (cf. cap. 11, $3), y que captura algunos de los elementos de la comparación de poder unificador de Kitcher.
7. Apéndice: Explicación teleológica y funcional (*)
En la sección 2 mencionamos las explicaciones teleológicas y funcionales entre los problemas a que debía enfrentarse el modelo de cobertura 1egal.inferencial de Hempel. El problemafundamental era que, contrariamente a lo que parece usual en el resto de explicaciones, en las explicaciones teleológicas y funcionales parece que no se deriva el explanandum del explanans sino éste de aquél. Explicamos las largas orejas de los conejós por Su función en el control de la temperatura corporal, y parece que lo que se infiere es
dereminado fenómeno de equilibrio térmico corporal a partir del tamaño de las orejas (y de otras cosas), y no al revés. Explicamos el viaje de Rosa a Salzburgo por la finalidad de asistir a un determinado concierto, y parece que lo que se infiere es su asistencia al concierto a partir del viaje (y de otras cosas). A pesar de este aparente carácter paradójico, en la discusión general sobre la naturaleza de la explicación científica estos casos no han tenido un papel destacado entre los problemas con los que se iban enfrentando los diferentes análisis. El motivo es que su propia naturaleza espec$ca era suficientemente problemática como para considerarlos piedra de toque en la discusión general. Era preciso elucidar antes su peculiar naturaleza. Una vez realizada esta elucidación, gracias principalmente a L. Wright (1976), no presentan características por las que merezcan una referencia específica en la discusión general. Hempel se ocupa de la explicación funcional inmediatamente después (cf. Hempel, 1959) de su primer trabajo, en colaboración con Oppenheim, sobre la explicación. Tomemos el caso de la explicación del latido del corazón en los vertebrados mediante su función de hacer circular la sangre. La idea es que lo que consideramos el explanans, la circulación de la sangre, es una función de un sistema, el cuerpo del venebrado, que requiere de la presencia del explanandum, el latido del corazón, para seguir desempeñando correctamente su función, dadas ciertas condiciones del entorno. El rasgo a explicar, I, es un rasgo o disposición relativamente persistente. La explicación funcional consiste en mostrar que, dadas ciertas condiciones internas Ci del sistema S, y ciertas condiciones externas C, de su entorno, el rasgo I produce en las condiciones C, y C, la satisfacción de una condición N necesaria para el correcto funcionamiento de S. A este modelo se ajusta, también, según Hempel, p.ej. la explicación freudiana de algunas conductas patológicas para evitar ataques de ansiedad; o la explicación anuopológica de algunos ritos, no por sus finalidades declaradas (p.ej. producir lluvia), sino por su función en la cohesión grupal. Hempel señala que esta explicación no se ajusta al modelo inferencial. Su estructura lógica es según él la siguiente: a ) En el momento t, S funciona correctamente en condiciones C; y C,. b) Si S funciona correctamente en condiciones Ci y C, entonces se cumple N. C) Si I está presente en S en condiciones C; y C, entonces se cumple N. d) [Por tanto] I está presente en S en el momento t.
Pero esto es obviamente una inferencia inválida, un caso de falacia de afirmación le consecuente que, como vimos (cap. 2), es inválida tanto deductiva como inductivamenr. Lo único que se infiere válidamente es que en r se cumple N, pero no que se da l. Para ue se infiriese eso, c ) debería decir no sólo que I es suficiente para la satisfacción de N no (además) que es necesaria. Pero eso parece enipíricanienre inaceptable, puede haber i general otros modos de producir N. A esos rasgos alternativos que también pueden oducir N los denomina HempeI equivalei~resfincionafes. Podríamos formular c ) como bicondícional si sustituimos el rasgo específico Z por la disyunción I v P v I" v... . de los los equivalentes funcionales que producen N, pero entonces lo único que podemos icluir de que se cumple N es que se da algicno de ellos, no específicamente el que nos
,,
interesaba explicar. Así, puesto que las explicaciones son al menos inferencias válidas, Hempel concluye que los anblisis funcionales no tienen valor explicativo sino sólo heurístico. Otros concluirán, al contrario, que puesto que sí son explicaciones, éstas no son siempre inferencias. Nagel (1961, cap. 12 $1.1) defiende que las explicaciones funcionales son inferenciaIes aduciendo que e1 rasso a expIicar no s61o es suficiente sino también necesario pala el cumplimiento de la función. El análisis de Napel es el siguiente (sustituimos su propia terminología por la de Hempel, incluyendo ahora entre las condiciones internas lo que Nagel denomina organización del sistema, nada esencial depende de esta adaptación terminológica): "La función de I en el sistema S con organización C; es permitir a S realizar en el entorno C, el proceso N' significa: e) El sistema S está en C;y C, y realiza N. j) Si, dadas Ci y C,, I no está presente en S, entonces S no -realizaN. Ahora, ciertamente, de ambas cosas se infiere válidamente que I está presente en S. Por tanto el explanandum, I, se infiere del explanans, la función N. Pero nótese que a q u í 8 es la conversa de c). Dejando de lado por el momento a Ci y C,, c) dice que I es condición suficiente de N, j ) dice que es condición necesaria. Eso equivale a negar que I tenga equivalentes funcionales, a sostener que sólo I puede producir N. Ésta es una salida para salvar el carácter inferencia1 de las explicaciones funcionales que hemos visto que Hempel desestima. Nagel es consciente de esta objeción, pero en su opinión no está justificada. Es cierto, dice Nagel, que en cierto sentido puede haber otros rasgos que produzcan N, pero ese sentido no es relevante aquí. Es el sentido meramente lógico de 'puede' y aquí importa su sentido físico. Es lógicamente posible que otro factor produzca N, pero, dado el mundo como de hecho es, ello no esfisicamente posible. Así pues,f) no es una verdad conceptual, pero sí una verdad nómica, una ley natural, que es de lo que aquí se trata. Nagel pone como ejemplo el caso de la explicación de la presencia de clorofila en las plantas por su función en la fotosíntesis. Es lógicamente posible que otras sustancias capaciten la fotosíntesis, pero dado el mundo como de hecho es, no es físicamente posible: siendo las leyes biológicas las que son, la clorofila es una condición necesaria para la fotosíntesis, de modo que de la existencia de fotosíntesis se deriva la presencia de clorofila. Esta línea de respuesta no convencería a Hempel, pues su objeción era que la inexistencia de equivalentes funcionales es empíricamente (no sólo lógicamente) inaceptable. Nagel se ocupa básicamente de la explicación funcional en biología, y ahí su tesis es quizá defendible, esto es, los medios mediante los que los organismos desempeñan sus funciones vitales son seguramente necesarios, dadas las leyes de la química, la biología y la evolución. Pero en otros terrenos es más discutible: por ejemplo, en las explicaciones funcionales en la antropología. ¿No es antropológicarnente posibIe desarrollar la cohesión grupa1 mediante otros procedimientos que los rituales, o mediante unos ritos en vez de otros? Esto conecta con las explicaciones teleológicas, pues las explicaciones funcionales en ciencias humanas (sociología, economía, antropología) son muchas veces teleolópicas,
dependen defines con los que se desarrollan ciertas acciones, en estos casos colectivas. Y en las explicaciones teleológicas es más difícil, si no patentemente inverosímil, sostener la tesis de Nagel pues usualmente hay varios modos alternati\ros de alcanzar una misma finalidad. La dificultad principal de las explicaciones teleológicas y funcionales, más allá de su carácter inferencia1o no, se deriva de que están olinttadas hacia e1fUnr1-0 (Ifilticre oriented'). En estas explicaciones el explanans es posterior en el tiempo al explanandum. Pero si la relación de explicación ha de ser en algún sentido causal, parecería que la causalidad ha de tener la misma dirección que la explicatividad, esto es, del futuro al pasado, lo cual contraviene una característica esencial de las relaciones causales, a saber, que la causa es anterior en el tiempo a su efecto. En la medida en que las relaciones causales involucradas sean "normales", esto es del pasado hacia el futuro, parecería que es el explanandum el que produce el explanans y no al revés. En conclusión, si las relaciones explicativas y causales van en la misma dirección, parece que debemos aceptar causalidad hacia atrás ('bachjard causation'); pero si la causalidad no puede ser hacia atrás, entonces en estos casos, explicatividad y causalidad parecen tener direcciones contrarias. El problema que presentan las explicaciones teleológicas y funcionales es pues el de congeniar la dirección futuro-pasado de estas explicaciones con la dirección pasado-futuro de la causación. El primero en dar un análisis satisfactorio de las explicaciones teleológicas y funcionales fue L. Wright (1973 y 1976). El análisis de Wright da cuenta de la orientación hacia el futuro de estas explicaciones en términos causales que no requieren causalidad hacia el pasado. Aunque la idea es la misma en ambos casos, Wright distingue las explicaciones teleológicas de las funcionales. Las explicaciones teleoiógicas explican acciorzes o en general conductas mediante cierta finalidad a las que están dirigidas. Son susceptibles de explicación teleológica tanto la conducta deliberada de los agentes intencionales (p.ej. el viaje de Rosa a Salzburgo), como el "con~portamiento"de artefactos diseñados con un fin específico (p.ej. el movimiento de un torpedo), como la conducta no intencional de los organismos vivos (p.ej. elandar cauteloso de los felinos). En el primer caso la finalidad es el contenido de un deseo o intención del sujeto de la acción, en el segundo el contenido de la intención con que se ha diseñado el artefacto, en el tercero la satisfacción de cierta condición necesaria para la supervivencia del organismo. La idea de Wright es que en todos los casos de conducta dirigida a un fin, la conducta no sólo produce-causa el fin, sino que además la conducta ocurre porque, esto es, a causa de que, produce el fin. La conducta se produce porque conductas como ésa halt producido en el pasado Itecl?os del inismo tipo que elfiiz. Tal como lo formula Wright:
S realiza I con la finalidad N syss: 12) I produce N i) I ocurre porque produce N. (En realidad, Wright no exige que I produzca N invariablemente, sino que tienda a producirlo, o que lo produzca generalmente. Pero este aspecto aproximativo del análisis podemos obviarlo en el presente contexto.)
Aquí I y N son conductas y sucesos particulares, pero se hace referencia implícita a tipos de conductas y sucesos. h ) dice que la conducta particular I causa el suceso particular N,pero ya sabemos que tras una afirmación causa1 particular hay u n a relación causal general, a saber, conductas del tipo de 1 causan sucesos del tipo de N. La referencia implícita a los tipos de conductas y sucesos en i) es más fundamental. i) se ha de leer del siguiente modo: es parte de la historia causal de la acción concreta / e l que acciones del tipo de 1 causen sucesos del tipo de N. Así, la condición h) sólo da cuenta de (parte de) la dimensión causal de la explicación, no de su orientación hacia el futuro. Esto es, h ) no da cuenta de en qué sentido apelamos a N, que pertenece al futuro de 1, para explicar la ocurrencia de I. Eso lo hace i). La explicación de una ocurrencia concreta de la conducta I está dirigida hacia ("se encuentra en") el futuro en el sentido precisado por i): sucesos que son del mismo tipo del que tendrá lugar en el futuro, N, pero que ocurrieron en el pasado, son causalmente responsables de la ocurrencia actual de I; esto es, que en el pasado sucesos del tipo de I causaran sucesos del tipo de il', causa la actual ocurrencia de I. De este modo conjuga Wright causalidad hacia adelante y orientación hacia el futuro en las explicaciones teleológicas. La referencia a los casos pasados sólo es esencial en las explicaciones de conductas que, como las de los animales, no resultan de actos de deliberación. En el caso de los artefactos, diseñados para desempeñar cierta función, se puede tener la finalidad "desde la primera vez", por así decir. Pero incluso la primera vez, Iri causa de que ocurra un ejemplar dri I es que I carisn N: el acontecimiento I ocurre porque el diseñador hace que ocurra, y el diseñador hace que ocurra I porque sabe que I causa N y quiere quz ocurra N, por tanto (*) "que (acontecimientos de tipo) I causa(n) (acontecimientos de tipo) M'pertenece a la historia causal del acaecimiento particular dz tipo I. Pero nótese que (*) pertenece a esa historia en un sentido especial, pues es un hecho general, una regularidad, y por tanto co "causa" las ocurrencias particulares de I ya que los acaecimientos particulares tienen como causas otros acaecimientos particulares (p.ej. las intenciones de los diseñadores de los instrumentos). Análogamente sucede en los casos de conducta deliberada consciente de un sujeto cuando la conducta es resultado de una acción deliberada que se realiza por primera vez. Eso plantea el problema de las primeras ocurrencias de conductas finalistas no deliberadas (todas las de los animales no conscientes y la mayoría de las nuestras). En estos casos, o bien al principio se da cierta indeterniinación sobre su carácter finalista, o bien se supone que opera cierto tipo dz agente diseñndor (la selección natural, o quizá un deus arrifex). El análisis que Wripht hace de las explicaciones, o adscripciones, funcionales es esencialmente el mismo. La diferencia es que ahora lo que se explica no es una acción o conducta sino la presencia de una entidad en cierto sistema, p.ej. un trozo de papel bajo una puerta, un pico curvado en la cabeza de un ave o una señal de tráfico en una curva. El anilisis es análogo al de las acciones:
I tiene la función N syss: j) la presencia-ahí de I produce N k) I está-ahí porque produce N.
Estas condiciones se deben leer en términos exactamente análogos a las anteriores: j ) la presencia-ahí de I causa N, y k) la causa de que I esté-ahí es que 1 causa N. La literatura sobre explicaciones teleológicas y funcionales posterior a los trabajos de Wright es extensa y variada, pero no modifica los aspectos esenciales de su análisis aquí expuestos. Hay contribuciones importantes sobre algunos elementos disposicionales, o sobre la aplicación de este análisis a problemas de filosofía del lenguaje y de la mente, pero escapan de los límites de esta obra.
ANÁLISIS SINCRÓNICO DE TEORÍAS 1. LA CONCEPCI~NAXIOMÁTICA: LAS TEORÍAS COMO CÁLCULOS INTERPRETADOS
Con este capítulo iniciamos la presentación de los diversos análisis de la noción de teoría empírica con que se pretende elucidar la naturaleza y estructura de las teorías científicas. Como mencionamos brevemente en el capítulo 1, las teorías científicas son entidades que se extienden o perduran en el tiempo, que permanecen a través del cambio. Ello supone que el estudio puramente sincrónico que las considera como entidades estáticas, "congeladas", constituye sólo una primera aproximación que se debe completar con un análisis diacrónico que dé cuenta del carácter persistente de estas entidades, esto es, con una cinemática de teorías. En este capítulo y en los dos siguientes vamos a realizar la primera parte de la tarea, el estudio sincrónico, que se completará en el capítulo 12 con el análisis diacrónico. En las dos primeras secciones de este capítulo se presentan en detalle, y se ilustran con ejemplos puramente formales, las nociones de teoría ariomática y dz inodelo (o realización); en la primera se presenta además una primera idea de otras nociones que se estudiarán en otros capítulos, especialmente las de contenido, redclcción y equivalencia. En la tercera sección se aplica la primera noción a las teorías empíricas y se introduce el análisis clásico de las teorías empíricas como cálculos axiomáticos empíricamente interpretados. En las dos secciones siguientes se discuten dos cuestiones especialmente importantes de este análisis, (i) la naturaleza y función de las reglas de correspondencia y (ii) la distinción teórico/observaciona1 y el problema de la base empírica.
1. Teorías axiomáticas Se,oún cierta noción de teoría, una teoría es un conjunto de afirmaciones sobre un determinado áinbito de la realidad. Así, según esta concepción, la Mecánica Clásica (MC) consiste en una serie de afirmaciones sobre el movimiento de los cuerpos de tamaño medio; la Termodinámica (TM), sobre sistemas que interaccionan intercambiando energía; la Genética Mendeliana (GM), sobre la transmisión de rasgos en la generación de seres vivos; la Economía del Intercambio (EI), sobre procesos de transferencia de bienes de consumo; la Aritmética de Peano (AP), sobre los números naturaIes y sus propiedades; la
Teoría de Conjuntos (TC), sobre las clases, conjuntos o colecciones; o una supuesta Teoría
del Parentesco (TP) sobre los hechos que se derivan de las relaciones familiares. Concebidas como conjuntos de afirmaciones sobre un determinado ámbito, las teorías se analizan o reconstruyen como teniendo cierta estructura que expresa las relaciones que mantienen entre sí las diversas afirmaciones y los diversos términos o conceptos con los que se realizan tales afirmaciones. La noción formal que expresa esa estructura es la de cálcrtlo asionrático o, simplemente, teoría asiontárica, y se aplica por igual a teorías empíricas y a teorías puramente formales; la diferencia radica en que esta noción agota el análisis de las segundas pero no el de las primeras, que se debe completar con elementos adicionales. Ahora vamos a contemplar exclusivamente este elemento común. Y TEOR~ASAXIOSIÁTICAS: TÉRMINOSPRIMITI\'OS. 1.1. CÁLCULOS
AXIOMAS Y
TEOREMAS;
DEFlNIClONES Y TÉRMINOS DERI\!ADOS
La idea básica es que una teoría o conjunto de afirmaciones se puede "resumir" "concentrar" en algunas de sus afirmaciones, de las que se derivan todas las restantes mediante un proceso de inferencia deductiva. A las afirmaciones que forman parte de ese "conjunto-resumen", consideradas primitii~as,se las denomina 'axiomas', y a las afirmaciones que se deducen de los axiomas, consideradas derivadas, se las denomina 'teoremas'. Si llamamos contenido de una teoría al conjunto de todas sus afirmaciones, entonces tal contenido se encuentra ya co~npleto,aunque inlplícito, en los axiomas (cf. cap. 2, 92). El contenido de la teoría, la información que da, es por tanto el conjunto de consecuencias lógicas de los axiomas. Toda afirmación se encuentra ya en los axiomas: explícitamente, si es un axioma, o implícitamente, si no lo es, en cuyo caso se puede hacer explícita deduciéndola lógicamente, esto es, obteniéndola como teorema a partir de los axiomas. Los teoremas, por tanto, no contienen información nueva, sólo hacen explícita información contenida implícitamente en los axiomas. Por supuesto, para que esto sea así es preciso que de los axiomas en cuestión se sigan efectivamente todas las afirmaciones de la teoría o sea, que el conjunto de axiomas sea sztficiente, o como se dic'e a veces, comnpleto. Al axiomatizar una teoría se pretende dar con un conjunto completo de axiomas para ella. Ésta es pues una condición necesaria para una buena axiomatización. Es fundamental ver que la anterior condición, aunque necesaria, no es suficiente. Que de los axiomas se obtengan todas las afirmaciones no basta para una buena axiomatización, pues de lo contrario el simple conjunto de todas las afirmaciones sería ya un buen conjunto de axiomas. De tal conjunto se obtienen efectivamente, cómo no, todas las afirmaciones; es, si se quiere, un conjunto de axiomas, pero no es un buen conjunto de axiomas pues viola el espíritu que inspira la axiomatización, a saber, dar una versión lo más "resumida" o "concentrada" posible de la teoría. Así pues, es un principio metodológico general que los axiomas han de constituir un conjunto i?zNlitno de afirmaciones primitivas, ningún axioma debe ser deducible de los restantes; o, como se dice técnicamente, los axiomas deben ser indepeltdieiltes entre sí (para una ejemplificación de esa y O
otras nociones, cf. más abajo el ejemplo de las teorías del parentesco). Un buen conjunto de axiomas para una teoría es por tanto un subconjunto de sus afirmaciones que sea comp[eto y cuyos miembros sean independientes entre sí. Es importante señalar q u e estas condiciones no determinan un único subconjunto de tales afirmaciones. Dada una teoría (en sentido intuitivo), siempre hay más de un subconjunto completo e independiente de afirmaciones, siempre hay axiomatizaciones alternativas. Hasta aquí hemos hablado sólo de las afirmaciones de la teoría. Debemos hablar ahora de los constituyentes de estas afirmaciones, los términos o conceptos de la teoría.' Como veremos, la referencia a los tirminos introducirá una complicación adicional en las relaciones entre las afirmaciones, pues además de axiomas y teoremas intervienen entonces las definiciones. Los términos de una teoría, los constituyentes de sus afirmaciones, expresan el aparato conceptualizador de la teoría, esto es, el aparato con el que se pretenden capturar las entidades de diverso tipo (objetos individuales y sus propiedades y relaciones) que conforman el ámbito de la realidad del que se ocupa la teoría. Así, por ejemplo, MC habla de partículas, masas, velocidades, etc.; AP habla de la propiedad de ser número natural, del cero, de la función siguiente, etc.; TP habla de padres, hermanos, abuelos, etc. Los términos d é las teorías, contempladas éstas en su estadio intuitivo, son susceptibles también en general de cierta simplificación. Por ejemplo, si en MC disponemos ya de 'posición' y 'tiempo' podemos prescindir como término primitivo de 'velocidad', pues se puede introducir o definir a partir de los anteriores; o si en TP disponemos ya de 'progenitor' y 'hermano', podemos prescindir como término primitivo de 'tío', pues se puede introducir o definir a partir de los anteriores. Esta introducción de nuevos términos a partir de otros anteriores supone la entrada en juego de otro tipo de "afirmaciones" o enunciados, las definiciones, pues sólo mediante enunciados (o esquemas de tales) es posible explicitar el modo en que se introduce un término nuevo a partir de otros anteriores. Las definiciones siempre tienen la forma de una equivalencia del tipo:
Aquí t es el nuevo término y ti, ..., tk, son términos ya disponibles, esto es, términos pri~iiitivoso ya definidos con anterioridad a r ; n indica el número de variables a las que se aplica el término, esto es, su ariedad; a y P son funciones proposicionales. Ésta es la forma estándar que claramente presentan las definiciones de los relatores (n-ádicos), que nombran propiedades o relaciones entre individuos; por ejemplo, 'ser impar': ".r es impar syss~,fxdividido entre 2 da de resto 1" (análogamente, p.ej., con 'ser múltiplo de'). Pero los términos de un lenguaje no siempre son relatores, puede haber también términos singulares (p.ej. ' 1') y functores (p.ej. 'el siguiente de ...', 'la intersección de ... y ...' que nombran, respectivamente, a individuos y a funciones-operaciones entre individuos. En 1. Términos o conceptos, respectivan~ente,según se entienda por 'afirmación' el enunciado mismo o su contenido. De acuerdo con la prcíctica dominante en filosofía de la ciencia. seguiremos ahora en general la primera interpretación, y diremos por tanto que los constituyentes de las afirmaciones son t6miinos.
270
FüND.4hlEhXlS DE FILOSO^^^ DE LA CIENCIA
principio parece que las definiciones de términos singulares y de functores no se ajustan a la forma (1) sino a estas otras: (2) (3)
"t = drjy(t1,..., tk)" para términos singulares, y "t(xI, ...,x,,) = dcf%t1. ..., ti, XI,...,xn)" para functores (n-ádicos),
donde en ambos casos la parte derecha, "y(...)" es una descripcin'ií que usa otros términos ya disponibles; por ejemplo: "1 =dg el siguiente de O"; "x n y =dd el conjunto cuyos elementos son los elementos comunes a x e y". Sin embargo, es fácil ver que estas definiciones se pueden expresar también mediante una equivalencia de la forma (l), esto es, respectivamente, mediante: (2') (3')
"para todo z: z = t syssdcr: = ~ t l..., , t~)", "para todo z: z = t(xt, ...,x,) s ~ s s = ~ y(?], ~ ~ ..., : tk,XI, ...,S,)"
Por tanto, la forma general de la definición queda bien expresada mediante (1) (ligeramente modificada pues, como el lector habrá advertido, (2') y (3') contienen cuantificadores y (1) no). Ahora bien, una vez señalado esto, lo usual es introducir los términos singulares y los functores mediante (2) y (3) respectivamente, y así lo haremos también aquí. Las definiciones no son afirmaciones del mismo tipo que los axiomas y los teoremas, no son afirmaciones sustanevas de la teoría sino que expresan meras abreviaturas notacionales. Esto se expresa diciendo que las definiciones deben cumplir dos requisitos: han de ser a) elNni?zablesy b) no creativas o inocuas. Lo primero significa que cualquier afirmación que contenga un término definido ha de poder eliminarse usando la definición que introduce dicho signo; esto es, con ayuda de la definición se debe poder probar que tal afirmación es equivalente a otra que no contenga dicho signo, y en última instancia, si eliminamos los otros signos definidos previamente, equivalente a otra afirmación que contenga sólo signos primitivos. Lo segundo significa que si tenemos una afirmación que involucra el término definido t cuya prueba recurre, además de a los axiomas y otras definiciones previas, a la definición de t , su afirmación equivalente resultante de eliminar t ha de poder probarse sin recumr a la definición de t, y si se han eliminado todos los términos definidos, ha de probarse a partir de los axiomas solos. Nótese que en caso contrario la presunta definición contendría subrepticiamente información sustantiva, no sería una mera abreviatura terminológica. En este sentido las definiciones son inocuas, no añaden nada al contenido de la teoría; por ello son teóricamente prescindibles, lo que se dice con su ayuda se puede decir igualmente sin ellas. Por supuesto que si un teorema contiene un término definido, para probarlo no nos bastan los axiomas, necesitamos además al menos una definición, la que ha introducido dicho término (y sólo esa definición si es el único término no primitivo del teorema). Pero si el término se ha introducido correctamente, mediante una definición eliminable y no creativa, ese teorema es equivalente a otro cuya prueba no requiere dicha definición, y en última instancia equivalente a otro que contiene sólo términos primitivos cuya prueba recurre exclusivamente a los axiomas. Las definiciones son pues prescindibles, todo lo que se dice con su ayuda se
puede decir sin ella; no se puede decir exactamente de la misma forma, si dicha forma usa términos no primitivos, pero sí de otra equivalente que sólo use términos primitivos. Ahora bien, aunque las definiciones son teóricamente superfluas, no lo son en la práctica de la construcción y aplicación de una teoría; en efecto, para teorías de un mínimo de complejidad conceptual y fuerza expresiva, el prescindir totalmente de definiciones haría a éstas inmanejables y prácticamente incomprensibles. Las definiciones poseen un gran valor de "economía intelectuai" en la construcción de las teorías. En general al axiomatizar una teoría se pretende reducir al mínimo no sólo las afirmaciones primitivas o básicas, los axiomas, sino también los términos primitivos. Es cierto que en esto último la práctica es un poco más laxa y a veces se ofrecen axiomatizaciones en las que algunos términos básicos son definibles a partir de otros, pero ello casi siempre responde a motivaciones pedagógicas (y por los mismos motivos, aunque es menos usual, se dan a veces axiomas no independientes del resto); el ideal estrictamente científico es siempre el mismo: no presentar como primitivo lo que pueda ser derivado, ya sean afirmaciones o conceptos. A veces las simplificaciones de axiomas y términos van de la mano, pues un axioma puede ser eliminado si determinado término, considerado primitivo hasta entonces, se define apropiadamente. Por ejemplo, en TC se puede dar una axiomatización que contenga como término primitivo el signo functor de par ordenado '< , >' y un axioma que regule su comportamiento, a saber "-,y> =
ejemplo epistémico, esto es, qué afirmaciones se consideran mejor fundamentsdas, o más fácilmente cognoscibles. De eso no vamos a decir nada squí, sólo que esta dependencia epistémica es en principio independiente de la que se introduce al axiomatizar y que, por tanto, la axiomatización no tiene por qué seguir criterios de prioridad epistémica. En la presentación axiomática de una teoría se ofrece simplemente una serie de términos primitivos y una serie de afirmaciones primitivas que usan dichos términos, y los términos definidos se introducen. si se quiere, después para abreviar los teoremas que resultarían de escritura excesivamente larga si se usaran sólo los términos originales. .4sí vista, una teoría parece "que parte de cero", pero no hemos de olvidar que en la mayoría de 10s casos 10 que se pretende es "poner orden" en un cuerpo de afirmaciones previamente existentes. Es importante señalar, además, que este proceso no siempre consiste en una mera ordenación, pues a veces la versión intuitiva incluye afirmaciones incompatibles entre sí y al axiomatizar se debe tomar partido por alguna de las alternativas. De hecho. algunas de las axiomatizaciones han surgido precisamente como respuesta a determinadas inconsistencias, o en general dificultades, descubiertas en la versión intuitiva; tal es el caso de las teorías axiomáticas de conjuntos, motivadas principalmente por la paradoja de Russell, o de las axiomatizaciones de las geometrías no euclídeas, que surgieron del intento de probar la independencia en la geometría euclídea del axioma de las paralelas respecto de los restantes. Antes de ver algunos ejemplos es conveniente señalar que este análisis de las teorías, o en general cuerpos de conocimiento, plantea inmediatamente cuestiones fundamentales relativas al significado de los términos teóricos y a la justificación de las afirmaciones de la teoría. El significado de los términos definidos se retrctrae al de los términos primitivos a través de las definiciones. La justificación de los teoremas se retrotrae a la de los axiomas a través de las pruebas de aquéllos a partir de éstos. Como aprendemos pronto de niños, no toda afirmación se puede derivar de otras, ni todo término se puede definir eliminativamente a partir de otros. Los términos primitivos y 10s axiomas son los primitivos en los que nos detenemos; pero entonces el significado de los términos de la teoría pende en última instancia del significado de términos para los que no hay definición explícita, y la justificación de todas las afirmaciones de la teoría pende en última instancia de la justificación de afirmaciones para las que no hay demostración que parta de otras. ¿Cómo adquieren aquéllos significado y éstas justificación? Nótese que, por más que dispongamos de cierta "preconcepción" del significado de los términos primitivos, ello corresponde al estadio intuitivo o preaxiomático de la teoría. Desde una perspectiva axiomática, lo único que especifica explícitamente la teoría al fijar los términos primitivos es su categoría lógica, esto es, si se trata de relatores, functores o términos singulares, categoría que nos permite combinarlos correctamente de acuerdo con la gramática del lenguaje lógico que se utilice. En cuanto a las afirmaciones primitivas, lo único que hace la teoría desde un punto de vista formal es elegir, de entre las infinitas combinaciones bien formadas de términos primitivos y signos complementarios (lógico-matemáticos, según la teoría formal que se presuponga), algunas de ellas para fijarlas como axiomas. La pregunta por el significado de los términos primitivos y por la justificación de los axiomas de la teoría surge pues inme-
diatamente al contemplar las teorías como sistemas axiomiticos. De esta cuestión nos ocuparemos por extenso más adelante en este y en los dos próximos capítulos, de momento nos interesa tan sólo la estructura formal de los sistemas axiomáticos. Para fijar las ideas anteriores vamos a dar el esbozo de algunas teorías axiomáticas, principalmente de las ciencias formales que es donde mis claramente, al menos hasta mediados del siglo XX, ha sido aplicada esta noción; lo peculiar de cierto modo de entender las teorías empíricas es que considera que la naturaleza y estructura de las teorías empíricas también se expresa adecuadamente mediante la noción de teoría axiomática, adecuadamente completada para dar cuenta de las peculiaridades del conocimiento empírico frente al lógico-matemático. Antes de ver los ejemplos reales provenientes.de las ciencias formales, y puesto que no cabe suponer en general el conocimiento del contenido intuitivo de dichas teorías, comenzaremos con una pseudoteoría cuyo contenido nos es familiar a todos, la "Teoría" del Parentesco. Vamos a ver cómo se puede expresar este cuerpo de afirmaciones como teoría axiomática en el sentido elucidado, de modo que capte "las verdades sobre el parentesco" que conocemos. El esquema es siempre el mismo: n términos primitivos ti, ..., r,, tn axioma s.^^,, ..., A,; teoremas T , , Tz, .., con términos primitivos; p definiciones-abreviaturas Di, ..., D,, que introducen p tCrminos derivados t,,,, ..., t,,, y finalmente nuevos teoremas que contienen también términos derivados. Toda afirmación de la teoría ha dz estar constituida exclusivamente por términos propios de la teoría, primitivos o definidos, más vocabulario lógico ('todo', 'y', 'no', etc).
Vamos a presentar aquí, como ejercicio, algunas "teorías del parentesco" de entre las varias que es posible construir. Estas teorías expresan, mejor o peor, las afirmaciones básicas relativas a ese ámbito de la realidad constituido por las relaciones de parentesco sanguíneo o biológico. Además de fijar las ideas anteriores, estos ejemplos servirán para introducir algunas ideas nuevas concernientes a las posibles relaciones que pueden darse entre diversas teorías. Para una mayor precisión, la presentación de las teorías debería utilizar el lenguaje formal de primer orden, pero de momento, y para facilitar la lectura, escribiremos aquí en general los diversos enunciados de las teorías en lenguaje informal; sólo daremos como muestra la versión formal de los axiomas en el primer ejemplo. El lector debe notar que, como señalamos más amba, los enunciados contienen exclusivamente términos introducidos explícitamente por la teoría o términos puramente lógicos. Teoría del Parentesco 1(TPI): Términos (o conceptos) primitivos: C 1. Progenitor (relator diádico): P C2. Varón (relator monádico): V C3. Hembra (relator monrídico): H
Axiomas: A l . Todo individuo es varón o hembra, y sólo una de las dos cosas. V x (Vx H 1 Hx) A2. Todo individuo tiene al menos un progenitor varón. V x 3 y ( v y A PJX) A3. Todo individuo tiene al menos un progenitor hembra. Vx3y (Hy A Pyx) A4. Todo individuo tiene como máximo dos progenitores. Vx,y,z,r (Pxt A P j t A Pzt + z = x v z = y v x =y) Si un individuo es progenitor de otro, éste no lo es de aquél. A5. v x . y (Pxy 4 1 Pyx) Con estos axiomas ya se pueden probar algunos teoremas: TI.
T2. T3.
Todo individuo tiene exactamente dos progenitores. (Prueba: De A2, A3 y A l se sigue que tiene al menos dos progenitores diferentes, de ello y de A4, se sigue que tiene exactamente dos. QED) Nadie es su propio progenitor. Para todo individuo existen como mínimo dos hembras que son progenitoras de progenitores de dicho individuo.
Como muestra T3, algunos teoremas pueden ser muy largos, por lo que es conveniente introducir algunas abreviaturas o definiciones (las incompletas las puede completar el lector; nótese que según la noción de hermano que se va a definir, todo individuo es hermano de sí mismo): Padre: x es padre de y syssdcfxes progenitor de y y x es varón. Madre: .u es madre de y syssddxes progenitor de y y x es hembra. Her: x es her de y sy ssutlx e y tienen los mismos progenitores. Hermano: x es hermano de y syssd4x es her de y y x es varón. Hermana: x es hermana de y syssd,, ................ Hij: x es hij de y SySSr,jy es progenitor de x. Hijo: x es hijo de y syssdcf.............. Abu: x es abu de y syssdrfxes progenitor de algún progenitor de y. Ti: x es ti de y syssdt,............... El lector puede dar las definiciones restantes (sob, sobrino, sobrina, prim, primo, etc.). Con estas definiciones podemos abreviar, p.ej., T3 como T4 y, en general, expresar muchas de las afirmaciones de la teoría intuitiva mediante términos no primitivos:
T4. Todo individuo tiene como mínimo dos abuelas. T5. Todo individuo tiene exactamente un padre y una madre. T6. Todo individuo es her de sí mismo.
T7. Los her de her son her entre sí. T8. Nadie es su propio padre. T9. Si uno es hij de otro, éste no lo es de aquél. TPl es un ejemplo sencillo de teoría axiomática pero que contiene ya todo lo esencial; toda teoría axiomática, por muy complicada que sea, tiene exactamente esta estnrctura. TPI sólo contiene relatores y, como hemos visto antes, Ias teorías pueden contener también como términos, primitivos o derivados, functores y términos singulares (p.ej. podríamos haber dado una teoría "bíblica" del parentesco con los términos singulares primitivos 'Adán' y 'Eva', en cuyo caso deberíamos modificar algunos axiomas pues A2 y A3 no valen para Adán y Eva). El número y variedad categorial de los términos de una teoría aumenta considerablemente su complejidad, pero la estructura es esencialmente la misma en todos los casos, esto es, como la que TP1 ejemplifica. Por otro lado, como teoría del parentesco TP1 no es muy buena, pues no permite obtener como teoremas afirmaciones de la teoría intuitiva como "nadie es bisabu de -sí mismo". La siguiente teoría, que amplía TP1 añadiendo el término nuevo 'ancestro' y sus correspondientes axiomas, es un poco mejor.
Teoría del Parentesco 2 (TP2): Términos primitivos: C 1. Ancestro (relator diádico) C2. Progenitor (relator diádico) C3. Varón (relator monádico) C4. Hembra (relator monádico) Axiomas: A l . Si uno es ancestro de otro, éste no lo es de aquél. A2. Si uno es ancestro de otro y éste lo es de un tercero, entonces el primero lo es del último. A3. Si un individuo es progenitor de otro, también es su ancestro. A4. Si un individuo es ancestro de otro, entonces le conecta con éste una secuencia finita de progenitores. A5. Todo individuo es varón o hembra, y sólo una de las dos cosas. A6. Todo individuo tiene al menos un progenitor varón. A7. Todo individuo tiene al menos un progenitor hembra. AS. Todo individuo tiene como máximo dos progenitores. A9. Si un individuo es progenitor de otro, éste no lo es de aquél. Hemos dado los axiomas de TP2 añadiendo simplemente los cuatro primeros a los de TP1, extendiendo o aumentando TP1 con un nuevo ténnino primitivo y nuevos axiomas. El resultado no es muy feliz, pues ahora A9 es redundante, no es independiente del resto pues se sigue de A l y A3. Construyamos ahora una nueva teoría del parentesco
276
FCNDA~~E\TOSDE FILOSOFL~ DE LA CIENCIA
Teoría del Parentesco 3 (TP3): Los mismos términos primitivos y derivados que TP2 y los mismos axiomas salvo
Ag. TP3 está un poco mejor que TPl pues se obtienen como teoremas todos los de TP1 más algunas afirmaciones que se le escapaban a TPI, como "nadie es bisabu de sí mismo", y además otras afirmaciones deseables sobre el nuevo concepto, tales como "todo individuo tiene tantos ancestros varones como hembras" y "dos individuos tienen los mismos progenitores si y sólo si tienen los mismos ancestros". TP3 presenta además una característica novedosa respecto de TPI. TP1 contiene, además de sus términos primitivos, sólo términos lógicos, términos de la lógica de primer orden (LPO) que es por tanto la teoría presupuesta por TPl y "dentro de la cual" realizarnos nuestras demostraciones. Pero TP3, en su A4, contiene un término extralógico, el término 'secuencia finita'. Este término no pertenece a LPO sino a otra teoná formal específica más rica que LPO, la aritmética o, alternativamente, la teoría de conjuntos. Algunas teorías pueden por tanto utilizar como recursos formales adicionales (ténninos y principios), no sólo los de la lógica que utilice sino también los de alguna teoría matemático-formal. En TP3 esos recursos teóricos formales adicionales son muy sencillos, pero en teorías físicas altamente matematizadas pueden incluir partes muy elevadas de la matemáticas (cálculo diferencial, teoría de tensores, etc.). TP3 ilustra además otro hecho. Diremos que una teoría es inmediatalne~ztesimnplifzcable si sus axiomas no son independientes. Vimos que TP2 era una extensión de TP1 inmediatamente simplificable y eliminando el axioma redundante obteníamos TP3, que ya no es inmediatamente simplificable. Pero aunque TP3 es mejor que TP2, no es todo lo buena que podría ser pues es simplificable en otro sentido menos inmediato pero igualmente importante, sentido en el que desempeñan un papel fundamental los términos primitivos. El sentido es el siguiente: podemos definir alguno de sus términos primitivos en función de los restantes de modo que alguno de los axiomas pase a ser deducible del resto, esto es, de modo que la nueva teoría sea inmediatamente simplificable. Eso es lo que pasa con TP3, pues puedo definir 'progenitor' en función de 'ancestro' (un progenitor es un "ancestro de primera generación") obteniendo una teoría inmediatamente simplificable. Teoría del Pareittesco 4 (TP4): Los mismos términos primitivos que TP3 salvo 'progenitor', que se introduce ahora como término definido del siguiente modo: x. es progenitor de y s y s ~ es ~ ~ ancestro ~ x de y y no hay ningún individuo z tal que x es ancestro de z y z es ancestro de y. Los mismos axiomas que TP3. Se dirá que ahora los axiomas de TP4 no pueden ser directamente los de TP3 pues contienen un término, 'progenitor', que ahora no es primitivo. Pero nada impide que una
teoría contenga axiomas con términos definidos; estos términos son meras abreviaturas y, si se prefiere, podemos escribir los axiomas sin ellos, pero también podemos hacerlo con su ayuda si usando sólo términos primitivos resultan muy engorrosos, como ocurriría con los axiomas 3, 6, 7, 8 y, en especial, 4 de TP4 (que ahora diría que no hay secuencias infinitas de "ancestros consecutivos"). Pues bien, los escribamos como los escribamos, en su actual forma o "deshaciendo" la definición de 'progenitor', el resultado es que ahora A3 se puede probar como teorema, es decir, TP3 es inmediatamente simplificable. Esta situación nos permite una primera aproximación intuitiva a dos conceptos de los que nos ocuparemos por extenso más adelante, los de redllcción y eqrrivalencia (cf. cap. 11). Obtengamos ahora una nueva teoría eliminando de la teoría inmediatamente simplificable TP4 el axioma redundante A3.
Teoría del Parentesco 5 (TP.7): Los mismos conceptos primitivos y derivados que TP.4 y los mismos axiomas menos A3. Olvidemos por el momento TP2 y TP4, que no son buenas teorías asiomiticas al ser inmediatamente simplificables, y centrémonos en TPl, TP3 y TP5, buenos sistemas axiomáticos con todos sus axiomas independientes. Tal como hemos dado con ellas, deberían estar claros ahora los siguientes hechos: a ) TP3 y TP5 "dicen lo mismo", tienen el mismo contenido; 6 ) TP3 y TP5 "dicen al menos tanto como" TP1, todo el contenido de TP1 es también contenido de éstas. En el primer caso decimos que TP3 y TP5 son equivalentes, en el segundo que ambas reduceil TP1. Intuitivamente: una teoría T reduce otra T' si el contenido de T' es parte (quizá no estricta) del contenido de T; una teoría T es equivalente a otra T' cuando tienen el mismo contenido, es decir, cuando se reducen mutuamente. Tal como hemos obtenido nuestras teorías, quizá estas relaciones no parezcan muy interesantes. TP3 es una simplificación de TP2, que es una simple ampliación (inmediatamente simplificable) de TP1, por lo que poco tiene de sorprendente que TP2, y con ella TP3, reduzcan TP1; en realidad TP3 tiene incluso todos los conceptos primitivos de TP1, y algunos más, nada muy sorprendente pues que diga lo mismo que ella y quizá algo más. Pero es esencial destacar que la reducción no exige que la teoría reductora contenga como primitivos 10s términos primitivos de la reducida; TP5 reduce TP1 y entre sus términos primitivos ('ancestro', 'varón', 'hembrat) no están todos los primitivos de TP1 ('progenitor', 'varón', 'hembra'). Y lo mismo ocurre respecto de la equivalencia o reducción recíproca. TP3 y TP5 son equivalentes y sin embargo no tienen exactamente los mismos términos primitivos. En este caso particular, los términos primitivos de una de las teorías, TP3 ('ancestro', 'progenitor', 'varón', 'hembra'), incluyen los primitivos de su equivalente TP5. Pero no es necesario ni que tengan los mismos tirminos primitivos ni siquiera que los de una lo sean también de la otra. Como ejemplo tómese la siguiente teoría del parentesco.
27 8
FüSDA51EhT3S DE FILOSOFLA DE LA CIENCIA
Teoría del Parentesco 6 (TP6):
.
Términos primitivos: C 1. Padre (relator diádico) C2. Madre (relator diádico) C3. Varón (relator monádico) C4. Hembra (relator monádico) Axiomas: A l . Todo individuo es varón o hembra, y sólo una de las dos cosas. A2. Todo individuo tiene exactamente un padre. A3. Todo individuo tiene exactamente una madre. A4. Los padres de alguien son varones y las madres hembras. A5. Si un individuo es padre de otro, éste no lo es de aquél. A6. Si un individuo es madre de otro, éste no lo es de aquél. Definiciones: D1. Progenitor: x es progenitor de y syssddxes padre o madre de y. El resto de definiciones como en TP1.
Pues bien, es fácil ver que TP6 es equivalente a TP1 (y como TPI, por tanto, reducida por TP3 y TP5) y sin embargo ninguna incluye como primitivos todos los conceptos primitivos de la otra. Lo que sí ocurre, y este es el punto esencial, es que los términos primitivos de una pueden ser defiilidos mediante los de la otra (en los términos comunes la definición es inmediata, la gracia está en los no comunes) de modo que los axiomas de una se convierten en afirmaciones (axiomas o teoremas) de la otra. Éste es el concepto un poco más refinado de reducción: Treduce T' 'si los términos primitivos de T' pueden ser definidos en T de modo que los axiomas de T' se obtienen como axiomas o teoremas de T (s610 como teoremas, si no tienen ningún término en común); T y T' son equivalentes si se reducen mutuamente. Cuando las teorías tienen términos comunes, como en nuestras teorías del parentesco, estas relaciones no suelen ser extremadamente interesantes, después de todo "parecen hablar (al menos parcialmente) de lo mismo". Más interesantes son los casos, que discutiremos por extenso más adelante (cf. en el próximo apartado de esta sección el ejemplo de la teoría de conjuntos y la aritmética, y para ejemplos empíricos el capítulo 11), en los que las teorías involucradas no compmen ni siquiera parcialmente el material conceptual, esto es, cuando las teorías parecen en principio estar hablando de cosas diferentes y se descubre que una teoría reduce otra. Este tipo de situaciones tienen el máximo interés desde el punto de vista metacientífico, como veremos, por su relevancia en los fenómenos de cambio teórico y sus implicaciones epistemológicas y ontológicas (cap. 13).
Acabaremos dando algunos ejemplos de teorías axiomáticas pertenecientes al campo de las ciencias formales, más interesantes a efectos ilustrativos que nuestra
inventada teoría del parentesco pues corresponden a casos reales d e teorías axiomati-
zadas. Aritinética de Peano (AP):
AP, axiomatizada por Peano (y Dedekind) a finales del siglo xrx, pretende sistematizar axiomáticamente las verdades conocidas y utiIizadas informalmente desde antiguo sobre los números naturales y sus propiedades, relaciones y operaciones básicas. Términos primitivos. C1. Número natural (relator monádico) C2. Cero (término singular) C3. El siguiente de (functor monádico) Axiomas: A l . Si un objeto es número natural, su siguiente también lo es. A2. El cero es un número natural. A3. El cero no es el siguiente de ningún número natural. A4. Dos objetos con el mismo sizuiente son el mismo. A5. Si el cero tiene una propiedad cp y el que un número natural sea cp implica que su siguiente también es cp, entonces todo número natural tiene la propiedad 9. (Nótese que A5 no es exactamente un único axioma sino lo que se denomina un esquema axiomático, un axioma con una (meta)variable libre cp, en este caso una variable para propiedades, que da lugar a axiomas específicos para cada ejemplificación concreta de la variable.) Teoremas: T1. El siguiente del siguiente del cero es un número natural. T2. El siguiente del siguiente del cero no es el siguiente del cero. T3. Cero no es el siguiente del siguiente de cero. Definiciones: D 1. Uno = d,f el siguiente de cero. D2. Dos = defelsiguiente de uno. D3. T r e ~ =......... ~~f D4. Suma (functor binario: la suma de ... y ...): a ) x más cero = dcfir b) x más el siguiente de y = J,rel siguiente de (x más y). D5. Producto(functor binario): a ) x por cero = dsfcero b) x por el siguiente de y = 2tf.u más (.u por y). D6. x I:y syssJ4existe un número natural z tal que x más z = y . D7. x es par syssd4existe un natural z tal que .r = dos por z.
(D4 y D5 son lo que se denomina defiiziciones recztrsii~as;intuitivamente: el resultado de la operación de un número con otro diferente de cero se da en función del resu:tado con el anterior del segundo -cláusula b)-; como además se da el resultado de operar cualquier número con el cero -cláusula a)-, queda bien definida la operación para cualesquiera números, pues todos los números surgen del cero mediante la función siguiente.) Teoremas: T3. Dos es número natural y par. T4. Dos no es el siguiente del cero. T5. Cero no es el siguiente de uno. T6. Uno más dos = tres. T7. Para todo .Y, y: x más J = y más x. T8. Para todo x: x por uno = x. T9. Para todo x, y: s I s más y.
Teoría de Conjlcntos (TC): TC es una teoría desarrollada en su práctica totalidad por el matemático alemán G. Cantor a finales del siglo XIX. TC trata de los "agregados", conjuntos, colecciones o clases, de las propiedades, relaciones y operaciones entre estas entidades. TC se axiomatizó a principios del siglo xx como parte de algunas estrategias para resolver los problemas de fundamentos derivados de la inconsistencia de la teoría en su versión intuitiva inicial. Hay varias axiomatizaciones alternativas, y la que damos aquí es parcial pues recoge sólo algunos de los axiomas más comunes; es por tanto insuficiente y no contiene los elementos que hacen propiamente interesantes Iris diversas axiomatizaciones existentes. Términos primitivos: C 1 . Conjunto (relator monádico). C2. Pertenencia (relator diádico: ... es elemento de ...). Axiomas: A l . Dos conjuntos a los que pertenecen los mismos objetos son el mismo. A2. Dado un conjunto y una propiedad 9,hay un conjunto cuyos elementos son los elementos del primero que tienen la propiedad cp. A3. Existe un conjunto que no tiene elementos. A4. Dados dos conjuntos, existe otro formado por los elementos de los anteriores. A5. Dados dos objetos, existe un conjunto formado por ambos. (El lector habrá notado que A2 es un esquema axiomático.) Teoremas: T I . Existe un y sólo un conjunto sin elementos. T2. Dados dos conjuntos, existe un y sólo un conjunto cuyos miembros son los elementos de los anteriores.
Dados dos conjuntos, existe otro formado por los elementos comunes de ambos, y es único. T3. Dados dos conjuntos, existe otro formado por los elementos del primero que no pertenecen al segundo, y es único. Definiciones: D I . 0 = dcf el conjunto sin elementos. D2. x cy syssdeflos elementos de .u son también elementos de y. D3. x u y = def el conjunto formado por los elementos de .u o de y. D4. x ny = J,f el conjunto formado por los elementos comunes de x e y. D5. x - y = def el conjunto formado por los elementos de x que no pertenecen a J . Teoremas: T5. Para todo x: 0 c.u. T6. Para todo x: x u 0 = s. T7. Para todo .u, y: .u nJ = J n.u. TS. Para todo x, y, z: .Y - C\' u z)=(s - J ) n ( x - z). T9. Para todo x, y: si .Y cy entonces s n y = .Y. T3.
AP y TC proporcionan una ilustración interesante de uno de los conceptos que introdujimos más arriba con ocasión de las diversas teorías del parentesco, la relación de reducción. Vimos entonces que TP5 reducía TP1, hecho que no parecía muy interesante dada la inmediata proximidad temática de ambas teorías. Pues bien, uno de los logros más importantes de la historia de las ciencias formales (debido fundamentalmente a Frege) consiste en haber mostrado que AP se reduce a TC (no a esta TC, sino a la teoría dz conjuntos en su versión completa). Éste es un hecho en principio sorprendente pues ambas teorías parecen hablar "de cosas diferentes". Pues bien, Frege mostró que hay una manera de definir los números como determinados conjuntos (o estensiones, como él decía) de modo que las verdades básicas sobre números se derivan de las verdades básicas sobre conjuntos: es posible definir los términos aritméticos primitivos en términos conjuntistas de modo tal que los axiomas de la aritmética se convierten en teoremas que se derivan de los axiomas de la teoría de conjuntos. La rzducción se da pues exactamente en el mismo sentido que m5s arriba vimos respecto de TP1 y TP5, pero ahora es realmente interesante pues las teorías involucradas no comparten. en principio, aparato conceptual. A modo de ejemplificación de la idea abstracta de reducción, vamos a presentar tan sólo las líneas generales de la reducción de AP a TC (ahora nos expresaremos incorrectamente y mezclaremos definición de términos con identificación de entidades). El cero se define identificándolo con el conjunto vacío. Para la función siguiente haj varias posibilidades. Una es definir el siguiente de un conjunto .r como su unitario { x } (cuya existencia unívoca queda garantizada: si esiste s,existe por A5 {.Y, .Y] que es identico a {.Y} por Al). Otra posibilidad es definir el siguiente de un conjunto r como su unión con su unitario, e.e. como .u u {.Y} (cuya existencia unívoca también queda garantizada. por la existencia de {s]más A4). La definición de 'número natural' requiere algunas complicaciones que no hemos incluido en la \.ersión simplificada de TC que hemos presentado. En especial se requiere el siguiente axioma que habíamos omitido: "existe al menos iin
conjunto tal que a ) tiene como elemento 0 y b) si tiene como elemento un conjunto, entonces tiene también el siguiente de dicho conjunto". Este axioma asegura que existe al menos un conjunto con el vacío y con todos los que le siguen (que son infinitos, por eso se le denomina a veces Axioma de Infinitud). A los conjuntos así se les denomina inductivos, y es posible que haya varios tales conjuntos "inductivos", si además de tener esos objetos tienen otros. Pues bien, el menor de todos esos conjuntos inductivos, e.e. la intersección de todos ellos, tiene como elementos sólo el vacío y sus siguientes, es decir, los números naturales "definidos" en términos conjuntistas. La propiedad de ser un número natural se define entonces como "pertenecer al menor conjunto inductivo", definición con la que concluye la reducción de la aritmética a la teoría de conjuntos, pues ahora los cinco axiomas de Peano son teoremas de TC (con algunas complicaciones que hemos obviado, sobre todo relacionadas con A5 de AP, pero que no son esenciales para la idea general). Lógica Proposicional (LO): Concluimos con la presentación del propio cálculo lógico de la lógica proposicional (lo mismo se podría hacer con la Iógica de primer orden). Aunque hoy es usual presentar los cálculos lógicos como cálculos de deducción natural, históricamente se formularon originariamente como cálculos axiomáticos; eso fue (parte de) lo que hicieron, p.ej., Frege en su Begr~ffsschrij?y Russell y Whitehead en Principia Marheilzatica para la Lógica d e Primer Orden. En lo que sigue referimos sólo los axiomas de una de las diversas versiones posibles para la lógica de enunciados (no referimos las reglas de inferencia, Modus Ponens y Sustitución; las variables están por proposiciones. y los axiomas y teoremas se han de leer, como en las teorías anteriores, clausurados uni\lersalmente). Términos primitivos: C 1. Negador: 7 (functor monario). C2. Implicador: + (functor binario). Axiomas: A l . x+(y-+x). A2. ( i x + l y ) + ( y + . x ) . A3. (x -+ 0> 4 2 ) ) ((x 4 y) -+ (x -+ z)j. Teoremas: TI. x + x . T2. -i (x-+ 7x). T3. x + ( l x + y). Definiciones: 91. X V Y = ~ ~ J ~ X + ~ . D2. x r \ y = d r f 7 ( x - + - i y ) . D3. ~ t j y = ~ ~ ( x + y ) ~ O > + x ) . Teoremas: T4. ~ ( x A - x ) . T5. x v - i x .
Con LO como última ilustración concluimos la presentación del concepto de cálculo o teoría axiornática y de otras nociones relacionadas, como las de reducción y equivalencia. Para fijar estos conceptos hemos utilizado intencionadamente como ejemplos (además de nuestras inventadas teorías del parentesco) teorías pertenecientes al campo de las ciencias formales. El motivo es que el análisis de las teorías de las ciencias empíricas como cálculos axiomáticos presenta problemas específicos que no tienen que ver con el concepto abstracto de teoría axiomática. Una vez fijado el instrumental conceptual, en las secciones subsiguientes nos ocuparemos por extenso de su eventual aplicación a las ciencias empíricas y los problemas específicos que tal aplicación comporta. Finalizaremos esta introducción del aparato conceptual presentando el concepto formal de modelo o realización de una teoría axiomática.
2. Teorías y modelos En el lenguaje común el término 'modelo' es un término extremadamente polisémico, y dentro mismo de la filosofía de la ciencia se usa con toda una variedad de significados diferentes (para un análisis de los mismos, cf. Falguera, 1993). Una familia de tales significados tiene que ver con la idea de caso o realización de una afirmación o conjunto de ellas. Así, por ejemplo, podemos decir que Romeo y Julieta, o mejor ellos "junto con su amor", son un modelo, caso o realización de la afirmación "los amantes prefieren la muerte a la separación"; o que España y Bélgica, "con todo lo que llevan dentro", son en la actualidad modelos o casos de monarquía constitucional, esto es, de una serie de principios o reglas políticas, y que Francia, Italia y Portugal lo son de estados republicanos (aunque España y Bilgica no realizan exactamente los mismos principios monárquicos, sólo comparten parte de ellos, y lo mismo Francia, Italia y Portugal respecto de los principios republicanos). Parte del sentido de este uso es explicitado y precisado por una teoría lógico-matemática altamente abstracta, la Teoría de Modelos. No vamos a ver aquí siquiera los rudimentos de tal teoría, nos limitaremos a presentar informalmente el concepto de modelo del que ella se ocupa, pues desempeña un papel importante en algunos análisis metateóricos que veremos en este y próximos capítulos. Un modelo en el sentido de la Teoría de Modelos (en adelante escribiremos simplemente 'modelo') es un sistema o estructura, un "trozo de la realidad constituido por entidades de diverso tipo, que realiza una teoría o conjunto de axiomas en el sentido de que en dicho sistema "pasa lo que la teoría dice" o, más precisamente, la teoría es verdadera en dicho sistema. Si tomamos los principios monárquicos generales comunes a las constituciones española y belga. y los bautizarnos como Teoría Mínima de la Monarquía Constitucional, entonces España y Bélgica, y p.ej. también Suecia, como sistemas o "partes de la realidad,
284
FL'XDAhlE\TOS
DE FILOSOFL~DE L.4 CIENCIA
son modelos de dicha teoría, y Francia, Italia y Portugal no lo son. Esta idea intuitiva se puede hacer precisa mediante la noción formal de sistema o estructura que presentamos en el Apéndice. Recordemos que un sistema es simplemente una tupla o secuencia de entidades conjuntistas construidas a partir de un universo o dominio básico de objetos. A veces puede haber varios dominios básicos, pero eso no es una diferencia esencial, pues siempre se puede tomar su unión como el universo y después destacar de él los subconjuntos principales. Lo importante es que un sistema es o representa "un pedazo de la realidad, entidad lingüística, salvo quizá, en algunas ocasiones. en un sentido d objetos del universo son ellos niismos entidades lingüísticas. El dominio tar de personas, números, proposiciones, partículas o cualesquiera otras e plo enunciados. En el primer caso tenemos un sistema "humano", en el s rico", y en e1 último caso tenemos un sistema "lingüístico", constituid ~üísticas.Pero incluso si en este caso queremos decir que el sistema es + ca en el sentido de estar construido por entidades lingüísticas, ello sólo pues estos sistemas "lingüísticos" no son ellos mismos entidades ling estiucticradas de la realidad, y como sistemas son simplementepa~~es lingüísticas susceptibles de ser verdaderas o falsas o de tener signifi realidad respecto de la cual ciertas entidades lingüísticas, enunciado las teorías entendidas en el sentido axiomático visto. son verdaderas contemplada la relación en la dirección opuesta, son panes de la reali no como afirma la teoría, que satisfacen o no las afirmaciones de la t teoría axiomática todas sus afirmaciones, su contenido, está expres implícitamente, por los axiomas, para ver si un sistema .es- o no --.-.-ver si satisface o no sus axiomas. Para que un sistema pueda siquiera ser modelo de tenga eloapropiado, es decir, que esté constituido por entida lógico que los t é n i n o s primitivos de la teoría. pues las entidades significado en el sistema", esto es la inrerpl-eración, de los término teoría contiene relatores diádicos y en el sistema no hay relaciones b ni siquiera podemos ponemos a ver si la teoría es verdadera o falsa e una teoría T cuyos términos primitivos son j relatores R!, ..., Rj (cad especificada), k functoresfi, ...,fr (con sus ariedades especificadas) res o constantes individuales cl, ..., cm.Diremos entonces que un sistema ción osible de.odT- i s Vamos a utilizar la h a r las entidades que interpretan en el sistema los t es una realización posible de T si S consta de un universo U y, relaciones R i , ..., Rj.,k funciones f,, ..., fi.y 112 individuos destacado ..., Rj, fi, ..., fL,ci, ..., cm>,tales que cada relación y función es de 1 relator o functor que interpreta. Estos sistemas son las entidades preguntarse si son o no modelos de la teoría, si en ellas la teoría ello s e x e s ' . Por supuesto que (salvo q e sea una tearía tautológica) no todas las posibles realizaciones serán realizaciones efecti as o modelos d e la teoría. Las realizaciones efectivas, o inodelos de la teoría, son aque las realizaciones __-m
C
- - - - - 1
1 1
posibles en las que ocurre lo que la teoría afirma, las que de hecho se comportan como la teoría dice, o técnicamente, en las que los axiomas (y con ellos todo el resto de afirmaciones) de la teoría son verdaderos. Para fijar ideas concluiremos dando una serie de axiomas y diversos sistemas, algunos de los cuales satisfacen todos los axiomas y otros sólo parte de ellos. Términos primitivos: C1. M (relator diádico).
C2. * (functor diádico). C3. 0 (functor diádico). C4. (functor monádico). C.5. e (constante individual). Axiomas (léanse clausurados universalmente): A l . xMx A2. x M y ~ y M z - + x M z A3. x*y =y*x A4. xoy =yox A.5. (x*y)*z = x*(y*z) A6. xOx= x A7. - - x = x A8. xhL~*y Ag. x0yM.r A 10. xob*z) = (xoy)*(.xoz) A l l . -(.vy)=-x* - Y A12. x * e = x A13. x o e = e A14. x* - . r = e
-
Contemplemos ahora los siguientes sistemas, en los que el primer constituyente, después del universo, interpreta 'M', el segundo '*', el tercero 'o', el cuarto '-' y el quinto 'e'. S, =
El lector puede comprobar que todos ellos son realizaciones posibles, tienen el tipo lógico apropiado para poder satisfacer los axiomas, pero que sólo S5 y S6 son modelos de todos los axiomas, satisfacen de hecho todos los axiomas a la vez. En S , fallan los axiomas 6, 7, 9, 11 y 14; S: y S3satisfacen los mismos, a saber, todos menos 6, 8, 9 y 11; por último, SI sólo satisface 1,2,3.5,7, 12 y 14. Como se ve, una misma teoría, un mismo conjunto de axiomas, puede tener modej los muy diferentes. De hecho no hay ninguna teoría que tenga un único modelo o realización, al menos si estamos dispuestos a aceptar siempre modelos matemáticos. Ahora bien, aunque las teorías no determinan unívocamente sus modelos en este sentido tan estricto, lo pueden hacer en otro sentido todavía interesante. un poco más débil que el anterior y de hecho más razonable. En la interpretación que venimos usando, una teoría pretende "describir (un trozo de) la realidad". Pues bien, si los diversos modelos son "extremadamente semejantes" entre sí, aunque no se describa un ú*co modelo se tratará de una buena descripción en el sentido de suficientet~tenteuníi,oca. Dicho técnicamente: si los diversos modelos son isomorfos entre sí (para la noción de isomorfía, cf. Apéndice), la teoría determina la realidad del modo más fuerte que es razonable exigir; a una teoría así se le denomina categórica. Dar con una teoría categórica no es fácil. Por ejemplo, la teoría consistente en todos los axiomas que acabamos de presentar tiene modelos no isomorfos, S5 y S,. La teoría consistente en los axiomas 1, 2, 3,4,5,7, 10, 12, 13 y 14, tiene modelos isomorfos, S2 y SI, pero otros no isomorfos, pues S5 y S6 son también modelos de esa teoría y no son isomorfos entre sí ni respecto de S: y SI. En realidad no siempre es bueno pretender que la teoría sea categórica. Quizá eso sea deseable en las teorías formales, pero desde luego no lo es en las teorías empíricas. En las teorías empíricas es natural pretender que una teoría tenga modelos que sean partes de otros modelos o, como se dice técnicamente, q r e entre sus modelos algunos puedan ser extensiones de otros, esto es, partes más grandes de la realidad, por así decir. Eso no siempre impide la isomorfía, por ejemplo SI es una extensión de Sj y son isomorfos; pero la impide cuando los modelos, como parece razonable no descartar en las teorías empíricas, tienen un universo finito. Sobre este tipo de cuestiones trataremos más adelante. De momento es conveniente insistir ahora tan sólo en el siguiente hecho, trivial pero interesante: todos los modelos de una teoría, sean o no isomorfos, se parecen mucho en cierto sentido, a saber, todos se comportan como la teoría dice. Y eso por supuesto es un parecido digno de tener en cuenta, de hecho es el tipo de parecido a tener en cuenta cuando se trata de teorías empíricas.
1; ->
3. Caracterización general de las teorías empíricas como cáIculos interpretados Examinemos ahora los primeros análisis que se hicieron del concepto de teoría empírica. Según la concepción a que dichos análisis dieron lugar, una teoría empírica es un cálculo interpretado, donde por 'cálculo' se entiende un cálculo o teoría axiomática en el sentido presentado en la sec. 1. Allí vimos unos ejemplos puramente formales, y la ilustración era intencionada, pues de hecho los primeros filósofos de la ciencia tomaron la idea de las axiomatizaciones que entonces se hacían de algunas teorías lógicas y matemáticas (axio-
matizaciones en matemáticas que hasta mediados de siglo seguirían invariablemente el esquema de la sección 1). Es más, el primer análisis detallado de las teorías empíricas como cálculos interpretados se presenta explícitamente en relación con una teoría axiomática puramente matemática. Se trata del estudio que hace Reichenbach en los años veinte de las semejanzas y diferencias en naturaleza y estructura de la Geometría Pura (GP) y la Geometría Física (GF) (cf. 1928). La semejanzas consistían básicamente en la estmctura axiomática de ambas; las diferencias se derivaban de la naturaleza empírica de la segunda. A diferencia de GP, cuyo análisis se agota al dar su estructura axiomática puramente formal, el carácter empírico de GF obliga a completar la parte puramente axiomático-formal con elementos adicionales que den cuenta de su carácter "físico"; estos elementos deben hacer explícitos los modos en que el formalismo abstracto se pone en contacto con la experiencia, esto es, el modo en que recibe una interpreraciónflsica determinada. Éste es el origen y núcleo del análisis de las teorías empíricas como cálculos interpretados. La idea básica es desarrollada, en los años veinte y treinta del siglo xx, de modo parcialmente coincidente por Reichenbach, Ramsey, Bridgman, Campbell y Camap, que sería su principal impulsor. Esta idea se conforma como el núcleo central de lo que se denominará más tarde Concepción Heredada y encuentra su expresión más elaborada en las principales monografías que en los años cincuenta y sesenta escriben sus principales representantes (cf. especialmente Braithwaite, 1959; Camap, 1966; Nagel, 1961 y Hempel; 1965 y 1966) y será prácticamente dominante en filosofía de la ciencia hasta casi los años setenta. Veremos primero en esta sección cuáles son sus aspectos más generales y discutiremos en las sisuientes con algo de detalle algunos de sus elementos, la evolución que sufrieron y las últimas revisiones críticas, principalmente por parte de Hempel.
Según la posición dominante en filosofía de las ciencias formales, al menos durante la primera mitad del siglo xx, los axiomas del formalismo abstracto son lo único que interviene en la caracterización de las entidades "de las que habla" una teoría matemática; qué cosas son esas de las que pretendemos hablar al usar los términos de la teoría es algo que depende únicamente de los axiomas, las entidades en cuestión son cualesquiera de las que los axiomas sean verdaderos. Así, por ejemplo, los números naturales, es decir, la propiedad de ser número natural, el número cero y la función siguiente, serán cualesquiera entidades de las que resulten ser verdaderos los axiomas de Peano. A veces se expresa esto diciendo que los axiomas caracterizan las entidades de la teoría o, también, que definen iinplícitamente los términos primitivos. Debe quedar claro que no se trata de una definición en el sentido introducido en la sección 1. De los términos primitivos no puede haber definición e-rplícira, pues entonces no serían primitivos (las definiciones explícitas son justamente el modo en que se introducen los términos derivados a partir de los primitivos). Los axiomas "definen" implícitamente los términos primitivos en el sentido apuntado, a saber, ellos son los únicos elementos constitutivos del significado de los términos; cualquier estructura que sea modelo de los axiomas es una interpretación admisible de los
mismos; esto es, los constituyentes de cualquiera de tales estructuras son interpretaciones admisibles de los términos con que se formulan los axiomas. Algunos autores, como Carnap, han dado una interpretación coi~vencio~íalista de las definiciones implícitas, según la cual los axiomas estipulan el significado de los términos y por tanto son "\lerdades por convención". Otros, como Hilbert inicialmente, han defendido una interpretación fori7talisra, de acuerdo con la cual los axiomas son simplemente reglas para el manejo de los signos involucrados, y por tanto en sentido estricto ni siquiera es razonable considerarlos susceptibles de ser verdaderos o falsos. En tal caso es discutible que tenga incluso sentido hablar propiamente del si,pificado o interpretación de los términos involucrados. Convencionalismo y formalismo son dos modos específicos de entender la idea general de que en un sistema axiomático los axiomas definen implícitamente los términos, que los axiomas solos caracterizan plel~amenteel "uso correcto" de los términos. Pero se puede defender esta idea sin defender ninguna de esas interpretaciones específicas de la misma, defendiendo que existen "realmente" las entidades matemáticas significadas por los tenninos primitivos; los números naturales son cualquier cosa (tomando ahora 'cosa' en serio en un sentido no lingüístico) que satisfaga los axiomas de Peano. Independientemente de cuál sea su interpretación específica (salvo en el caso quizá del formalismo radical) hay algo de plausible en la idea general de que las cosas de las que una teoría matemática habla son cualesquiera entidades que satisfagan los axiomas. Ese elemento de plausibilidad es el que justifica que aceptemos que Frege redujera la aritmética a teoría de conjuntos. Como hemos visto en la sección 1, Frege demostró que los axiomas de Peano que usan los términos 'cero', 'el siguiente de' y 'número natural' son verdaderos de "el conjunto vacío", "la unión con el propio unitario" y "pertenecer al menor conjunto inductivo". Entonces eso son (los) naturales, pues de esas cosas son verdaderos los axiomas de la aritmética. Quien proteste y diga que a pesar de ello no se trata de la aritmética, pues está claro que "esas cosas" son conjuntos y no números, está rechazando de plano dicha idea general; y en la medida en que tal protesta se considere injustificada se considerará plausible la idea en cuestión. Y efectivamente la protesta parece algo injustificada, lo que son las cosas depende de sus propiedades, de su "comportamiento", que es lo que establecen los axiomas, no depende de las expresiones lingüísticas con las que la teoría las nombre. De todas formas las intuiciones no son del todo claras pues, ¿qué diríamos si de hecho AP fuese verdadera también de (supongamos por un momento que efectivamente existen tales entidades) el individuo Lucifer, la función "el corruptor de" y la propiedad "ser demonio"?, ¿aceptaríamos también sin protestar que estamos ante números naturales? Esta cuestión es extremadamente compleja y no vamos a ocupamos aquí de ella, pues eso es tarea de la filosofía de la matemática. Si nos hemos extendido algo sobre este punto es para presentar la intuición central del análisis de las teorías empíricas. La idea que queremos destacar es la siguiente: mientras que en las ciencias formales parece razonable, o al menos defendible, la tesis de que las entidades a las que la teoría se refiere son cualesquiera de las que sean verdaderas los axiomas, ella es totalmente inaceptable aplicada a las ciencias empíricas. Por ejemplo, si los principios de la mecánica newtoniana, formulados con términos como 'partícula', 'masa' y 'fuerza', fuesen por casualidad
verdaderos de los ángeles, su "cantidad de espiritualidad" y sus "afinidades", no por ello diríamos que ésas son cosas de las que habla la teoría mecánica, no diríamos que son sistemas mecánicos. 0, con un ejemplo menos absurdo, tales principios son de hecho verdaderos de ciertos dominios puramente numéricos y de ciertas funciones puramente numéricas entre los números de los dominios, pero eso no hace que la mecánica hable (quizá entre otras cosas) de puros números, no por ello los números son partículas mecánicas. Eso es indiscutible en este caso; la idea de que los términos de la mecánica refieren a cualesquiera entidades que satisfagan el formalismo abstracto es claramente inaceptable. El motivo es que, a diferencia de las ciencias formales donde esa idea es cuando menos discutible, las teorías empíricas tienen, además de las constricciones derivadas del sistema axiomático abstracto, otras constricciones derivadas de su vinculación con el mrrndofísico-natural, o mejor dicho, con algún aspecto específico del mismo del que pretenden dar cuenta. Por supuesto que esta diferencia depende de que se considere que hay a su vez una diferencia entre teorias formales y teorias empíricas, y efectivamente la mayoría de los autores de este período (y también posteriormente) consideran que dicha diferencia es un dato firme de nuestras intuiciones. Aceptando esta peculiaridad de las teorías empíricas, jcómo se debe recoser este hecho específico en el análisis de las mismas? La respuesta parece inmediata: incluyendo, junto con el sistema axiomático abstracto, otro elemento que exprese la conexión de dicho formalismo con "situaciones de la experiencia" en las que interactuamos o "contactamos" con el mundo físico. La articulación específica de esta respuesta que se impondrá en la Concepción Heredada es que esas situaciones de experiencia en las que se da el contacto básico con el mundo físico son situaciones de observación directa de fenómenos físicos. En la formulación y expansión de esta idea influyó sin duda el neoempirismo (a veces radical) dominante en los círculos filosóficos donde se planrearon estas cuestiones, pero independientemente de ello la idea tiene cierta plausibilidad en sí misma. La interacción básica con nuestro entorno físico inmediato la realizamos a través de los órganos sensoriales, interacción que se plasma en forma de obsetvaciótt, en un sentido amplio. no estrictamente visual, del término. Pero hay que distinzuir esta idea general difícilmente recusable de otras dos más fuertes: a ) El "estar basado en la observación" característico dz nuestro sistema cognitivo global, caracteriza también sus diversas partes, y en particular es característico en exactamente el mismo sentido de cada teoría científica concreta. b) Por observación directa se ha de entender observación independiente de esquemas cognitivos elaborados. Aunque hemos formulado estas tesis muy vagamente, debe notarse que no son ya indiscutibles, que son mucho más fuertes que la idea general claramente defendible. En la penúltima sección volveremos sobre ellas para discutirlas en detalle; por el momento basta saber que eran defendidas por muchos de los iniciadores de la Concepción Heredada y que se acabarían imponiendo en la versión oficial de la misma (aunque. como veremos, la particular versión que cada autor ofrece de ellas incluye importantes matizaciones y cualificaciones para evitar algunas de las conseciiencias más patentemente inaceptables).
3.2.
~ Á L C U L O S ISTERPRFTADOS: VOCABULPIRIO; AXIOSl.4S Y REGLAS DE CORRESPONDENCIA
Según el análisis que estamos presentando, por tanto, cada teoná científica está conformada por un cálculo axiomático abstracto y otro componente que conecta las expresiones de dicho cálculo abstracto con situaciones de la experiencia entendidas como situaciones de obsen~acióndirecta. Este segundo elemento está conformado por enunciados que vinculan los términos del sistema axiomático con términos obse~-racioiilalesque refieren a objetos, propiedades o relaciones directamente obsenfables. A esos "enunciados conectores" se les ha denominado de varios modos: reglas de correspoltdelzcia (Camap, Nagel, Margenau), defiiziciones coordi~~ativas (Reichenbach), elzunciados ilzterpretariilos (Hempel), postulados de siglzificación (Camap, Hempel) diccioizario (Campbell, Rarnsey) o defniciones opemcioiiuzles (Bridgman). Pero, a pesar de que hay algunas diferencias de concepción (especialmente notables en el último caso), su función es en términos generales la misma, proporcionar interpretación empírica al cálculo axiomático que por sí mismo está sacío de contenido empírico. Las teorías empíricas son pues cálculos axiomáticos inrerpi-etadosempíricamente a través de esos enunciados que conectan los términos del formalismo con situaciones de obsen~acióndirecta. En este punto, y antes de esquematizar los elementos centrales de esta concepción, es necesario hacer una observación. Hemos dicho que el cálculo axiomático por sí solo carece de contenido empírico y que, para dar cuenta de su interpretación empírica, el análisis añade junto a los axiomas del cálculo un conjunto de reglas de correspondencia. Pero podría pensarse, quizá, que las cosas no tienen por qué ser así. Aunque lo distintivo de las teorías empíricas sea que tienen contenido empírico, e incluso si tal contenido se adquiere a partir de ciertas situaciones de observación, no es necesario introducir las reglas de correspondencia, puede bastar con el cálculo axiomático si algunos de sus términos fuesen términos de obsentación, en cuyo caso algunos de los axiomas estarían ya cargados de contenido empírico. Bien, esta cuestión es en parte puramente nominal, derivada de cómo hemos presentado las cosas. Tomemos todas las afirmaciones (primitivas) de la teoría y seleccionemos entre ellas las que no contienen términos observacionales: direinos que estas afirmaciones constituyen el cálculo axiomático abstracto. Tomemos las afirmaciones que incluyen términos tanto obsernacionales como no observacionales, éstas son las reslas de correspondencia. Se trata, si se quiere ver así, de que el análisis "divide" el sistema de afirmaciones completo en dos partes, o en realidad en tres partes, pues hay que añadir las afirmaciones que sólo contienen términos observacionales, esto es, las afirmaciones puramente observacionales. Esta estrategia de análisis sería insatisfactoria si toda afirmación contuviera términos obsenracionales, pues en tal caso lo que hemos venido llamando cálculo axiomático abstracto no existiría. Pero ello no es así, toda teoría mínimamente compleja y sistematizada, que no sea un mero informe de afirmaciones obsenlacionales, contiene afirmaciones sin términos observacionales. Y no sólo eso, sino que la mayoría de sus afirmaciones son de ese tipo, al menos tal y como aparecen las teorías formuladas en los libros de texto avanzados. Esas afirmaciones, aisladas, están desconectadas de la experiencia, de modo que lo que nos presenta una formulación estándar de una teoría empírica conlpleja altamente elaborada se parece mucho a lo que hemos caracterizado como un cálculo axiomático abstracto no interpretado (o al menos
así lo pensaban los autores mencionados). Eso representa un serio reto para los filósofos de orientación empirista que, como parte de un proyecto que arranca de la Ilustración, quieren descartar como carentes de sentido las afirmaciones (no puramente analíticas) desconectadas de la experiencia, típicamente las de la metafísica especulativa y las de pseudociencias como la astrología. Es un reto, pues las afirmaciones que aparecen en los textos avanzados de muchas teorías científicas parecen en principio de ese tipo. La solución radica e n que, aparezcan o no en las exposiciones usuales de la teoría, forman parte esencial de la teoría otras afirmaciones que ponen en conexión expresiones que aparecen en las primeras con situaciones observacionales; y si no existen afirmaciones de ese tipo, no se trata de una teoría empírica. Ésa es la diferencia entre la ciencia empírica y la metafísica; la diferencia con las pseudociencias consistiría en que, o carecen (como la metafísica) de reglas de correspondencia, o si tienen tales conexiones con la experiencia, entonces son patentemente falsas. Pasemos ahora a esquematizar sumariamente los principales elementos del análisis presentado. Las teorías empíricas dan cuenta de fenómenos empíricos postulando ciertas entidades o procesos gobernados por ciertas leyes; esas entidades postuladas no están directamente dadas en la observación, están "alejadas" de la experiencia observable, contrariamente a los fenómenos de los que pretenden dar cuenta, directamente accesibles a la observación. La teoría introduce nuevos términos para referirse a esas entidades y procesos no observables. Diremos de esas entidades que son entidades teóricas'y de los términos introducidos para referirnos a ellas que son ténnirzos teóricos. Vocabulario. Podemos dividir el conjunto de expresiones o vocabulario V de una teoría en tres partes (nos limitamos aquí a los términos primitivos, los términos derivados se introducen mediante definiciones explícitas del modo indicado en la sección 1):
(1) Términos puramente lógico-matemáticos. Éste es el vocabulario formal 'C; de la teoría, esto es, el vocabulario de apoyo que proporciona el lenguaje o instrumental formal y que en algunos casos puede incluir partes muy eleva‘aiken~r-I. das d t la matemática. " (2) Términos observacionales. Éste es el vocabulario observacional Vo de la teoría, esto es, el vocabulario que se refiere a entidades directamente obser\ vables y a propiedades y relaciones entre ellas directamente observables. Son I términos observables, por ejemplo, 'rojo', 'caliente', 'vara', 'más largo que', \r 'más voluminoso que', 'más liviano que', etc. ! ' (3) Términos teóricos. Éste es el vocabulario teórico VT de la teoría, esto es, el vocabulario que se refiere a entidades, propiedades y relaciones no directamente i observables postuladas para dar cuenta de los fenómenos. Son términos teóricos, por ejemplo, 'electrón', 'masa', 'campo eléctrico', 'gen', 'entropía', etc. Si llamamos vocabulario descriptivo VD al vocabulario no meramente formal d e a p o y o , t e n e m o s V = V ~ u V ~ , V ~ = V 0 ~ V ~ , V ~ n V ~ = 0 y V ~ n7 V O = 0 .
/
i . . i i I z -
h
Afinnnciorzes. La anterior partición del vocabulario de una teoría genera otra a nivel de los enunciados o afirmaciones. Toda afirmación de la teoría contiene vocabulario
formal, pero no sólo vocabulario formal, también contiene términos descriptivos. Eso nos deja las siguientes tres posibilidades: (1) Enunciados (puramente) teóricos. Contienen como vocabulario descriptivo únicamente términos teóricos. De entre ellos se seleccionan algunos como axiomas o postulados primitivos: A l , ..., A.; el resto se deriva de ellos como teoremas. Son los enunciados que expresan el comportamiento de las entidades teóricas. Son enunciados teóricos, por ejemplo, 'la fuerza eléctrjca es directamente proporcional al producto de las cargas', 'los genes tienen dos pares de alelos', etc. (2) Enunciados (puramente) observacionales. Contienen como \~ocabulariodescnptivo únicamente términos observacionales. Algunos describen situaciones observables particulares y otros son afmaciones generaIes, esto es, expresan generalizaciones o leyes puramente empíricas-obsen.acionales. Son enunciados observacionales, por ejemplo, 'Juan Pérez tiene los ojos verdes', 'esta porción de agua se ha solidificado', 'los líquidos se solidifican al enfriarse', etc. (3) Reglas de correspondencia. Contienen tanto términos teóricos como términos observacionales. En la medida en que unas se puedan derivar de otras, también se pueden escoger de entre ellas unas que hagan de primitivas: R I ,...,R,. Son los enunciados que conectan los términos teóricos con la experiencia observable cargando así de interpretación empírica los axiomas puramente teóricos. Son ejemplos de reglas de correspondencia, por ejemplo, 'a presión constante, el volumen aumenta con la temperatura', 'diferencias en el e-color --@ -S van acompañadas de diferencias en los -genes', 'al solidificarse un -___ líquido disminuye su entropía', etc. Estos enunciados son el puente que permite pasar de lo observacional a lo teórico y v;ceversa. Esta clasificación de los términos y los enunciados permite expresar de un modo simple la estructura de las teorías en tanto que cálculos interpretados: una teoría T es un par T = , donde A es el conjunto (o la conjunción) de todos los axiomas y R es el conjunto (o la conjunción) de todas las reglas de correspondencia. Las teorías empíricas son cálculos interpretados: A es el cálculo axiomático, R proporciona la interpretación empírica. Se dirá que faltan los enunciados puramente observacionales, pero no es así, pues se derivan de A y R y, por tanto, ya están incluidos en T. Se comienza por una serie de observaciones particulares, que quizá den lugar a generalizaciones empíricas de las que queremos dar cuenta. Para ello se postulan una serie de entidades teóricas regidas por ciertas leyes expresadas por A . Una vez determinadas las reglas R que expresan los efectos observacionales de las entidades teóricas, se derivan, si se tiene éxito, de A y R las generalizaciones o fenómenos de los que queríamos dar cuenta (explicación), u otros nuevos que servirán para contrastar la teoría (predicción).? 2.
Algunos representantes de esta concepción, como Xagel (cf. 1961, cap. 5, 511.3, también Hesse, tiiodelos. Pero la referencia a
1966) incluyen, como "elemento adicionai", además de axiomas y reglas,
.
Esta estructura es plásticamente expresada por Hempel mediante su famosa metáfora de la red: "Una teoría científica puede entonces ser comparada con una red espacial compleja: sus términos est6n representados por los nudos, mientras que los hilos que unen éstos corresponden en parte a las definiciones y en parte a las hipótesis fundamentales y derivadas incluidas en la teoría. Todo el sistema flota, por así decir, sobre el plano de la observación y está anclado en él mediante reglas de interpretación. A éstas se las puede considerar conlo cuerdas que no forman parte de la red pero que conectan ciertas partes de ella con lugares específicos de la observación. En virtud de estas conexiones interpretativas, la red puede funcionar como teoría científica: a partir de ciertos datos observacionales podemos ascender a través de una cuerda interpretativa hasta algún punto de la red teórica, de aquí pasar a través de definiciones e hipótesis a otros puntos, desde los cuales otras cuerdas interpretativas permiten descender al plano de la observación" (1952, $7). Hasta aquí las líneas generales del análisis de las teorías empíricas, de sus constituyentes, naturaleza y funcionamiento, propio de la Concepción Heredada. Para concluir con este enfoque comentaremos en las próximas secciones dos cuestiones que fueron objeto de especial atención: a) la naturaleza de las reglas de correspondencia y sus consecuencias para la supuesta eliminabilidad de los términos teóricos: y b) la distinción teórico/observacional y la naturaleza de la base empírica. En esta última cuestión presentaremos las críticas internas de Popper y el último Hempel, que sugieren modificaciones fundamentales.
4. Las reglas de correspondencia y la cuestión de la elirninabili'dad de los términos teóricos Hasta ahora hemos presentado las reglas de correspondencia de una forma extremadamente general, sin especificar su estructura, tan sólo hemos dicho de ellas que contienen términos tanto teóricos como observacionales. Ésta es una caracterización muy Pero eso no fue siempre débil compatible con prácticamente cualquier forma ~intáctica.~ así y en los inicios se pretendió imponer consuicciones más fuertes sobre la forma de las reglas, constricciones derivadas de la finalidad que se les atribuía.
modelos en esta concepción es excepcional y, cuando se hace, está poco desmollada, mal estructurada con el resto de elementos y, en general, es muy confusa. Al no pasar a formar parte de la versión oficial, no vamos a detenemos aquí en ella. 3. Aunque no con cualquiera, al menos no si se entiende la inclusión de términos de ambos tipos en sentido esencial, e.e., que las reglas contienen esenciulmenre términos tanto teóricos como observncionales. Si eso es así y, supuesto que t es el único timiino de uno de los tipos, la regla no puede tener la forma, P.e., "a A ( X t ) v -. y(t)) + p', pues ahí r no ocurre esencialmente (a no ser que ocurra esencialmente en a o en p); es sólo este tipo de formas el que queda excluido por la caracterización general anterior.
791
FUND.r\hlE\TOS DE FILOSOF~.-\ DE LA CIENCIA
Las reglas expresan la conexión de los términos teóricos con la experiencia observable, cargan de contenido o significación empírica tales términos. Como hemos indicado más arriba, una de las preocupaciones de estos filósofos, de orientación general neoempirista. era dejar clara la legitimidad-ca de las expresiones científicas, por contraposición a otras según ellos carentes de sentido. Esa legitimidad la da el anclaje en la experiencia obsenable, y es tanto mayor cuanto m%s fuerte sea dicho anclaje obsenlaciohal. Si eso es así, entonces la alternativa más fuerte a considerar es que los términos teóricos sean completamente definibles mediante términos obsenlacionales, esto es, que haya'de$ziciones explícitas de los términos teóricos mediante vocabulario observacional. Más arriba hemos indicado que no puede haber definiciones explícitas de los términos primitivos del cálculo axiomático, pero en ese contexto estaba claro que teníamos en cuenta únicamente la intervención de términos teóricos. La opción ahora es definir explícitamente los términos primitivos teóricos del formalismo abstracto, no mediante otros términos teóricos sino mediante términos observacionaies; puesto que con los términos teóricos prin~itivosse definen los restantes términos teóricos, la alternativa implica la eliminabilidad total de los términos teóricos, los convierte en meras abreviaturas de expresiones más complejas cuyos componentes se refieran sólo a entidades observables. Esta alternativa determina la forma que deben tener las reglas de correspondencia, a saber, la de las definiciones explícitas: para cada término r de Vi-hay una regla de correspondencia que tiene la forma "$1) cp(o,, ..., o&)".donde t es el único término teórico que ocurre en y y cp sólo contiene como términos descriptivos k términos observacionales o,, ..., oi. Si esta propuesta fuese viable, entonces la teoría estaría utilizando siempre un vocabulario en realidad exclusivamente obsemacionai, sólo que usando a menudo abreviaturas notacionales. No es difícil ver que ello conferiría la máxima legitimidad observacional al lenguaje de la teoría: las entidades teóricas "desaparecen" o, más suavemente, se reducen a, o se consuuyen como, complejos de observables. El principal defensor de dicha propuesta, Carnap, reconoció pronto su inviabilidad. El problema principal lo ejemplificaban los términos de propjedades disposicionales, como 'frágil', 'elástico' o 'soluble'. Estos términos se refieren a propiedades que se caracterizan por cierta reacción ante ciertas circunstancias; por ejemplo, un cuerpo es soluble si, al sumergirse en agua, se disuelve (las propiedades no disposicionales se denominan categóricas, p.ej. ser molécula de ácido sulfúrico o ser vertebrado). Aunque no 10 parezcan en primera instancia, muchas de las propiedades teóricas de la ciencia son disposicionales, lo que representa un serio problema para el programa eliminativista. Las únicas definiciones explícitas para estas propiedades deben tener la forma
donde D es la propiedad disposicional que queremos definir, C son las condiciones observables en las que se actualiza la disposición y R es la respuesta observable que la disposición produce en las condiciones C; por ejemplo, "x es soluble syss, si x se sumerge
1 fpc
i
jiLk21 1"
1 j
f
1 I
iI
i
I
, I
en agua, entonces x se disuelve". El problema es que, por la lógica del condicional material, estas definiciones atribuyen la propiedad disposicional a todo individuo que no sea sometido a las condiciones C,por ejemplo a toda sustancia que no se sumerja nunca en agua, lo cual es inaceptable. La solución de Carnap (cf. 1936-1937, 57) es abandonar la propuesta reduccionista radical, optar por otra que no tenga consecuencias inaceptables aunque no permita la eliminación vía definición explícita de los términos teóricos. La nueva propuesta consiste en modificar la forma de las reglas para términos disposicionales del siguiente modo:
Es claro que (2) no tiene los problemas de (l), pero también que no permite eliminar el término disposicional al no ser una definición explícita, sino una definición "parcial" o, en expresión de Camap, un enunciado de reducción parcial. Una reducción (definición, eliminación). eliminación) earcial es, Simplemente, una no reducción (de&ión. ahora, cuando las condiciones de prueba C no se satisfacen, la posesión o no de la propiedad dhosicional D queaa simplemente indeterminada; por ejemplo, de una sustancia que nunca se sumerja en agua queda indeterminado, según (2), si es o no soluble. Eso sería una consecuencia inaceptable si pretendiéramos que (2) es una definición, esto es, si pretendiéramos que determina las condiciones necesarias y suficientes de que algo sea o no soluble. Pero ahora ya no se pretende tal cosa.' Los términos disposicionales no son los únicos que sugieren estas modificaciones, aunque son los que mejor las ilustran, al menos en primera instancia. Se reconoce que lo mismo ocurre con términos en principio no disposicionales, como 'temperatura'. También en estos casos las reglas sólo proporcionan interpretaciones empíricas parciales. Por ejemplo, la regla "si al introducir un tubo de vidrio con mercurio en una sustancia y después introducirlo en otra, la columna de mercurio asciende, entonces la segunda sustancia está a mayor temperatura que la primera" interpreta sólo parcialmente el término 'temperatura', pues no se aplica a sólidos, o a temperaturas muy altas, o muy bajas, etc. (cf. p.ej. Camrip 1966, cap. XXVIII). Y lo mismo ocurre con las demás reglas para el término. Podría pensarse que la situación se rzsuelve conyuntando todas las reglas de correspondencia para cada término, pero, y esto es verdaderamente importante, no es así. La conyunción proporciona la total interpretación empírica, pero no constituye una definición o eliminación del término, pues no incluye situaciones en las que, según los axiomas teóricos, también se aplica: por ejemplo, no hay ninguna regla de correspondencia directa para la situación consistente en que el centro del Sol está a mayor temperatura que su superficie. Una vez abandonada la propuesta eliminativista radical y abierta la puerta a reglas de correspondencia no definicionales, no hay especial razón para imponer constricciones
m
4. Es cierto que ésta no es la única alternativa al problema, hay otns que mantienen Ia vocación drfinicional. La mis inmediata es sustituir en (1) el condicional material por un condicional contrafictico o de necesidad física (cf. cap. 5), pero para la mayoría de nuestros filósofos neoempinstas (especialmente Cxnap. pero no sólo él) las soluciones en esta línea son inaceptabks por apelar ir conceptos modales, como el dr necesidad. que prefieren evitar en una reconstrucción lógica de la ciencia.
muy específicas a la forma de las reglas. De este modo se acaba admitiendo como regla cualquier tipo de enunciado mientras contenga esencialmente términos teóricos y obsenracionales. O para ser más precisos, de los tres tipos de enunciados que puede contener una teoría científica, a saber, enunciados sólo con términos teóricos, enunciados sólo con términos observacionales y enunciados con términos tanto teóricos como obsen7acionales, j se se'_eccioaan esto~~últimos (o una subclase-representante de los mismos) como ,_---- las reglas (incluso a 1 de ;orre9a&xxi.a de%_-teoría sin importar la forma -- -sintáctica -que- tengan veces, como señalaron Ramsex-Camap yTráithi+yáite,las reglas p e d e n tener la forma de definiciones explícitas de términos observacionales mediante términos teóricos). El propio Camap acaba poniendo como ejemplo de regla de correspondencia enunciados que simplemente conectan mediante un condicional material un término teórico con otro observacional, por ejemplo "si u es más caliente que v, entonces la temperatura de u es mayor que la de v" (cf. Carnap, 1956, QV). Esta liberalización en la forma Iógica de las reglas va acompañada de otra en apariencia más radical, a saber, ni siquiera es necesario que todo término teórico intervenga esencialmente en al menos una reglz de correspondencia. Pero esta liberalización es más radical sólo en apariencia. En efecto, si no se trata de definir observacionalmente los términos teóricos, si basta con que estén conectados con términos obsen~acionalesmediante las reglas, entonces no es necesario que esa conexión deba ser directa para todos y cada uno de los términos teóricos; esto es, puede que algunos se conecten sólo Ntdirectarnenre con la base observacional a través de su conexión axiomática con términos teóricos conectados directamente con la base observacional. Algunos términos teóricos*fendrán varias reglas (p.ej. varios enunciados de la forma (2) con diferentes Cs y Rs), pero otros pueden no tener ninguna y no por eso carecen de contenido empírico (y con ello de legitimidad semántica) pues adquieren tal contenido (legitimidad) indirectamente por su conexión a-través de los axiomas con otros términos para los que sí hay reglas de correspondencia. Resumiendo, los términos teóricos (primitivos), por tanto, no son eliminables mediante definiciones explícitas a partir de términos observacionales. Son términos con "vida propia" que fijan su contenido o significado por dos vías, cada una de las cuales los "define" sólo parcialmente: a ) su conexión con otros términos teóricos a través del cálculo axiomático, y b) su conexión, directa o indirecta, con términos observacionales a través de las reglas de correspondencia. Así pues, el significado de los términos teóricos no es puramente observacional, las conexiones axiomáticas contribuyen esencial e ineliminable3 mente al mismo. Nótese que tampoco es viable la alternativa opuesta, a saber, que el significado fuese puramente teórico, que los axiomas diesen el significado (implícito) completo de los términos teóricos y que las reglas fuesen hipótesis empíricas que no contribuyeran al significado de tales términos. Si eso fuera así, los axiomas teóricos, las leyes, serían (como en las ciencias formales) verdades analíticas, verdades en virtud del significado de los términos que involucran, carentes por tanto de todo contenido empírico; sólo tendrían contenido empírico las reglas de correspondencia, la mayoría de las afirmaciones de las teorías consideradas enipíricas serían, contra toda apariencia, analíticas. Puesto que ésta parece una conclusión claramente rechazable, el significado de los términos teóricos no
\
L.-
puede depender de los axiomas solos, como tampoco depende de las reglas solas, sino de ambos a la vez. Aquí, sin embargo, se abre uno de los problemas más profundos de la filosofía de la ciencia, relativo al significado de los términos teóricos y al estatuto epistémico de las afirmaciones científicas. El lector avisado habrá advertido que, si el significado de 10s términos teóricos no es constituido por los axiomas solos, ni por las reglas solas, sino por ambos a la vez, entonces parece que se puede decir de "los axiomas más las reglas" lo mismo que se dice en las ciencias formales de los axiomas, a saber, que puesto que constituyen el significado de los términos, entonces axiomas y reglas son analíticamente verdaderos, verdaderos en virtud de definiciones. Ésta es en parte la brecha por la que Quine ataca la distinción analítico/sintético (cf. 1951) al poner de manifiesto toda una serie de problemas en la distinción tradicional que obligarán a revisar la relación entre analítico y etnpíricamente revisable. No podemos detenemos aquí en esta cuestión. Para concluir con las reglas de correspondencia mencionaremos brevemente dos modos en los que, en este enfoque, se acepta que los términos teóricos son eliminables en cierto sentido en favor de los observacionales, aunque no mediante definiciones explícitas.
El primero de los procedimientos se debe a F. P. qamsey. Ramsey mostró (cf.
1929) que, dada una teoría T = 4, R>, siempre es posiblz da' con otra que tenga el mismo contenido empírico, es decir las mismas consecuencias observacionales, y que no use tirrninos teóricos. El expediente es sencillo: sustituimos cada enunciado "y(t)" de A o de R que contenga un término teórico t por otro de la forma "3y(x)"; por ejemplo, sustituimos "si u es más caliente que v entonces Temp(1c) > Temp(v)" por "3P (si u es más caliente que v entonces P(u) > P(v)". En realidad no se realiza la existencialización en cada enunciado suelto, pues cuando un mismo término teórico aparece en varios enunciados, la variable para su existencialización debe ser la misma. Una teoría T = 4, R> (con p términos teóricos y q términos observacionales) se puede identificar con la conyunción "AxlA Ax2 A ...Rc, A Rez A ...", de los axiomas de A y las reglas de R, que abreviaremos mediante "AR ( t i ,..., r,, O,,..., O,)". Si T es una teoría, la versión-Ramsey de T es:
Pues bien, se puede demostrar entonces que todo enunciado (puramente) observacional que se sigue de T se sigue también de TR, enunciado éste que, como hemos visto, no contiene términos teóricos. En este sentido los términos teóricos son ciertamente eliminables. Sin embargo, este resultado tiene poca trascendencia filosófica si lo que se pretende es prescindir de las entidades teóricas (lo que no era la pretensión de Ramsey). En primer lugar, la versiónRamsey de la teoría requiere lógica de segundo orden, pues algunas constantes descriptivas teóricas serán predicados, con lo que la versión-Rarnsey de enunciados con predicados cuantificará sobre variables predicativas (como en nuestro ejemplo, que cuantifica sobre
298
FUNDAMEATOS DE FILOSOFÍ-~DE LA CIENCIA
una variable de función, un tipo de variable predicativa). Segundo, relacionado con lo anterior, y verdaderamente importante, la versión-Ramsey TR prescinde de, o elimina, los rénninos teóricos, cierto, pero no las e~itidadesteóricas. TR presupone la existencia de entidades teóricas tanto como T, pues las \wiables introducidas en TR deben trner algún valor. En T, las entidades teóricas son los referentes de las constantes descriptivas teóricas, en P son 10s valores de las nuevas variables introducidas. Por tanto, mediante este expediente, al desaparecer los rértnitíos teóricos, nos libramos quizá nominalmente de la formulación del problema semántico acerca de la legitimidad de estos términos bajo sospecha para el empirista, pero no nos libramos en absoluto (ni siquiera nominalmente) de la cuestión ontológica relativa a las entidades teóricas pues la nueva versión sigue apelando a ellas, aunque mediante otro recurso expresivo, las variables. Lewis (1970) utiliza el método de Ramsey para mostrar cómo se puede dar una definición "funcional" de los términos teóricos, esto es, cómo se puede denotar una entidad teórica mediante una expresión que no contenga términos teóricos, a saber, mediante una descripción que describa su función en la teoría; por ejemplo, la masa es la denotación de la descripción "la función xj tal que ...", donde los puntos suspensii~oscontienen la versión-Ramsey de la Mecánica Clásica (y j es un subíndice concreto). Queda claro por tanto que el método de Ramsey no permite eliminar las entidades teóricas sino tan sólo el modo usual de referimos a ellas mediante constantes predicativas (o funcionales).
La alternativa de Ramsey no depende de que los dos grupos de términos sobre los que se realiza la eliminabilidad relativa sean los teóricos y los observacionales en el sentido pretendido, se aplica a cualquier teoría en la que dividamos el vocabulario en dos conjuntos disjuntos. Lo mismo sucede con el segundo expediente de eliminación, debido a Craig y que es consecuencia de un teorema de lógica formal del mismo autor. Craig mostró (cf. 1953 y 1956) que si el vocabulario V de una teoría T se divide en dos conjuntos disjuntos de términos VI y Vz, y la teoría satisface ciertos requisitos formales (no especialmente estrictos), entonces siempre existe otra teoría P que usa términos sólo de un tipo, digamos Vi,y de la cual se derivan los mismos V,-enunciados (e.e. enunciados que involucran sólo términos de V , )que se derivaban de T; T y T; son por tanto Vl-equivalentes. Además TX no contiene, contrariamente a la versión de Ramsey, recursos expresivos nuevos, nuevas variables. Aplicado a la distinción entre los vocabularios teórico y observacional, este resultado implica que las mismas consecuencias observacionales que se derivan de una teoría con términos teóricos, se derivan también de otra teoría que no contiene términos teóricos ni variables que los sustituyan. En este sentido parece que los términos teóricos son eliminables o prescindibles, y ahora no se trata sólo de los ténninos sino también de las entidades teóricas mismas. Pero, como antes, esta vía no es tan prometedora para el eliminativista como a primera vista parece. Aunque ahora parecen ser eliminables las entidades teóricas mismas, ello es sólo "en principio". En primer lugar, la eliminabilidad es sólo a posteriori, esto es,
i
1
1 I
una vez tenemos previamente la teoría original con sus tkrminos teóricos, por lo que la teoría puramente observacional "sustituta" no puede desempeñar ninguna función heurística o metodológica efectiva. Pero además el expediente es tal que la teoría puramente observacional T: consiste siempre en un conjunto infinito de axiomas no simplificable de manera significativa (ni siquiera mediante esquemas axiomáticos). Las consecuencias filosóficas de la eliminabilidad a lo Craig son prácticamente nulas, a lo sumo satisfacer la mala conciencia de las mentes empiristas radicales con una eliminabilidad en principio completamente irrelevante para la práctica científica. Pero si nos contentamos con eso, ni siquiera se precisa de complejos resultados formales, pues es trivial construir una teoría T' puramente observacional y observacionalmente equivalente a otra T que use sólo términos observacionales: simplemente seleccionamos como axiomas para T' todas las (infinitas) consecuencias puramente observacionales de T (dado T = AR, T' = { a/aes consecuencia de AR y contiene sólo términos observacionales).
5. L a distinción teórico1observaciona1 y la naturaleza de labase empírica Hasta aquí hemos procedido como si estuviera clara la naturaleza de los términos, y las entidades, observacionales. Pero eso dista mucho de ser así y en la Concepción Heredada se plantearon, casi desde los inicios, diversos problemas relativos a la naturaleza dz estos términos. Comentaremos aquí muy brevemente tres que están íntimamente conectados, dos de los cuales hemos mencionado anteriormente: a ) el problema ontológico de la naturaleza de las entidades teóricas, la fundamentación a partir de ella de la distinción teórico/observaciona1 y el carácter rígido o fluido de tal distinción; b) el problema semántico de la supuesta neutralidad teórica de los términos observacionales; c) el problema metodológico de la supuesta naturaleza observacional de la base empírica de contrastación, no sólo del conjunto de nuestro conocimiento, sino para cada teoría científica particular. Estas cuestiones motivaron multitud de debates, han sido tratadas por casi todos los filósofos de la ciencia y en relación con ellas surgieron algunas de las posiciones que dieron lugar a concepciones alternativas a la Concepción Heredada. En el primer parágrafo nos limitaremos a los aspectos más generales, y en los dos siguientes desarrollaremos algunos problemas específicos.
5.1. ENTIDADES OBSERVABLES Y DISTINCIÓNTEÓRICO/OBSERVACIONXL
Para muchos empiristas y positivistas lógicos del período de entreguerras, y especialmente para aquellos en tomo a los cuales se gestan las primeras versiones de la concepción estándar, la fundamentación del conocimiento en la experiencia se entendía en términos fenomenalistas: los primeros datos sobre los que se construye todo conocimiento, que justifican nuestras creencias, son datos de la experiencia fenoménica. Esta posición extrema plantea múltiples dificultades en las que no podemos detenemos aquí, y el fenomenalismo termina por ser abandonado, al menos como base de experiencia para las
300
FUNDAhfEhTlS DE RLOSOFL~ DE LA CIENCIA
teorías científicas. Las entidades fenoménicas (qualia,datos sensoriales) son entonces sustituidas por entidades que se caracterizan simplemente como "directamente presentes a la obsenración". Sin embargo, esta nueva versión, que se convertirá en estándar, tiene sus propios problemas, el principal de ellos su vaguedad. Las entidades fenoménicas son claramente distinguibles de las no fenoménicas, pero por su "privacidad" o subjetividad son poco plausibles coino constituyentes de la base de experiencia para la ciencia. Las entidades observables, públicas, parecen en primera instancia poder desempeñar más plausiblemente tal función, pero ahora el problema es la dificultad para distinguir nítidamente entre entidades obsenrablesy no obsenpables (teóricas). Inicialmente, Carnap intentó una caracterización precisa de los términos observacionales como aquellas expresiones del lenguaje tales que, en condiciones normales, un obsenlador puede determinar a través de una serie de observaciones, y con un alto grado de confirmación, si el término se aplica o no en una situación dada (cf. Carnap, 19361937). Esta caracterización es inadecuada, pues, sin más precisiones, se aplica también a predicados pretendidamente no obsen~acionales.En escritos posteriores, Camap se lin-iitó a caracterizar el vocabulario obsenracional como aquel que se refiere a eitridades obserisables (cf. 1956, $11): los términos obsen~acionalesson predicados que denotan propiedades observables de acontecimientos o cosas, o relaciones observables entre ellos. Pero es claro que si no se especifica lo que caracteriza las elztidades observables, simplemente se desplaza el problema. Hempel presentó las cosas de modo parecido al hablar de entidades o fenómenos "que podemos observar directamente" (1958, $11). La cuestión es: ¿qué cuenta como observación directa? Aunque no se da una respuesta a esta cuestión, parece que en este primer momento se sigue pretendiendo que la distinción que hoy tras ella es relativamente rígida y no dependiente del contexto. Después de una serie de críticas, especialmente de Putnam (cf. 1962, y también Hanson, 1958), el primer exponente de la doctrina oficial en reconocer el carácter fluido de la distinción fue Nagel, quien en su monografía de 1961 afirma: "es dudoso que haya un sentido riguroso que pueda ser asignado con utilidad a la palabra 'observable'; y en la medida en que la distinción [entre leyes empíricas y axiomas teóricos] se base en el contraste entre lo que es obsenrable y lo que no, la distinción patentemente no es nítida" (cap. 5, $1). Carnap, en su monografía de 1966, acabó también aceptando explícitamente que la distinción es gradual. Por ejemplo, si la percepción visual directa cuenta como obsenlación, ¿qué ocurre con la asistida de lentes?, de prismáticos o catalejos?, ¿y de telescopio óptico?, de telescopio de radio? 0, para ir en la dirección contraria, ¿cuenta como observación la realizada con lupa?, i y con microscopio óptico?, ¿y con microscopio electrónico? ¿Observa directamente el físico la trayectoria de una partícula cuando ve el rastro en una cámara de niebla?; jse observa la comente eléctrica al ver moverse la aguja de un amperímetro? Presuntas como éstas son las que le hacen concluir que "hay un continuo que comienza con obsenlaciones sensoriales directas y pasa a métodos de observación enormemente complejos e indirectos, [...] el físico habla de observables en un sentido muy amplio, comparado con el estricto sentido que da el filósofo a la palabra, pero en ambos casos la línea de separación entre lo observable y lo inobservable zs muy arbitraria" (cap. XXIII).
A pesar de la fluidez o vaguedad de la distinción, tanto Nagel como Camap insisten en su utilidad para la caracterización de la naturaleza y estructura de las teorías. Así, por ejemplo, Camap insiste en que las leyes empíricas son las que contienen términos que refieren a entidades "directamente observables por los sentidos o medibles mediante técnicas relativamente simples" (ibid.).Pero sorprendentemente menciona ahora como ejemplos, además de regularidades cualitativas simples (como la típica "todos los cuervos son negros") también leyes cuantitativas (como las de los gases, que relacionan presión, volumen y temperatura para los gases. o la ley de Ohm, que relaciona potencial, resistencia e intensidad de corriente) que involucran términos que había considerado tradicionalmente teóricos (como 'temperatura' o 'intensidad de corriente eléctrica'). El cambio se debe sin duda a la aceptación de la fluidez de la distinción. La cuestión que surge ahora es si en estos nuevos términos la distinción teórico/observacional puede desempeñar la función para la que fue originalmente introducida. Numerosos críticos, como Putnam (1962), Shapere (196.5). Maxwell (1961), Achinstein (1965) o el propio Hempel posteriormente (1973), argumentaron en contra de ello. Veamos algunas de las principales dificultades.
5.2.
NEUTRALID.AD TEÓRICADE LOS T E R ~ ~ I S OOBSERVACION.4LES S Y CARGA TEÓRICADE LOS HECHOS
El principal motivo de la introducción de la distinción teórico/observaciona1 era proporcionar legitimidad semántica, según los criterios empiristas, a los términos "sin conexión empírica inmediata" que las teorías científicas introducen a través de sus leyes para dar cuenta de los fenómenos. Esta finalidad semántica va acompañada de otra metodológica, pues se pretende que la base observacional es la que proporciona la experiencia "neutra" con la cual contrastar las afirmaciones de la teoría. Esta neutralidad teórica de la base de contrastación parece en primera instancia fundamental, pues de lo contrario parecería que la teoría resulta autojustificativa. Si la experiencia observacional que se usa para contrastar la validez de una teoría fuese dependiente de la teoría en cuestión, esto es, si la elaboración de los informes observacionales que sirven de base de contrastación presupusiera la validez de la teoría, entonces tendríamos un círculo autojustificativo. Por tanto, la base observacional, si ha de servir para la contrastación, debe ser teóricamente neutral. Esta cuestión está íntimamente ligada a la anterior, pues la distincizn T/O parcce problemática en la medida que lo que consideramos usualmente observaciones requieran adiestramiento o conceptualización teórica. Ya antes de la formulación explícita de la Concepción Heredada, Duhem (1914) objetó a lo que iba a ser este elemento de la misma. Duhem rechazó que la observación esté libre de conceptualización teórica, aunque usualmente sí lo está respecto de algunas teorías, esto es, puede ser que las observaciones no presupongan una teoría que usa de ellas en su contrastación. Debe recordarse que orisinalmente la observabilidad no se pretende relativizada a una teoría, los estados de cosas son observables o no sin más, y los que supuestamente lo son se usan para contrastar unas teorías u otras. Lo que constató Duhem es que toda observación, o mejor dicho todo informe observacional, supone una
interpretación de los datos de los sentidos, y una interpretación no es más que una conceptualización teórica, sea explícita o implícita. Quizá el aparato conceptual i n t e ~ r e t a d o que r genera la base obsenfacional no corresponde a cierta teoría que usa djchz base en la contrastación, pero en cualquier caso corresponderá a otro "constructo teórico"; este constructo presupondrá a su vez otro en la descripción de sus propios fenómenos empíricos y así sucesivamente. No hay (en general) una autojustificación inmediata de cada teoría. pero sí un círculo global autojustificativo en el conjunto de la ciencia. Duhem ejemplifica esta tesis con múltiples casos históricos y con referencias a la práctica experimental usual en laboratorios (cf. p.ej. su ejemplo de la oscilación de una barra de hierro en cierto mecanismo y la medición de la resistencia, 1914 p. 218). Ésta es la base del conocido holis~node Duhem, de gran influencia en el siglo xx, y sobre,el qhe vblveremos brevemente más adelante (cap. 11). En el Círculo de Viena fue Neurath quien más radicalmente se distanció de la tesis oficial inicial de la neutralidad de los "informes protocolares de experiencia" y a él, y a Duhem, apelará después Quine como inspiradores de sus propias tesis holistas. Pero en el campo específico de la filosofía de la ciencia, en el contexto neopositivista de entreguerras, fue Popper quien primero expresó de forma explícita el componente teórico de la base empírica de contrastación, lo que después se denominará carga teórica de los heclms. Popper es uno de los mayores críticos de las tesis centrales del Círculo de Viena (al que, como insiste en declarar, no pertenecía), pero comparte en general la caracterización de las teorías como cálculos interpretados. El principal punto de desacuerdo tiene que ver con la epistemología de la contrastación; como veremos en detalle en el capítulo 12, frente al confirmacionismo y la lógica inductiva de Carnap, de los que Popper fue el primer y más severo crítico, él defiende una lógica de la falsación. Pero otro de los puntos de disensión tiene que ver con nuestra actual cuestión. Aunque no sacara todas las consecuencias (consecuencias que acaban cuestionando sus tesis falsacionistas más radicales, cf. cap. 12, $4 y §5), declaró abiertamente que en la determinación de la base de contrastación, de "los hechos", interviene un conocimiento de fondo necesitado de aceptación previa. Al someter a prueba una teoría, señala, no sólo intervienen en ella las condiciones iniciales y los supuestos auxiliares (según el esquema comúnmente admitido) sino también cierto conoci~nientode fondo sobre los hechos singulares. Este conocimiento de fondo, que "contiene" lo que se acepta como hechos, se puede considerar constituido por teorías de bajo nivel que se aceptan como altamente corroboradas y que no entran en el juego de la contrastación. Y no entran en el juego por decisión (no necesariamente consciente): "Siempre que una teoría se somete a contrastación [...] hay que detenerse en algún enunciado básico que decidimos aceptar: si no llegamos a decisión alguna a este respecto, [...] la contrastación no lleva a ninguna parteW(1935-58,$29). Esta idea pone de manifiesto lo que se denomina, siguiendo a Hanson, la carga teól-ica de los Izecl~os.Hanson fue el primero en hacer de este fenómeno algo esencial para el anáIisis de la ciencia y en defender la opinión de que ello modifica dramáticamente la visión tradicional de la misma. Apoyándose en los casos de ambigüedad perceptiva estudiados por la psicología de la Gestalt, destacó la importancia del contexto y los elementos organizativos ya en la percepción. Ilustró esta tesis con el siguiente ejemplo (cf. 1958, cap. 1).
-
Al contemplar las figuras 1 y 3, se ven en los extremos inferiores derechos dos animales diferentes a pesar de que son "la misma cosa" (figura 2); además, cuando contemplamos el dibujo aislado podemos ver una cosa u otra, pero no las dos a la vez. En parte se ve lo mismo (hay una excitación similar del córtex) y en parte no, y el sentido interesante de 'ver' relevante para la ciencia es el segundo. No se trata de interpretaciones diferentes a partir de una misma visión; eso, afirma, no tiene sentido, pues "interpretar", si se quiere llamar así, es parte constitutiva de "ver". Además, el contexto puede no darse explícitamente, no es esencial al hecho que el ejemplo pretende mostrar que en él el contexto esté manifiesto; piénsese, afirma Hanson, en lo que ven un físico y un profano ante los rastros de una cámara de niebla. Este fenómeno, que salvo radicales diferencias culturales tiene en la vida cotidiana escasa trascendencia, es determinante en la ciencia, donde la dependencia del contexto es altamente teórica y. en momentos de cambio conceptual en los que se contraponen diferentes contextos de fondo, deviene crucial. Cuando Tycho y Kepler ven el Sol al amanecer, dice Hanson, en parte ven lo mismo y en parte no: Tycho ve un astro móvil, Kepler uno estático, "y es el sentido en que no ven la misma cosa el que debe tomarse en cuenta para entender los desacuerdos que existen dentro de la física" (ibid.B). Consideraciones parecidas a éstas se encuentran en otros autores. Toulmin afirma que los fenómenos no sólo son seleccionados por la actividad teórica sino que incluso están definidos por la misma: hay una "continua interacción entre teoría y hecho L.. ], las teorías se construyen sobre la base de hechos, a la vez que les dan significación y aun determinan lo que son "hechos" para nosotros" (1 961, p. 95). Feyerabend, defendiendo su pluralismo metodológico (cf. 1964, 1965, 1981). sostiene que la descripción de los hechos depende siempre de una teoría (aunque en general no de la que se contrasta) y que hay hechos que sólo pueden salir a la luz con ayuda de teorías alternativas incompatibles. Rechaza por tanto la tesis de que "los hechos existen y están disponibles independientemente de la consideración de alternativas a la teoría que se contrasta" (1981, $5) La consecuencia de ello es lo que él caracteriza como la inversión de la relación tradicional entre teoría y observación. El significado de las oraciones de observación e s t j determinado por las teorías con las que están relacionadas, no son significativas a menos que se hayan relacionado con las teorías: "la interpretación de un lenguaje de observación está determinada por las teorías que usamos para explicar lo que observamos, y cambia tan pronto como estas teorías cambian" (1981, $6). En su monografía de 1975 ilustró esta tesis con innumerables ejemplos extraídos de la historia de la ciencia que, en su opinión, la confirman; muestra, por ejemplo (cap. lo), cómo, en la controversia entre Galileo y los aristotélicos sobre las consecuencias de la observación telescópica de diverscs fenómenos
astronómicos, el primero se apoyaba, entre otros supuestos que los aristotélicos tenían buenas razones para rechazar, en una teoría óptica inaceptable. Kuhn, c o r o veremos, sostuvo por su parte que las teorías contienen elementos que determinan el contenido de la experiencia y que defensores de teorías diferentes viven en mundos experienciales diferentes. También Lakatos apuntaba en la misma dirección cuando, siguiendo a su maestro Popper, afirmaba que en la contrastación no comparamos la teoría con hechos neutros sino con otras teorías más básicas presupuestas por los hechos. El fenómeno de la carga teórica de 10s hechos, y el ofrecer una imagen de las teorías y de la actividad científica adecuada a este fenómeno y a los casos históricos del mismo, es una de las principales motivaciones de las nuevas concepciones que surgen en tomo a estos ~zuevosfilósofosde la ciencia (así denominados, en su día, por contraposición a la Concepción Heredada). Nosotros dejamos provisionalmente la cuestión aquí sólo apuntada y volveremos sobre ella en los dos próximos capítulos. Es esencial darse cuenta de que toda esta discusión presupone una identificación casi siempre aceptada implícitamente. Se comienza cuestionando la neutralidad teórica de los informes observacionales y se concluye que los datos, fenómenos o hechos que constituyen la base de experiencia en la contrastación están teóricamente cargados. Ello supone la identificación entre a) Nlformes de experiencia o datos de contrastaciórz y b ) irtforrnes obse~vacionales.Parte de las críticas expuestas se deben entender como cuestionando esta identificación. Para concluir nos detendremos brevemente en este aspecto de fa cuestión.
Las teorías empíricas se generan a partir de una serie de fenómenos de los que, tras la elaboración teórica, se pretende dar cuenta; esos mismos fenómenos, u otros nuevos del mismo tipo, constituyen el ámbito de experiencia sobre el que la teoría hace predicciones y se somete a contrastación. Llamemos a esos datos, fenómenos o hechos que constituyen el ámbito de experiencia y contrastación de una teoría, la base e~npíricao base de contrasración de la teoría en cuestión. Hemos visto que en la versión oficial de la Concepción Heredada se entiende la base empírica en términos obsen~acionales. Por otro lado, aceptemos, como demuestran múltiples estudios tanto empíricos como teóricos, que la observación "directa" incluye conceptualización. A pesar de ello, cabe suponer que algunos aspectos de esa conceptualización, los cognitivamente más básicos, serán generales, comunes a todo sistema cognitivo (o al menos, en su dimensión biológica-evolutiva, comunes a todos los seres humanos). Si eso es así, del hecho de que la observación presuponga cierta conceptualización no se sigue que dicha conceptualización dependa siempre esencialmente de las teorías científicas. Por tanto, si la base de contrastación &ese observacional, ello no implicaría que lo que cuenta como base empírica depende esencialmente de las teorías cienrljTcas. En realidad, pues, lo que hay implícitamente detrás de las co~sjderaciones.críticas sobre la carga teórica (cientrjTcainerzte teórica) de todo dato de contrastación es una puesta en cuestión del squesto de la ConcepCión Heredada de que la base de contrastación es en general de naturaleza observacional. Tras muchas de las críticas a
f!
ii 1 :
la supuesta neutralidad de las observaciones, lo que hay en realidad es un rechazo a la identificación entre base empírica de contrastación y experiencia directamente observable. El principal motivo para identificar la base empírica con la experiencia observable directa es el viejo anhelo empirista de fundamentar y justificar todo nuestro conocimiento e n la expenencia sensorial. Todo conocimiento (empírico) empieza con las afecciones de nuesrro entorno sobre nuestro aparato sensorial y toda justificación del mismo debe apelar en última instancia a esa "observación directa" del entorno. Pero, como dijimos más arriba (seccibn 3), de este supuesto razonable no se sigue que la justificación de cada pieza de nuestro conocimiento deba proceder del mismo modo, que esta tesis global sea también válida localmente. Puede ocumr que, como organismos vivos, la interacción más básica con nuestro entorno la realicemos en términos globales perceptualmente mediante observación directa, pero que en algunas partes de nuestro sistema cognitivo. especiaImente en las muy complejas que dan lugar a las teorías científicas (muy escasas 4 raras en términos evolutivos globales), la base de experiencia no se dé a través de observación directa inmediata. Puede que todo empiece por la observación pero, si el sistema cognitivo es modular y jerárquico, no en todas partes. Si eso es así, la base de contrastación de muchas, o (casi) todas, las teorías científicas puede estar constituida por datos o fenómenos que no sean de observación directa; y por tanto, alternativamente, lo distintivo de los términos teóricos no será que denotan entidades inobservabIes. Ya en 1962, Putnam se opuso a identificar la distinción "inobservable/observable" con "teórico/no teórico". Afirmaba, por un lado, que hay teorías cuyo aparato teórico se refiere a entidades observables, y, por otro, que casi nunca los fenómenos a explicar son accesibles mediante observación directa. Se trata de dos dicotomías diferentes. Un término teórico es un término que proviene de una teoría científica y "el problema apenas tocado en treinta años que se lleva escribiendo acerca de 'términos teóricos' es qué es lo realmente distintivo de dichos términos" (1962, $1). Poco antes, Ryle había distinguido entre expresiones de una teoría que están cargadas con el peso de esa teoría particular y expresiones que no lo están; así, p.ej., "los términos técnicos de la genética están impregnados de teoría, l...] no sólo con equipaje teórico de alguna clase, sino con el de la teoría genética" (1956, p. 90). Estas consideraciones apuntan a la idea de que un término es teórico o no en relación con una teoría en función de si depende O no, de un modo que hay que especificar, de la teoría en cuestión. Achinstein (1968, cap. 6) hace explícita esta caracterización y discute varios sentidos en que un término puede depender de una teoría. Como veremos en el próximo capítulo, durante los años sesenta, Kuhn y Lakatos hicieron también consideraciones que apuntan en la misma dirección. El primero en dar una caracterización mínimamente articulada y elaborada de la nueva distinción que se está gestando fue Hernpel en una sene de trabajos de finales de los años sesenta y principios de 10s setenta (1966, cap. 6, 1970, 1973). En estos trabajos, Hempel divide ahora el vocabulario básico de cada teoría en dos clases que se pretenden nítidamente separadas y relativjzadas a una teoría específica. Una clase está formada por los términos con los que se describen los fenómenos a explicar, la base empírica. Estos términos constituyen el vocabu!ario preteórico o, como también dice, "previamente disponible". Estos términos preteóricos no corresponden en general a situaciones observables
306
FUXD.;\SíE\TOS DE F I L O S O F ~DE . ~ L.4 CIENCIA
en sentido estricto, sino que a menudo se introducen en la ciencia en el contexto de una teoría anterior. Los otros términos descriptivos usados en la teoría son los que ella introduce para llevar a cabo la elaboración teórica que da cuenta de los fenómenos preteóricamente descritos; ellos constituyen el vocabulario teórico de dicha teoría. Es imponante enfatizar dos puntos de esta nueva distinción: a ) es una distinción relativizada a las teorías, un término no es teórico o preteónco sin más, sino respecto de una teoría especifica, y por tanto un término puede ser preteórico en una teoría y teórico en otra; aunque no lo afirma explícitamente, de su caracterización informal parece seguirse que un término puede ser preteórico en varias teorías, aunque normalmente será teórico sólo en una; b ) el criterio para la distinción es el uso o no del término en la descripción de los fenómenos empíricos a explicar; por tanto, la distinción será precisa en la medida en que se dé un criterio preciso para determinar qué enunciados son los que describen los fenómenos a explicar, pero Hempel no lo da. Junto con esta nueva caracterización del vocabulario básico de una teoría, Hempel introduce otra para los enunciados. Además de enunciados puramente empíricos, la teoría contiene: (i) principios inren7os, que son los que especifican "el escenario teórico", los que sistematizan el nuevo aparato conceptual introducido por la teoría; (ii) principiospuente, que indican la forma en que "se relaciona lo que ocurre a nivel del escenario teórico con los fenómenos que la teoría debe explicar" (1973, $1). Esta clasificación de los enunciados parece una nueva versión de la anterior, axiomas teóricos y reglas de correspondencia, pero no es así. Aunque hay enunciados cuyos únicos términos descriptivos son preteóricos (a saber, los informes empíricos particulares y sus generalizaciones), no hay ahora enunciados que contengan sólo términos teóricos; tanto los principios internos como los principios-puente contienen esencialmente tanto términos teóricos coino preteóricos. En cuanto a la presunta función de los enunciados en la fijación del significado de los términos, Hempel sostiene ahora que el significado de los términos teóricos no está totalmente detelminado por los principios internos más los principios-puente. Ambos tipos de enunciados ofrecen al aprendiz de la teoría el acceso principal a la compresión de las expresiones, pero no determinan completamente su significado. La idea clásica de que el significado de los términos se fija completamente ~nediallteelzunciados que los conectan con otros términos es errónea; y, como ya había sugerido Putnam (1962), el problema del significado de los términos teóricos planteado en ese esquema no existe, es un pseudoproblema. El motivo es que los términos científicos adquieren su significado por vías diversas, quizá en algunos casos (parcialmente) mediante enunciados, pero usualmente de otros modos; especialmente, como los términos del lenguaje ordinario, vinculándolos a aplicaciones específicas, "mediante instancias de uso en contextos particulares" (Hempel, 1973, $7, donde menciona además a Kuhn como referencia explícita para estas ideas; cf. también al respecto las teorías causales de la referencia, p.ej. Putnam, 1975). Por último, Hernpel considera ahora que la pretensión de la Concepción Heredada de caracterizar una teoría empírica a través de su reconstrucción axiomática es inadecuada, pues siempre hay varias axiomatizaciones posibles, ninguna de las cuales expresa mejor que las otras la naturaleza de la teoría; una teoría no se puede identificar pues con un sistema espec$co de enunciados dotados de cierta estructura o sistematización.
Todas estas innovaciones del último Hempel son importantes y apuntan a elementos esenciales en la caracterización de las teorías que se desarrollarán en otras concepciones, pero en esta particular versión son sumamente insatisfactorios. Sus principales contribuciones son: a) la relativización de la distinción teóricolpreteórico a las teorías y b) la caracterización de la base empírica en términos preteóricos, con lo cual los datos se consideran cargados de teoria pero no de la misma teoría para la que constituyen su base empírica. Las principales dificultades radican en: (i) la imposibilidad de distinguir entre principios internos y principios-puente, y (ii) la inexistencia de un criterio preciso para poner en obra la distinción entre términos teóricos y preteóricos. I
a (
6. Consideraciones finaIes En este capítulo hemos examinado los primeros análisis que, en el contexto de la llamada Concepción Heredada, se dieron de la naturaleza y estructura sincrónica de las teorías empíricas. La idea básica que inspira este análisis es que una teoría empírica es un conjunto de afirmaciones que a ) son susceptibles de ser estructuradas mediante relaciones de dependencia lógica y b) versan sobre la realidad física, algunas directamente y otras indirectamente a través de las primeras. El núcleo de este análisis lo constituye la noción de cálculo axiomático empíricamente interprerodo. La articulación de esta noción supone la distinción entre vocabulario teórico y observacionai, y entre afirmaciones puramente teóricas (axiomas del cálculo abstracto). afirmaciones puramente observacionales (enunciados fácticos particulares y generalizaciones empíricas) y afirmaciones "mixtas" (reglas de correspondencia). La intuición que hay tras la idea básica es esencialmente correcta, pero el modo específico en que la Concepción Heredada la desarrolla presenta diversas dificultades. Estas dificultades son básicamente de tres tipos. De ellas, sólo la última ha recibido atención en las secciones anteriores, pues sólo ella fue tematizada por los representantes de esta concepción, las otras serán examinadas en detalle en los dos próximos capítulos. 1. La primera dificultad tiene que ver con la excesiva "rigidez" del uso que se hace de la noción de cálculo axiomático. Tal como se presenta aquí, todos los axiomas (y reglas) de una teoría están al mismo nivel, no hay unos más esenciales, básicos, y otros menos, complementarios. Nótese que estamos hablando sólo de los axiomas, no se piense por tanto que la distinción entre axiomas y teoremas tiene que ver con ésta que ahora estamos apuntando. Por lo que a los axiomas se refiere, si todos están al mismo nivel, si todos son igualmente esenciales, entonces es difícil que esta noción tan rígida, "monolítica", de teoría sincrónica permita una elucidación adecuada de las teorías en sentido diacrónico. Si todo está al mismo nivel, si no se distingue entre afirmaciones esenciales y otras sólo complementarias ("no esenciales"), entonces el más mínimo cambio implica un cambio de toda la teoría, la sustitución de una teoría por otra teoría diferente. Esto es intuitivamente insatisfactorio. Una de las principales contribuciones de los nuevos filósofos de la ciencia que estudiaremos en el próximo capítulo consistz
precisamente en llamar la atención sobre esta inridecuación y proponer un concepto de teoría mucho más rico y dúctil. 2, La segunda dificultad tiene que ver con la noción misma de sistema axiomático. Tal como se presenta la identidad de una teoría, ésta parece depender de los axiomas que se elijan en su axiomatización, lo cual es inruitivamente insatisfactorio. Parece que una teoría puede decir "lo mismo" mediante recursos expresivos diferentes. Esto no lo niegan los representantes de la Concepción Heredada pero, simplemente, la articulación "enunciativista" que hacen de la idea básica no les permite recoger plenamente las intuiciones. Como veremos en el capítulo 10, para ello es necesario hacer jugar un papel más central en la caracterización de las teorías a la noción de modelo que presentamos en la sección 2. Ésta será la principal contribución de las concepciones semanticistas que estudiaremos en ese capítulo. 3. Por último, en la discusión sobre la naturaleza de la base de contrastación, su supuesta carga teórica y su eventual naturaleza observacional, se deben distinguir dos niveles, el local y el global. Por lo que se refiere al supuesto carácter observable de la base de contrastación, una cosa es a) que las teorías científicas, globalmente consideradas como partes del sistema total de nuestro conocimiento, descansen en última instancia, por lo que a su justificación se refiere, en los modos más básicos de experiencia "observable" ("observabilismo" global), y otra b) que cada teoría científica sea tal que los enunciados que expresan los hechos con los que se contrasta involucren sólo expresiones que se refieren a situaciones observacionales básicas ("obsen~abilismo" local). Lo primero es seguramente cierto, lo segundo es, a la luz de las teorías reconstruidas, muy poco plausible. En cuanto a la carga teórica de la base de contrastación, una cosa es c) que la determinación de los datos de contrastación presuponga "directamente" la teoría que se quiere contrastar mediante dichos datos (autojustificacionismo local), y otra 4 que tal determinación presuponga otra u otras teorías vinculadas a nivel global de una disciplina, o incluso la ciencia entera, con la teoría original (holismo de contrastación). Lo primero es claramente inaceptable, lo segundo merece un juicio filosófico más detenido. Sobre estas cuestiones volveremos en los próximos capítulos.
ANÁLISIS SINCRÓNICODE TEORÍAS 11. LAS CONCEPCIONES HISTORICISTAS: LAS TEOR~ASCOMO PROYECTOS DE INVESTIGACI~N
l . L a revztelta Itistoricista y la naturaleza sincrónica de las teorías Durante los años sesenta, y en parte como consecuencia de los debates sobre algunas de las cuestiones que hemos expuesto en el capítulo anterior, se gestan y desarrollan concepciones alternativas a la Concepción Heredada que cuestionan sus supuestos fundamentales. De ellas, la que más pronto cristaliza como alternativa es la que entonces se denominó niteva filosofía de la ciertcin, vinculada a autores como Hanson, Toulmin, Kuhn, Feyerabend y Lakatos, y mucho más tarde y sin pertenecer oficialmente al grupo, pero con orientaciones parecidas, Laudan. Una de las características de estcs pensadores es su mayor preocupación por, y su mejor conocimiento de, la historia de la ciencia (el más representativo e influyente de ellos, T. Kuhn, se había dado a conocer años antes como un extraordinario y renovador historiador de la ciencia). En su opinión, la atención a la ciencia real que la historia nos presenta obliga a modificar la práctica totalidad de la imagen de la misma que se ofrece en la Concepción Heredada. Esta rev~ieltahistoricista propicia una revisión drástica en prácticamente todos los ámbitos metacientíficos. Aunque, como siempre, también en esta concepción las tesis centrales en los diversos ámbitos están extremadamente interrelacionadas, vamos a ocupamos aquí, en la medida d e lo posible, exclusivamente de las tesis relativas a la naturaleza y estructura de las teorías científicas en su dimensión estática o sincrónica (en el capítulo 13 nos detendremos en los aspectos diacrónicos). Conviene advertir que, contrariamente a la Concepción Heredada, ésta no es una cuestión que reconozcan como central los nuevos filósofos, ni siquiera hacen de ella un tema de estudio explícitamente declarado (salvo quizá Kuhn en una segunda etapa). En la medida en que se ocupan de las teorías o constructos teóricos, lo hacen siempre, consecuentemente con su orientación general historicista, desde una perspectiva diacrónica, centrándose en los aspectos dinámicos de las teorías como entidades que se extienden en el tiempo, esto es, que nacen, se desarrollan y "mueren" (se desalojan mutuamente). Sin embarso, debe quedar claro que, independientemente de que se reconozca o no explícitamente, el estudio diacrónico presupone una concepción de la naturaleza
310
FUND.A~IE\TOSDE FILOSOFLADE L.4 CIESCIA
sincrónica de las teorías. Cualquier análisis de la dimensión diacrónica de las teorías científicas debe partir de que las teorías diacrónicamenre consideradas, en tanto que entidades que perduran en el cambio a través del tiempo, consisten en dzterminadas secuencias de "teorias en sentido sincrónico". La "historia" de una teoría consiste en la sucesión de las diversas "etapas" o versiones por las que pasa. Estas etapas, en tanto que imágenes "congeladas" de la teoría en cierto momento, se deben considerar aproximadamente estables o "estáticas". La cinemática de la teoría, su "historia7', consiste en la sucesión de sus diversas versiones estáticas, en la sucesión de "etapas" por las que la teoría pasa. Esta intuición básica, en la que descansa cualquier análisis de la estructura diacrónica de la ciencia, implica entonces que los análisis diacrónicos presuponen alguna noción de la estructura sincrónica de las teorías, de las etapas cuya sucesión constituye la teoríaen-el-tiempo. El análisis y discusión de la evolución de los constructos teóricos contiene pues, cuando menos implícitamente, cierta preconcepción de la naturaleza de los diversos estadios por los que atraviesa ese constructo teórico, de sus elementos constituyentes y su estructuración. Esta preconcepción de la naturaleza sincrónica de las teorías que subyace a los estudios diacrónicos puede estar mejor o peor articulada y en algunos de estos autores está, aunque no siempre explícita, altamente estructurada y elaborada. Éste es el caso particularmente de Kuhn y también, aunque en menor medida, de Lakatos (su temprana muerte le impidió concluir la reelaboración de sus ideas que estaba preparando). Revisaremos aquí las contribuciones de estos dos autores, con especial detenimiento en Kuhn, y concluiremos comentando brevemente las de Laudan quien, aunque posterior, desarrolla una posición parcialmente parecida en abierta polémica con los anteriores. Como veremos al final, estos autores realizaron contribuciones fundamentales a la caracterización sincrónica de las teorías. Ahora bien, en su opinión, esos nuevos elementos que señalan, al estar esencialmente vinculados a la actividad científica como actividad práctica con componentes históricos y sociales inelirninables, son inaccesibles al análisis formal. Todo el proyecto original de desarrollar una lógica de la ciencia, incluida en ella la reconstrucción formal de las teorías, está según ellos abocado al fracaso. Uno de los mayores retos de la filosofía de la ciencia posterior será dar cuenta en términos formales, o semiformales, de las principales contribuciones de estos autores. En general, estos nuevos elementos van a conformar una noción de teoría mucho más dúctiI que la extremadamente rígida de la Concepción Heredada. Ahora, el análisis de las teorías ha de ser tal que éstas resulten entidades susceptibles de evolución, que puedan sufrir modificaciones extendiéndose en el'tlempo sin perder su identidad. Para ello es imprescindible que sus estadios, las teorías en su dimensión estática o sincrónica, sean dúctiles, tengan partes más accidentales que puedan cambiar manteniendo su identidad, esto es, preservando sus coniponentes más esenciales. h7eamoscómo se concreta esta idea básica en las nociones de paradigma o matriz disciplilzar, de Kuhn, de programa de i~zvestigación,de Lakatos, y de tradición de ir7vesrigació~~, de Laudan.
2. Los paradigrnas-matrices disciplinares de Kuhn En 1962, Kuhn presenta en La Estrrrct~trade las Revolrlciones Cientificas una visión de la ciencia, de los constmctos teóricos, de las comunidades científicas y de su actividad, radicalmente novedosa y contraria a la dominante hasta entonces. Se ha señalado que esa nueva perspectiva tiene muchos puntos en común con la que esbozara el científico y filósofo polaco L. Fleck treinta años antes (cf. Fleck, 1935). El propio Kuhn reconoce en la introducción a su obra no sólo la semejanza, sino la influencia de las ideas de Fleck:Pero, reconocidos sus méritos corno precursor adelantado, es indudable que por la articulación y desarrollo de las tesis, por la elaboración y precisión posterior de las mismas y, sobre todo, por la enorme influencia que ejercieron, corresponde sin duda a Kuhn el mayor protagonismo en el surgimiento de esta nueva concepción. En esta obra se tratan prácticamente todos los temas fundamentales de la filosofía de la ciencia y todos elIos bajo una perspectiva nueva. Nos ceñiremos aquí a los relativos a la estructura de los constnictos teóricos o, como Kuhn los denomina inicialmente, paradigmas.
2.1. CIENCIA NORMAL Y CIENCM REVOLUCIOS.ARIA
En las ciencias maduras, Kuhn distingue dos modos de "hacer ciencia" que además, en su opinión, se suceden históricamente. Al primero lo llama norr~ialpues es el modo usual en que opera la ciencia. la manera en que ésta se desarrolla la mayor parte del tiempo. Al segundo lo denomina, por oposición, no-rzor-mal o e,rtraordinario y, a veces, revolucionario. Es importante insistir en que éste es el modo en que, según Kuhn, procede la ciencia madura, pues el panorama que vamos a trazar no se aplica a los períodos de formación o asentamiento de una disciplina. Los períodos de ciencia normal se caracterizan por el hecho de que la comunidad de científicos que trabaja en un determinado ámbito comparten ciertos presupuestos de muy diverso tipo (tejricos, experimentales. metodológicos y otros) que son los que les permiten ir haciendo ciencia. Estos elementos compartidos se encuentran, implícitamente unos, explícitamente otros, en los canales usuales de enseñanza y transmisión de una disciplina (principalmente los libros de texto) y el futuro científico los adquiere por regla general en su período de aprendizaje. En ciencia normal la tarea casi exclusiva consiste en lo que Kuhn llama trabajo de resollrción de enigmas o rorrrpecabezas. Esta tarea consiste, grosso modo, en ir ampliando y perfeccionando la aplicación del aparato teórico-conceptual a la experiencia, y a la vez y como consecuencia de ello, en ir ajustando y puliendo la base teórico-conceptual. Algunas de 1 arcas típicas de la investigación normal son la precisión de constantes ya conocidas, la determinación de otras nuevas, encontrar formas específicas de leyes generales y aplicar las ya disponibles a nuevos fenómenos. Para llevar a cabo este trabajo es esencial que el científico no cuestione los supuestos compartidos, pues son precisamente ellos los que guían su investigación y le permiten abrigar esperanzas de éxito. La ciencia normal no discute sobre fundamentos ni "tiende hacia novedades fácticas o teóricas y, cuando tiene éxito, no descubre ninguna" (1962- 1970, p. 43). Z
Ahora bien, la ciencia normal es sólo rcjt modo en que se desarrolla la empresa científica. La cjencia (madura) no discurre siempre de este modo. Un tipo importante de enigmas tiene que ver con la presencia de monwlías, experiencias que "no erioajan" en el aparato teórico. Aunque a menudo se resuelven con éxito, a veces a l ~ u n a sanomalías (o, más raramente, algún otro tipo de enigma) se muestran recalcitrantes. Si ello ocurre con varias, o con alguna considerada especialmente importante, puede ocurrir que, tras cierto tiempo, algunos miembros de la comunidad desesperen de encontrar una solución, o que, aunque la encuentren, consideren excesivas las modificaciones r?onnales a que obliga. Cuando este sentimiento se generaliza en la comunidad científica sobreviene lo que Kuhn llama una crisis: se comienzan a cuestionar los supuestos que guiaban la investigación, se pierde la confianza en ellos y se empiezan a revisar y a discutir los fundamentos. En estos períodos de crisis se suceden propuestas alternativas hasta que en tomo a alguna de ellas se comienza a organizar un nuevo cuerpo de supuestos desde los que mirar las viejas cosas de un modo nuevo y más prometedor. Con el tiempo, y si el trabajo basado en los nuevos supuestos permite abrigar esperanzas de éxito, reciben la confianza de los especialistas de la comunidad y acaban suplantando a los antiguos como guía para la investigación. Los viejos supuestos son desplazados por los nuevos consumándose lo que Kuhn llama una .~~oSuciÓ cieiztljTca, l~ tras la cual se inicia un nuevo período de ciencia normal. Éste es el tipo de actividad que caracteriza la ciencia i1o-i1017nalo extraordinaria, la que se desarrolla en los períodos revolucionarios. A ella están asociados los "grandes nombres" de la historia de la ciencia, como CopSmico, Sewton, Darwin o Einstein. Pero es importante señalar que no sólo ellos pues. si bien la ciencia extracrdinaria es un fenómeno mucho más extraño que la ciencia normal, según Kuhn se da con más frecuencia de la que la referencia a estas grandes revoluciones puede sugerir (cf. 1969, p. 149; el "tamaño" de las revoluciones es una de las cuestiones que Kuhn nunca ha precisado suficientemente). Es importante señalar que el paso de un período normal a otro no viene obligado por necesidad lógica. Se trata de un desplazamiento de confianza y, en ausencia de un nuevo programa, el antiguo puede mantenerse largo tiempo aunque haya entrado en crisis. Recuérdese que ésta es la situación en disciplinas científicas ya asentadas. En los períodos de gestación no hay un paradigma dominante y lo que sucede es algo muy parecido a lo que sucede en los períodos de crisis en la ciencia madura, a saber, una extraordinaria proliferación de alternativas rivales que compiten por imponerse en la comunidad.
El concepto básico que articula esta nueva concepción de la ciencia es el de paradigma. Un napa6aypa (del griego 'napa':cercano, aproximado; y '6eiwa':muestra, mostración) es un ejemplo o caso de algo que hace de modelo para otros casos de lo mismo, es un ejemplo-tipo o típico. Así decimos, por ejemplo, que María Callas es un paradigma de cantante de ópera, que es una cantante de ópera paradigmática; o que Romeo y Julieta son un paradigma de amantes apasionados; o, el ejemplo preferido del
propio Kuhn, que amo-amas-amat-amamus-atrtatis-amant es un paradigma de la conjugación del verbo latino. Este significado original del término 'paradigma' se desplaza en La Estructlcra en varias direcciones hasta llegar a tener sentidos muy diferentes (cf. p.ej. hlasterman, 1970, para un análisis de los mismos). De entre ellos, e1 dominante, e1 que sustenta esta concepción, es desafortunadamente el más impreciso de la obra. En este sentido un paradigma es el conjunto de supuestos compartidos por una comunidad que guían su investigación normal. La ciencia normal es ciencia-basada-en-(un-)paradigma y la ciencia extraordinaria o revolucionaria es el paso de un paradigma a otro. En esta última, al igual que en la fase inmadura o preparadigmática de una disciplina, se trabaja sin (el dominio de un) paradigma, hay una proliferación de hipótesis diferentes. Las disciplinas maduras, aquellas en que ha surgido ya un primer paradigma, se desarrollan de pnradigma en paradigma a través de revolrrciones. En este primer trabajo, Kuhn no es lo suficientemente explícito acerca de estos supuestos compartidos como para extraer una idea clara de los mismos. Muchas de las críticas que se le dirigieron inicialmente no sólo se dirigían contra la equivocidad del término sino también, y principalmente, contra la vaguedad de éste su sentido preponderante. Parecía que hablar de paradigmas no era sino otro modo, poco afortunado, de referirse en términos muy generales a teorías. En trabajos posteriores (cf. especialmente 1962-1970, "Postscriptum", y 1970c), Kuhn intenta distinguir y precisar los diferentes sentidos con que introdujo el término. Los diversos usos que de él hacía en su primera obra los reagrupa ahora en dos sentidos principales. El primero es global y comprende todos los compromisos compartidos por un grupo científico, la completa constelación de creencias, valores, técnicas y demás elementos compartidos por los miembros de una comunidad científica dada. Como veremos, el segundo es concreto y denota un componente específico de lo anterior, un tipo especialmente importante de tales compromisos. Aunque entre los estudiosos de la ciencia el término ha acabado por usarse en el sentido global, fue el segundo el que motivó originalmente su introducción y el que se adecua a su significado etimológico. Para no confundirlos, Kuhn denomina en estos trabajos 'matriz disciplinar' ('disciylinary rnatrix') a lo primero y 'ejemplar' a lo segundo. Un paradigma qua matriz disciplinar es por tanto lo compartido por una comunidad científica, lo que guía en un momento dado su investigación normal. Sus principales componentes son los siguientes:
Genera1i:aciones simbólicns Éste es el componente formal o fácilmente formalizable de la matriz disciplinar y comprende, aproximadamente, las tradicionales lqes. A menudo se encuentran ya en forma simbólica, como f = ma, I = VIR o V'Y + Src'~n/h=(E - V)Y = O; pero también pueden venir expresadas en palabras, como "la acción es igual a la reacción" o "la combinación química se produce según proporciones constantes de peso". Estas generalizaciones simbólicas, consideradas aisladamente, funcionan como expresiones de un sistema matemático puro de uso compartido por los miembros de una comunidad científica; como mero formalismo abstracto, son expresiones vacías de significado o aplicación empírica.
FL'NDPlhlEhTOS DE FILoSOFL~DE LA CIENCIA
No todas las generalizaciones simbólicas son paradigmáticas, esto es, :)O todas se consideran incuestionables. Es típico que así ocurra con las que tienen cierto carácter fundacional o programático. De entre ellas, son especialmente importantes las "más generales", cuasi-vacías o cuasi-tautológicas, como f = ina o la ecuación de onda de Schrodinger, que más que generalizaciones son esquemas de tales: "no son tanto generalizaciones como esquemas de generalizaciones, formas esquemáticas cuya expresión simbólica detallada cambia de una aplicación a la siguiente" (1970c, SIII). Una de las tareas de la ciencia normal consiste precisamente en intentar aplicarlas a situaciones empíricas concretas encontrando formas especiales de las mismas: "En el problema de la caída libre, f = I?UI pasa a ser 17lg = ~nd'sldr'. Para el péndulo simple se convierte en mg seno = - ~ítd'sldt~.Para osciladores armónicos acoplados, la mencionada fórmula se convierte en dos ecuaciones, la primera de las cuales puede escribirse mid2sildt?+ kisi= k2(d+ s2- S,). Problemas mecánicos de mayor interés, por ejemplo el movimiento de un giroscopio, mostrarían aún mayor disparidad entre f = ma y la generalización simbólica a la que efectivamente se aplica la lógica y la matemática" (ibid.). Es en este sentido que f = riza no es tanto una generalización específica cuanto un esquema que va adquiriendo formas específicas para casos de aplicación específicos. Y por eso es, cortsiderada en sí mis~na,cuasi-vacía o cuasi-tautológica y, por tanto, difícilmente refutable, difícilmente puede entrar en conflicto con la experiencia. Por sí sola apenas tiene "contenido", son sus versiones específicas las que lo tienen y las que entran en conflicto con la experiencia. Pero si ello ocurre, siempre es posible mantener la ley más general y retocar sólo sus desmollos específicos. La idea es que tales leyes generales son "programáticas", son algo así como "guías para la investigación": si tienes un feiiómeno cinemático a explicar, busca fuerzas responsables del mismo de modo que la suma de todas ellas sea igual al producto de la masa por la aceleración; si la suma de fuerzas no coincide con dicho valor, la conclusión no es que 1a.segunda ley es falsa, sino que debes seguir buscando nuevas fuerzas o precisar mejor la naturaleza y magnitud de las ya detectadas. En este sentido, este tipo de generalizaciones son "irrefutables" y sólo sus versiones específicas entran en conflicto con la Durante los períodos de ciencia experiencia. Su abandono es un fenómeno re~~oluciottar.io. normal no se cuestionan, s61o se cuestionan en los momentos de crisis y si se terminan abandonando es porque han perdido la confianza de la comunidad como principios que guían la investigación. Las revoluciones entrañan, entre otras cosas, el abandono de estos pnncipios, de estas leyes paradig~ízáricas,pero como parte del proceso general de pérdida de confianza en el paradigma-matriz en crisis (sobre la forma lógica de estos pri~icipiosguía, cf. Moulines, 1982, cap. 2.3). Modelos Kuhn usa aquí 'modelo' en el sentido de imagen, algo a lo que se puede asimilar otra cosa, por ejemplo cuando decimos que un computador es un modelo de la mente. Los modelos proporcionan al grupo las analogías preferidas o? si se les sostiene a fondo, una ontología. En un primer sentido, los modelos son simples analogías, son sólo heurísricos, por ejemplo la asimilación del con~portamientode un gas con el de un conjunto de pequeñas bolas en movimiento, o del funcionamiento de la mente con el de un computa-
dor. En un segundo sentido, más fuerte, los modelos son objeto de compromiso metafísico, son ontológicos, por ejemplo la creencia de que todo fenómeno perceptible es debido al movimiento e interacción de átomos en el vacío. Kuhn admite que ambos tipos de modelos son conceptualmente diferentes, pero los subsume en un mismo grupo de compromisos porque su función metodológica y epistémica es muy parecida (cf. 1962-1979, "Postscriptum", n. 9). Además de proporcionar a la comunidad científica sus analogías preferidas, muchas veces determinan qué puede ser aceptado como solución a un problema. Por otro lado, a veces modelos heurísticos pueden pasar a convertirse en ontológicos, como ocurrió en la reducción de la termodinámica a la mecánica estadística con la asimilación del calor con la energía cinética media de las moléculas. Kuhn enfatiza que, aunque usualmente los miembros de una comunidad comparten los modelos, ello no es esencial, pueden no compartirlos, ni siquiera los heurísticos. En este punto, sin embargo, no está claro qué grado de "esencialidad" tienen estos componentes de las matrices (cf. 19621970, pp. 15 1-152).
Valores Los valores son el conjunto de criterios axiológicos que emplea la comunidad al evaluar su propia actividad. Los más destacados son los relativos a la no vaguedad de las predicciones, el margen de error admisible de las observaciones respecto de las predicciones, la fecundidad, coherencia y simplicidad del aparato teórico y la compatibilidad con otras teorías aceptadas. A veces también se contemplan otros más externos relacionados, por ejemplo, con la utilidad de la ciencia o su función social. Los valores operan tambi6n en la ciencia normal, pero juegan su principal papel en el surgimiento de las crisis y en su resolución, en la elección de paradigmas alternativos. Generalmente estos valores son compartidos por varias comunidades dentro de una misma disciplina, pero no por ello tienen siempre el mismo efecto. Puesto que su aplicación conjunta produce conflictos al no ser plenamente compatibles entre sí, es forzoso a veces conceder más importancia a unos que a otros, y diferentes comunidadzs, o la misma en momentos diferentes, pueden hacerlo de diferente modo. Ésta es una de las razones por las que no hay un procedimiento mecánico que nos diga cuándo un paradigma debe ser abandonado, se le debe retirar la confianza, o qué elección hacer entre paradigmas alternativos. Nótese que, en las revoluciones, una opción, el viejo paradigma, está muy desarrollada y otra, el nuevo, poco, por lo que no está claro cómo contrapesar los resultados de las exigencias que impone el mismo grupo de valores. Si concedemos mucha importancia a la fecundidad, el nuevo paradigma incipiente sale de momento perdiendo, pero si se la concedemos a la resolución de problemas recalcitrantes, saldrá ganando. El proceso de decisión de acuerdo con esos valores no es pues automático o mecanizable, y a veces puede depender esencialmente de otros elementos externos a la actividad científica, elementos de carácter social, o económico, o incluso político o ideológico.
316
FUn'D.4blEh'TOSDE FILOsOFi4 DE M CIENCIA
Ejemplares Éste es el componente más importante, junto con las generalizaciones simbólicas, de la matriz. A él se refiere el otro sentido de 'paradigma' anunciado, sentido que motiva originalmente la introducción del término. Los ahora llamados 'ejemplares' son paradigmas en sentido etimológico: casos que hacen de modelo, ejemplos modélicos. Los ejemplares son aplicaciones empíricas específicas del aparato formal que sirven de modelo o guía para el trabajo de resolución de rompecabezas, para otras aplicaciones; son las "partes de la realidad" a las que típicamente se aplica el formalismo. Pueden ser logros especialmente importantes de la teoría, como la aplicación al sistema solar de la mecánica newtoniana, o la aplicación al cometa Halley de esa misma teoría, o la aplicación al perihelio de Mercurio de la mecánica relativista, etc. Otros son ejemplos-tipo, típicos, para su aplicación, como una experiencia de laboratorio con un plano inclinado, o un problema-resuelto de un libro de texto. A ellos se refiere Kuhn en La Esrnictirra cuando afirma que los paradigmas son "realizaciones científicas universalmente reconocidas que, durante cierto tiempo, proporcionan modelos de problemas y soluciones a una comunidad científica" (p. ix). Mediante los ejemplares se ven situaciones nuevas como semejantes a otras anteriores bien establecidas. Se ven fenómenos diferentes de modo similar, como casos de aplicación de una misma ley; por ejemplo se puede ver el movimiento de un péndulo como semejante, con ciertas idealizaciones, al de una bola moviéndose en un doble plano inclinado, o puede verse, como propusieron los copemicanos tras el descubrimiento de las lunas de Venus, el sistema Sol-planetas como semejante al sistema Júpiter-lunas. También aquí no todos estos elementos son considerados igualmente esenciales, no todos los casos de aplicación son igualmente importantes, de entre ellos sólo algunos son considerados paradigmáticos. Al hacer de modelos-paradigmas para la resolución de enigmas, los ejemplares guían, junto con las leyes paradigmáticas, la investigación nornlal, el desarrollo de la matriz disciplinar. En gran medida, la ciencia normal consiste en ir ampliando con éxito el ámbito de situaciones semejantes a los ejemplares, intento que obliga generalmente a alguna modificación de las leyes más específicas (no paradigmáticas). Al presentar el primer elemento de las matrices, las generalizaciones simbólicas, vimos que Kuhn enfatiza que por sí solas son simples componentes de un formalismo abstracto vacío de contenido empírico. Pues bien, según Kuhn es justamente a través de los ejemplares como, al menos en parte, se cargan de contenido empírico los términos de las generalizaciones que constituyen el formalismo abstracto. Con los ejemplares se aprende cómo el aparato conceptual se aplica a la naturaleza y, en consecuencia, parte de su significado. Los ejemplares desempeñan ahora (al menos parte de) el papel de las antiguas reglas de correspondencia. En la sección en que se ocupa de la conexión de la teoría con la experiencia, Kuhn afirma explícitamente que la "habilidad adquirida para ver semejanzas entre problemas aparentemente dispares desempeña en las ciencias una parte importante del papel atribuido corrientemente a las reglas de correspondencia" (1970c, SIV); a esta idea se refería Hempel cuando, como mencionamos en el capítulo anterior, señala a Kuhn como una de las fuentes de sus nuevas tesis sobre el modo en que los
términos teóricos se cargan de contenido empírico. Por otro lado, los ejemplares no son experiencias puras, descripciones neutras de la naturaleza. Son ejemplares dentro de un paradigma y están en parte ya conceptualizados. Ello hace que, al cambiar el paradigma, con todos sus componentes, cambie, según Kuhn, al menos parte del significado de los términos y a su vez el modo-de-ver-guiado-por-ejemplares las cosas. Las "mismas" situaciones se ven de modo diferente y quienes mantienen paradipmas diferentes viven, en cierto sentido, en mundos diferentes. Éste es el origen del fenómeno de la inconrnensurabiliclad que en opinión de Kuhn acompaña los cambios revolucionarios. Esta nueva concepción de los constmctos teóricos tiene importantes consecuencias para las más importantes cuestiones epistemológicas y semánticas de la filosofía de la ciencia, como el ya mencionado de la inconmesurabilidad, o los del relativismo, la racionalidad, el significado de los tCrminos científicos, la confirmación y la falsación, etc. Por ahora nos limitamos a los elementos fundamentales de las matrices disciplinares y más adelante, cuando tratemos algunas de estas cuestiones, volveremos sobre el resto de las tesis kuhnianas (cf. especialmente cap. 12, $5, sobre sus consecuencias para el problema de la inmunidad y cap. 13, 94, 95 para las relativas a la inconmensurabilidad). Para concluir comentaremos brevemente un problema de ambigüedad relativo al término 'matriz disciplinar'. Kuhn afirma que introduce dicho término en sustitución del equívoco Cient@cas, y que mediante él se 'paradigma' usado en La Estr~icrurade 10s Re~~oluciones quiere referir al conjunto de supuestos compartidos por los miembros de una comunidad científica. Estos supuestos son los supuestos de los cuatro tipos que acabamos de examinar, pero lo que no está claro es si la matriz disciplinar incluye todos los supuestos de cada tipo o sólo los paradigmdticos; o limitándonos a los dos que más centrarán nuestra atención, no está claro si las matrices incluyen todas las leyes y todos los ejemplares o sólo las leyes programáticas generales y los ejemplares paradigmáticos. Esta cuestión es en parte sólo nominal. Kuhn afirma que su intención era captar lo que tradicionalmznte se ha denominado 'teoría', pero que no usa este término porque tal como de hecho lo emplean los científicos "comiota estructuras mucho más limitadas en naturaleza y alcance que las requeridas [...]; para los presentes propósitos sugiero 'matriz disciplinar': 'disciplinar' porque se refiere a la posesión común de los practicantes de una disciplina; 'matriz' porque está compuesta de elementos ordenados de varios tipos" (19621970, p. 150). No aclara sin embargo si la matriz incluye todos los elementos de cada tipo o sólo algunos, y cuando usa el término unas veces parece referirse a todos y otras sólo a los paradigmáticos. En principio, sus numerosas referencias al "conjunto total de supuestos compartidos" parecen sugerir que incluye todos, pero en realidad ello no es inmediato pues depende de qué se entienda por 'comunidad científica'. Si la comunidad científica es el conjunto de científicos que trabajan en una teoría en un momento dado, entonces la matriz incluye todos los sriplrestos compartidos eri ese estadio de la teoría. Pero si la comunidad es el conjunto de los científicos que trabajan en la teoría en toda s u historia, entonces la matriz incluye todos los siipiiestos compartidos a lo largo de toda la historia de la teoría, que serán solo los paradigmáticos pues, como veremos (cf. cap. 13), éstos son los que se preservan a lo largo de la historia de la teoría. La presente ambigüedad no es, pues, sino consecuencia de la
ambigüedad entre los sentidos sincrónico y diacrónico de 'teoría' o 'n~atrizdisciplinar'. Desde una perspectiva sincrónica, la matriz disciplinar incluye todos los elementos compartidos en un momento dado; desde la perspectiva diacrónica, incluye sólo los que perduran durante la historia de la teoría. Una vez esto quzda claro, qué palabras usemos es lo de menos. Cuando en adelante usemos esta expresión, el contexto aclarará el sentido en que se hace, en caso contrario lo aclararemos explícitamente.
3. Los programas de investigación d e Lakatos Lakatos, inicialmente discípulo de Popper, reacciona contra él llegando a puntos de vista similares a los de Kuhn y Feyerabend aunque sin caer, al menos eso pretende, en algunas tesis extremas de éstos, sobre todo las relativas a la racionalidad científica, que considera inaceptables, desde una perspectiva popperiana general que comparte. Lakatos lleva a cabo la revisión del falsacionismo de Popper en una serie de estudios sobre lo que denomina la metodología de los programas de ini*estigacióncieittijka. Estos trabajos iban a concluir con una extensa monografía titulada, en referencia directa a la obra de Popper, The Clzaizging Logic of Scientij?~Discovery, proyecto que quedó truncado al morir su autor. Una de las finalidades de esta obra era desarrollar la estructura final de los progralnas de investigación, noción con la que Lakatos pretendía recoger lo que consideraba fundamental de los constructos teóricos. Al quedar el proyecto sin conclusión, sólo disponemos, como fuente de sus ideas sobre la estructura de los programas de investigación, de sus primeros trabajos (especialmente 19686 y 1970). El propio Lakatos los considera muy insuficientes y provisionales, pero contienen ya algunos elementos de interés para nuestro actual tema. Veremos aquí muy brevemente las principales contribuciones, que casi siempre están sólo esbozadas. Lakatos parte de las observaciones de Popper sobre el coitocirnie~ztode fondo y la contrastación y las lleva a sus últimas consecuencias. Lo que se evalúa en la contrastación, dice, no es una teoría comparada con los hechos sino un conjunto de (mini)teorías, de diferente estatus metodológico, comparadas entre sí: "el conflicto no es entre 'teorías y hechos', sino entre una teoría ii~rerpretarivaque provee de hechos y una teoría explicativa que los explica [...], no se trata de que nosotros propongamos una teoría y la Naturaleza pueda gritar NO, sino que nosotros proponemos una red de teorías y la Naturaleza puede (1970, p. 130). Este conflicto se intenta resolver modificando algugritar INCONSISTE~~ES" nos elementos de la red y se genera así una sucesión de teorías-redes ligadas por "una notable continuidad". Esta serie o sucesión de teorías es lo que Lakatos llama un 'programa de investigación' que, como reconoce explícitamente, tiene fuertes reminiscencias de la ciencia normal de Kuhn. Lakatos presenta los elementos constituyentes de los programas de investigación en el contexto de Ias heurísticas que caracterizan la metodología de los programas. Todos los programas tienen un núcleo que los vertebra y les confiere unidad. Este núcleo lleva asociada una heurística que determina dos tipos de reglas metodológicas: unas nos dicen qué senderos de investigación hemos de evitar, Iieurística negativa, y otras qué senderos hemos de seguir, heurística positiva. La heurística negativa prohibe, por decisión, aplicar
1t
1! :
i
1
la refutación al núcleo, para lo cual se debe articular un cinturón protector de hipótesis auxiliares o complementarias que sí se consideran modificables. La heurística positiva sugiere cómo modificar y desarrollar esta parte "refutable" del programa. Éstas son las líneas maestras de la nueva metodología de Lakatos, contenida sucintamente en el siguiente pasaje: "Todos los programas de investigación científica se pueden caracterizar por su 'núcleo'. La heurística negativa del programa nos prohíbe dirigir el modus tollens a este 'núcleo'. En lugar de ello debemos emplear nuestro ingenio en articular o incluso inventar 'hipótesis auxiliares7 que conformen un cinturón protector en tomo a ese núcleo, y es a éstas a quienes debemos dirigir el mod~rstollens. Es ese cinturón protector de hipótesis auxiliares quien tiene que resistir el peso de las contrastaciones e irse ajustando y reajustando, o incluso ser sustituido por completo, para defender al núcleo, que de ese modo se hace más sólido. [...] Este núcleo es 'irrefutable' por decisión metodológica de sus protagonistas: las anomalías sólo deben llevar a cambios en el cinturón protector. [...] La heurística negativa especifica el núcleo del programa que es 'irrefutable7 por decisión metodológica; la heurística positiva consiste en un conjunto parcialmente articulado de sugerencias o indicaciones sobre cómo cambiar y desarrollar las 'variantes refutables' del programa de investigación, cómo modificar, sofisticar, el cinturón 'refutable' de proteccii5n" (1970, $ 3 ~ - b ) . El resultado de aplicar esta metodología constituye la evolución de una teoría científica; en términos de Lakatos, se trata de una sucesión de diferentes versiones del mismo programa, esto es, en tomo a un mismo núcleo. Como se habrá advertido, esta imagen es similar a la evolución de un paradigma kuhniano. Lakatos ofrece además una tipología de los programas de investigación en función de su mayor o menor "éxito". Un programa es progresivo si (entre otras cosas en las que no podemos detenemos ahora) predice hechos que se constatan después, y es, o está, estancado si sólo "postdice", esto es, si sólo ofrece explicaciones ad hoc de hechos (para él) inesperados. Esto exige dos cualificaciones. En primer lugar, el juicio requiere cierta perspectiva histórica, esto es, a los programas incipientes es racional "concederles cieno tiempo". Por otro lado, e incluso garantizada la perspectiva histórica, las cosas no siempre están tan claras, los casos mencionados son más bien idealizaciones y hay numerosos casos intermedios. Como es usual en los filósofos de esta orientación, Lakatos ilustra su nueva concepción con un detallado estudio histórico, en este caso del programa de investigación de Prout centrado en la idea de que todos los átomos están compuestos de átomos de hidrógeno, y del programa de investigación de Bohr centrado en la tesis de que la emisión de luz se debe al salto de órbita de los electrones en el interior del átomo. Es importante señalar que esta tipología idealizada de programas no debe tomarse como un criterio cuasiformal de sustitución: nada obliga, y por supuesto la lógica más "los hechos" tampoco, a abandonar un programa estancado, aunque sólo sea porque siempre es posible su "resurrección", esto es, de todo programa estancado siempre es en principio posible que se convierta de nuevo en uno progresivo. Esta perspectiva, bastante kuhniana en general, se distancia de la del autor de La Estructilra en algunos puntos, especialmente los que tienen que ver con los problemas de
la inconmensurabilidad y la racionalidad de la ciencia y en los que no podemos detenemos ahora. Por lo que respecta a la estructura de las teorías, la diferencia más señalada, aparte de la extrema imprecisión de las nociones de ~irícleoy cintrtrón protector, tiene que ver con el "alcance" o "dimensión" de los programas de investigación. En Kuhn está (aproximadamente) claro que los paradigmas-matrices se identifican, diacrónicamente, con teorías a lo largo de la historia. La astronomía geocéntrica constituye un paradigma, la heliocéntrica otro diferente; la mecánica desde Newton a Lagrange constituye un paradigma, la mecánica relativista otro diferente; la química del flogisto constituye un paradigma, la química del oxígeno otro diferente; etc. Sin embargo, y quizá como consecuencia de la mencionada imprecisión, no está claro en Lakatos cuáles son los límites de los programas de investigación. En general parece que engloban, como en Kuhn, sólo teorías extendidas en el tiempo; así se refiere, por ejemplo, "al programa de Newton". Pero en ocasiones habla como si varias de esas teorías pudieran constituir una única tradición, que se identificaría entonces con toda una disciplina. En ausencia de mayores precisiones, no es posible entonces distinguir claramente entre a ) el paso de una versión a otra de la misma teoría, y b) el paso de una teoría a otra. Estos dos fenómenos diacrónicos son prima facie esencialmente diferentes (como veremos con detznimiento en el capítulo 13) y poder dar cuenta de esta diferencia depende de cómo se caractericen los constructos teóricos en su dimensión sincrónica. Probablemente Lakatos no consideraba que la diferencia de la que se debe dar cuenta sea nítida, pues incluso llega a afinnar que "la ciencia como un todo puede considerarse un inmenso programa de investigación" (ibid., $3). Pero entonces la imprecisión de sus nociones centrales, programa de invesrigacióiz, ~iúcleoy ciizturón protector, es deliberada y no se ve claramente cómo es coherente con la aplicación histórica que realiza sobre casos concretos. Seguramente esta cuestión era una de las que quería clarificar en la monografía que preparaba y que no pudo concluir.
4. Las tradiciones de investigación de Laudan Laudan no pertenece generacionalmente al grupo de los nuevos filósofos de la ciencia, pero su obra, bastante posterior, presenta grandes afinidades, tanto en intereses como en contenidos, con la de aquéllos. Desde finales de los años setenta, Laudan publica una serie de estudios donde revisa las principales tesis acerca de la naturaleza de los constructos teóricos, los valores que rigen la actividad científica y la noción de progreso adecuada a ellos. Como en el caso de Kuhn, el ámbito de estudio es extraordinariamente amplio, somete a revisión crítica prácticamente todas las cuestiones centrales de la filosofía de la ciencia. En relación a nuestro actual tema, el concepto básico que articula su concepción de los constructos teóricos es el de ri-adición de iitvestigaciólz, presentado por primera vez de forma sistemática en su monografía de 1977. Aunque, como los paradigmas de Kuhn, estas entidades se caracterizan diacrónicamente, nos centraremos ahora en los aspectos sincrónicos que tal caracterización diacrónica presupone. Laudan presenta la noción de tl-adiciói~de irrvestigació?~en relación explícita con
los paradigmas de Kuhn y los programas de investigación de Lakatos, intentando preservar lo que considera adecuado de ellos y modificando los aspectos que considera insatisfactorios (cf. Laudan, 1977, cap. 3). Laudan comienza distinguiendo dos sentidos del término 'teoría científica', dos tipos de "redes proposicionales". En primer lugar, el término puede denotar un conjunto relativamente específico de doctrinas, leyes, hipótesis o principios relacionados, que se usan para hacer predicciones experimentales y ofrecer explicaciones de fenómenos naturales. Ejemplos de ello son la teoría newtoniana de la luz, el electromagnetismo de Maxwell, la teoría de la estructura atómica de Bohr, la del efecto fotoeléctrico de Einstein o la de la plusvalía de Marx. Además de este sentido, el término se usa también para referirse a conjuntos de doctrinas o supuestos "mucho más generales y mucho menos fácilmente corroborables empíricamente" (p. 71). Ejemplos de ello son la teoría de la evolución, la teoría atómica o la teoría cinética de los gases. Aunque no siempre es claro al respecto, parece que las teorías en este segundo sentido consisten, al menos, en familias enteras de teorías en el primer sentido vinculadas por principios metodoló~icosu ontológicos muy generales. Kuhn y Lakatos, afirma, han mostrado que son las teorías en el segundo sentido las unidades en que se debe centrar el estudio de la actividad científica, la "herramienta primaria para la comprensión y valoración del progreso científico [. ... yo] comparto esa opinión, pero encuentro que las explicaciones dadas hasta ahora de lo que son estas teorías más amplias y de cómo evolucionan, no son completamente satisfactorias" (p. 72). De estas teorías generales, en el segundo sentido del término, es de lo que pretende dar cuenta su noción de tradición de investigacióiz. Veamos, sin detenemos en las críticas específicas que hace a Kuhn y Lakatos, cuáles son los principales elementos que caracterizan a estas tradiciones de investigación.
Sirp~iestoscornpnrridos Las tradiciones constan de dos tipos de supuestos generales, que individualizan una tradición dada y la distingue de otras: (i) Cornprornisos metafísicos. Conjunto de. creencias acerca de qué tipos de entidades y procesos constituyen el dominio de investigación; por ejemplo, en física, las creencias asociadas a las teorías atomistas, o contrariamente, las asociadas a las teorías de campos. (ii) Nonnas epistéjnicas y metodológicas. Normas acerca de cómo tiene que investizarse el dominio, cuál es el conocimiento de fondo intocable, cómo han de someterse a prueba las hipótesis, cómo han de recogerse los datos, cómo han de evaluarse la solución a los problemas, etc. Conjuntamente, los compromisos metafísicos y las normas epistémicas y metodológicas proporcionan a la tradición una heírrística, orientaciones para la investigación, y una rrriologín, normas de evaluación.
322
FL1ND,4hfEXTOSDE RLosoF~PI DE L4 CIENCIA
Arriculación teórica Las tradiciones poseen un cierto número de teorías especljScas asociadas que las ejemplifican y las constituyen parcialmente. Son los elementos empíricamente contrastables de la tradición, el "lugar" donde se contrasta la tradición con la experiencia.
Resolución de problemtlas La finalidad principal de las tradiciones, en relación a la cual se evalúan globalmente, es la resolución de probleinas. Los problemas son de dos tipos:
(i) Problemas empíricos. Derivados de la aplicación de las teorías específicas al dominio empírico de investigación. Estos problemas pueden ser (estar): resueltos, los casos de aplicación al dominio empírico exitosos según los estándares de la tradición; potenciales, los casos de aplicación que la tradición considera que deben resolverse, pero todavía no resueltos por la tradición en cuestión ni por ninguna otra; anóiízalos, los casos de aplicación que la tradición considera que deben resolverse, que ella todavía no ha resuelto y que han sido resueltos en otra tradición alternativa. (ii) Problemas concepruales. Relativos a la estmcturación conceptual de alguna teoría específica. Se dan en los siguientes casos: cuando la teoría es inconsistente; cuando contiene supuestos inaceptablemente ambiguos; cuando algunas de sus hipótesis contravienen otras teorías específicas, o los supuestos metafísicos predominantes; cuando sus afirmaciones no proceden según las doctrinas metodológicas y epistemológicas; cuando no acierta a integrar conceptos y principios de teorías más generales a las que está subordinada. Desarrollo histórico Las tradiciones discurren en el tiempo a través de un cierto número de formulaciones. Estas formulaciones son la respuesta en un momento específico a la evaluación negativa sobre la solución dada a alguno o varios de los problemas. El modo más usual en que cambia una tradición es modificando sus teorías específicas, pero ocasionalmente puede cambiar alguno de sus elementos nucleares más básicos.
Coexistencia Las tradiciones no son "dominantes", no se imponen por períodos. En cierto momento dado, en contra de lo que sugiere Kuhn, la coexistencia de tradiciones de investigación rivales es la regla, y no la excepción. Éstos son los rasgos más generales de las tradiciones de investigación según Laudan, que como se habrá apreciado tienen mucho en común con los paradigmas kuhnianos y los programas de investigación de Lakatos. Como hemos indicado, sin embargo, aunque esté de acuerdo con la idea general, Laudan discrepa en aspectos que considera centrales.
Esto se pone de manifiesto en el desarrollo específico de algunos de estos rasgos generales. Concluiremos comentando brevemente algunos de los elementos más problemáticos en el desarrollo de su programa. En primer lugar, no está muy definido el "tamaño" de las entidades involucradas, tradiciones de investigación y teorías específicas. Los ejemplos que da de tradiciones, como la teoría de la evolución o la teoría cinética de los gases, sugieren entidades como las matrices kuhnianas, esto es, teorías científicas a lo largo de su historia. Pero la caracterización general que da parece más bien sugerir grandes orientaciones científicas de una época (quizá coexistiendo y rivalizando), como el mecanicismo o el vitalismo, que pueden incluir varias matrices disciplinares en una época. Esta fluctuación es pareja a la que se da en las teorías específicas. Algunas veces parece que se trata de leyes bastante especificas, del tipo de la ley de caída libre de Galileo, la de gravitación de Newton, o la de gases ideales. Otras veces parece que se refiere a agregados de tales leyes, como el electromagnetismo de Maxwell o la teoría atómica de Bohr. Seguramente la vaguedad es intencionada y se pretende que puede haber diversas dimensiones en ambos tipos de entidades. El problema es cómo caracterizarlas para que la diferencia entre las más grandes de las teorías específicas y las más pequeñas de las tradiciones de investigación, no sea sólo de grado; ello representa un problema en la medida en que Laudan parece requerir que la diferencia entre teorías y tradiciones sea nítida. En segundo lugar, y relacionado con lo anterior, no está claro si hay alguna relación formal, y si la hay cuál es, entre tradiciones y teorías específicas. Por un lado, no se clarifica si, como decía Kuhn, de los supuestos generales puede formar parte alguna expresión legaliforme, alguna ley especialmente general que funciona cuasi-definicionalmente y de la cual las leyes específicas son concreciones. Quizá se pudieran incluir cosas de este tipo en los compromisos metafísicos generales, pero Laudan no dice si es así ni, caso de que lo sea, cómo se diferenciarían estos compromisos de los otros. Por otro lado, afirma que la relación entre tradiciones y teorías específicas no es de implicación, las tradiciones no implican sus teorías constitutivas. Al argumentar este punto, enfatiza el hecho de que las tradiciones pueden contener, y usualmente contienen, teorías específicas incompatibles (si teorías incompatibles fuesen implicadas por la tradición a la que pertenecen, las tradiciones serían simplemente inconsistentes). El caso más claro es el de teorías específicas sucesivas en la misma tradición, que se contradicen mutuamente; recuérdese que las teorías específicas hacen afirmaciones empíricas específicas, y por tanto si una da cuenta de un problema del que su versión anterior en la tradición no podía dar cuenta (anomalía), ambas versiones espec$cas sucesivas son inconsistentes. Pero también abundan, según Laudan, los casos en que teorías incompatibles coexisten en la tradición en el mismo período, como las teorías ópticas rivales de la tradición cartesiana que defendían, respectivamente, el aumento o disminución de la velocidad de la luz en función de la densidad del medio. Se supone que entonces tenemos uno de los problemas conceptuales a que antes nos referíamos, pero una cosa es que se den a veces problemas de este tipo, y otra que se den tan usualmente y tan drásticamente como Laudan parece sugerir. Por último, como hemos mencionado más arriba, a veces en la evolución de la tradición pueden modificarse algunos de los supuestos básicos. Eso es en principio
324
FUh'D.4hlEXTOSDE RLOSOF~ADE LA CIENCIA
sorprendente dentro de su propio enfoque, pues Laudan sostiene a la vez que tales supuestos básicos identifican la tradición, por lo que parece que pueden perder (al menos parte de) su identidad y seguir siendo ellas mismas (!). Una vez más, este efecto es querido por Laudan, que discrepa en este punto de Kuhn y Lakatos sobre la persistencia de la esencia o núcleo a lo largo de la tradición. La esencia, afirma, está relativizada respecto al tiempo. El núcleo muy raramente permanece constante a lo largo de toda la evolución de la tradición: "difícilmente hay un conjunto interesante de doctrinas que caracterice las tradiciones de investigación a lo largo de roda su historia" (op. cir., cap. 3, 46). Es cierto que existe una continuidad, pero se trata de una "continuidad relativa entre etapas sucesii~asdel proceso evolutivo" (ibid.).Es importante enfatizar que, aun restringida a estadios sucesivos, la continuidad debe ser sólo aproximada, no absoluta, en cada paso se pueden modificar parte de los supuestos básicos; si en cada paso se debieran conservar todos los supuestos básicos, entonces en el conjunto del proceso se seguirían conservando. Pero si parte de la esencia se puede abandonar, la pregunta que surge inmediatamente es, ¿qué y cuanto se puede cambiar del núcleo sin abandonar la tradición?, ¿qué distingue a ) el paso de un estadio a otro de la misma tradición de b) el paso del estadio terminal de una tradición al inicial de otra tradición nueva diferente?: "Una respuesta parcial a esta pregunta proviene del reconocimiento de que, en cualquier nzotítento dado, determinados elementos de una tradición de investigación son más medulares y están más alojados en la tradición de investigación que otros. [...] Ciertos elementos son sagrados y no pueden rechazarse sin repudiar la tradición misma. Pero, a diferencia de Lakatos, quiero insistir en que el coigurzro de eleinentos de esta clase (los irreclznzables) cainbia con el rieinpo" (ibid.).Pero esto no parece ser una respuesta ni siquiera parcial, pues si el conjunto de elementos irrechazables cambia con el tiempo, ¿en virtud de qué dos conjuntos diferentes sucesivos se consideran correspondientes a la misma tradición o tradiciones sucesivas diferentes? S610 hay dos modos en que, como pretende Laudan, pueda no conservarse nada en el transcurso de una tradición. Uno es que en cada paso no haya un conjunto bien definido de elementos irrechazables, pudiendo ser rechazado cualquiera de ellos mientras se preserve la inmensa mayoría; así, tras una serie de pasos puede que no permanezca ninguno de los originales. Otro es que sí haya un conjunto bien definido de elementos irrechazables, pero que ese conjunto cambie parcialmente en cada estadio; también así puede que tras varios pasos no permanezca ninguno de los elementos originales. Pero si no se dice nada más, en ambos casos no está clara la diferencia entre el cambio etz una tradición y el cambio de tradición. Quizá sea sólo una cuestión de grado, o de convención en la reconstrucción histórica. Pero si no se aceptan estas consecuencias, la única posibilidad es que haya algo que se mantenga a lo largo de toda la tradición y cuyo cambio sea precisamente el indicio de un cambio de tradición. Esto es, que las teorías científicas, aun cuando cambien en el tiempo, tengan un núcleo persistente.
5. Consideraciones finales La incidencia de los nuevos flósofos de la ciencia, y otros afines, en nuestra disciplina fue decisiva. La irrupción de la perspectiva historicista que en general los caracteriza marca definitivamente el desarrollo de la reflexión metacientífica posterior. La influencia más determinante afecta quizá a cuestiones como la importancia de los estudios históricos y de los determinantes sociales, la cuestión de la carga teórica de los hechos y el problema de la inconmensurabilidad, los problemas del progreso y la racionalidad en la ciencia, o del relativismo. Sin embargo, a la mayoría de sus tesis subyace, sin implicarlas estrictamente, una nueva visión de la naturaleza y estructura de las teorías científicas, más ajustada a la realidad y más fiel a las teorías tal como la historia nos las presenta. En nuestra opinión, y sin desmerecer sus otras aportaciones, es en esta nueva noción, aunque muy imprecisa, de teoría empírica donde radica su mayor contribución a la disciplina. Desde la perspectiva actual, los principales rasgos de esta nueva noción de teoría que está emergiendo son los siguientes. Las teorías en sentido sincrónico:. 1. Son entidades sumamente complejas y dúctiles, susceptibles de evolucionar en el tiempo sin perder su identidad. Aunque la idea de que las teorías son entidades que se extienden en el tiempo a través de diferentes estadios no es un descubrimiento de estos filósofos, sí fueron los primeros en dar a ese hecho todo su valor. 2. No son enunciados o secuencias de enunciados y en un sentido propio no pueden calificarse de verdaderas o falsas, aunque con ellas sí se realizan afirmaciones empíricas verdaderas o falsas. 3. Tienen, al menos, un componente formal, las leyes o hipótesis, y otro empírico o aplicativo, los sistemas a que se pretenden aplicar. 4. Cierta parte de cada uno de estos componentes se considera intocable por decisión metodológica (núcleo). Las teorías tienen pues partes "esenciales" y partes "accidentales", en ello radica su ductilidad. El aparato formal se articula en niveles progresivamente cada vez más específicos, que dan cuenta de situaciones empíricas también específicas. A veces se denomina 'teoría', en un sentido más restrictivo, a estos desarrollos concretos del formalismo (p.ej., la teoría de la gravitación). 5 . Tienen diversos niveles de empiricidad. Parte de la teoría conceptualiza los hechos y parte explica, y se contrasta con, lo así conceptualizado. 6. Es la parte específica, "accidental", del formalismo la que recibe el peso de la contrastación. Ante una contrastación negativa, el núcleo siempre se puede salvaguardar modificando los elementos no nucleares. 7. Llevan asociadas normas, valores, o simplemente indicaciones metodológicas y evaIuativas, algunas de ellas fuertemente dependientes del contexto socio-histórico.
La principal deficiencia de esta nueva caracterización es su imprecisión, en ocasiones tan extrema que termina por difuminar casi totalmente lo que parecen intuiciones correctas. El principal motivo de los positivistas para desarrollar una filosofía formal de la ciencia era justamente eludir el discurso metacientífico vago e impreciso. Y gran parte de
las polémicas que surgen tras la irrupción de los nuevos filósofos son generadas por la imprecisión y equivocidad de algunas de sus nociones centrales. La mayoría de los filósofos de la ciencia sensibles a esta nueva perspectiva concluyeron que la complejidad y riqueza de los elementos involucrados en ella escapa a cualquier intento de formalización. No sólo las forrnalizaciones al estilo de la Concepción Heredada son totalmente inadecuadas para expresar estas entidades en toda su complejidad, sino que no parece razonable esperar que cualquier otro procedimiento de análisis formal pueda capturar los elementos mínimos de esta nueva caracterización. Ésta es la moraleja antiformalista que se extendió en muchos ambientes metacientíficos tras la revuelta historicista. Como vamos a ver en el próximo capítulo, no en todos. Tras la digestión de los primeros efectos antiformalistas, algunas de las corrientes más recientes en filosofía de la ciencia muestran que al menos parte de los nuevos elementos señalados, los más estructurales, son susceptibIes de un razonable análisis y reconstrucción formales.
i 1
I
El efecto de la irrupción historicista durante los años sesenta y principios de los setenta fue doble. Por un lado, a su estela se desarrolla toda una rama de los science studies (con importantes, aunque puntuales, antecedentes antes de los años sesenta) que se centra en el estudio de los determinantes sociales de la ciencia apoyándose en una considerable investigación empírica. Esta línea de investigación culmina con el asentamiento durante 10s años ochenta de la sociología de la ciencia como disciplina. Aunque desde este ámbito se han hecho numerosas incursiones en la filosofía de la ciencia, su importancia para el tema actual, la estructura de las teorías, es escasa, pues sus propuestas son sólo negativas, más bien nihilistas: en la práctica científica no existen en realidad entidades identificables que quepa caracterizar, en ningún sentido del término mínimamente preciso y útil para la comprensión de la actividad científica, como "teorías científicas". No vamos a detenemos aquí en estas tesis. Por otro lado, asimiladas las contribuciones incuestionables de los historicistas y expurgados sus principales excesos, se recupera durante los años setenta la confianza en la viabilidad de los análisis formales o serniformales de la ciencia, al menos en algunos de sus ámbitos, entre ellos el relativo a la naturaleza de las teorías. A finales de los años setenta y en los ochenta, aunque algunas versiones venían desarrollándose desde bastante antes, se extiende y acaba imponiéndose en general una nueva caracterización de las teorías científicas que se ha denominado Concepción Semántica de las Teorías. En realidad no se trata de una única concepción sino de una familia de ellas que comparten algunos elementos generales relativamente unitarios en comparación con las caracterizaciones de la Concepción Heredada. A esta familia pertenecen Suppes, su pionero en Ios años cincuenta, y su escuela de Stanford; van Fraassen, Giere y Suppe en EEUU; Dalla Chiara y Toraldo di Francia en Italia; Przelecki y Wójcicki en Polonia; y la concepción estructt~ralistade las teorías, iniciada en EEUU por Sneed y desarrollada en Europa, principalmente, por Stegmüller, Moulines y Balzer. En este capítulo vamos a presentar, en primer lugar, la motivación principal que, en relación con el proyecto de la Concepción Heredada, acompaña a este nuevo enfoque, así como los rasgos más generales comunes a las diferentes versiones del mismo. A continua-
328
FUND;\hlE%TOS DE FILOSOFLADE LA CIENCIA
ción veremos los orígenes de la concepción modeloteórica en los trabajos fundacionales de Suppes y la contribución esencial de un miembro de su escuela, E. Adams. Después repasaremos brevemente las principales peculiaridades de cada uno de los enfoques vinculados a la familia semántica. En relación con el tema que nos ocupa, la naturaleza y esuuctura de las teorías, la concepción estructuralista es la que ha desarrollado un aparato metateórico más rico para el análisis y reconstrucción de las teorías científicas. La última sección está destinada a presentar con cierto detalle los elementos principales del análisis estructuralista.
1. Teorías, enunciados y modelos
El lema de las concepciones semánticas es: "presentar una teoría no es presentar una clase de axiomas, las teorías no se identifican metateóricamente con conjuntos de enunciados; presentar una teoría es presentar una clase de modelos, las teorías se identifican metateóricamente como conjuntos de modelos". Puesto que la noción de modelo es una noción fundamentalmente semántica, se denomina concepciólí seináizrica a este nuevo enfoque que enfatiza la importancia de los modelos en el análisis de la ciencia; contrariamente, la concepción clásica es calificada de sintáctica por su caracterización de las teorías como conjuntos de enunciados y por su énfasis general en los aspectos lingüísticosintácticos. Este lema expresa por tanto el carácter distintivo frente a la concepción clásica. Pero apreciar en su justa medida cuál es ese carácter distintivo es difícil. Para ello comenzaremos revisando un aspecto de la concepción sintáctica que es claramente insatisfactorio. El enfoque semántico es en parte un intento de mejorar la concepción clásica en ese punto.
1.1. AXIOMAS Y MODELOS Para apreciar el elemento insatisfactorio más manifiesto de la concepción sintáctico-axiomática es imprescindible tomársela en serio, tomarse en serio la i8e;zti~icaciórzde una teoría con una serie de enunciados, los axiomas (ahora no distinguimos entre axiomas y reglas de correspondencia, pues esa distinción no afecta a la cuestión que aquí se trata). Según esta concepción, una teoría es una clase de axiomas, y si nos tomamos eso en serio ello implica-que toda diferencia en axiomas supone una diferencia de teorías. Puesto que dos axiomatizaciones diferentes son dos diferentes clases de enunciados, tenemos dos teorías diferentes. Ésta es una consecuencia intuitivamente insatisfactoria, pues podemos tener dos axiomatizaciones diferentes de, intuitivamente, "la misma teoría". Debe quedar claro que nos estamos refiriendo a casos en los que el aparato conceptual en ambos conjuntos de axiomas es el mismo; en caso contrario las intuiciones no están tan claras. Por ejemplo, en casos como el de la equivalencia entre las versiones ondulatoria y matricial de la mecánica cuántica sí cabe decir en un sentido interesante que se trata de teorías diferentes entre las que se da determinada relación interteórica específica, la de equivale~z-
cia (cf. cap. 1 1, $4). Pero en los casos a que nos referíamos, cuando ambos conjuntos de axiomas utilizan el mismo aparato conceptual, parece intuitivamenfe razonable considerar que se trata de axiomatizaciones diferentes de una misma teoría, esto es, que no hay ningún sentido interesante en que quepa hablar de dos teorías. Si eso es así entonces una teoría no puede ser un conjunto de axiomas, no se representa metateóricamente de forma satisfactoria identificándola con un conjunto tal. Se dirá que eso es ser demasiado rigurosos, poco caritativos con la concepción clásica. Después de todo, ya se reconocía que si dos axiomatizaciones diferentes coinciden en el conjunto de sus teoremas, se trata en cierto sentido, no de dos teorías diferentes equivalentes sino de dos axiomatizaciones equivalentes de la misma teoría. El problema es que la caracterización de las teorías que hace esa concepción no es el mejor modo de expresar ese cierto sentido, no puede expresarlo satisfactoriamente. Quizá se piense que sí, pues en muchas presentaciones de la concepción clásica se dice que una teoría es el conjunto de afirmaciones primitivas más todas sus consecitencias. Pero, si se mantiene un papel esencial para los axiomas, eso no resuelve el problema. Incluso si incluimos la referencia explícita a las consecuencias. dos conjuntos diferentes de axiomas-junto-consus-consecuenqias (e.e. y o l f , Con(Af)>)siguen siendo entidades diferentes aunque las consecuencias sean las mismas, pues simplemente los conjuntos de axiomas son diferentes. La única posibilidad es prescindir totalmente, en la individualización de las teorías, de la referencia a los axiomas, identificando la teoría simplemente con el conjunto de las consecuencias. Las teorías serían nombradas por expresiones del tipo 'el conjunto de enunciados consecuencias de A,, ..., A,', y dos nombres diferentes, que mencionan distintos axiomas, pueden ser nombres de la misma teoría. En este caso la referencia a los axiomas sólo se incluye entonces en el nombre de la teoría, pero en la teoría misma, esto es en la identidad del conjunto infinito de enunciados, no desempeñan ningún papel. Sin embargo, así planteada, esta opción se compadece mal, como veremos, con el nriomaticismo que inspiraba a la Concepción Heredada. En parte, la concepción semántica consiste en expresar el núcleo de esta idea de un modo adecuado, un modo que no hace desempeñar a los enunciados un papel esencial en la identidad de las teorías. Nótese que el problema con la Concepción Heredada no es que quiera sostener una idea que nos parece inadecuada, no es que pretenda que dos teorías con el mismo vocabulario que "digan lo mismo" sean diferentes; el problema es que en su versión sintáctico-axiomática expresa inadecuadamente una intuición correcta, a saber: que en tales casos se trata de una única teoría. El modo en que la concepción semántica va expresar las intuiciones contenidas ya en la Concepción Heredada surge de tomarse en serio el hecho de que dos axiomatizaciones diferentes p e d i n serlo de la misma teoría,¿Por qué lo son de la misma teoría? Porque el conjunto total de las cosas que dicen de cierta parcela del mundo es el mismo, porque la manera en que según ambas dicha parcela se comporta es la misma. Lo que importa de una teoría, lo que la identifica, es lo que dice sobre el comportamiento de determinada parcela de la realidad, no cómo lo dice. Lo esencial es que caracteriza ciertos trozos de la realidad como comportándose de cierto modo. Esto es, que determina ciertos modelos. Si dos axiomatízaciones lo son de lo mismo, lo son porque ambas detemiinan la misma clase
330
RINDAbIESiOS DE FILOSOF~ADE LA CIENCIA
-
de modelos o realizaciones. Lo importante es pues qué modelos determina una teoría, no '+ los recursos lingüísti,cos que empl6a para ello. *B+B~T ePIema de la concepcyón selma&: *presentaruna teoría es presentar una clase de m68&03, no de axiomas. ' Se dirá que no es necesario recurrir a los modelos, que apelando sólo al conjunto total de las consecuencias de los axiomas tenemos una vía "sintáctica" equivalente; en lugar de 'la clase de modelos que satisfacen A,, ..., A,' podemos usar igualmente 'el conjunto de enuncjados consecuencias de Al, ..., A,' pues nombran entidades biunívocamente relacionadas, a cada conjunto de modelos tales le corresponde un conjunto de enunciados tales, y viceversa. Pero usar la versión de las consecuencias nos mantiene en el plano sintáctico sólo aparentemente; ésta es la razón por la que hemos indicado que esta opción se compadece mal con el espíritu sintacticista propio de la Concepción Heredada. La clave es que apelar a las consecuencias es apelar implícitamente a los modelos, la noción de consecuencia introduce subrepticiamente la de modelo: un enunciado es consecuencia de otros si todos los modelos de éstos son modelos de aquél. Por tanto, si queremos expresar la idea de que mediante axiomas diferentes podemos capturar la misma teoría, debemos hacer necesariamente referencia, explícita o implícitamente, a los modelos. Si es así, lo mejor y más clarificador es hacerlo desde el comienzo: una teoría se caracteriza por determinar una clase de modelos, y su identidad está vinculada a tal clase. Es importante comprender que esta opción no supone, ni pretende, prescindir de los enunciados o, en general, de las formulaciones lingüísticas; no pretende que los recursos lingüísticos son superfluos para la caracterización metateórica de las teorías. Por supuesto que para determinar o definir una clase de modelos hace falta un Ienguaje. Los modelos, en la medida en que en el análisis metateórico se determinen explícita y precisamente, se determinan dando una serie de axiomas, principios o leyes, esto es, mediante enunciados. Nadie pretende negar tal cosa. Lo único que se pretende es que los conceptos relativos a modelos son más provechosos para el análisis filosófico de las teorías científicas, de su naturaleza y funcionamiento, que los relativos a enunciados. Que la naturaleza, función y estructura de las teorías se comprende mejor cuando su caracterización, análisis o reconst~cciónmetateórica se centra en los modelos que determina, no en un particular conjunto de axiomas o recursos lingüísticos mediante los que lo hace. Efectivamente la determinación de los modelos se realiza mediante una serie de axiomas, pero la identidad de la teona no depende de esa formulación lingüística específica. Si se quiere, las formulaciones lingüísticas son esenciales en el sentido (trivial) de ser el medio necesario para la determinación de los modelos, pero en un sentido verdaderamente importante no lo son, pues nada en la identidad de una teoría depende de que la formulación lingüística sea una u otra. Resumiendo: "De acuerdo con la concepción semántica, presentar una teoría es presentar una familia de modelos. Esta familia puede ser descrita de varios modos, mediante enunciados diferentes en lenguajes diferentes, y ninguna formulación lingüística tiene ningún estatuto privilegiado. Específicamente, no se atribuye ninguna importancia a la axiomatización como tal, e incluso la teoría puede no ser axiomatizable en ningún gentido no trivial" (van Fraassen, 1989, p. 188). El enfoque semántico, que enfatiza la referencia explícita a los modelos, más que a 10s enunciados, puede parecer una mera revisión del enfoque sintáctico propio de la S,,
Concepción Heredada. Es efectivamente una revisión, pues pretende expresar más adecuadamente una idea ya contenida en la concepción anterior, aunque insatisfactoriamente expresada. Pero no es una mera revisión si con ello se quiere sugerir que se trata de una revisión sin importancia. En cuanto conceptualización más satisfactoria de una idea esencialmente correcta pero insatisfactoriamente conceptualizada con anterioridad, ejempIifica el tipo d e progreso al que se puede aspirar en filosofía. Esta reconceptua\ización genera inmediatamente otras subsidiarias vinculadas a la idea central, lo que permite reorientar algunos problemas que más dificultades habían planteado a la Concepción Heredada. Uno de ellos será el relativo a la vinculación de los conceptos teóricos con la experiencia. Como se recordará, la Concepción Heredada sostiene que ese vínculo se establece a través de enunciados, las reglas de correspondencia, que conectan términos teóricos con términos que, pretendidamente, refieren a entidades directamente observables. Esta cuestión había suscitado todo tipo de problemas y, como vimos, el propio Hempel acaba rechazando la idea de que el vehículo de conexión empírica sea lingüístico. En la perspectiva sintacticista clásica pocas alternativas quedan. Veremos que la referencia a los modelos, característica de la concepción semántica, va a permitir dar una nueva orientación a esta cuestión.
En el parágrafo anterior hemos visto la motivación y justificación del cambio de estrategia que caracteriza a las concepciones semánticas. En cuanto al desarrollo de esta estrategia, cada miembro de la familia lo hace de un modo específico, no sólo técnicamente sino que también difieren en cuestiones filosóficas fundamentales. No comparten pues una serie de tesis filosóficas sus tan ti va^^ sino un modo y un marco en el que plantear los problemas filosóficos. Lo mismo ocurre en el seno de la Concepción Heredada, donde el acuerdo general sobre el enfoque axiomático es compatible con diferencias radicales en temas filosóficos sustantivos, como el del realismo, la explicación o la causalidad. A pesar de sus diferencias, las diversas caracterizaciones de la noción de teoría que se hacen dentro de la familia semántica tienen algunos elementos comunes: 1. Una teoría se caracteriza en primer lugar, como hemos visto, por determinar un conjunto de modelos; presentar-identificar una teoría es presentar-identificar la familia de sus modeIos. La determinación de los modelos se realiza mediante una serie de principios o leyes. Las leyes se deben entender, por tanto, como definiendo una clase de modelos: "x es un sistema ... [un modelo de la teoría - ] s y s s q(.r)", ~ ~ ~ donde
2. Una teona no sólo determina, a través de sus leyes, una clase de niodelos. Si sólo hiciera eso, poco tendríamos. Ya sabemos. por ejemplo, qué es en abstracto un sistema mecánico. ¿Qué hacemos sólo con ello? Nada. Definimos los sistemas mecánicos para algo más,quizá p.ej. para explicar el comportamiento del par de objetos Tierra-Luna. Una teoría determina una clase de modelos para algo, para dar cuenta de ciertos datos, fenómenos o experiencias correspondientes a determinado ámbito de la realidad. Parte de la identificación de la teoría consiste entonces en la identificación de esos fenómenos empíricos de los que pretende dar cuenta. 3. Una vez identificados los modelos teóricos abstractos y los fenómenos empíricos de los que se pretende dar cuenta, tenemos lo esencial de la teoría. Lo que hace la teoría es definir los modelos con la pretensión de que representan adecuadamente los fenómenos, esto es, con la pretensión de que los sistemas que constituyen los fenómenos de que queremos dar cuenta están entre los modelos de la teoría; en términos tradicionales, que tales fenómenos concretos satisfacen las leyes de la teoría, que ellos se comportan como las leyes dicen. Esta pretensión se hace explícita mediante un acto lingüístico o proposicional, mediante una afin?zación,la afirmación o aserción "empírica" de la teoría. La aserción empírica afirma que entre los sistemas empíncos reales de que queremos dar cuenta y los modelos determinados por las leyes se da cierta relación. Esta relación puede ser de diversos tipos, más fuertes o más débiles, según las diferentes versiones. Puede ser la identidad, e.e. que los sistemas empíncos son literalmente algunos de los modelos; o la aproximación, e.e., que los sistemas empíncos se aproximan (en un sentido que hay que precisar) a los modelos; o de subsunción, e.e., que los sistemas empíricos son subsumibles (en un sentido que hay que precisar) bajo los modelos. Pero más allá de los detalles, importantes como veremos, lo esencial es que expresa la pretensión de que nuestra teoría representa adecuadamente la realidad, esto es, que nuestros modelos se "aplican bien" a los sistemas a explicar. Así es cómo la teoría dice cómo es el mundo, esos pedazos del mundo de que quiere dar cuenta en su ámbito de aplicación específico. Dice que el mundo es de cierto modo al afirmar que ciertos sistemas empíricos específicos son (o se aproximan a, o se subsumen bajo) modelos de los que ella ha definido; "el mundo", los sistemas empíricos, se comporta de "ese" modo. Es importante enfatizar el hecho de que esta afirmación simplemente hace explícita una pretensión ya contenida implícitamente en el par "<modelos definidos, fenómenos>". Es importante para no confundirse en cuestiones importantes, como la contrastación. Algunos representantes de la concepción semántica tienden a identificar las teorías con la aserción empírica (o a incluir la aserción en la identidad de la teoría).' Pero, como se verá, hay buenos motivos para no identificar una teoría con su aserción empírica. Hacer eso oscurece la naturaleza estructuralmente muy compleja d e las teorías, complejidad que es preciso que se refleje claramente en la noción de teoría para dar cuenta de algunos hechos fundamentales, entre otros los enfatizados por los historicistas. Es más adecuado, 1. No se piense que por eso se destierran de la familia semántica, pues siguen pensando que el mejor modo de describir esa entidad es en iérrninos de modelos y sus relaciones.
t
i
1 F
por tanto, identificar las teorías con esos pares de conjuntos de modelos (en realidad, como veremos, con secuencias un poco más complejas de conjuntos de modelos). Así identificadas, es obvio entonces que, en un sentido estricto, las teorías no son entidades susceptibles de ser verdaderas o falsas, pues un par (una secuencia) no es una entidad a la que quepa atribuir con sentido ~&*~redicados verdadero y falso. Es cieno pues que, si las identificamos de ese modo, estrictamente las teorías no son verdaderas ni falsas. Pero nada filosóficamente sustantivo se deriva sólo de ello. Las teorías, esos pares, llevan biunívocamente asociadas entidades que sí son susceptibles de ser verdaderas o falsas, a saber, sus aserciones empíricas. Por tanto, aunque no cabe atribuir primariamente valores veritativos a las teorías, sí cabe atribuírselos deifvativarnente: una teoría es "derivativamente verdadera" si y sólo si su aserción empírica es verdadera. Y este sentido derivativo es suficientemente importante desde el punto de vista filosófico. Insistir en que las teorías deben ser, o incluir esencialmente, aserciones puesto que decimos que son verdaderas o falsas, no es un argumento suficiente si hay buenas razones para no identificarlas de ese modo. Pero del hecho de que no se identifiquen con entidades proposicionales no se pueden extraer conclusiones apresuradas sobre problemas filosóficos sustantivos relativos a la "verdad" de las teorías. Por ejemplo (como veremos más adelante en detalle, cap. 12, 5 3 , si hay cierto sentido interesante en el que las teorías no son falsables, no es porque no sean entidades a las que no cabe atribuir los predicados verdadero o falso. No cabe atribuírselo primariamente, pero sí derivativamente y con ello es suficiente para el sentido importante de falsar: si la aserción es falsa la teoría queda "falsada" en el sentido de que no todo puede permanecer igual. Si no son falsables será, como veremos, porque entendemos entonces por teoría sólo la parte esencial, el núcleo lakatosiano que siempre se puede mantener indemne a costa de suficientes reformas en la parte accidental, el cinturón protector de hipótesis específicas. Una última advertencia antes de ver algunas de lds versiones de la familia semántica. Al caracterizar los elementos generales compartidos de esta familia hemos hecho constante y central referencia a los modelos. En la sección 2 del capítulo 8 presentamos la noción intuitiva informal de modelo y una de sus posibles precisiones, la que se establece en la teoría formal de modelos. Debe quedar claro que cuando hemos hablado aquí de modelos nos referíamos a la noción informal. Las diversas versiones de la concepción semántica discrepan, entre otras cosas, en la naturaleza precisa de esas entidades a las que denominan modelos y cuya determinación identifica una teoría. Para Suppes y la concepción estructuralista, se trata de modelos en el sentido genirico de la teoría de modelos, para van Fraassen y Suppe son lo que se denomina espacios de estado, para Giere son modelos en cualquier sentido informal aceptable del término.
2. La noción de teoría de Suppes Patrick Suppes es el primero en criticar la práctica general de la Concepción Heredada de identificar las teorías con determinadas formulaciones lingüísticas. En pleno
apogeo de la Concepción Heredada y de su enfoque sintáctico-axiomático, Suppes plantea ya en los años cincuenta las principales objeciones que, como acabamos de ver, se ]e pueden hacer. Como alternativa a la axiomatización clásica desarrolla un programa alternativo de axiomatización de teorías científicas con el que se inaugura el enfoque semántico. Su propuesta es desarrollada por él mismo y algunos de sus discípulos de Stanford (cf. McKinsey, Sugar y Suppes 1953, Suppes 1954, 1957, cap. 12, 1960, 1967 y 1970b y Adams 1959); en este desarrollo E. Adams tiene, como veremos, una posición especialmente destacada al contribuir con una modificación esencial a la propuesta original de Suppes. Durante cierto tiempo, sin embargo, ese nuevo enfoque no recibe general atención y queda reducido a la llamada escirela de Stanford. Es a finales de los sesenta y principalmente durante los setenta, una vez superados los momentos más radicales de la revuelta historicista de los años sesenta, cuando la propuesta modelista iniciada por Suppes se extiende entre la comunidad metacientífica y es aceptada en sus aspectos más generales. El nuevo procedimiento de axiomatización consiste en la introducción de lo que Suppes llama un predicado cotljirtzrista: "axiomatizar una teoría es definir un predicado conjuntista" (1970b, p. 2/25). En esencia, un predicado tal es una manera específica de definir una clase de modelos. En este caso, tal manera se caracteriza básicamente por entender los modelos en el sentido técnico de la teoría de modelos, como sistemas o estructuras constituidas por una serie de dominios básicos y relaciones y funciones construidos sobre ellos. El recurso formal que se utiliza para definir la clase de modelos es entonces el lenguaje semiformal de la teoría intuitiva de conjuntos, completado con todos los recursos matemáticos necesarios propios de la teoría que se está axiomatizando; por ejemplo, para la mecánica clásica se usan en la axiomatización conceptos del análisis. El lema de Suppes es: el instrumento para axiomatizar las teorías científicas no es la metamatemática sino la matemática. En esta propuesta hay que distinguir dos contribuciones, ambas importantes pero diferentes. Una es la propuesta de caracterizar una teoría definiendo una clase de modelos. Otra es la precisión de la noción de modelo en términos de secuencias de entidades conjuntistas de cierto tipo y la estrategia vinculada de determinar los modelos mediante el lenguaje conjuntista adecuadamente enriquecido. La primera es más general que la segunda, se puede concordar con Suppes en el enfoque modelista general pero discrepar en el desarrollo específico del mismo; de hecho eso es lo que hacen algunos miembros de la familia semántica. Eso no quiere decir que la segunda contribución no sea importante. Para Suppes, y para los que le siguen también en esto, la técnica conjuntista es mucho más dúctil y manejable que la clásica, permitiendo reconstruir efectivamente teorías interesantes de la ciencia real. En la perspectiva clásica, el recurso formal para la axiomatización es exclusivamente la lógica de primer orden, por lo que, si observamos estrictamente tal constricción, la axiomatización de una teoría física matematizada contiene como parte la axiomatización de toda la matemática que presupone, algo que distaba mucho de estar realizado, incluso de ser prácticamente realizable. Por ello, los ejemplos de axiomatizaciones que se manejan casi siempre en la Concepción Heredada son maquetas muy simples y poco interesantes, que no se corresponden con teorías científicas usadas realmente por los científicos.
Un predicado teórico conjuntista es un predicado del tipo "x es un sistema syssdef
a ) Las entidades que componen .Y, esto es, que x es una estructura o secuencia de conjuntos y relaciones y funciones sobre ellos. b) (i) Los tipos lógicos de las entidades componentes de x, esto es, si se trata de dominios de objetos, de relaciones o de funciones; (ii) su constitución relativa, esto es, los dominios y contradominios de relaciones y funciones; y (iii) sus propiedades matemáticas más generales, como que ciertos conjuntos son finitos, o infinitos numerables, o que cierta función es continua, etc. Los axiomas mediante los que se hacen estas caracterizaciones son meras tipificaciones, son por tanto axiomas su¿ generis, o como diremos después, axiomas impropios. Los axiomas impropios no imponen constricciones efectivas a las estructuras, simplemente nos dicen de qui tipo de entidades están constituidas, qué propiedades matemáticas tienen y cuáles son las relaciones lógicas de constitución entre ellas. c) Condiciones restrictivas no puramente constitutivas o lógicas. Esto es, se trata de axiomas en sentido propio que tienen un efecto constrictivo. A las estructuras que satisfacen las condiciones definicionales de b) se les impone ahora como condiciones adicionales las leyes, en sentido tradicional, de la teoría. Son efectivamente restrictivas porque las cumplirán sólo algunas de las estructuras especificadas en b), otras no. Muchas veces tendrán la forma de relaciones entre varias de las entidades; por ejemplo, si en la estructura hay dos operaciones, uno de estos axiomas propios puede exigir que una sea distributiva respecto de la otra. Pero a veces pueden afectar a un solo componente; por ejemplo, se puede exigir que cierta operación sea asociativa. Para fijar las ideas, reproducimos como ejemplo la definición del predicado "x es un sistema de mecánica de partículas" (cf. Suppes, 1957, cap. 12, parcialmente modificado en Adams, 1959; Iri presente es una versión mixta, con algunas simplificaciones notacionales que suponen algunas deficiencias técnicas, sobre todo en (8), pero es suficiente para los actuales fines ilustrativos). Definición 1O. 1:
x es un sistema de mecánica (neit.toniana) de partículas syssd,f existen P. T, S, m, f tales que: (1) x = < P , T,s,m,f> (2) P es un conjunto finito no vacío. (3) T es un intervalo de números reales. (4) S es una función de P x T e n el conjunto de vectores tridimensionales (tríos ordenados) de números reales, y es dos veces diferenciable sobre T. (5) m es una función de P en el conjunto de números reales tal que para todo p E P: m@) > 0. (6) f es una función de P x T x N en el conjunto de vectores tridimensionales (tríos ordenados) de números reales.
FUND.4XIE5TOS DE FILOSOF~A DE LA CIENCIA
(N es el conjunto-ayuda de números naturales, que marca con U i i índice ]af para cada p y t ; podríamos escribir '$(p. 1)' en lugar de t, i)'). f(P,t, i). (7) Para todo p e P y r E T: r 7 t @ ) - &/dr2[s@,r)] = (8) Para todo p E P, q E P y t E T: (9 fl;p, t . i,) = -Aq. t. j,) (ii) S@, r) @j7p,r, i,) = -s(q,r) @Jq, r, j,). (Aclaración notacional: indicamos mediante 'i, que la f que tiene como uno de sus argumentos dicho índice "se debe a q", así 'fip,r.i,)' denota el valor de f sobre p en t "debido a q", e.e., la fuerza que ejerce q sobrep; '@' denota el producto vectorial.)
'a,
(1) presenta (el número de) los constituyentes de las estructuras. (2)-(6) son los axiomas impropios, meras tipificaciones lógico-matemáticas de las entidades que constituyen la estructura. La idea es que P es un conjunto específico de partículas: en una estructura x determinada ese conjunto contiene sólo la Tierra y la Luna; en otra, el Sol y los planetas; en otra, la Tierra y un péndulo; en otra la Tierra y dos objetos en una polea; etc. T es un conjunto de instantes temporales. s es la función posición, que asizna a cada partícula del sistema un determinado vector-posición en cada instante; es dos veces diferenciable respecto del tiempo, su primera derivada es la velocidad y su segunda derivada es la aceleración. 171 es la función masa, que asigna a cada partícula un número real positivo, su masa (que es independiente del tiempo). f es la función fuerza, que asigna a cada partícula en cada instante una serie de vectores-fuerza, las fuerzas actuantes sobre la partícula en ese instante; en vez de tener varias funciones, tenemos una única función que tiene como argumentos, además de partículas e instantes, ciertos índices que distinguen los diferentes \lectores-fuerza actuantes sobre p en r; así, f(p, t, i) = (Y,,x2, x3> y 0, t, j ) =
asigne a los elementos del dominio números reales, no tiene sentido preguntarse si cumple o no ei segundo principio de Newton, pues tal principio involucra funciones de ese tipo. A las estructuras que satisfacen las tipificaciones las llama Suppes realizncionesposibles (cf. 1960, pp. 287-289). Lo que debe quedar claro es que lo esencial de una teoría no son (sólo) sus posibles realizaciones, sino (principalmente) sus realizaciones efectivas o modelos en sentido propio. La teoría no sólo contiene tipificaciones, contiene condiciones adicionales que son restrictivas en el sentido de que algunas de las realizaciones posibles las cumplirán, pero otras no. No por tenzr el tipo de conjuntos y funciones que especifican (1)-(6) toda estructura va a satisfacer (7)-(8); puede ser que tenga ese tipo de entidades, pero que la suma de los vectores-fuerza para una partícula en un instante simplemente no dé el mismo resultado que el producto de su masa por su aceleración, por ejemplo que sea igual al producto de la masa por el cuadrado de la aceleración, o la raíz cuadrada del producto de la masa por la aceleración, o cualquier otra cosa (como ejercicio, el lector puede construir un ejemplo puramente numérico de sistema que cumpla (1)-(6) pero no (7)). Las realizaciones efectivas o modelos de una teoría son aquellas realizaciones posibles que además satisfacen los axiomas propios; el conjunto de modelos será por tanto en general un subconjunto propio del conjunto de realizaciones posibles.
3. Adams y las aplicaciones intencionales En la sección anterior hemos presentado lo esencial de la nueva caracterización que hace Suppes de las teorías científicas, debemos ver ahora brevemente la importante modificación que introduce su discípulo E. Adams. La modificación de Adams está destinada a subsanar lo que él considera una insuficiencia cmcial de la versión original de Suppes. La insuficiencia que Adams atribuye a la propzesta de Suppes tiene que ver con algo que hemos hecho al presentar el ejemplo y que Suppes mismo hace, y que sin embargo no es claro que se pueda hacer desde sus presupuestos. Una vez presentado el predicado conjuntista, hemos indicado cuál era la interpretación pretendida de las entidades componentes de los modelos, esto es, partículas físicas, sus masas, posiciones espaciales, fuerzas incidentes, etc. La cuestión es, ¿quién dice eso?, ¿cómo dice eso la teoría? Puede ocurrir que el predicado sea satisfecho por entidades que ontolópicamente nada tengan que ver con esas entidades pretendidas. Por ejemplo. que los ángeles, junto con su "cantidad de espíritu", sus "afinidades" o lo que sea, satisfagan esos axiomas. 0, por poner un ejemplo menos absurdo, esos axiomas son satisfechos de hecho por estructuras puramente matemáticas, esto es, estructuras cuyo conjunto P está constituido por números. En otras palabras, entre los modelos efectivos, no meramente entre las realizaciones posibles, sino entre las realizaciones efectivas que cumplen (7) y (8) además de (1)-(6), hay con seguridad sistemas puramente matemáticos (y quizá "angélicos" u otros de parecida rareza), sistemas de los que nopretende hablar la teoría. Parece claro que es esencial a una teoría empírica el que pretenda aplicarse sólo a algunos de sus modelos efectivos; en el ejemplo visto no se pensaron los principios newtonianos para sistemas puramente
(o angélicos). Pero si presentar una teoría consiste exclusivamente en presentar una clase de modelos definidos mediante la introducción de un predicado conjuntista (con axiomas impropios y propios), no se ve cómo se puede recoger ese hecho. La cuestión en juego es, como el lector habrá adivinado, la de la interpretación empírica. EI predicado conjuntista que define los modelos es un mero formalismo matemático abstracto carente de interpretación empírica, o mejor dicho compatible con interpretaciones muy diferentes, tanto empíricas como no empíricas. El conjunto de modelos que tal predicado determina incluye sistemas de la más variada constitución, tanto empíricos como matemáticos. Efectivamente, estamos de nuevo ante el viejo problen~ade la conexión del formalismo con la experiencia. Otro modo de presentar la objeción a Suppes es mostrar que su caracterización, sin elementos adicionales, no permite distinguir las teorías empíricas de las teorías matemáticas. Para Suppes eso no es un problema tan grave, pues piensa que en realidad la diferencia entre unas y otras no es siempre tan clara como se pretende, y que una ventaja de su enfoque es justamente que hace explícito ese hecho. Naturalmente Suppes no pretende negar que a veces hay una diferencia. Reconoce que hay casos en que es así y ofrece una vía para dar cuenta de ella. Sin embargo, Suppes no piensa que esa diferencia, cuando se da, haya de reflejarse en la estructura manifiesta de la teoría. La diferencia radica en que, en las teorías empíricas (matematizadas), la determinación-medición de algunas de (o todas) sus magnitudes vincula dicha magnitud con situaciones empíricas cualitativas que fundamentan la medición; por ejemplo, la función masa está ligada a procedimientos de comparación cualitativa mediante una balanza de brazos. Esas situaciones empíricas cualitativas sobre las que descansa en última instancia2 la medición son estudiadas por las llamadas reorías de la medición (metri:ación)fif~lzdamental (para estas y otras nociones relativas a la medición, cf. cap. 6). La interpretación empírica de una teoría se expresa entonces a través de los vínculos que guardan sus funciones métricas con las teorías de la medición fundamental. Por tanto, la interpretación empírica no se manifi esta "inmediatamente" en la caracterización-axiomatización de una teoría, sino sólo en la reconstrucción de sus vínculos interteóricos con las teorías d e la metrización fundamental. Adams plantea esencialmente la misma objeción que hemos presentado, pero de un modo que no se puede resolver apelando a la medición fundamental. La objeción de Adams es que si caracterizamos las teonas, como hace Suppes, exclusii,amelzfe mediante el conjunto de sus modelos o realizaciones efectivas, entonces no es posible hacer explícito el elemento veritativo o proposicional de las teorías; esto es, no es posible hacer explícito el sentido en que las teorías son verdaderas o falsas, o si se prefiere, correctas o incorrectas. El conjunto de modelos caracteriza cierto modo como pueden ser las cosas, el modo como son las cosas 2. En Última instancia porque, como vimos en el capítulo 6, algunas veces (la mayoría en realidad) la medición de una magnitud para cierto objeto usa simplemente otros valores. Eso es la medición indirecta. Pero, recuérdese, la medición indirecta no puede ser el único procedimiento de medición, pues los valores previamente disponibles se han tenido que medir con anterioridad, y así sucesivamente. Así, en algún lugar debe empezar la tarea, en algún momento asienamos números a las cosas sin usar números previamente disponibles. Esos son justamente los procedimientos de medición directa o fundamentales, sobre los que descansa en úlrim instancia toda medición, y a los que se refiere Suppes.
~ I N , ~ L ISS I SS C R ~ N IDE C OTEORIAS III
339
según la teoría. Pero ¿de qué cosas trata? La teoría guiere decir "así son las cosas". Pero ¿de
qué cosas dice ella que son asi?: ¿planetas?; iPén&ulos?, @aíses?, ¿ángeles?, ¿simples números? El "así" está expresado por el conjunto de modelos. Pero si eso es todo lo que tenemos, nos falta algo que exprese "las cosas" de las que se pretende que son de ese modo. Sin eso no podemos expresar esa pretensión de la teoría. Como vimos, esta pretensión es esencial a las teorías, pues éstas son ideadas para dar cuenta de parcelas específicas de la realidad. Y esra pretensión contiene el elemento proposicional de las teorías, pues se expresa mediante una afirmación susceptible de ser verdadera o falsa: verdadera si esas cosas son efectivamente así(si están entre los modelos), falsa si no lo son. Adams propone "abordar el concepto de verdad o corrección [...] a través de la noción de interpretación pretendida ['intended'] o AodeCo pretindido de la"&~i%a,[... que es] cualquier sistema del cual [...] se pretende que se ajusta a los axiomas. Hay siempre en general un enorme número de sistemas que satisfacen los axiomas de la teoría, pero en las teorías de la ciencia empírica, normalmente sólo unos pocos de ellos serán aplicaciones o modelos pretendidos" (1959, p. 258). Son modelos pretendidos de la mecánica newtoniana, por ejemplo, el sistema formado por la Tierra y la Luna, o el constituido por el Sol con los planetas, o un plano inclinado, o un proyectil sobre la Tierra, etc. La identificación o caracterización metateórica de una teoría debe incluir entonces, además del conjunto de modelos que satisfacen el predicado, un conjunto de aplicaciones, de sistemas físicos específicos, de "partes concretas de la realidad", de las que se pretende que se comportan como la teoría dice, esto es, de las que se pretende que están entre los modelos. Resumiendo: "Si la verdad y la falsedad han de ser definidas, hemos visto que se deben tener en cuenta dos aspectos de una teoría: primero, el aspecto formal que corresponde al predicado conjuntista definido mediante los axiomas, [... o mejor,] la extensión de dicho predicado, el conjunto de los sistemas que satisfacen los axiomas; y segundo, el aspecto aplicativo, que corresponde a1 conjunto de modelos pretendidos. Formalmente, una teoría T se caracterizará como un par ordenado de conjuntos T = cC,I> tal que C es el conjunto de todas las entidades que satisfacen los axiomas, e I es el'conjunto de modelos pretendidos" (ibid.). Como se ve, una teoría no es estrictamente una entidad de la que cabe predicar primariamente la verdad o la falsedad, pero en un sentido lato, derivativo, sí que es adecuado, y esencial, decir que puede ser verdadera o falsa: "La teoría es verdadera si y sólo si todos sus modelos pretendidos satisfacen sus axiomas, en caso contrario es falsa. Si T =
mas empíricos, las partes concretas de la realidad a la que se pretende aplicar ia teoría. E] único modo de responder a esta cuestión es apelando a las intenciones de la comunidad de cjentíficos: I es el conjunto de sistemas empíricos x tales que la comunidad científica cc pretende o i~tterztaaplicar T a x. Por ejemplo, en las fases iniciales de la Mecánica Clásica, los físicos pretendían que la teoría se aplicaba a cuerpos en caída libre, tiros parabólicos, trayectorias de cuerpos celestes, y muchas otras cosas, entre ellas los rayos de luz; la luz fue inicialmente una aplicación intencional de la mecánica (al menos de 10s partidarios de la teoría corpuscular, como el propio Newton), aplicación que terminó por excluirse del dominio de aplicaciones cuando se impuso la teoría ondulatoria rival. Simplemente, qut sistemas específicos están en I depende exclusivamente de las pretensiones o intenciones de 10s científicos (en un momento dado, cf. cap. 13). En un segundo sentido, 'determinar las aplicaciones' significa, una vez seleccionadas, "determinar sus parámetros", típicamente en los casos de teorías cuantitativas, determinar en cada aplicación los valores precisos de cada una de las magnitudes involucradas. Y aquí es donde aparece el problema, pues, si en la determinación de las aplicaciones, en la medición de los valores de las magnitudes del sistema-aplicación x del que se quiere contrastar si se ajusta o no a las leyes de T, se usaran las leyes de T, estaríamos ante un expediente autojustificativo. Esto es, si en la determinación de los hechos o base empírica de aplicación se usaran las leyes de la teoría, la aserción se autojustzj5caría. El problema con la caracterización de Adams es que no es lo suficientemente fina para abordar esta cuestión. Nótese que según Adams la aserción empírica es de la forma Z c C, y por tanto cada aplicación concreta x es un sistema del mismo tipo lógico que los modelos actuales, tienen los mismos componentes, las mismas funciones. Eso supone que determinar una aplicación seleccionada exige medir en dicho sistema los valores de todas las funciones de las que habla la teoría. Como veremos más adelante, si eso fuese efectivamente así, estaríamos irremisiblemente condenados al problema de la autojustificación, pues algunas de las funciones de las que habla la teoría no se pueden medir sin usar sus propias leyes. En la medida en que las teorías no son localmente autojustificativas, en esa misma medida el análisis de Adams es insatisfactorio, no puede ser que la contrastación de una teoría exija disponer en los sistemas-aplicación de los valores para todas las magnitudes de que habla la teoría. Veremos que una de las motivaciones por las que surge el estructuralismo en Sneed es precisamente caracterizar las aplicaciones pretendidas de un modo más adecuado que permita elucidar el carácter no autojustificativo de la aserción empírica. Antes de concluir con la escuela de Stanford, hay que señalar que el propio Suppes se plantea en cierto momento la cuestión de la aplicación empírica de las teorías empíricas desde una perspectiva que guarda algo de semejanza con el espíritu de la propuesta de Adams. En un trabajo de 1960 publicado dos años más tarde, 'Models of Data', defiende que lo que cuenta como datos para una teoría se presenta también en forma de modelos, los ?nodelosde datos. La diferencia entre las teorías empíricas y matemáticas es que en las primeras, y no en las segundas, los modelos de datos son de distinto tipo lógico que los modelos teóricos. Aunque no es totalmente explícito en este punto, parece que la diferencia de tipo lógico a que se refiere en el caso de teorías empíricas consiste en que los modelos de datos son subestructuras de los modelos teóricos. A juzgar por el ejemplo que
i
presenta, de este modo parece que se debe interpretar su afirmación de que "en la teoría [empírica] se usan nociones teóricas que no tienen un análogo directo observable en los datos experimentales" ($1). En su ejemplo, la teoría del aprendizaje Estes-Suppes (cf, Suppes y Estes, 19.59). los modelos de la teoría están constituidos por ciertas entidades, algunas consideradas observables y otras no; los modelos de datos están constituidos entonces por los constituyentes observables de los modelos teóricos, de modo que resultan ser subestructuras de aquéllos. Los modelos de datos, además, son definidos por sus propias teorías, y es a través de su conexión con estas teorías de datos como adquiere contenido empírico la primera. '*Lo que he intentado argüir es que se establece una jerarquía completa de modelos entre los modelos de la teoría básica y la base experimental completa. Más aún, para cada nivel de la jerarquía hay una teoría por derecho propio. A la teoría de cierto,nivel le es dado su significado empírico al hacer conexiones formales con la teoría de un nivel más bajo" ($3). La propuesta de Suppes está sólo esbozada en este artículo, y no llegó a desarrollarla en trabajos posteriores (de hecho, posteriormente parece contradecirla parcialmente, pues exige que los datos sean del mismo tipo lógico que los modelos teóricos, cf. Suppes 1989, p. 264). En esa versión es muy imprecisa, está poco articulada con el resto de su programa y contiene elementos problemáticos que no se tratan. Aunque puede encontrarse cierta semejanza de espíritu con las ideas de Adarns, sus modelos de datos no se corresponden exactamente con las aplicaciones pretendidas de Adams. Aquéllos son observacionales y plenamente determinables teóricamente (mediante otra teoría de bajo nivel); éstas se determinan intencionalmente y no tienen porqué ser plenamente observawcionaies, de hecho no lo pueden ser si deben tener el mismo tipo lógico que los modelos teóricos. Veremos que el análisis satisfactorio de la base empírica incorpora elementos de ambos.
4. La familia semanticista Como indicamos, el enfoque semántico inaugurado por Suppes se mantiene en principio circunscrito al ámbito dz su grupo en Stanford, pero a finales de los años sesenta comienza a expandirse y durante los setenta se va asentando poco a poco hasta convertirse en dominante a partir de los ochenta. Veremos ahora brevemente los elementos específicos de los representantes más destacados de este nuevo enfoque: van Fraassen, Suppe, Giere y la Concepción Estructuralista (para la escuela polaca, cf. Przelecki, 1969, y Wójcicki, 1977 y 1979; para la escuela italiana, cf. Dalla Chiara y Toraldo di Francia, 1973 y 1976). Aunque la implantación general se realiza bajo la influencia de los trabajos de Suppes, no todos los miembros de la familia están directamente influidos por él o le siguen en los aspectos específicos de su propuesta. Se trata más bien de que a la estela de la propuesta específica de Suppes se desarrollan una serie de otras propuestas que en muchos casos comparten con aquél sólo la orientación modelística. Comparten tan sólo una estrategia general y una preferencia por determinada forma. ia modelística, de presentar y analizar los problemas, pero, como también advertimos, no comparten tesis filosóficas sustantivas. Casi todos los miembros de esta familia realizan contribuciones importantes en
312
FCND.431E3TOS DE FILOSOFLADE LA CIENCIA
varios ámbitos de la filosofía de la ciencia, y algunas de ellas se presentan en detalle en otras partes de esta obra. En relación al tema que ahora nos ocupa, la estructura de las teorías, la concepción estructuralista es la que ha realizado un análisis más detallado de la estructura fina de las teorías, ejemplificando tal análisis con numerosas reconstrucciones de teorías específicas. Los otros miembros de la familia se limitan en este tema a presentar 10s aspectos más generales de su propuesta semántica particular, sin desarrdlar en detalle la estructura fina de las teorías. Yeremos aquí cuáles son esos aspectos más generales característicos de cada una de las propuestas y en la próxima sección presentaremos en detalle el análisis estructuralista.
4.1.
VANFRAASSEN: ESPACIOS DE ESTADO; BASE E ~ ~ P Í R I C Y A OBSERV4BILIDAD
L7an Fraassen coincide con Suppes en que el modo filosóficamente más iluminador de caracterizar una teoría es presentándola como definiendo una clase de modelos. Discrepa de él, sin embargo, en la naturaleza matemática de estas entidades. Frente a los modelos como estructuras conjuntistas de Suppes, van Fraassen opta por los modelos como "puntos" o "trayectorias" en un espacio de estados, idea cuya aplicación a las teorías físicas atribuye a Beth. Beth (cf. 1960) propone un análisis semántico de las mecánicas newtoniana y cuántica en términos de sistemas constituidos por estados gobernados por las ecuaciones mecánicas fundamentales. Van Fraassen desarrolla y generaliza esta idea a principios de los años setenta (cf. 1970 y 1972). Aunque los detalles son complicados y no podemos verlos aquí, el núcleo de la idea es el siguiente (van Fraassen advierte sobre las limitaciones para el caso de teorías físicas relativistas, pero no nos detendremos en ello). Un estado de un sistema está definido por los valores de ciertas magnitudes en cierto momento (cf. cap. 5, $1.3). Por ejemplo, un estado de un gas queda definido por los valores del volumen, la presión y la temperatura; se puede identificar por tanto con una triada ordenada . Los estados se identifican por tanto en general con puntos en un determinado sistema de coordenadas, de tantas dimensiones como componentes tengan los estados, tridimensional en el primer ejemplo, hexadimensional en el segundo. A cada tipo de sistema le corresponde entonces un esyacio de estados, el conjunto de todas las posibles n-secuencias (n es la dimensión del espacio) de valores; los estados posibles de los sistemas de ese tipo son pues los puntos de ese espacio. Lo que hacen los postulados y leyes de una teoría es imponer constricciones sobre las relaciones entre estados, permitiendo ciertas transiciones (leyes de sucesión) o coexistencias (leyes de coexistencia) entre estados y excluyendo otras (sobre las leyes de sucesión y coexistencia, cf. cap. 5, $1.3). Las transiciones se identifican con determinadas trayectorias en dicho espacio, y las coexistencias con regiones específicas del mismo. Las leyes de una teoría permiten ciertas trayectorias y regiones y excluyen otras; de entre todas
las trayectorias y regiones I(jgicat7rerzte posibles, la teoría determina sólo algunas de ellas, las nómicarrtente posibles. Así, el conjunto completo de puntos del espacio es el análogo al conjunto de realizaciones posibles de Suppes, y el subconjunto del mismo permitido por las leyes es el análogo al conjunto de realizaciones efectivas de Suppes. En ambos casos tenemos un espacio de modelos lógicalnente posibles en relación con el cual las leyes de la teoría determinan el subespacio de modelosfísicamente posibles. Como en Suppes, por tanto, la teoría define mediante las leyes una clase de modelos, pero ahora tales modelos son trayectorias o regiones permitidas en un espacio de estados de determinada dimensión. Esta diferencia en la caracterización de los modelos no tiene consecuencias filosóficas sustantivas. En concreto, la forma de antirrealismo que van Fraassen defiende, su llamado etnpirisrno constr~rctivo,no depende de las preferencias sobre la forma de los modelos. El empirismo constructivo es una tesis epistemológica acerca de qué creencias implica la aceptación de una teoría. En la defensa de esta tesis epistemológica, \.an Fraassen desarrolla toda una variedad de tesis, de orientación general también antirrealista, sobre muchas cuestiones filosóficas sustantivas, como la causalidad, la explicación, las leyes, la modalidad o la observabilidad (cf. especialmente 1980 y 1989). No es éste el lugar de revisarlas, ni siquiera someramente. Nos limitaremos para concluir a presentar la idea de base empírica sobre la que sostiene parte de su argumento general. "La parte 'pura' de la teoría define el tipo de sistemas a los cuales se aplica; las aserciones empíricas tendrán la forma de que cierto sistema empírico dado pertenece a tal clase" (1970, p. 3 11). En realidad la aserción no dice, como en Adams, exactamente que los sistemas empíricos pertenecen a dicha clase, que son algunos de los modelos, sino sólo que son "subsumibles". La diferencia radica en que los sistemas a los que se aplica la teoría son submodelos, subestructuras de los modelos determinados por las leyes consistentes en quedamos con la parte observacional de los modelos: "ciertas partes de los modelos [son] identificadas como subestrzrcturas empíricas, y esos [son] los candidatos para la representación de los fenómenos observables con los cuales la ciencia se puede confrontar en nuestra experiencia, [...] la adecuación empírica consiste en la subsumibilidad de esas partes en algún modelo único del mundo permitido por la teoría" (1989, pp. 227-228). Lo que hace la teoría es postular la existencia de ciertas entidades inobservables, "ocultas", cuya (supuesta) interacción con las entidades observables produce (pretendidamente) los efectos observables, los fenómenos. Parte de lo que la teoría sostiene es que esas subestructuras empíricas son subsumibles bajo uno de sus modelos, esto es, que se comportan del modo en que lo harían si el mundo fuese uno de sus modelos, con sus entidades ocultas interaccionando con las observacionaIes del modo específico indicado en las leyes. Ése es el contenido de la aserción empírica y si dicha aserción es verdadera decimos que la teoría es emnpíricamnente adecuada (que "salva los fenómenos"). Van Fraassen insiste en que eso es sólo parte de lo que la teoría dice, porque quiere defender que la teoría dice también algo más, dice que el mundo contiene tales y cuales entidades además de las observables: "Es claro que podemos discutir dos cuestiones separadas: ¿qué dice la teoría sobre cómo es el mundo? J ¿qué dice la teoría sobre cómo son los fenómenos? Puesto que los fenómenos son la parte observable del mundo, y es
344
FUNDASIENTOS DE F I L O S O F ~ DE~ L 4 CIENCIA
contingente que haya o no otras partes, se sigue que estas preguntas no son la misma" (1989, p. 191). Lo que quiere defender es que la teoría misi?za, y no sólo su aserción empírica, puede ser verdadera o falsa. Por eso insiste en que la teoría debe ser una entidad en cierto sentido proposicional, con valor veritativo y susceptible de ser o no creída. Hay un sentido débil en que la teoría puede ser verdadera o falsa, a saber, que su aserción es verdadera o falsa, que /a parte observacional del mrotdo es como dice la teoría. Pero hay un sentido más fuerte en que la teoría puede ser ~erdaderao falsa, a saber, es verdadera si y sólo si el ~nundoes como dice la teoría, esto es, si el mundo es rtrto de sus nod del os. En el primer sentido prefiere hablar, más que de verdad de la teoría, de adecuación emnpím-ica; sólo en el segundo sentido la teoría es propiamente iyerdadera. Este doble sentido se aplica también a las actitudes proposicionales que los sujetos epistémicos podemos tener hacia las teorías. Podemos creer sólo que la teoría es empíricamente adecuada, que su aserción empírica es verdadera; o podemos creer algo más.a saber, que la teoría misma, toda ella, es verdadera. En estos términos puede formular ahora van Fraassen su antirrealismo sucintamente. En su opinión, el realismo no es una tesis onrológica sobre lo que hay, sino una tesis epistemológica sobre lo que estamos justificados en creer que hay. Su antirrealismo sostiene que al aceptar una teoría estamos justificados sólo en creer en su adecuación empírica, no en su verdad. Aceptar una teoría nos compromete sólo a creer que lo que afirma de la parte observable del mundo es verdad, no a creer que lo que también afirma acerca de inobsemables es verdad. A esta posición antirrealista hacia lo inobservable la denomina "Uso el adjetivo 'constructivo' para indicar mi van Fraassen emnpii-iano co~7strz~crivo: concepción de que la actividad científica es una actividad de construcción y no de descubrimiento: construcción de modelos que deben ser adecuados a los fenómenos, y no descubrimiento de la verdad acercade lo inobsen~able"(1980, p. 5). Este antirrealismo es en opinión de van Fraassen la conclusión ineludible de dos premisas en su opinión irrechazables: a ) la tesis empirista según la cual la justificación de toda creencia empírica debe descansar en los fenómenos, en la experiencia, y b ) el hecho lógico de que puede haber teorías diferentes ii~coi?ipatiblesentre sí pero e~npíi-icameizte equivalemíres, con las mismas consecuencias contrastacionales (en esto consiste la iigradeterrni~zacióizde la teoría por la experiencia, sobre la que volveremos por extenso en el capítulo 12 dedicado al problema de la inducción). De b) se sigue que la creencia en una teoría frente a otra incompatible empíricamente equivalente no está basada en la experiencia y, por tanto, por a), no será una creencia justificada. En general, pues, sólo estamos justificados en creer en la adecuación empírica, no en la verdad de una teoría, de roda ella. Aunque no podemos discutir aquí a fondo este argumento, debe notarse que para que concluya lo que pretende van Fraassen ha de aceptarse una premisa implícita adicional. De a) y b ) se sigue que sólo estamos justificados en creer las afirmaciones que las teorías hacen sobre entidades "dadas en la experiencia", pero para concluir que sólo estamos justificados en creer las afirmaciones que las teorías hacen sobre entidades observables, hace falta la premisa adicional según la cual c ) la parte e~npíricade las teorías, su base de comzrrastacióiz, es siempre obsemvaciomial. El reto todavía pendiente es ofrecer una noción precisa y plausible de obseivabilidad que sustente c). Van Fraassen defiende un concepto antropocéntrico de
observable. Afirma que. en tanto que organismos biológicos, somos cierto tipo de mecanismos de medición o detección, que como tales tenemos ciertas limitaciones inherentes y "son estas limitaciones a las cuales refiere el 'able' de 'observable"' (1980, p. 17). Por ser antropocéntrico, este concepto no puede tener relevancia ontológica, para saber lo que hay, pero sí epistemolópica, para saber qué estamos justificados a creer que hay. Reconoce además que el concepto es hasta cierto punto vago. Por ejemplo, sostiene que las lunas de Júpiter son observables, pues los astronauta serían capaces de verlas directamente si se acercaran a ellas, pero que las partículas en una cámara de niebla no lo son, pues el juicio sobre su presencia incluye inferencias teóricas; pero entonces, ¿que decir de la observación con microscopio electrónico?, i y de una estrella lejana que quizá ya ha desaparecido? Pero antropocentrismo y vaguedad no son los problemas principales, pues son asumibles por sus tesis. Recuérdese que su tesis antirrealista es epistérnica, es una tesis acerca de lo que los humanos estamos justificados en creer que hay, y por eso no es objetable que su antirrealismo esté relativizado a nuestras capacidades epistémicas, esto es, que dependa de una noción antropomórfica de 'observable'. El problema principal es si se puede sostener que los sistemas empíricos que ejercen de datos en las teorías están constituidos por entidades observables en srr serztido de 'observable'. Él mismo reconoce que "la teoría no se confronta con datos brutos sino con modelos de datos, y la constmcción de estos datos es un proceso sofisticado y creativo" (1989, p. 229). De nuevo, como ocurría con la Concepción Heredada, incluso si en términos globales nuestro conocimiento se origina en situaciones observables en dicho sentido, hace falta un argumento adicional para establecer que la base empírica de cada teoría tiene esas características. Más bien parece que no siempre es así; en realidad casi nunca es así, o nunca si hablamos de teorías científicas mínimamente desarrolladas. Por seguir con su propio ejemplo: reconoce que las partículas no son observables en una cámara de niebla, que lo observable son los rastros en la niebla; afirma que los modelos de datos que ejercen de base empírica son partes, subestructuras, de los modelos de la teoría; pero, simplemente, sucede que los modelos de la mecánica cuántica no incluyen entre sus entidades cosas como rastros en la niebla. Si C) no es cierto, entonces para que su argumento concluya lo que pretende hay que reinterpretar a) de modo que se refiera a la observación: la justificación de toda creencia descarzsa en la "observación directa". Pero el problema ahora es con 'descansa'. Si es "descansa inmediatamente", entonces su antirrealismo se aplica también a la base empírica de contrastación cuando no sea directamente observable. Si es "descansa en última instancia", entonces hay que elaborar en detalle cuál es la relación entre la base empírica y la observación y qué se considera "en última instancia" Esto es esencial, pues dependiendo de qué aceptemos como "descansar en última instancia", vuelven a abrirse toda serie de estrategias a los realistas para recuperar la justificación de la creencia en las entidades "teóricas" postuladas por la teoría para dar cuenta de los modelos de datos de experiencia. En definitiva, el antirrealismo de van Fraassen parece, sin especificaciones adicionales, inestable: o se aplica también a la base de contrastación (cuando ésta no sea directamente observable), o no tiene por qué aplicarse a las entidades teóricas.
Suppe inicia su propio enfoque semántica en su tesis doctoral (cf. 1967) dedicada al significado y uso de los modelos en la ciencia, influido por los trabajos de von Neumann y Birkhoff sobre fundamentación de la mecánica cuántica y por los de Suppes sobre modeIos de datos. En dos trabajos clásicos sobre la Concepción Heredada, prácticamente ignorada en su tesis, contrasta los aspectos centrales de dicho enfoque con la concepción axiomática clásica (cf. 1972 y 1974), y durante finales de los años setenta y en los ochenta desarrolla su concepción aplicándola a los principales temas de la filosofía de la ciencia (cf. 1989). Suppe sigue a Suppes en la aproximación modeloteórica general pero, como van Fraassen, influido en su caso por los trabajos de von Neumann y Birkhoff, prefiere caracterizar los modelos mediante estados en un espacio de estados, no al modo conjuntista de Suppes. El instrumental matemático es prácticamente coincidente con el de van Fraassen y no abundaremos en él. Una teoría se analiza ahora como un sisteina relacional (cf. 1989 p. 84), consistente en a ) un dominio que contiene todos los estados lógicamente posibles de los sistemas de que trata la teoría (e.e. el espacio de estados entero) y b) una serie de relaciones entre los estados, determinadas por los postulados o leyes de la teoría, que especifican las trayectorias y regiones físicamente posibles. El sistema relaciona1 contiene lo que Suppe denomina sistenzas físicos cartsaline?zreposibles, que son los que hacen de modelos teóricos. Una teoría, entonces, determina, a través de alguna de sus formulaciones, una clase de tales sistemas, una clase de modelos. Para su identidad no es esencial la particular formulación sino la clase de modelos. Mediante la determinación de los sistemas físicos causalmente posibles, la teoría pretende dar cuenta de cierto ámbito de la experiencia, lo que Suppe llama el alcance pretendido ('inteizded scope'). Este ámbito de aplicación está constituido por sistemas físicos que ejercen de "datos duros" (' "lzard" darn') para la teoría. Pero los datos no son en ningún sentido relevante "observables3: "Las teorías tienen como su principal objeto los informes de datos duros, no informes de obsen~acióndirecta. [...] La necesidad de una dicotomía observacionaVteórico desaparece. La reemplaza la distinción entre datos duros aproblemáticos sobre sistemas físicos y condiciones de entorno y los más problemáticos asertos teóricos acerca de ellos" (1989, pp. 69, 71). Los datos son relarii~ameizteaproblemáticos en dos sentidos: primero, porque son aproblemáticos relatiimnente a una teoría, aquella teoría para la que son datos; segundo, porque, incluso para la teoría en cuestión, no son totalmente aproblemáticos, en caso de contrastación negativa pueden ser problematizados, esto es, revisados. Ello es posible porque los sistemas físicos que presentan los datos son réplicas altamente abstractas e idealizadas de los fenómenos. En la réplica se seleccionan sólo los parámetros del sistema relevantes para la teoría y se abstraen los demás, y los que se seleccionan se idealizan. Por ejemplo (ibid., p. 65), en la determinación del sistema-dato en un caso de caída libre en mecánica se prescinde de parámetros como el color, etc., y otros relevantes como la velocidad se seleccionan en condiciones ideales, como ausencia de rozamiento, masa puntual, etc. La determinación de los datos es pues un complejo proceso de elaboración a partir de los fenómenos, que involucra un gran
número de supuestos teóricos en la selección de los parámetros, su medición, la idealización, la determinación de las condiciones de entorno, etc. En ciertas circunstancias puede ser más adecuado revisar este proceso que los postulados teóricos. Quizá se piense que esta caracterización de los datos, obtenidos a partir de los fenómenos, abre la puerta trasera a la distinción que se ha abandonado, pues aunque los datos no serían observables, los fenómenos "de los que se extraen" sí lo serían. La distinción volvería a ser fundamental, sólo que un peldaño más abajo. Pero según Suppe no es así. Los fenómenos están constituidos por particulares que poseen ciertas propiedades y que están en ciertas relaciones, pero "estos particulares, sus propiedades y relaciones no necesitan ser observables" (ibid., p. 93). Así caracterizada, una teoría es empíricamente verdadera si los datos coinciden con los modelos de la teoría, si los sistemas físicos del alcance pretendido coinciden con los sistemas flsicos cairsaknente posibles determinados por la teoría, esto es, si en los sistemas de datos los valores de los atributos son los determinados por la teoría (quizá con ciertas idealizaciones). En realidad esa es una condición sólo necesaria, pues Suppe añade otra condición "antinominalista", que aquí sólo podemos presentar imprecisamente y sin comentario: los parámetros de los sistemas de datos corresponden a clases nat~rrales(cf. ibid., p. 98; sobre este concepto, cf. supm, cap. 5, $2). Suppe coincide con van Fraassen en que la aceptación de la teoría no supone aceptar su verdad, la verdad de toda ella. Pero no coincide con aquél en sus motivos. Esta diferencia es la que le permite defender, contra van Fraassen, lo que califica de cuasi-realismo. Las teorías, afirma, no dan descripciones literales de cómo funciona el mundo real, sólo pretenden describir cómo funcionaría el mundo si los parámetros seleccionados fuesen independientes de los desestimados. "Las teorías proporcionan descripciones contrafácticas de cómo sería el mundo si los parámetros desestimados no inflriyesen en los fenómenos que la teoría pretende describir. Pero típicamente los parámetros desestimados influyen al menos a veces en los fenómenos, y por tanto las caracterizaciones ofrecidas por las teorías no son literalmente verdaderas, sino como máximo contrafácticamente verdaderas, de los fenómenos de su alcance. Ésta es la postura cuasi-realista que he defendido" (ibid., pp. 316-349).
Giere desarrolla su propia versión de la concepción semántica en el marco de un programa metacientífico más amplio de análisis de los diversos elementos de la ciencia desde una perspectiva cognitiva (cf. especialmente 1988; también 1979, su libro de texto clásico sobre la argumentación científica, con nueva edición muy revisada en 1991). Desde esta perspectiva, propone considerar las teorías como medios para definir modelos abstractos de los que se postula su aplicación a ciertos sistemas reales. "Mi sugerencia preferida es que entendamos una teoría como compuesta de dos elementos: (1) una. población de modelos, y (2) varias hipótesis conectando esos modelos con sistemas en el mundo real" (1988, p. 85). Los modelos ahora no se caracterizan como entidades conjuntistas, ni mediante
espacios de estado, ni de ninguna otra forma específica. No se les atribuye una naturaleza matemática determinada. La noción de modelo teórico es aquí extremadamente amplia, son entidades abstractas definidas mediante ciertos recursos expresivos, generalmente, pero no necesariamente, lingüísticos (p.ej. se pueden usar grafos o croquis). A veces los modelos pueden ser "modelos a escala" físicamente construidos, como en el caso del modelo de doble hélice de M'atson y Crick para el ADN. Pero en general no son así y, lo que es más importante, en tanto que rnodelos teóricos no tienen por qué ser (no cuentan como) entidades físicas. "Un modelo teórico es parte de un mundo imaginado. No existe en ningún lugar excepto en las mentes de los científicos o como sujetos abstractos de las descripciones verbales que los científicos escriben" (1991, p. 26). Por ejemplo, si antes de ir a una fiesta nos "imaginamos" quién viene con quién, estamos determinando, definiendo, una entidad abstracta que es un modelo de (algunos aspectos de) la fiesta; otro ejemplo, el preferido por Giere, son los mapas. "Un modelo es por tanto, como en estos ejemplos, una entidad abstracta y estructurada que rtpresenta algo distinto. Los postulados, leyes y ecuaciones que aparecen en los textos científicos define~zestas entidades. La ecuación "md2sldS = - kr" define lo que es un oscilador armónico simple; la ecuación "md2sldP = - (mgll)~''define un tipo de oscilador armónico simple, el péndulo sin fricción. Osciladores, péndulos, son por tanto modelos definidos mediante esas ecuaciones, y en tanto que tales son "entidades socialtne~zreconstruidas [y] no tienen realidad más allá de la atribuida a ellas por la comunidad de físicos" (1988, p. 78). Una vez definidos los modelos teóricos, la teoría formula ciertas hipótesis teóricas. Una hipótesis teórica es un enunciado o proposición que afirma cierto tipo de relación entre un modelo y un sistema real determinado (o una clase de sistemas tales). Giere enfatiza que a diferencia de los modelos, las hipótesis teóricas sí son entidades lingüísticas (proposicionales), verdaderas o falsas. La relación que se afirma en la hipótesis teórica no es la de identidad, no se afirma que cierto sistema es el modelo; nótese que los sistemas son entidades físicas y los modelos no lo son, son entidades abstractas. La relación afirmada en la hipótesis es la de siitzilitud O selnejait~a.Pero toda relación de semejanza debe ser cualificada para ser mínimamente precisa. Debe relativizarse a determinados aspecros y, en ellos, a cierto grado. La forma general de la hipótesis teórica es pues la siguiente: "Tal sistema real identificable es similar al modelo designado en los aspectos y grados indicados" (ibid., p. 81). Es esencial notar que no todos los aspectos del sistema real se desean reflejar en el modelo. En el caso del modelo para nuestra fiesta, no nos interesa quizá el color de las ropas, o incluso la hora de llegada. Lo mismo ocurre en la ciencia, p.ej. en la mecánica no nos interesa el color de los objetos, o incluso a veces tampoco la forma ni el tamaño. Así, las hipótesis contenidas en los textos científicos formuladas en términos identificatorios expresan en realidad afirmaciones de similaridad. Cuando los físicos dicen "la Tierra y la Luna constituyen un sistema gravitacional newtoniano de dos partículas", lo que están afirmando es: "las posiciones y velocidades de la Tierra y la Luna en el sistema Tierra-Luna se aproximan mucho a las de un modelo newtoniano de dos partículas con fuerza central cuadrático-inversa". Giere desea enfatizar que, en su perspectiva, los enunciados contenidos en la formulación de la teoría no están en conexión directa con el mundo real, sino que se
conectan indirectamente con el mundo a través de los modelos. Los enunciados definen los modelos, y los modelos están directamente conectados con el mundo físico a través de la relación de similaridad. Esta relación de similaridad-en-ciertos-respectos-relevantes-yhasta-cierto-grado es expresada por la hipótesis teórica, que sí es una entidad lingüística. La relación puede darse o no darse; si se da la hipótesis, es verdadera, si no, es falsa. Podría pensarse que la abstracción, aproximación e idealización de la relación de similaridad se pueden reducir, hasta eventualmente eliminarse, mediante la definición de modelos más completos y precisos. Al aumentar los respectos relevantes, disminuye la idealización y se afina la aproximación. Por ejemplo, se puede definir un modelo para el oscilador armónico que incluya la fricción; este modelo incluye un nuevo aspecto para la relación de semejanza, es por tanto menos idealizado y puede aumentarse el grado de semejanza o aproximación a los valores del sistema real. Pero eso sólo reduce o estrecha la semejanza, por lo general no es posible convertirla en correspondencia exacta, en correspondencia entre el sistema y el modelo en todos los aspectos y con una precisión completa. Una consecuencia de este enfoque es, en opinión de Giere, que las teorías científicas son entidades que no están bien definidas. El motivo es que no está bien determinado, al menos no formalmente, cuáles son los modelos vinculados a una teoría específica, por ejemplo, quC cuenta propiamente como modelo newtoniano. En su opinión, todo lo que se puede decir es que los modelos de la mecánica comparten "un parecido de familia". Según Giere, este parecido es innegable, pero no consiste (sólo) en algo estructuralmente identificable en los modelos. Los modelos por sí solos no muestran en qué consiste dicho parecido. La única determinación posible es en términos sociolópicos: "Nada en la estructura de los modelos mismos puede determinar que el parecido es suficiente para pertenecer a la familia. Esta cuestión es decidida exclusivamente por los juicios de los miembros de la comunidad científica en un momento. Eso no quiere decir que haya un parecido objetivo susceptible de ser juzgado correcta o incorrectamente. Lo que quiere decir es que el conjunto de los juicios de los científicos determina si el parecido es suficiente. Éste es un aspecto en el que las teorías son no sólo construidas, sino además socialmente construidas" (ibid., p. 86). Giere defiende sobre estas bases cierto tipo de "realismo", que él denomina realismo constructivista, que tan sólo podemos enunciar aquí superficialmente. La ciencia tiene un aspecto esencialmente constructivo, la definición de los modelos, y modelos diferentes pueden ser representaciones alternativas de un mismo sistema físico. Hay modelos mejores que otros, pero eso no se puede especificar apeIando exclusivamente al mundo. Nada en el mundo mismo fija los aspectos a representar, ni cuán buena es la representación. La especificación debe apelar necesariamente a intereses humanos, y no sólo episrCmicos o científicos, sino también a intereses prácticos de diverso tipo. Eso supone una cierta dosis de relativismo, pero no es un relativismo radical: podemos circular por Nueva Iórk, mejor o peor, con dos mapas de Nueva York diferentes, pero no con uno de San Francisco. Este relativismo es compatible en su opinión con cierto realismo, en el sentido de que los modelos representan "hechos del mundo". Pero éste es un sentido muy impreciso asumible por los antirrealistas. Precisarlo requiere al menos dos cosas. Primero, caracterizar más finamente los sistemas físicos "del mundo" de los que se predica su similaridad con los
modelos, y lo que dice Giere al respecto sobre los datos es muy poco (cf. 1991. pp. 29-30). Segundo, imponer constricciones claras a la similaridad predicada que permitan, p.ej., decir por qué cierto mapa no es un mapa de Nueva York; jacaso un mapa de San Francisco no es similar a Nueva York en algwzos respectos? Si las únicas constricciones posibles apelan esencialmente a intereses o prácticas humanas, entonces difícilmente se puede calificar esta posición de realista.
La concepción estructuralista aúna y desarrolla de un modo específico dos tradiciones anteriores. De un lado, el programa Suppes-Adams de análisis y reconstrucción de teorías mediante el instrumental modeloteórico de la teoría informal de conjuntos. De otro, los trabajos de los historicistas, en especial de Kuhn y Lakatos, donde se analizan las teorías como entidades estructuralmente complejas y susceptibles de evolución, con un "núcleo" central inmutable y un "entorno" complementario cambiante. Ambos elementos se encuentran ya en The Logical Structure of Marlze~naricalPhysics (1971). Uno de los principales problemas de los historicistas es la vaguedad de sus nociones centrales, que consideraban casi siempre ineliminable. En esta obra, Sneed ofrece ya una primera precisión formal, todavía muy tosca, de esas ideas aplicando el aparato conjuntista de Suppes-Adams. La propuesta de Sneed la recoge Stegmüller (cf. 1973 y 1979), dando lugar a toda una serie de trabajos que desarrollan las diversas partes del programa y lo aplican a la reconstrucción de un considerable número de teorías científicas. Estos trabajos culminan parcialmente a mediados de los años ochenta con la publicación de An Architectonic for Scietzce, de Balzer. Moulines y Sneed, sumrna del programa que contiene sus principales elementos y algunas reconstrucciones de teorías. El programa estructuralista continúa su desarrollo en los años ochenta y noventa, tanto extendiéndose a nuevos ámbitos y problemas metacientíficos como aplicándose a la reconstrucción de nuevas teorías (Balzer y Moulines (eds.) 1996 y 1998 recogen, respectivamente, los principales resultados en ambas tareas). La concepción estructuralista es, dentro de la familia semántica, la que ofrece un análisis más detallado de la estructura fina de las teorías. En la próxima sección vamos a ver los principales elementos de dicho análisis con cierto detalle. Para concluir ésta avanzaremos tan sólo sus rasgos generales. a) Se rechaza la distinción "teórico/obsen~acional" y se sustituye por otra, "teóricolno teórico", relativizada a cada teoría. b) En términos de esa nueva distinción se caracteriza la base empírica y el dominio de aplicaciones pretendidas. Los datos están cargados de teoría pero no de la teoría para la que son datos. c ) Con esta nueva caracterización se da una formulación de la aserción empírica que claramente excluye la interpretación "autojustificativa" de la misma. d) Se identifican como nuevos elementos en la determinación de los modelos,
ademrís de las tradicionales leyes, otros menos manifiestos pero igualmente esenciales, las ligaduras o restricciones cmzadas. e ) Se identifican los vínculos entre los modelos de diversas teorías. f) Se caracteriza la estructura sincrónica de una teoría como una red con diversos componentes, unos más esenciales y permanentes y otros más específicos y cambiantes. La evolución de una teoría consiste en Ia sucesión de tales redes. g) Se analizan en términos modelísticos las tradicionales relaciones interteóricas de reducción y equivalencia.
5. La concepción estructuralista de las teorías Una teoría tiene, como en la versión de Adams del programa de Suppes, una parte formal y otra aplicativa. Pero ambas partes se articulan a su vez, como en Kuhn y Lakatos, en diversos niveles de especificidad. Esta idea de los diversos niveles de especificidad se expresa mediante la noción de red teórica, que describe en toda su riqueza la estructura sincrónica de las teorías, su imagen "congelada" en un momento dado de su evolución. Las redes están formadas por diversos elementos estratificados según su especificidad. Cada uno de estos elementos tiene una parte formal y otra aplicativa. La parte formal global de la teoría-red queda expresada por el conjunto de las partes formales de los eIementos constituyentes; su parte aplicativa global por el conjunto de las partes aplicativas de sus constituyentes. A estos elementos constituyentes se les denomina elementos teóricos. La parte formal de los elementos teóricos se denomina núcleo y su parte aplicativa, doininio de aplicaciones pretendidas (o intencionales).
El núcleo, al que denotamos mediante la letra 'K', expresa la parte formal de la teoría, las tradicionales leyes. Como en la familia semántica en general, las leyes no se expresan en términos lingüísticos sino modelísticos, entendiendo los modelos, siguiendo aquí a Suppes, como estructuras conjuntistas definidas mediante la introducción de cierto predicado. El núcleo K contiene entonces una serie de modelos, las estructuras que satisfacen los axiomas del predicado. Sin embargo, a diferencia de Suppes y Adams, para el estructuralismo no es adecuado identificar el núcleo con un único conjunto de modelos. Es conveniente que la expresión modelística de la parte formal de la teoría recoja y haga explícitos los diversos elementos distintivos; algunos de ellos ya están implícitos en la caracterización de Suppes, otros sin embargo son nuevos. Para referimos a ellos vamos a recurrir al ejemplo de Suppes de la mecánica de partículas presentado en la sección 2. Hay algunas diferencias técnicas y de matiz entre esa versión y la estándar en el estructuralismo, pero a los efectos actuales se pueden obviar. Tenga pues el lector de nuevo presente a partir de ahora aquella definición de los modelos de la mecánica.
352
FLih'DrZblEhTOS DE F I L O S O F ~DE LA CIENCIA
Modelos pote~~ciales y modelos actuales Ya vimos entonces que algunos de los axiomas del predicado conjuntista, en ese caso los axiomas (1)-(6), son meras caracterizaciones o tipificaciones de los modelos. ~Esos&ma~s3rnp~ogi~s'', s&8s;.d&dei.r eEk"amente entidades o modelos, pero sólo e1 tipo lógico-matemático de los &s&s, por lo que toda estructura de ese tipo será modelo de ellos, sin irnporrar qué pase después de szrstantivo o espec$co a sus cortstiluyenres. Los axiomas (7) y (8) no son así, imponen constricciones efectivas adicionales no meramente lógicas, expresan las leyes en sentido propio de las teorías. Eso significa que de todas las estructuras que satisfacen (1)-(6), sólo algunas satisfacen además (7) y (8). Llamaremos modelos potelzciales (de la teoría en cuestión), y denotaremos su conjunto mediante 'Mp', a las estructuras que satisfacen los axiomas impropios o tipificaciones, y inodelos actuales (de la teoría en cuestión), y denotaremos su conjunto mediante 'M'. a las estructuras que satisfacen además los axiomas propios que expresan constricciones no meramente lógicas. Los modelos potenciales son porel~cialesporque pltederz ser modelos efectivos de la teoría, porque son las entidades de las que tiene sentido preguntarse si satisfacen o no las leyes propiamente dichas. Aquellos modelos potenciales que, además de las tipificaciones, satisfacen las leyes propiamente dichas son los modelos actuales o efectivos; es inmediato, por tanto, que M cMp.
x E Mp(MC) syssd=jxsatisface (1)-(6) de Def. 10.1.
x E M(MC) syssdej,fxE Mp(MC) y x satisface (7)-(8) de Def. 10.1.
Es conveniente expresar esta diferencia incluyendo en el núcleo aillbos conjuntos de modeIos. En primer lugar, porque la diferencia expresa un hecho importante, a saber, la diferencia entre la parte meramente conceptualizadora de la teoría, Mp, y la parte efectivamente restrictiva, M. Pero además, porque los modelos actuales no constituyen la única constricción efectiva de la teoría. Hay otros elementos de la teoría, menos manifiestos, pero igualmente restrictivos, cuya expresión requiere también hacer referencia a los modelos potenciales. Es importante pues tener singularizados los modelos potenciales, el aparato conceptual de la teoría, con relación a los cuales se expresan diversos tipos de restricciones teóricas efectivas. De momento vamos a presentar una, en el último apartado veremos otra.
Condiciones de ligadura Las restricciones a que nos referimos son lo que el estructuralismo denomina ligaduras o restriccio~tescruzadas ('constraints'). La idea es que las leyes usuales no son las
únicas que imponen condiciones adicionales efectivas a los modelos potenciales. Si consideramos modelos sueltos, sí, pero si tenemos en cuenta varios modelos a la vez, no. Por ejemplo, según la mecánica clásica no puede ser que una partícula p tenga una masa en un modelo x y otra masa diferente en otro modelo y (por supuesto que la mecánica clásica permite los cambios de masa, por ejemplo "si se quita un trozo" a un objeto, pero se considera siempre que eso corresponde a la generación de otra partícula); por ejemplo, si cierto cohete está en el dominio de dos sistemas, uno el sistema Tierra-cohete y el otro el sistema Luna-cohete, en ambos modelos ha de tener la misma masa. Ésta no es la única constricción intermodélica. La teoría tampoco permite que si un modelo x contiene una partículap, (p.ej. conductor-más-coche), que es la combinación de dos partículas p2(conductor solo) y p3(coche solo), haya modelos que asignen a p2y p3 masas cuya suma no coincida con la asignada a p, en x. La primera condición expresa simplemente que la masa de una partícula es constante, y la segunda que la masa es aditiva, esto es, la masa de un compuesto es la suma de las masas de los componentes. Este tipo de condiciones inrennodélicas son las que permiten "transportar la información" de unos modelos a otros. Si tengo la masa del cohete en el modelo que forma con Ia Tierra, puedo calcular ciertos valores dinámicos de la Luna gracias a que exporto la información sobre la masa del cohete al modelo que forma con la Luna (cf. cap. 6, $6 sobre la trascendencia de estos hechos para la medición indirecta). Debe quedar claro que no hay manera de expresar este tipo de constricciones mediante los axiomas usuales, pues éstos se aplican a modelos sueltos. La condición que define la ligadura de identidad para la masa es la siguiente: "para toda partícula p, y modelos potenciales x, y (que tengan a p en su dominio): nz,@) = m,@)". Esta condición no es satisfecha o insatisfecha por modelos potenciales sueltos sino por grupos de ellos: si un conjunto tiene dos modelos con una partícula común a ambos dominios y en cada uno la función m asigna a esa partícula valores diferentes, no satisface la condición; si todos los modelos del conjunto asignan a las partículas comunes de sus dominios la misma masa, sí que la satisface. El efecto que tiene esta condición, por tanto. no es determinar un conjunto de modelos, sino uq conjunto de conjuntos de modelos: esto es, agrupa los modelos en grupos, grupos taIes que, en cada uno, sus modelos asipan a una misma partícula una misma masa; cada grupo se caracteriza porque en él los modelos asignan a cada partícula determinada masa. Una condición que es satisfecha o no por modelos sueltos define un conjunto de modelos, el conjunto de los modelos que la satisfacen; éste es el caso de los axiomas (7)-(8). Una condición que es satisfecha o no por conjuntos de modelos, define un conjunto de conjuntos de modelos, el conjunto de los conjuntos de modelos que la satisface. Éste es el caso de la ligadura de identidad para la masa. La condición define pues un ' ,.' conjunto de conjuntos de modelos potenciales, al que denotaremos mediante C Definición 10.4:
C =,(MC) = dLf { X c M p ( M C ) 1 Vs.? E X V p
E
P., n Py : m,(p) = n l , ( p ) } .
Debe estar claro que, mientras que M ( M C ) c Mp(XfC). C=,(MC) c Pot(hfp(MC)). Análogamente procede la condición de aditividad, que definz otro conjunto de conjuntos de
modelos. Ahora en cada uno de esos grupos la masa de una partícula compuesta es la suma de la masa de sus componentes, en cualesquiera modelos del grupo en que estén el compuesto o los componentes ('o' denota aquí la composición de partículas).
Estas dos ligaduras cuentan por tanto como constricciones efectivas adicionales de la teoría, que, a diferencia de las leyes usuales, no operan a nivel de modelos aislados sino de grupos de modelos, por eso se califican de restricciones cruzadas. Como en nuestro ejemplo, puede haber varias ligaduras en una misma teoría, y lo que interesa es tener identificado el efecto combinado de todas ellas. A este efecto combinado o suma de las ligaduras se la denomina ligadura global y se denota mediante 'GC'. Puesto que cada ligadura es determinado subconjunto {{xl, y,, z,, ...}, {x-, y,, ...), ....} de Pot(Mp), la ligadura global se identifica con su intersección conjuntista, pues los elementos de dicha intersección satisfarán a la vez todas las condiciones de ligadura.
Así, en general, si Cl, ..., C, son las n ligaduras de una teoría (Ci Pot(Mp)), entonces GC = C, n ... n C., GC se incorpora pues como un nuevo componente dzl núcleo K, junto con n4p y M.
T-teoricidad y nzodelos parciales Falta un último elemento para que el núcleo contenga todo lo que es relevante de "la parte formal" de la teoría (último provisionalmente, pues como hemos anunciado en el último apartado haremos referencia a otro). Este elemento tiene que ver con la recurrente cuestión de la teoricidad. El estmcturalismo rechaza la distinción "teórico/observacional" por ambigua. Esta distinción esconde en realidad dos: "observable/inobservab~e" de un lado, y "no teórico/teórico" de otro. Ambas distinciones no coinciden intensionalmente rzi extensionalmente. La primera distinción no tiene relevancia alguna para el análisis local de la estructura de las teorías (aunque por supuesto es relevante para la cuestión general de cómo se relaciona el conjunto de las teorías con la observación). Para el análisis local de la estructura de las teorías la distinción relevante es la segunda, pero en este caso no se trata ya de una distinción absoluta, sino que está relativizada a las teorías. Un término, o un concepto, o una entidad, no es teórico o no teórico sin más, sino relativamente a una reoría dada. Por eso no se debe hablar tanto de teoricidad cuanto de T-teoricidad, teoricidad relativamente a una teoría T. La idea que hay detrás es, expresada en términos
modeloteóricos, similar a la distinción que vimos en el último Hempel entre vocabulario antecedente y vocabulario propio (aunque formulada ya con anterioridad en la obra fundacional del estructuralismo, Sneed, 1971). La idea es que un concepto es T-teórico si es un concepto propio de la teoría T, "introducido" por ella, y es T-no teórico si es un concepto disponible previamente a T. La cuestión es precisar esta intuición. La formulación precisa del criterio de T-teoricidad usa de la noción técnica de procedimiento de determinación, que no podemos presentar aquí en detalle. Bastará de momento con la siguiente caracterización informal. Como vimos en el capítulo 4, los conceptos se aplican o no a las cosas, o si son cuantitativos, asignan valores a ciertas cosas. Determinar un concepto es determinar si se aplica o no a un objeto particular dado, o si es cuantitativo, determinar el valor de la magnitud para el objeto. Los modos para proceder a ello son los procedimientos de determinación de los conceptos. Puedo determinar la distancia entre la Tierra y la Luna haciendo ciertos cálculos a partir del período de rotación y las masas correspondientes. Puedo determinarlo también mediante ciertos procedimientos óptico-geométricos. Puedo determinar la masa de un objeto mediante una balanza de brazos. También mediante una balanza de muelle. O viendo cuánto se desplaza otra masa tras chocar con ella a cierta velocidad. Todos ellos son procedimientos de determinación, unos de la distancia, otros de la masa, etc. Pues bien, si un concepto es T-no teórico, si es "anterior" a T, entonces tendrá al menos algunos procedimientos de determinación independientes de T; en cambio si es T-teórico, si es propio de T, su determinación depende siempre de T. Un procedimiento de determinación se considera dependiente de la teoría T si presupone la aplicabilidad de T, la validez de sus leyes, esto es, si usa o presupone modelos actuales de T. La idea es que un concepto es T-teórico si no se puede determinar sin presuponer la aplicabilidad de T, si todo procedimiento para su determinación la presupone; y es T-no teórico si tiene algiín procedimiento de determinación T-independiente, si es posible determinarlo sin suponer la aplicación de la teoría, por más que también tenga otros T-dependientes. En el caso de la mecánica que venimos usando como ejemplo, la posición es MC-no teórica. Es cierto que, como ilustra el caso de la distancia Tierra-Luna, se puede determinar por procedimientos que usan las leyes de la mecánica, como el efecto gravitacional, pero también se puzde determinar sin usar leyes mecánicas, por procedimientos óptico-geométricos. Lo mismo ocurre con el tiempo o duración. Sin embargo no ocurre así con la masa: todos los procedimientos de determinación de esta magnitud presuponen la aplicabilidad de la mecánica, usan modelos mecánicos. Ello es obvio de los procedimientos de medición indirectos (mediante dinamómetro, o a través de la alteración en la trayectoria de otro cuerpo, etc.). Pero también lo es respecto de la medición directa mediante balanza, pues a menos que se considere que la balanza satisface ciertas leyes mecánicas no se puede considerar que lo que se mide es la masa de la que habla la tnecánica (cf. cap. 6, 37). Faltaría más, se dirá, la masa es un concepto mccánico. Pues bien, eso es justamente lo que queríamos, precisar el sentido exacto en que lo es, en que es un concepto "propio de" o "introducido por" la mecánica. En eso consiste la distinción "T-teónco/T-no teórico". En el caso de la mecánica clásica de partículas, espacio y riernpo son MC-no teóricos, conceptos cinemáticos previos. masa y fi~erzason conceptos hIC-teóricos, los conceptos propiamente mecánicos,
dinámicos. Es probable que para todo concepto T-no teórico haya otra teoría 7" respecto de la cual el concepto sea TI-teórico, pero eso es una hipótesis metaempírica que se debe confirmar. La noción de T-teoricidad permite precisar el último componente del núcleo. Hemos visto que los modelos potenciales expresan el aparato conceptual de la teoría. Es conveniente ahora distinguir en el núcleo entre el aparato conceptual global de la teoría y el aparato conceptual específico de ella. Esto es, distinguir los modelos que usan todo el aparato conceptual de la teoría de aquellos que usan sólo conceptos previamente disponibles, en esa diferencia radica la contribución conceptual específica de la teoria (además de para estas consideraciones generales, la necesidad de distinguir entre ambos tipos de modelos se hará patente cuando discutamos la base empírica). La determinación de esos modelos que no contienen el aparato específico de la teoría es sencilla una vez se dispone de la noción de T-teoricidad presentada, pues tales modelos contienen como constituyentes exclusivamente las entidades correspondientes a los conceptos T-no teóricos; esto es, estos n~odelosse obtienen a partir de los modelos potenciales "recortando" de ellos las entidades T-teóricas. A estos modelos se les denomina ~ílodelos(potenciales) parciales, y se denota su conjunto r que genera los mediante 'Mpp'. Así, en general, se puede definir una jiinció~zre-eco~~e n.iodelos parciales a partir de los potenciales. Si los modelos potenciales de T son estructuras del tipo x = d),, ..., DI, ..., Rl, ..., R,, ..., R,> y R,+l, ...,R, son T-teóricos, entonces r(x) =
Con ello concluimos la presentación del núcleo, la parte formal de los elementos teóricos. El núcleo K se ediante la tupla = 41p, Mpp, M, GC>,d@de Mp es el conjuntode modelos ,Mpp el de los modelos parciales (Mpp = r[Mp]), M el de los modelos actuales (M L Mp) y GC la ligadura global (GC G Pot(Mp)).
El núcleo K es el componente formal de la teoría, pero no el único. Como hemos visto en general en las concepciones semánticas, las teorías enrpíricas pretenden que las
7.7
Y
3
constricciones de K lo son de ciertas panes de la realidadfísica, los sistemas empíricos a los que se pretende aplicar el núcleo. Estos sistemas empíricos se denominan en el estnicturalismo, como en Adams, aplicaciones pretendidas o inren$pnales ('intended applications'), y se denota su conjunto'mediante 'I'. En nuestro ejemplo de la mecánica clásica, son aplicaciones pretendidas cosas como el sistema Tierra-Luna, el sistema Solar, un trapecista en su balancín, dos bolas de billar chocando, una balanza, un esquiador deslizándose por una pendiente, un niiío saltando en una colchoneta elástica, un satélite de comunicaciones en órbita, etc. La caracterización estructuralista de 10s dominios de aplicaciones contiene sin embargo elementos específicos, especialmente los dos siguientes. En primer lugar, las aplicaciones pretendidas de una teoría T se individualizan y describen mediante el vocabulario previo a T, esto es, mediante el aparato conceptual T-no teórico. Así, en los ejemplos mecánicos mencionados, la descripción de las aplicaciones incluye exclusivamente valores de las magnitudes posición y tiempo, es decir, son descripciones de los sistemas en términos puramente cinemáticos que presentan sus trayectorias espaciales a lo largo del tiempo. Por tanto, las aplicaciones pretendidas que conforman la base empírica de la teoría, los "datos" de la teoría, ciertamente están cargados de teoría, pero no de la teoría para la que son datos sino, en línea con las observacionzs de Lakatos, de otra previa o antecedente. Los datos de la mecánica, a los que se pretende aplicar y sobre los que se contrasta, están cinemáticamente cargados, pero no dinn'micarnente cargados. Esto es esencial para dar cuenta del carácter no autojustificativo de la aserción empírica mediante la que se contrasta la teoría. Formalmente, ello se traduce en que cada aplicación pretendida es un determinado sistema que contiene exclusivamente entidades T-no teóricas. Cada aplicación pretendida es entonces un determinado modelo parcial y el conjunto I de todas ellas es por tanto cierto subconjunto de Mpp: I c_ Mpp. El segundo hecho a destacar (parcialmente apuntado por Adams y, dentro de los historicistas, por Kuhn) es que la selección de las aplicaciones, la determinación de I, contiene elementos pragmáticos ineliminablzs, pues tal determinación es esencialmente intencional y pnradigmática. La determinación es intencional porque lo que hace de un sistema específico que sea una aplicación pretendida es que sea un objeto intencional de los usuarios de la teoría, que la comunidad científica pretenda que las constricciones-leyes se aplican a tal sistema (cf, más aniba $3). Y es paradigmática porque el conjunto I no se presenta "listando" todos y cada uno de los sistemas físicos que son aplicaciones pretendidas, sino "paradigmáticamente". No sólo es una aplicación pretendida de la mecánica un cierto esquiador deslizándose por una pendiente determinada en cierto momento específico, sino cualquier esquiador en cualquier pendiente en cualquier momento; y, por supuesto no sólo los esquiadores, también los ciclistas, y los niños bajando por las barandillas, etc. Para determinar el dominio I no hemos de listar todos y cada uno de los sistemas cinemáticos particulares de plano inclinado, sino algunos paradigmáticos y añadir: "y cosas como ésas"; o, alternativamente si se prefiere, referirse de modo general y relativamente impreciso a "todos los sistemas en que un objeto desciende por una superficie inclinada". Y lo mismo con los objetos vibrantes, con las órbitas estacionarias, con los objetos chocando y separándose después, con los objetos chocando y siguiendo unidos después, etc. Esto
358
FUSD,AAlEbTOS DE FILOSOF~.~ DE LA CIENCIA
sugiere que quizá sería mejor caracterizar al dominio de aplicaciones 1, no simplemente como un conjunto de aplicaciones sueltas (1c Afpp), sino como un conjunto de conjuntos de aplicaciones (1 c Pot(Mpp)) que tiene por elementos conjuntos que son S I - v o sde aplicaciones d e urz ininno tipo. Pero aquí no \.amos a introducir esta complicación (para un estudio detenido de la misma, cf. Moulines, 1982, cap. 2.4) y seguiremos considerando la versión más sencilla según la cual los elementos de I son directamente las aplicaciones individualmente consideradas.
Elementos teóricos
Ahora podemos presentar ya la noción estructuralista mínima (y provisional) de teoría, la noción de eleinento reórico. Un elemento teórico, una teoría en este sentido mínimo, está constituido por (1) una parte formal que expresa los recursos conceptuales a diferentes niveles y las constricciones-leyes que según la teoría rigen su ámbito de estudio, y (2) una parte aplicativa que especifica en términos preteóricos los sistemas físicos a los que la teoría pretende aplicarse, de los que pretende que son regidos por sus constricciones-leyes. Haciendo uso del aparato previamente introducido, un elemento teórico T se identifica entonces con el par formado por el núcleo K,la parte formal, y el dominio de =
Hemos visto que el núcleo K expresa la parte matemático-formal de la teoría. Es en ella donde se presentan las condiciones que, según la teoría, rigen las "partes de la realidad" de que ella trata. Estas condiciones consisten básicamente en las leyes propiamente dichas de un lado, y las condiciones de ligadura de otro, que en el núcleo se corresponden, respectivamente, con los conjuntos M y GC. Sin embargo, la teoría, al aplicarse, no pretende que estas condiciones rigen aisladamente o separadas, sino que las aplicaciones satisfacen todas las restricciones a la vez, tanto las leyes como las ligaduras. ES conveniente entonces "juntar" ambos tipos de condiciones, presentar su efecto restrictivo conjunto. Esto se expresa mediante la noción de co~zrenidoteórico, a la que nos referiremos mediante 'Con,'. El contenido teórico, esto es, el efecto combinado de leyes y ligaduras, queda representado mediante la apropiada intersección conjuntista de los conjuntos M y GC. Como M es un conjunto {x],x2, x3, ..., x9, ..., xis, ...} de determinados modelos potenciales (M c Mp) y GC es un conjunto { {x,,x:, xg, ...}, {x4,x-/,xg, ...), ..., {..., xi5, ...) } de conjuntos de modelos potenciales (GC E Pot(Mp)), la intersección apro-
piada correspondiente a la combinación de ambos tipos de condiciones no es la de GC con M, sino la de GC con Pot(h.f), esto es: Con, = de, Pot(bf) n GC. Es inmediato que Con, G Pot(Mp), el contenido teórico de T. es un conjunto de conjuntos de modelos potenciales, el conjunto cuyos elementos son conjuntos tales que: (1) satisfacen las ligaduras; y (2) están formados por modelos que satisfacen las leyes de la teoría, los axiomas propios del predicado conjuntista. La noción central para expresar la aserción empírica es la de contenido empírico, que se deriva de la de contenido teórico. El contenido empírico es el "contenido contrastacional"; en la versión tradicional, las consecuencias empíricas de la teoría. En nuestros actuales términos, las consecuencias empíricas del contenido teórico, el efecto a nivel empírico, esto es, T-no teórico, de las condiciones restrictivas de la parte formal de la teoría. El contenido empírico recoge entonces los (conjuntos de) modelos parciales que resultan de recortar los componentes T-teóricos de los modelos potenciales que satisfacen las restricciones. O de otro modo, los modelos parciales que es posible aumentar con componentes T-teóricos de forma que se cumplan las restricciones (y si las restricciones son efectivamente tales, no todo modelo parcial es aumentable de esta forma). Así, si denotamos mediante 'Con' el conjunto que expresa el contenido empírico, dicho conjunto es el resultado de recortar los componentes T-teóricos en los modelos que aparecen en Con,, abreviadamente: Con = r[[Con,]] (r(...) se aplica a modelos sueltos, r[...] se aplica a conjuntos de modelos, r[[...]] es la función recorte aplicada a conjuntos de conjuntos de modelos, como Con,).
Aserción empírica Ahora podemos expresar de modo preciso la naturaleza que, según el estmcturalismo, tiene la aserción empírica dz una teoría. La teoría pretende que ciertos sistemas físicos, T-no teóricamente descritos, satisfacen las condiciones impuestas por la teoría en el sentido siguiente: ésos son los datos de experiencia que se deberían obtener si la realidad operase como la teoría dice. Esta pretensión se expresa en la aserción empírica de la teoría. Por todo lo anterior debe ser claro que la forma lógica que corresponde a la aserción es "1 E Con", esto es, el dominio de aplicaciones pretendidas I es uno de los conjuntos de modelos parciales, T-no teóricos, que las constricciones del núcleo K determinan a nivcl empírico. Ésta es la versión modeloteórica precisa de la idea intuitiva de que las aplicaciones pretendidas satisfacen individualmente las leyes y, además, satisfacen colectivamente las condiciones de ligadura. Mejor dicho, no que "ellas mismas" satisfacen esas condiciones, pues ellas son estructuras T-no teóricas y tales condiciones involucran esencialmente constituyentes T-teóricos de los modelos. La aserción afirma que ciertos sistemas empíricos concretos, descritos T-no teóricamente, tienen el comportamiento que las restricciones legales determinan a nivel T-no teórico. Tomemos un sistema empírico que se comporta de cierto modo según ciertos parámetros T-no teóricos. Que la aserción sea cierta significa que ése es justamente el modo en que le corresponde comportarse si están presentes en él los parámetros T-teóricos que la teoría postula y éstos se relacionan con los T-no teóricos de la forma que establecen las leyes. Es decir, los sistemas de I son
n~odelosparciales que pueden ampliarse con funciones T-teóricas de modo que se obtengan modelos que satisfacen aisladamente las leyes y conjuntamente las ligaduras. En este sentido, la aserción afirma que la experiencia es subsumible o encaja en la teoná. Aplicada al ejemplo de la mecánica, la aserción entendida en estos términos expresa de modo sucinto lo siguiente: los sistemas físicos particulares intencionalmente seleccionados (planos, péndulos, muelles, poleas, órbitas, etc.) son tales que sus valores cinemáticos (posicioneso velocidad y aceleración en ciertos instantes) coinciden con los que deberían tener si en los sistemas estuvieran además presentes ciertos parámetros dinámicos (masas, fuerzas) interactuando con los cinemáticos del modo especificado en la mecánica, esto es, a) del modo que especifican el segundo principio de Newton y la ley de acción y reacción, y b) manteniendo la misma masa para las partículas que aparecen en diversas aplicaciones y respetando la aditividad de las masas cuando una partícula esté compuesta de otras (sean cuales sean las aplicaciones en que aparezcan). Es importante darse cuenta de que, aunque la experiencia o los datos están "cargados de teoría", eso no tiene consecuencias autojustificativas para la aserción. Se seleccionan intencionalmente ciertos sistemas físicos. Primero, se hacen ciertos cálculos suponiendo que en los sistemas está actuando todo lo que postula la teoría y del modo como ella establece. Segundo, e iizdependientemenre, se determinan en los sistemas los valores de ciertas magnitudes cuya medición no presupone la aplicación o validez de la teoría. Por último, se comprueba si esos valores coinciden con los calculados. No hay autojustificación en absoluto (al menos en sentido local). La aserción puede ser perfectamente falsa, lo es si los valores simplemente no coinciden. Esta caracterización de la aserción es parcialmente insatisfactoria por excesivamente rigurosa. Pretende que los valores coincidan exactamente, en cuyo caso toda aserción resulta falsa, pues siempre hay errores de aproximación. Ésta es en realidad una versión exacta o idealizada de la aserción, versión que no se corresponde con las pretensiones reales en la actividad científica. Los científicos nunca pretenden la coincidencia plena, sino el acuerdo aproxin~adocon los datos dentro de ciertos límites. Para reflejar este hecho el estructuralismo ofrece una versión modificada de la aserción empírica que recoge los aspectos aproximativos indicados. No vamos a presentarla aquí (cf. p.ej. Moulines, 1982, cap. 2.7), para la idea central basta con la versión idealizada.
Los elementos teóricos expresan la estructura sincrónica de las teorías sólo parcialmente, pues hay un aspecto estructuralmente relevante a nivel sincrónico que ellos no recogen. Se trata de un aspecto que, como vimos, enfatizaban especialmente Kuhn y Lakatos con la idea de que las teorías contienen partes esenciaks o inamovibles donde descansa su identidad y partes más accidentales que pueden 'perderse o modificarse permaneciendo, en un sentido diacrónico relevante, la misma teoría. Para capturar y formular en términos precisos esta idea, el estnicturalismo ha desarrollado el concepto de red teórica, que expresa la naturaleza sincrónica de las teorías en toda su riqueza estructural, y
que el propio Kuhn ha reconocido que es una buena precisión semiformal de sus matrices disciplinares en cierto momento de su evolución (cf. Kuhn, 1975).
Especialización
/
Una red teórica es un conjunto de elementos teóricos que guardan cierta relación entre sí. La idea es que el conjunto represente la estructura (sincrónica) de una teoría en sus diferentes estratos, esto es, en sus diversos niveles de especificidad. Tal conjunto, partiendo de elementos muy generales, se va concretando progresivamente en direcciones diversas cada vez más restrictivas y específicas, las "ramas" de la teoría-red. La relación que se ha de dar entre los elementos teóricos para considerar el conjunto una red ha de ser de "concreción" o "especificación" o, como se dice en terminología estructural, una relación de especialización. Podemos ilustrar esta situación con el ejemplo de la mecánica que hemos venido manejando. Vrolvamos a la definición de los modelos de la mecánica tal como vimos que la presentaba Suppes. Suppes exige que los modelos actuales de la mecánica satisfagan tanto el axioma (7), el segundo principio de Newton, como el (S), e1 principio de acción y reacción. Desde un punto de vista histórico eso es correcto, si por mecánica entendemos mecánica nebvtoniana, esto es, la que concibió y en la que creía Newton. Pero desde un punto de vista estructural, la estrategia es inadecuada. El segundo principio y la ley de acción y reacción no están al mismonivel, y es importante que este hecho se refleje en la estructura de la teoría. En contra de lo que creía Newton, no todo sistema que se ajusta a su segundo principio satisface además esa ley de acción y reacción. Hay sistemas mecánicos que satisfacen el segundo principio y que sin embargo son "no newtonianos", en el sentido de que incumplen dicha ley, por ejemplo sistemas que incluyen partículas moviéndose en un campo electromagnético (aunque este hecho queda algo oscurecido en la versión, como advertimos, técnicamente imperfecta que dimos de la ley). Así, mientras todo sistema mecánico satisface (7), no todos ellos satisfacen (8), sólo lo hacen algunos de ellos. Los modelos actuales que satisfacen (8) además de (7) son una especialización de los que sólo satisfacen (7). Los modelos actuales más generales de la mecánica son los que satisfacen (7). A partir de ahí se pueden abrir varias líneas de especialización. Algunos satisfarán además (8). Otros no satisfarán (8) pero satisfarán otro u otros principios específicos, etc. Y esto puede pasar también en niveles inferiores. Por ejemplo, no todos los sistemas de acción y reacción satisfacen otros principios adicionales. Unos satisfarán el principio de las fuerzas cuadrático-inversas de la distancia, otros el principio de oscilación armónica, etc. A partir del segundo principio, general, la mecánica clásica se va especializando en diversas direcciones específicas imponiendo propresivamente condiciones adicionales en diversas direcciones con la intención de dar cuenta de aplicaciones específicas. Éste es el panorama que pretende recoger y expresar la noción estructuralista de red teórica. El primer paso es definir de modo preciso la relación de especialización. Un elemento T' es una especialización de otro T si la parte formal (las constricciones) de T' es una concreción de la de T y está destinada a dar cuenta de una parte de las aplicaciones pretendidas de T. En términos modeloteóricos, ello si,@íca lo siguiente: (1) los modelos determina-
dos por las constricciones (leyes y ligaduras) del núcleo K son parte de los detem~inadospor K,esto es, los correspondientes conjuntos M' y G C de K' están incluidos respectivamente en M y GC de K (pues se van imponiendo condiciones adicionales), mientras que la parte conceptualizadora de los elementos teóricos, los conjuntos Mp y Mpp, queda igual; y (2) las aplicaciones de I' son algunas de las de I. La definición es pues la siguiente, donde 'T' o T' abrevia 'T' es una especialización de T': T' o T syssw (1) M'p = Mp, M'pp = Mpp, M' E M, G C c GC y (2) fc 1. Como puede verse, Ia relación de especiaIización es reflexiva, antisiméuica y transitiva, esto es, de orden parcial (no estricto).
Redes teóricas Con la noción de especialización disponible podemos precisar la noción de red teórica. Una red teórica N es simplemente un conjunto de elementos teóricos (parciaImente) ordenado por una relación de especialización: N = < { E } ,o > es una red teórica syssdef (1) { T , ) es un conjunto no vacío de elementos teóricos y (2) o es una relación de especialización sobre {T,).A cada red Ie corresponde un conjunto IN de aplicaciones pretendidas, la unión de los dominios I; de los elementos que la constituyen. Mediante el concepto de red teórica se captura la estructura de una teoría en un lno~neiztodado en toda su complejidad; este concepto expresa adecuadamente la naturaleza de las teorías desde un punto de vista sincrónico o estático. Sin embargo, el concepto es en cierto sentido demasiado débil. pues, al no exigir a o condiciones adicionales, se acepta (como en todo orden parcial) la posibilidad de que haya órdenes "extraños", con partes desconectadas entre sí, esto es, de que partes de una teoría estén totalmente aisladas de otras. El estructuralismo, que adopta por lo general una postura lo más liberal posible, considera que ello no es conceptualmeríte insatisfactorio. Se reconoce que en las teorías conocidas no ocurre de hecho tal cosa, pero se considera que se trata de una cuestión (~izeta)eti~pí~-ica que no hay que prejuzgar a priori. Aunque en parte es una cuestión abierta, se opta en general por limitarse a la versión débil y definir después un ripo de redes-teorías, las conecradas, constatando como cuestión de hecho que las teorías conocidas son de ese tipo. Una red conectada es una red "no degenerada", sin partes aisladas. Para ello no es necesario exigir que o sea conexa en el sentido lógico usual, esto es que cualesquiera dos elementos diferentes estén relacionados; eso daría lugar a un orden lineal, identificando, contra lo que se pretende, las redes conectadas con redes de una sola línea de especialización. Hay que exigir algo más débil, que sea una "malla", que siempre haya un camino que conecte dos elementos cualesquiera. Formalmente ello se garantiza si podemos "circular-vía-o" entre cualesquiera dos elementos de la red: N = < { E } ,o > es una red teórica colíecrada syssddpara todo T, T' E {Ti]hay Ti, ..., T, E { E ] tales que (T o TI O Ti o T ) y (TI O T ~ T:G o Ti) y ... y (Tn.i(3 T, O T,o T,.i) y (T'B T, O T,,(3 T'). Un tjpo especialmente interesante de redes (conectadas) son aquellas que presentan un único elemento superior, del cual "emana todo". Estas redes (que tienen forma de pulpo o de árbol invertido) se caracterizan formalmente por tener algún elemento teórico del que todos son especializaciones (es inmediato que si tiene alguno, tiene sólo uno). El estructuralismo llama arbóreas a tales redes: N = c{T,),o> es una red teórica arbórea
s y s s ~ hay ~ , T E [ T ; )tal que para todo T' E (Ti} T' (3 T. Las teorías arbóreas son especialmente interesantes pues en ellas, por así decir, la "esencia" está concentrada en un único elemento teórico básico. El siguiente gráfico ilustra esta situación.
Las redes arbóreas reflejan parcialmente la imagen de la ciencia que se desprende de los análisis de Kuhn y Lakatos, parcialmente porque faltan por ver los aspectos diacrón i c o ~ el , tipo de evolución de las redes que constituye la ciencia normal kuhniana. Resumamos cuáles son los principales elementos estructurales sincrónicos descubiertos por los historicistas que son recogidos en la noción estructuralista de red teórica. Las teorías tienen, en los elementos teóricos de la red, un componente formal, el núcleo K, y otro aplicativo, el dominio I de aplicaciones pretendidas. Una parte del núcleo, Mpp, conceptualiza la experiencia, los hechos, esto es, I Mpp. Otra parte explica lo así conceptualizado, explicación que introduce aparato conceptual nuevo propio de la teoría (Mp): las leyes M (cMp) y ligaduras GC (cPot(Mp)) intentan "subsumir" las aplicaciones, pretensión expresada por la aserción empírica de la teoría. Así, los hechos a explicar están cargados de teoría, pero no de la parte de la teoría que pretende explicarlos. El núcleo, que en sí mismo es puramente formal, se carga entonces de contenido empírico al aplicarse-alas-aplicaciones. Además, todo esto no ocurre de modo "rígido", como en un bloque indiferenciado. Las redes tienen partes esenciales (si son arbóreas, concentradas en un elemento teórico básico) cuyo componente formal es por lo general muy débil, muy poco o nada restrictivo en sí mismo (sin especializarlo), y partes accidentales que desarrollan mediante o la parte esencial especializándola en diversas direcciones, tanto en su componente formal, imponiendo restricciones más fuertes, como en el aplicativo.
Concluiremos señalando brevemente un último componente de la concepción estructuralista de las teorías que hemos obviado hasta aquí para simplificar la exposición. Este componente pretende dar cuenta de un hecho usual y esencial de la ciencia, a saber,
que las teorías no son entidades aisladas sino que mantienen estrechas relaciones entre si. Algunas de esas relaciones se expresan mediante "leyes mixtas" o "leyes puente", mediante postulados que involucran conceptos de diversas teorías. Las teorías mantienen pues i.í~ici~los interteóricos. En principio los vínculos pueden relacionar varias teorías a la vez, pero lo usual parece ser que relacionen dos teorías; en todo caso nos limitaremos aquí a este caso, el más sencillo, para evitar complicaciones de una presentación generalizada a cualquier número de teorías. Un ejemplo típico de vínculo interteórico binario lo constituye el que se da entre la hidrodinámica y la termodinámica expresado en la ecuación "P=dEldV' que relaciona presión, volumen y energía, siendo la presión una magnitud específicamente dinámica y la energía una magnitud específicamente termodinámica. Los vínculos interteóricos tienen, como las leyes propias de la teoría, efectos restrictivos sobre los modelos, pero a diferencia de ellas no son satisfechas o insatisfechas por modelos potenciales de una única teoría sino por pares (en el caso de los vínculos binarios) de modelos potenciales de teorías diferentes. Las leyes propias determinan un subconjunto de modelos potenciales, aquellos que las satisfacen (e.e. los modelos actuales). Los vínculos interteóricos no determinan directamente un subconjunto de modelos potenciales de una teoría. Si Mp y Mp' son respectivamente los conjuntos de modelos potenciales de dos teorías T y T', entonces el producto cartesiano Mp x Mp' contiene todos los pares posibles de modelos de ambas. Pues bien, dado un determinado principio puente entre T y T', sóIo algunos de esos pares satisfarán dicho principio, por lo que se puede considerar que el principio en cuestión determina o define cierto subconjunto L de h f p x Mp', el conjunto de pares de modelos que lo satisfacen. Por tanto, los principios puente determinan prilnarialnente conjuntos de pares de modelos. Pero eso supone una restricción efectiva adicional para cada una de las teorías, tiene como efecto la determinación de cierto subconjunto de modelos potenciales en cada una de las teorías: para T ese conjunto es el de los primeros miembros de los pares de L, para T' es el de los segundos miembros de los pares. Denotemos mediante 'Lr' al conjunto de modelos potenciales de T determinado-en-T por el principio puente L (y análogamente con T'). Pues bien, si el principio es efectivamente restrictivo, LT será un subconjunto propio de Mp. Como T puede tener varios vínculos interteóricos L;con diversas teorías, cada uno de ellos determina de este modo indirecto un cierto subconjunto Lir de modelos, que representa el efecto constrictivo del vínculo en la teoría T. El efecto combinado o conjunto de todos los vínculos se recoge entonces en la intersección de todos esos conjuntos, el i~'ncu10global que se denota mediante 'GL',y que es la intersección de todos los vínculos Lii para T. Una caracterización completa del núcleo K que exprese todas las condiciones que la teoría impone a los modelos debe incluir también este tipo de constricciones derivadas de las leyes puente. Así, hay que completar la anterior caracterización provisional del núcleo con este nuevo elemento: K = <Mp, Mpp, M , GC, GL>; el contenido teórico es entonces Con, = Pot(M) n GC n Pot(GL). Nótese que si no se incluyesen en la caracterización de las teorías este tipo de leyes-restricciones empíricas no aparecerían en la reconstrucción de ninguna teoría y por tanto "desaparecerían" en una eventual reconstrucción total de la ciencia resultante de reconstruir todas y cada una de las teorías. El motivo es
que estas leyes empíricas no se formulan con el vocabulario exclusivo de una única teoría, involucran conceptos de diferentes teorías, y por ello no aparecen como axiomas propios que determinan los modelos actuales. Pero no por ello son menos constrictivos empíricamente, son tan parte de lo que la teoría afirma de la experiencia como los axiomas propios de cada teoría y por tanto deben hacerse manifiestos en la reconstrucción de cada teoría. Nótese que no sería una buena estrategia alternativa "ampliar" por este motivo los conceptos propios de la teoría incluyendo cualquier concepto con el que se vinculen mediante leyes "los originales". Eso permitiría recoger las leyes-puente como axiomas propios pero al precio de unificar inaceptablemente diferentes teorías. Si la energía debiera incluirse como magnitud propia de la hidrodinámica por su relación con la presión mediante la ley mencionada, entonces también debería incluirse la entropía, dadas las leyes que la conectan con la energía. Pero eso tendría la consecuencia inaceptable de convertir la hidrodinámica y la termodinámica en una misma teoría. Y no sólo a ellas, sino que convertiría en la misma teoría gran número de teorías físicas (dadas las conexiones de hidrodinámica y termodinámica con otras), o quizá todas las teorías físicas o, si por distintos csminos se conectan con otras disciplinas, todas las teorías empíricas. . . Es obvio que no todas las teorías dentro de una disciplina, o de toda la ciencia, son la misma teoría. Por tanto, considerar los vínculos interteóricos exactamente del mismo modo que los axiomas propios de las teorías es inaceptable. Lo adecuado es reconstmirlos, e incluirlos en la caracterización de las teorías, como lo que son, a saber, leyes puente que vinculan teorías diferentes. Su existencia genera cierto tipo de "unidad", pero no puede convertir teorías diferentes en la misma teoría. Esas unidades que generan no son teorías individuales sino grupos de teorías interconectadas, o lo que el estructuralismo denomina holones ("totalidades") teóricos. Estas macro-unidades científicas pueden englobar partes de una disciplina, o incluso de disciplinas diferentes, y son fundamentales para elucidar algunas cuestiones relativas a la estructura global de la ciencia. El examen de estas cuestiones, sin embargo, sobrepasa los límites de este libro (para un estudio detallado, cf. Balzer, Moulines y Sneed, 1987, cap. VIII).
6. Consideraciones finales Con este capítulo concluimos el análisis de la estructura sincrónica de las teorías. La reconstrucción o análisis de una teoría debe poner de manifiesto todos los aspectos que sean relevantes para elucidar su naturaleza. Independientemente del formalismo que se prefiera usar para ello, la revisión que hemos hecho permite establecer al menos los siguientes elementos relevantes para la dimensión sincrónica de las teorías.
1. Las teorías tienen una parte formal, las leyes, y otra aplicativa, los sistemas físicos concretos a los que se pretende aplicar las leyes. Tal pretensión es expresada por la aserción empírica de la teoría. 2. Es más adecuado identificar las teorías a través de sus modelos que a través de sus enunciados. Para dar cuenta de algunas intuiciones hemos de referimos siquiera implí-
366
FUND.4XíESTOS DE FILOSOFL~DE LA CIENCIA
citamente a los modelos, y lo preferible es presentar el análisis metateórico, así como las cuestiones vinculadas al mismo, directamente en términos de modelos. 3. El aparato conceptual con el que se describen y determinan los modelos de datos es sólo parte del usado por la teoría. La determinación de los modelos de datos no puede depender de conceptos cuya aplicación presupongan la validez de la teoría. Los conceptos mediante los que se determinan los datos son pues previos, anteriores o no-teóricos en relación a la teoría para la que son datos. Los conceptos mediante 10s que la teoría explica o subsume esos datos son los conceptos propios o teóricos en relación a la teoría. La distinción "te6rico/no-teórico" es relativa a cada teoría. 4. La caracterización del componente formal debe hacer manifiesta la diferencia entre aparato meramente conceptualizador y aparato propiamente constrictivo. 5. En cuanto al aparato conceptuaiizador, se debe hacer manifiesta la diferencia entre los conceptos previos, T-no teóricos, y los conceptos propios, T-teóricos. 6. En cuanto al aparato propiamente constrictivo, la reconstrucción debe hacer manifiesta la diferencia entre: a) constricciones que se imponen a sistemas aislados e involucran conceptos exclusivos de la teoría en cuestión (leyes propias); b) constricciones que se imponen a sistemas aislados e involucran conceptos de diferentes teorías (leyes puente); c) constricciones que se imponen a grupos de sistemas (condiciones de coherencia o ligaduras). 7. La parte aplicativa, los sistemas de datos, seleccionada intencional y paradigmáticamente y determinada T-no teóricamente, contribuye esencialmente a la determinación del significado empírico de los términos teóricos. 8. Todo lo anterior se debe considerar conformando una estructura dúctil, con unas partes más genéricas y esenciales que constituyen el núcleo firme de la teoría, y otras partes más específicas y accidentales que pueden ir modificándose como resultado de la contrastación de la aserción empírica. En qué sentido se pueden producir estas modificaciones lo examinaremos en detalle en el capítulo 13.
Las teorías de las ciencias empíricas en general (a diferencia, quizá, de algunas teorías de la matemática pura y de las teorías metafísicas) no son "mónadas" conceptuales y metodológicas; es decir, ni desde el punto de vista de su armazón conceptual, ni tomando en cuenta el modo como funcionan, como se aplican y ponen a prueba, pueden ellas existir de manera completamente aislada unas de otras. En el capítulo anterior hemos visto ya un modo en que las teorías empíricas están conectadas unas con otras, a través de los vínculos interteóricos o leyes puente. En este capítulo examinaremos otros tipos de relaciones interteóricas de naturaleza más global, en especial la teorización, la reducción y la eq~~ivalencia. Después de una introducción a la noción general de relación interteórica, examinaremos cada una de estas relaciones y concluiremos con un apéndice dedicado al reduccionismo entre ciencias especiales y ciencia básica.
1 . Concepto general de relación interteórica
Cada teoría de las diversas disciplinas científicas se halla en relaciones más o menos estrechas y de diversa índole con otras teorías, con frecuencia de la misma disciplina, pero a veces también de disciplinas bastante distintas. No se puede entender y aplicar una teoría mecánica, pongamos por caso, sin tomar en consideración su relación con la geometría física; las relaciones de la termodinámica con la química son esenciales a ambas disciplinas; no sabremos realmente qué dice la genética sobre los seres vivos si no tomamos en cuenta conceptos esenciales de la taxonomía, etc. Es muy dudoso que, en el estado actual de la ciencia empírica, exista una sola teoría, por elemental que sea, que no conlleve relaciones significativas empírica y conceptualmente con otras varias teorías. En muchos casos, estas relaciones son incluso absolutamente esenciales a la teoría en cuestión en el sentido de que no podemos identificar esa teoría o determinar plenamente de qué trata si desconocemos algunas de sus relaciones con otras teorías. Por ejemplo, la relación de la mecánica con la geometría física es esencial para la primera (aunque no para
368
F U N D A h I E h ' S DE F I L O S O F ~DE ~ LA CIENCIA
la segunda): no comprenderemos lo esencial de una teoría mecánica si no aprehendemos la vinculación de algunos de sus conceptos bisicos con conceptos provenientes de la
geometría. En otros casos, aunque sería quizá exagerado afirmar que la identificación de una teoría dada presupone su relación con otras teorías, sin embargo, las relaciones interteóncas resultan esenciales a la hora de someter a prueba empírica la teoría en cuestión. Probablemente no haya una sola teoría empírica cuya contrastacibn con la experiencia no requiera del concurso de otras teorías, aunque sólo sea por el hecho de que los instrumentos utilizados para poner a prueba esa teoría vienen controlados por las leyes de otras teorías. Así, por ejemplo, cuando ponemos a prueba las predicciones experimentales de la termodinámica mediante un termómetro, presuponemos implícitamente que éste funciona correctamente, y ello quiere decir que funciona de acuerdo a leyes mecánicas, hidrodinámicas, electrostáticas, etc. La constatación de que nunca podemos poner a prueba una teoría empírica aisladamente, sin tomar en cuenta que forma parte de toda una familia de teorías coadyuvantes, la hizo ya Piene Duhem a principios del siglo xx. Este autor formuló esta tesis sólo para las teorías de la física y dudaba de que fuera aplicable a otras disciplinas (a la fisiología, por ejemplo). Sin embargo, hoy día sabemos ya lo bastante acerca de la estructura de otras disciplinas, además, de la física como para que nos atrevamos a suponer el mismo efecto en todas las ciencias empíricas: ninguna teoría empírica puede ser contrastada sin tomar en consideración sus relaciones interteóricas. Esta visión de la problemática de la contrastación de teorías fue radicalizada posteriormente por W. V. Quine, quien postuló que, en la contrastación de cada teoría particular, interviene una madeja inextricable y prácticamente inabarcable de relaciones de esa teoría con la totalidad de la ciencia (incluso las ciencias formales). A tal tesis se la suele caracterizar como ~olismo'(r&ro&lógico) (de la palabra griega Izolos, que significa "totalidad"); también se Ia suele llamar "tesis Duhem-Quine", dando a entender que ambos autores, Duhem y Quine, defendieron prácticamente el mismo punto de vista. Sin embargo, como acabamos de indicar, el "holismo" de Duhem es mucho más moderado (y verosímil) que el holismo extremo de Quine. A efectos de la discusión presente nos basta con dar por bien establecida la versión duhemiana del holismo: a1 contrastar una teoría con la experiencia siempre hay que tener en cuenta al menos algunas de sus relaciones con algunas otras teorías. Así, pues, tanto respecto a la cuestión de la identidad de teorías empíricas como respecto a su contrastación, sus relaciones mutuas juegan un papel de primer orden. Por ello es que el estudio de las relaciones interteóricas representa un capítulo muy importante de la filosofía de la ciencia, un capítulo largo tiempo negligido, pero que en las últimas décadas ha pasado cada vez más al primer plano de la discusión. El estudio de las relaciones interteóricas resulta imprescindible para comprcnder los aspectos más globales de la ciencia, tanto en una petspectiva sincrónica como en una diacrónica. Aquí podemos tratar sólo de los tipos más importantes y discutidos de relaciones interteóricas, y lo haremos sólo desde un punto de vista sincrónico; algunos aspectos de relevancia diacrónica de las relaciones interteóricas entrarán en j u e ~ oen el último capítulo. Otra restricción en el examen que asumiremos es la siguiente. Si consideramos un
grupo de n teorías, Ti. ..., T. (con rt > 2 ) . que constatamos relacionadas entre sí, podría ocurrir que hubiera una relación n-ádica R(Tl, ..., T,) que no se pudiera descomponer en relaciones parciales entre pares de teorías del grupo. Sin embargo, numerosos análisis de ejemplos reales de relaciones interteóricas parecen indicar que la eventualidad mencionada es meramente una posibilidad lógica en la inmensa mayoría de casos, y que los tipos realmente relevantes de relaciones interteóricas son (casi) siempre relaciones establecidas sobre un par de teorías, es decir, relaciones diádicas. En cualquier caso, aquí restringiremos nuestra atención a las relaciones interteóricas diádicas. De éstas, a su vez, hay de tipos diversos, según su forma lógica y su función metodológica. Muchos de esos tipos ni siquiera han recibido una denominación especial en la literatura, y los dejaremos de lado. Aquí nos limitaremos a examinar tres grandes tipos, que han sido objeto de amplias investigaciones, y que tienen también especial relevancia epistemológica: la teorización, la reducción y la equivalencia. La reconstrucción formal de los diversos tipos de relaciones interteóricas dependerá naturalmente, en parte, de la noción formal de teoría que se presuponga. Si se adopta una concepción axiomática o enunciativa de las teorías como cálculos interpretados (cf. capítulo S), entonces está claro que los diversos tipos de relaciones interteóricas aparecerán como relaciones entre (sistemas de) enunciados o axiomas; en cambio, si adoptamos una concepción semántica de las teorías (cf. capítulo lo), y en especial si las definimos como estructuras modeloteóricas (que es el punto de vista favorecido en este libro), entonces las relaciones interteóricas también se verán como relaciones entre modelos o conjuntos de modelos. En lo que sigue, y para el examen de cada uno de los tipos considerados, primero adoptaremos la idea más clásica de las teorías como sistemas de enunciados para pasar luego a la versión modeloteórica. En realidad, las dos formas de reconstrucción no son incompatibles entre sí, sino que la primera puede servir a modo de sugerencia "elemental" para la segunda que, como veremos, permite un análisis más diferenciado y complejo de las relaciones interteóricas.
2. Teorización
La teorización, vista como relación interteórica, se da entre dos teorías TI y TO cuando algunos de los conceptos que aparecen en las leyes de TI vienen determinados en la teoría To, o sea, le son "provistos" a TI por To; a tales conceptos podemos llamarlos "conceptos TI-no-teóricos", mientras que a los demás conceptos de TI, que no vienen determinados por ninguna teoría independiente de TI, los llamamos "Tl-teóricos".l En tal caso, cuando algunos de los conceptos de TI vienen determinados por una teoría TO independiente de Tiy otros, en cambio, no vienen determinados por ninguna teoría independiente de TI, decimos que TI es una teorización de To o que Toes una teoría subyacente 1. La distinción entre conceptos T-teóricos y T-no-teóricos que establecemos aquí está inspirada en ideas básicas de la concepción estnictunl, expuestas en el capítulo 10 ($5). Sin embargo, en Iq forma en que aquí la discutimos es independiente de dicha concepción. 13s
a Ti. También podemos decir que To es una teoría 171etodológicainenteprevia a Ti, pues sin ella algunos de los conceptos de TI no quedarían determinados y por tanto no sabríamos cómo aplicar Ti ni, en definitiva, de qué trata dicha teoría. Así, por ejemplo, si no dispusiéramos de los conceptos cinemáticos de distancia, tiempo, velocidad y aceleración (y de maneras de determinarlos de acuerdo a ciertos principios cinemáticos y geométncos), no tendría sentido tratar de utilizar, aplicar o poner a prueba una teoría mecánica. Por ello podemos decir que la mecánica es una teorización de la cinemática. O bien, si no dispusiéramos del concepto de volumen, no podríamos ni siquiera entender de qué trata la termodinámica, por lo que hay que considerar esta última como una teorización de la geometría física. Finalmente, está claro que la distinción entre fenotipo y genotipo es esencial para cualquier teoría genética; pero la noción de fenotipo viene determinada por los rasgos anatómicos y fisiológicos de los seres vivos, por lo que la genética será una teorización de la anatomía y la fisiología. En general, se suele suponer que, si Ti es una teorización de To, es porque TOestá más próxima a la experiencia inmediata del sujeto epistémico, puede servir como "base empírica" para poner a prueba TI, la cual por lo general se considerará más "abstracta", más alejada de la experiencia. Algunos autores también contraponen el lenguaje en que está formulada To, considerado como "lenguaje observacional", al lenguaje propio de Ti, considerado como "lenguaje teórico" (cf. cap. 8). Podemos aceptar este modo de hablar siempre y cuando tengamos presente que se trata de una distinción relativa al par <Ti, To> : To es "observacional" con respecto a TI, pero no tiene por qué serlo en un sentido absoluto; es decir, TOno tiene por qué considerarse una teoría basada únicamente en "observaciones puras", suponiendo que haya tal cosa. Basta simplemente que las determinaciones de los conceptos en To hayan de presuponerse antes de pasar a utilizar Ti. Pero por supuesto que To puede ser, a su vez, teorización de otra teoría aún más "elemental" T:, y por otro lado Ti puede servir de "base empírica" a otra teoría aún más "abstracta" T3,etc. La teorización puede ser total o parcial. Diremos que TI es una "teorización total" de To cuando To es la única teoría de la cual Ti es teorización, o sea, Te es 'la única teoría que subyace a TI. Es plausible suponer que un ejemplo de teorización total lo constituye la relación entre la mecánica y la cinemática, pues todos los conceptos no propios de la mecánica que hay que presuponer para aplicar la mecánica provienen de la cinemática. Sin embargo, la teorización total es más bien la excepción y no la regla. Por lo general, a una misma teoría subyacen varias teorías distintas, o sea, TI es teorización de To, To', T,,", ... . Así, por ejemplo, la termodinámica es teorización de por lo menos tres teorías: la geometría física (por el volumen), la hidrodinámica (por la presión) y la estequiometría (por el concepto de mol). Parece muy plausible suponer que la teorización es una relación asi~?zétrica;o sea, que si Ti es teorización de To, entonces no podrá ser To también teorización de TI. Sin embargo, es importante notar que no hay ninguna razón a priori o conceptual para que ello sea así: en principio, podría ocurrir en al& caso que algunos conceptos de TI presupusieran To, pero que ciertos conceptos de Tcpresupusieran a su vez la determinación de otros conceptos de Ti. En tal caso no tendríamos un círculo lógico vicioso, pero sí lo
RELACIONES INTERTE~RJCAS
37 1
que podríamos denominar un "círculo metodológico vicioso". Está claro que la praxis científica está constituida de tal modo que, en principio, tratará de evitarse trna situación así. No obstante, que realmente consiga evitarse siempre, es otra cuestión. Puede ocurrir que, en la práctica del uso de teorías, se introduzcan inadvertidamente tales círculos. Ello puede ocurrir especialmente cuando las "cadenas de teorizaciones" son relativamenta largas. En efecto, supongamos que tuviéramos una serie de teorías To, T I ,..., T,-1, T,, tal que T, sea teorización de T.-!, ..., Ti teorización de Toy finalmente que TQsea teorización de T,; admitamos además que la relación de teorización es transitiva, o sea que, si T, es teorización de T2 y T2 es teorización de TI, entonces también habrá que considerar T3 como teorización de TI (lo cual es un supuesto muy plausible); entonces tendríamos en el caso de esa "cadena" de teorías que T, es teorización de Ta y To es teorización de T,, precisamente el círculo que tratábamos de evitar. Es una cuestión todavía abierta la de si una situación como la descrita puede realmente darse en las ciencias empíricas, y qué consecuencias epistemológicas y metodológicas tendría ella; esta cuestión, como el lector habrá adivinado, está emparentada con las tesis del holismo señaladas al principio, en particular en su forma extrema debida a Quine. Aquí no podemos detenemos a fondo en este problema y nos limitamos a apuntarlo tan sólo. En general, supondremos que tales círculos no se dan. y que la constitución de la mayoría de disciplinas (al menos desde el punto de vista sittcrónico) es tal que la teorización es realmente una relación transitiva y asimétrica. EHo implica, a su vez, la existencia de un orden jerárquico entre las teorías, desde las más "básicas", que no son teorizaciones de otras teorías, hasta las más "teóricas", que revelan tener tras de sí largas cadenas de teorizaciones. Ésta es la alternativafundacionis{a. Según la alternativa opuesta, coherentista, no habría teorías básicas y globalmente considerado "todo estaría presupuesto en todo'". Caben alternativas intermedias, con la presencia tanto de algunas teorías básicas como de algunos círculos metodológicos. Aunque hemos supuesto que en general tales círculos no se dan (fundacionismo), debe quedar claro que ello no es algo que se pueda establecer a priori, sino que se debe resolver (meta)empíricamente mediante un detallado y exhaustivo trabajo de análisis y reconstrucción de conjuntos de teorías. Hemos iniciado la discusión de la relación de teorización caracterizándola como la relación que existe entre dos teorías TI y To cuando algunos de los conceptos de Tivienen determinados por To, mientras que otros conceptos de Ti no vienen determinados por ninguna teoría independiente de TI y son por tanto "TI-teóricos". Esta caracterización es más o menos intuitiva pero por ello mismo también más o menos vaga. Conviene que nuestra caracterización sea más precisa. La noción clave aquí, que aún no hemos dilucidado formalmente, es la de deternzinación. Hemos dicho que, cuando TI es una teorización de To,a l p n o s conceptos de T i vienen determinados en Toy otros no. Pero ¿qué quiere decir exactamente que los conceptos de una teoría son "determinados" en otra? Para elucidar esta cuestión haremos uso de la concepción modeloteórica de las teorías tal como la hemos expuesto en el capítulo anterior, especialmente en su versión estructural. Antes, sin embargo, conviene introducir la noción general de subestruca~ra.
Definición 11.1: Sean dos estructuras x =
Definición 11.2: Ti es una reorizació~lde Tosi y sólo si: (1) t l x E I(T1) 332 6:Sx A jSz A z E M(Tc)) (2) VXE Mp(Ti) 3y O;Sx A V Z ( ZE Mp(T0) + 7 jSz)). En el caso en que en la condición (1) ocurra y = x, tendremos que cada aplicación intencional "completa" de T I se concibe como un modelo o parte de un modelo de una determinada teoría subyacente, en cuyo caso sería superfluo buscar otras teoxías subyacentes para Ti, situación que se corresponde a lo que hemos descrito antes como teorización total. Pero, por lo general, las aplicaciones intencionales de una teoría TI estarán compues-
tas de diversas subestmcturas y, y', subyacentes To,T'c,, ... 3.
... determinadas
como modelos de diversas teorías
Reducción
La reducción de una teoría a otra es probablemente el tipo de relación interteórica que más se ha discutido en la filosofía de la ciencia. Ello se debe a que la relación d e reducción se ha conectado con cuestiones epistemológicas y metodológicas de largo alcance, como son las del realismo (epistemológico), la unidad de la ciencia, el progreso científico, etc. En efecto, si todas las disciplinas científicas existentes pudieran reducirse a una sola (por ejemplo, todas las ciencias sociales a la biología, la biología a la química, la química a la física), y dentro de esa disciplina hubiera una sola teoría que redujera a todas las demás (por ejemplo, la "gran teoría unificada" que persiguen los físicos de partículas), entonces podríamos considerar el desarrollo científico como un "progreso" hacia una "unidad cada vez mayor, en la que todas las teorías quedarían al fin reducidas a una sola que explicaría todos los fenómenos del universo y que se podría considerar "la verdadera representación" de "la realidad" tal cual es; tal situación parecería una garantía de conocimiento definitivo (cf. más adelante la última sección). Frente a este programa reduccionista se han planteando objeciones de diversa índole. Entre ellas, quizá las más frecuentes dentro de la filosofía de la ciencia provienen de una perspectiva diacrónica: se señala que la repetida manifestación de revolnciones científicas, en tanto que rupturas dramáticas en el aparato conceptual y metodológico de una disciplina, con la concomitante inconmetrs~lrnbiliddde las teorías involucradas (cf. cap. 13), dan al traste con la idea de reducir las teorías anteriores a las posteriores en una revolución'; al menos históricamente, según estos críticos, no resulta verosímil el programa reduccionista para teorías diferentes (y aún menos, si cabe, para las diversas disciplinas). Aquí no podemos entrar a fondo en esta discusión. Baste hacer notar, no obstante, que tanto las tesis reduccionistas como las antirreduccionistas han adolecido a menudo de cierta falta de rigor conceptual, y que en realidad se puede objetar al reduccionismo radical sin necesidad de apelar a "revoluciones" e "inconmensurabilidades". Tan pronto como se ofrece un concepto exacto y verosímil de reducción se comprueban dos cosas: a) que las consecuencias epistemológicas y ontológicas de las reducciones, caso de existir, son mucho menos importantes de lo que la discusión ha sugerido; y b) que hay muchos menos casos genuinos de reducción de lo que parece y de lo que en obras de divulgación científica suele sugerirse. Y para darse cuenta de ello no es necesario constatar ninguna "inconmensurabilidad", sino que basta con percatarse de que, incluso en el caso de teorías que pertenecen a una misma "familia" y que están vinculadas conceptualmente. reducir una teoría a otra es mucho más arduo de lo que puede esperarse, es una empresa que pocas veces ha culminado en un éxito total. Con otras palabras, incluso prescindiendo de la problemática de las revoluciones científicas y de la inconmensurabilidad, lo cierto es que se han sobrevalorado las posibilidades de reducir unas teorías a otras.
374
FüNDAME?;TOS DE F I L O S O F ~DE ~ L.4 CIENCIA
A esta dificultad se añade el hecho (debido precisamente a la falta de rigor en el tratamiento del problema) de que muchos supuestos ejemplos de reducciones no conesponden en realidad al concepto de redtrcciórí esacta, que es la reducción propiamentr dicha, sino a lo sumo a lo que podemos llamar una r-edzicciór~apronitnariipa.De hecho, la relación de aproximación como relación interteórica, ya sea de carácter reductivo o no, es mucho más importante y frecuente que la reducción exacta, y aunque en algunos casos la aproximación revela ciertas semejanzas estructurales con la reducción, sería erróneo equiparar y aún más identificar ambos conceptos. Muchos ejemplos que se han dado en la literatura científica o filosófica de reducciones revelan ser, ante un examen más cuidadoso, solamente aproximaciones: éste es el caso para la supuesta reducción de la teoría planetaria de Kepler a la teoría de la gravitación de Newton, de la termodinámica a la mecánica estadística, de la mecánica clásica a la relativista, de la genética mendeliana a la genética de poblaciones, etc. La relación interteórica de aproximación es, sin embargo, de naturaleza esencialmente más complicada que otras relaciones interteóricas, en especial la reducción, y su tratamiento requeriría de cierto nivel de tecnicismos que no podemos desarrollar en este libro. No obstante las prevenciones que hemos formulado sobre la tendencia a sobrevalorar el tema de la reducción en la ciencia, no cabe duda de que se trata de un tipo importante de relación interteórica, que conviene precisar y para el cual hay ejemplos concretos e interesantes. Casos claros de reducción (exacta) de teorías son: la reducción de la mecánica (cartesiana) del choque a la mecánica (newtoniana) de partículas, de la mecánica del sólido rígido a la mecánica de partículas, de la teoría de los gases ideales a la teoría cinética, de la electrostática a la electrodinámica y de la genética mendeliana a (cierta versión de) la biología molecular; probablemente haya otros varios casos que aún no han sido reconstruidos con detalle. Estos casos paradigmáticos de reducciones y las intuiciones asociadas a ellos pueden guiamos a la hora de formular un concepto viable y bien fundado de reducción, que además nos pudiera servir más adelante como base para tratar adecuadamente su "pariente próximo", la aproximación reductiva, la cual sin duda reviste cierta analogía con la reducción exacta. La intuición básica de la reducción puede ser interpretada tanto en una perspectiva diacrónica como en una sincrónica. Diacrónicamente, la teoría reducida T precede a la teoría reductora P en el sentido de que representa un estadio más "elemental", más "simple", de nuestro conocimiento de determinada parcela de la realidad. En cierto modo, T ha de quedar "cubierta" por P en el sentido de que los logros positivos de T estarán aunque probablemente no a la inversa. contenidos también en los logros positivos de P.', Podemos decir que, sobre el mismo dominio empírico, T"; dice lo mismo que ya decía T, pero lo dice mejor, y además dice otras cosas que nunca dijo I: Desde el punto de vista sincrónico, la teoría reducida T con frecuencia representa un modo más rápido y expedito, pero también "más grosero" de resolver los mismos problemas que se plantean en la teoría reductora P. Es decir, la teoría reducida simplifica la formulación de los problemas y las aplicaciones propuestas, haciéndolas más asequibles que su teoría reductora, aunque al precio de negligir ciertas informaciones relevantes. Así, por ejemplo, podemos tratar del choque de dos esferas macizas olvidándonos de cómo esas esferas están compuestas de partículas unidas entre sí por ciertas fuerzas de cohesión; o podemos predecir el cambio de
RELACIONES I';TEFCU~RIC,\S
375
volumen que sufrirá un gas al ser sometido a cierta presión sin preocuparnos del movimiento de las moléculas en el interior del gas. La cuestión que nos planteamos ahora es la de cómo desarroIIar un concepto genera1 de reducción que responda a estos ejemplos y a la idea intuitiva que ellos sugieren. Hemos dicho que la teoría reductora se refiere en lo esencial al mismo campo de la experiencia y que contiene la misma información, y más, que la que provee la teoría reducida. Ello sugiere dos cosas. Por un lado, que ambas teorías estarán vinculadas semánticamente, y por tanto que habrá una conexión entre los conceptos de ambas. Y por otro, que las aseveraciones sobre el mundo que hace la teoría reductora son "más fuertes" que las que hace la reducida, pero no incompatibles con ellas. Estos dos requisitos intuitivos de la reducción han sido explicitados en la concepción axiomática de las teorías como las dos condiciones fundamentales de toda reducción: la condición de conectabilidad y la de derivabilidad. Cuando en el capítulo 8 presentamos la noción de teoría axiomática ya dimos una primera idea de esta noción de reducción (sin tener entonces en cuenta los aspectos empíricos). Recuérdese (cap. 8, 61) que lo esencial consistía entonces en que una teoría reduce a otra si se pueden definir los términos primitivos de la segunda mediante términos primitivos de la primera de modo que los axiomas de la segunda se deriven de los axiomas de la primera más estas definiciones. Éste es el núcleo de la idea clásica de reducción (dos referencias básicas para la misma son Kemeny y Oppenheim, 1956, y Nagel, 196 1, cap. 11). El requisito de conectabilidad exige que, para disponer de una formulación explícita de la reducción de T a P,se establezcan ciertas "dzfiniciones coordinadoras" entre todos los conceptos básicos de T y al menos algunos conceptos básicos de P.Estas definiciones tendrán en general la forma de condicionales que afirman que, si cierto concepto C de T se aplica a cierto dominio de objetos D, entonces necesariamente a este dominio D se aplicará(n) también cierto o ciertos conceptos Ci,..., Cn de T* "coordinados" con C. El segundo requisito, el de derivabilidad, exige que las leyes de T sean todas deducibles de las leyes básicas de T:junto con las definiciones coordinadoras (y eventualmente algunos enunciados más particulares sobre condiciones iniciales). Tomemos el ejemplo de la reducción de la mecánica del sólido rígido a la mecánica newtoniana de partículas. En la primera, un concepto básico es el de sólido rígido y una ley básica es la de conservación del momento angular. En la segunda, tenemos como concepto básico el de partícula y las leyes básicas son el Segundo Principio de Newton y la ley de acción y reacción. Pues bien, para reducir la primera teona a la segunda hay que establecer primero una definición coordinadora del concepto de sólido rígido en términos del concepto de partícula, por la cual se define un sólido rígido como un conjunto de partículas que mantienen distancias constantes entre sí (y análogamente con las restantes nociones propias de la teoría reducida); y luego hay que demostrar que, de las leyes de Newton, más la mencionada definición coordinadora, se deduce la ley de la conservación del momento angular. Debe notarse que aunque las definiciones coordinadoras son afirmaciones generales cargadas (si la reducción es viable) de cierta noinicidnd ("necesidad" en virtud de la naturaleza), no se trata de leyes usuales; se trata más bien de relaciones de constitución (sobre esto, cf. más adelante la última sección).
Este análisis de la noción de reducción apunta, en lo esencial, en la dirección correcta; sin embargo, cuando la queremos aplicar a casos concretos, nos percatamos de que adolece aún de deficiencias. de que es demasiado simplista o idealizada. Ella enfrenta sobre todo dos problemas: (i) muchas veces es difícil o inverosímil establecer para cada uno de los conceptos básicos de Tuna definición coordinadora con conceptos de P;(ii) la deducción de las leyes de T a partir de las de T^ muchas veces no puede llevarse a cabo formalmente, ya sea porque nos faltan precisamente las definiciones coordinadoras (o ]as que se han propuesto son intuitivamente inaceptables), o bien porque la derivación requiere, además, de ciertos postulados o supuestos adicionales difíciles de formular o variables según el tipo de aplicación. Por ello, aun cuando podemos conservar la noción general de reducción estipulada antes, es conveniente tomar un enfoque "más global", que no adolezca de las dificultades señaladas. De nuevo nos ayudará aquí la versión modeloteónca. Los requisitos fundamentales serán ahora, dicho de manera intuitiva, los siguientes. Primero, en vez de estipular una coordinación para cada uno de los conceptos de T tomado singularmente, requeriremos simplemente una "correspondencia global" entre el marco conceptual de T y el de P;eila será formalmente una relación entre Mp(T) y Mp(T*). Ahora bien, tal correlación no sólo deberá existir a nivel de los modelos potenciales respectivos, sino también a nivel de las aplicaciones I(T) e I(F),o sea, de las porciones del mundo empírico a las que pretenden aplicarse ambas teorías; toda aplicación intencional de T deberá tener su correlato en P, pero no necesarimente a la inversa (en general, TXtendrá un mayor campo de aplicación que T). La correlación entre I(T) e l(T*), formalmente hablando, no será exactamente la misma relación que la que se da entre Mp(T) y Mp(T4), pues recuérdese que las aplicaciones intencionales son modelos parciales, esto es, subestructuras resultantes de "recortar" de los modelos potenciales sus constituyentes T-teóricos; sin embargo, es una relación "derivada" de la primera, en el sentido de que es esta misma restringida a las subestructuras en cuestión. Finalmente, el requisito de derivabilidad de las leyes adoptará en esta interpretación modeloteórica la siguiente forma. Aunque no podamos decir, en sentido estricto, que las leyes de T se deducen de Ias de P,no obstante podremos postular una condición intuitivamente análoga: siempre que una aplicación cumpla las leyes de P,es decir, sea extensible a un modelo actual de F ,y adernás cumpla ciertas condiciones específicas, es decir, sea extensible a un modelo actual de ulza especialización de F ,llamémosla Ff, entonces en T el correlato de esa aplicación cumplirá las leyes de la teoría reducida T, o sea, será extensible a un modelo actual de T. Podemos ahora sintetizar estos requisitos en la siguiente definición; en ella, denotamos añadiendo el subíndice 'e' a la relación que cualquier relación entre modelos potenciales genera a nivel empírico (T-noteórico): si p es una relación entre modelos potenciales, p, es el resultado de recortar los constituyentes T-teóricos de los modelos potenciaIes de 10s pares de p, esto es, p, = r[p]. La idea que hay detrás es que en la reducción no se usa "toda" la teoría reductora sino sólo parte de ella, determinada especialización (en la definición que sigue, y para simplificar la notación, no usaremos la noción de red teórica sino la de elemento teórico y consideraremos que la teoría reductora es un elemento teórico que tiene especializaciones; recuérdese que la relación o es la relación de especialización entre elementos teóricos, cf. cap. 10, $5).
Definición 11.3: Sean Mp(T), M(7), I(T), respectivamente, los conjuntos de modelos potenciales, modelos actuales y aplicaciones intencionales de T. y análogamente Mp(T*). M(T*), I(T*) respecto de T*. T es reducible a T:si y sólo si existe una relación p tal que: (1) P c M p ( 0 x MPV*). (2) I(T) E Dom Pt y pc[I(T)I G I(T*). (3) Vy, y* (
4.
Equivalencia
La relación de equivalencia entre teorías también ha jugado un papel considerable en discusiones epistemológicas generales, aunque quizá no de manera tan controvertida como en el caso de la reducción. La significación de la equivalencia en términos generales estriba en que, cuando ella se da, dos teorías que a primera vista parecen muy distintas por sus conceptos y Ieyes, resulta, no obstante, que "hablan de lo mismo" o que aportan la misma información sobre la misma porción de realidad. De ahí puede inferirse fácilmente la conclusión epistemológica general de que no tiene por qué haber univocidad en el tratamiento teórico adecuado de la misma parcela de nuestra experiencia. Diversas teorías pueden ser igualmente aptas para explicar e1 mundo que nos rodea, ninguna de ellas es la verdadera en un sentido absoluto. Así, por ejemplo, podemos desarrollar una teoría de las relaciones espaciales en la que partimos del concepto básico de "punto geométrico" y definimos las líneas como sucesiones infinitas de puntos; o bien, alternativamente, pode-
378
FUNDAhlE\TOS DE F I L O S O F DE ~ ~ LA CIENCIA
mos partir del concepto de "línea recta" como concepto básico y definir los "punros" como las intersecciones de líneas rectas. Si escogemos bien los axiomas dz una y oira teoría, la que trata primordialmente de puntos y la que trata primordialmente de h e a s , constataremos que, aunque aparentemente las dos teorías hablan de cosas distintas, ambas establecen exactamente las mismas relaciones espaciales entre los objetos que podemos comprobar en nuestra experiencia cotidiana, y en este sentido "hablan de lo mismo". En otro campo, el del movimiento de los cuerpos, constatamos que la teoría mecánica de Newton y la teoría mecánica de Lagrange, aunque construidas sobre conceptos y principios distintos, conducen a los mismos resultados empíricos sobre el movimiento de los cuerpos en general; por ello es frecuente leer en los libros de texto de física que la mecánica newtoniana y la mecánica lagrangiana son dos "formuiaciones equivalentes" de la mecánica clásica. Al tratar el tema de la equivalencia de teorías y sus consecuencias epistemclógicas conviene, sin embargo, distinguir dos tipos generales de equivalencia que muchas veces se confunden: la que podemos llamar equii~aleitciafuerte, o equivalencia "en sentido estricto", y la que llamaremos equivalencia empírica, que es más débil. En el primer caso, aunque conceptos y leyes de una y otra teoría sean distintos, hay una correspondencia plena y biunívoca entre ambas teorías, de modo que todo lo que puede decirse en la primera teoría puede traducirse sin pérdida de información a la segunda, y viceversa. Es decir, hay una correspondencia exacta entre ambas teorías tanto a nivel conceptual como a nivel del contenido de sus afirmaciones respectivas. El ejemplo de la correlación entre una "geometría de puntos" y una "geometría de líneas" es de esta naturaleza. En el caso de la equivalencia empírica, más débil, ese paralelismo sólo se da a nivel de los datos empíricos que cubren ambas teorías: todo dato predicho por una teoría es también predicho por la otra, y a la inversa. Y, sin embargo, puede que no haya una correlación plena ni entre los conceptos ni entre las Ieyes de ambas teorías, de modo que no pueden derivarse las leyes de una teoría a partir de las de la otra, ni a la inversa. En tales casos pueden existir serias divergencias teóricas entre ambas teorías, las cuales, no obstante, no se traducen en divergencias en el campo de lo que podemos experimentar: las teorías dicen "más" de lo que dice la experiencia que ellas cubren. Es en este caso en el que piensa Quine cuando insiste en la Tesis de la Indeterminación de la Teoría por la Experiencia: el mismo dominio de datos experimentales es igualmente compatible con dos o más teorías, las cuales, sin embargo, son incompatibles entre sí a nivel teórico (de ello nos ocuparemos por extenso cuando estudiemos en el próximo capítulo el problema de la inducción; recuérdese también el argumento de van Fraassen que examinamos en el capítulo 10). Si bien la equivalenciafierte o estricta aparece con bastante frecuencia no sólo en geometría, sino en la mayoría de las ramas de la matemática pura, es dudoso que ella juegue un gran papel en las ciencias empíricas propiamente dichas (excepto en casos triviales como el de dos teorías físicas que se distinguen solamente por un cambio de notación). Se ha solido señalar el ejemplo, ya mencionado, de la relación entre la mecánica de Newton y la de Lagrange como caso de equivalencia fuerte en la física; sin embargo,
un análisis formal detenido de este ejemplo, como el que se ha realizado dentro de la concepción estructuralista, muestra que la equivalencia fuerte es válida sólo si se hacen ciertos supuestos (generalmente implícitos) acerca de la estructura global de ambas teorías que están lejos de haber sido confirmados (cf. Balzer, iMoulines y Sneed, 1987, cap. VI, $5.1). La cuestión de la equivalencia "Newton-Lagrange" sigue, en realidad, abierta. Con más razón aún puede decirse ello de otros ejemplos que suelen aducirse en la física, como la supuesta equivalencia entre la mecánica de Newton y la de Hamilton, o entre la mecánica ondulatoria y la mecánica de matrices en la física cuántica; lo más probabIe es que éstos sean sólo casos de equivalencia empírica. Dada la importancia de la distinción entre equivalencia fuerte y equivalencia empírica, conviene establecerla de la manera más rigurosa posible, pues ello también puede facilitar el examen de ejemplos concretos. Utilicemos de nuevo para ello nuestro aparato modeloteórico habitual. Hemos dicho, de manera intuitiva, que en el caso de la equivalencia fuerte todo lo que puede decirse en una teoría halla su correlato exacto en la otra, y a la inversa; o sea que hay un paralelismo estricto tanto a nivel del aparato conceptual como de las leyes y sus aplicaciones. En nuestros términos modeloteóricos ello significa una correlación tanto a nivel de los modelos potenciales y aplicaciones intencionales como a nivel de los modelos actuales. Y tomando en cuenta la noción de reducción que hemos explicado más arriba es plausible entonces interpretar la equivalencia entre dos teorías como reducción "de doble vía": una teoría es equivalente a otra cuando la primera es reducible a la segunda y la segunda lo es a la primera. Llegamos así a la siguiente definición.
Definición 11.4:
TI es equivalente en sentidofiderte a Tz si y sólo si TI es reducible a T2 y T2 es reducible a T I (en el sentido de la Def. 1 1.3). La elucidación de la equivalencia meramente empírica no es tan inmediata y requiere de una decisión previa acerca de qué se debz entender por "igualdad de datos empíricos". En el espíritu de muchos autores está la idea de apelar a situaciones observacionales neutrales; sin embargo, en diversas ocasiones en esta obra hemos señalado el carácter problemático de la idea de una "observación pura", y hemos constatado la necesidad de separar en principio las nociones de observabilidad y empiricidad y admitir sólo una "empiricidad" relativa a cada teoría. Dentro de nuestro marco modeloteórico, esa noción viene fijada por el dominio de las aplicaciones intencionales de cada teoría. De acuerdo a esta interpretación, la equivalencia empírica entre dos teorías consistirá entonces en una equivalencia meramente al nivel de las aplicaciones intencionales: una correlación entre los dominios de aplicaciones intencionales de ambas teorías de tal naturaleza que, siempre que una aplicación intencional de una teoría sea extensible a un modelo actual de la misma (o sea, cumpla las leyes de esa teoría), entonces su conelato en la otra teoría cumplirá lo mismo, y recíprocamente. He aquí la especificación formal de esta idea
(para simplificar, no hacemos mención en ella de las restricciones cruzadas o condiciones de ligadura, cf. cap. 10, $5).
Definición 11.5: TI es ernpíricameiíte equii*aIeiztea T2si y sólo si existe una relación E tal que: (1) E c ](TI) x l(T2). (2) V ~ Iy2, ( C ~ Iy+, E E + C y t E r[M(Ti)] ++y2 E r[M(T:)])). Nótese que, en esta definición de equivalencia empírica, no se especifica nada acerca de cómo estén correlacionados los modelos potenciales de ambas teorías, si es que 10 están de alguna manera; tampoco se dice nada acerca de los modelos actuales; en particular, no se infiere de ella que si un modelo actual .ul de TI tuviera un correlato xz en T2,este último sería necesariamente también un modelo actual de T2.
5. Apéndice: Ciencia especial y ciencia básica; reducción, múltiple realizabilidad y superveniencia (*) En esta última sección vamos a retomar el problema de la relación entre las ciencias especiales y la ciencia básica. Aunque en la literatura se plantea el problema sobre todo en relación a la psicología y la neurociencia (problema mente-cerebro), conceptualmente el problema es general. Se trata de precisar la supuesta "relación de dependencia" entre diversos pares de disciplinas científicas; por ejemplo, psicologíalneurología, lingüísticaípsico-socioIogía,biologíaíquímica, o química/física; en realidad plantear esta cuestión para disciplinas enteras es inapropiado, lo adecuado sería hablar de la relación de dependencia entre teorías concretas de estos pares de disciplinas. La cuestión es pues determinar hasta qué punto las explicaciones de (teorías de) las ciencias especiales "descansan" en explicaciones de (teorías de) ciencias más básicas, hasta llegar eventualmente, mediante una cadena de sucesivas dependencias explicativas, a una supuesta ciencia básica (jrnicrofísica?). Hicimos algunas consideraciones preliminares sobre esta cuestión en el capítulo 5, cuando examinamos la noción de ley y también al comienzo de la sección 3 de este no estricta o ley ceteris paribus (W), capítulo, al presentar la idea de reducción. Vamos a examinar ahora las diferentes posiciones al respecto con un poco más de detalle. Aunque algunos aspectos de este problema se pueden tratar más satisfactoriamente desde una perspectiva modeloteórica global, vamos a limitamos ahora a la perspectiva axiomática "enunciativa" clásica, pues así es como se presenta y discute en la literatura y los aspectos a que nos vamos a ceñir en este apéndice pueden abordarse de modo interesante ya en términos tradicionales. Recordemos que en la perspectiva axiomática clásica las relaciones de dependencia o reducción se contemplan, no de forma global, sino de forma local, término-a-término (concepto-a-concepto, propiedad-a-propiedad). Se trata de ver hasta qué punto un
recurso conceptual de una teoría es "dependiente en su función explicativa" de otros recursos conceptuales de otras teorías "más básicas". O en términos de propiedades, hasta qué punto unas propiedades "macro" dependen de, o se reducen a, propiedades "micro". La intuición, p.ej. en el caso de la psicología, es que puesto que los psiquisrnos, las mentes, están alojados en los cerebros y éstos están compuestos de neuronas, las propiedades psíquicas dependen de algún modo de propiedades neurológicas; o puesto que Ias sustancias químicas están formadas por partículas físicas, las propiedades químicas dependen de algún modo (son el resultado) de propiedades físicas; y análogamente en los restantes casos. A Ias primeras las vamos a considerar teorías macro, y a las segundas teorías micro. Antes de abordar directamente este problema vamos a presentar dos distinciones importantes en relación al mismo.
5.1. D i s r i x c r o ~ ~PREVIAS: s TÉRSIINOS GENERALES, COSCEPTOS EXPRESADOS Y ENTIDADES DENmADAS; ACAECIS1IE.UTO-UEXIPLAR Y ACAECISIIENTO-TIPO Expresada en términos lingüísticos, la cuestión que vamos a tratar consiste en determinar cuál es la relación entre los conceptos expresados, y las propiedades denotadas, por los predicados de las teorías macro y los predicados de las teorías micro. La primera distinción tiene que ver con los diferentes niveles que se hallan involucrados en las diversas alternativas, el lingüístico, el conceptual o semántico, y el ontológico. En lo que sigue, distinguiremos cuidadosamente entre: a ) los términos generales o b) los conceptos (significados o predicados, como 'agua', 'rojo', 'sentir dolor', o 'H20'; contenidos conceptuales) expresados por los términos generales, como el concepto de agua, el de rojo, el de sentir dolor, o el de molécula formada por dos dtornos de hidrógetzo y ~ ( 1 2 0de oxígeno; y c) las entidades, sustancias o propiedades, denotadas por los términos generales, como la sustancia asua, la propiedad de ser rojo, la de sentir dolor, etc. (a diferencia del resto de la obra, en este apéndice no usaremos cursivas para las mayúsculas que refieren a propiedades porque las cursivas se reservan para los conceptos). Puesto que a veces se usa 'significado' de modo ambizuo, para referirse unas veces al concepto expresado y otras a la entidad denotada, en general tenderemos a no usar dicho término y hablar directamente de los conceptos expresados o las entidades denotadas; en la medida en que lo usemos, lo usaremos, salvo advertencia en contrario, con el primer sentido. Insistimos en que esta distinción es fundamental, pues se puede defender que aunque, los significados conceptuales de dos predicados de dos ciencias son diferentes, ambos denotan la misma entidad. La segunda distinción, en términos de la cual se suelen presentar las diferentes alternativas en la literatura, es entre acnecimientos tipo ( ' h p e ' ) y acaecimientos ejemplar ('token'). Recordemos (cf. cap. 5, $3) que los acaecimientos son determinada especie de entidades particulares. Un objeto particular es cualquier entidad espacial y10 temporalmente localizada (p.ej. el auto de Adela, esta pantalla de ordenador, el cuerpo calloso del cerebro de Quine, la iinagen de la estatua de Colón en el córtex de Pedro ayer a las 14,30, etc.); los acaecimientos particulares (tanto los procesos como los estados) son cualquier
cosa que ocurre o silcede en cierto lugar durante cieno intervalo temporal (p.ej. la batalla de Waterloo, el último partido de fútbol Barcelona-Madrid, la salida de Juan de la carretera ayer en la Costa Brava, etc.). Tanto objetos como acaecimientos son entidades particulares que pueden tener diversas propiedades. Un mismo objeto particular puede tener muchas propiedades diferentes (p.ej. esto que está aquí abajo tiene la propiedad de ser una silla. pero también las de ser azul, ser cómoda, estar aquí debajo, o ser mencionado en este libro); también un mismo acaecimiento particular puede tener di~ersaspropiedades (p.ej. eso que ocumó el martes sobre la estatua de Colón de Barcelona tiene la propiedad de ser la caída de un rayo, pero también las de ocunir de día, asustar a Rosa, producir un cortocircuito en el funicular, ocumr sobre la estatua de Colón, o ser mencionado en este escrito). Cada particular concreto (objeto o acaecimiento) es un caso o ejelttplar ('token') de las propiedades que ejemplifica. Dos ejemplares son del mismo tipo ('r)pe5)si comparten determinada propiedad. El auto de José y el de Adela son dos ejemplares diferentes de un mismo tipo (de objeto), Opel Corsa; la enfermedad de Rosa -y la de Pedro son ejemplares diferentes de un mismo tipo (de proceso), infección gripal; la disfunción de María y la de Fernando son ejemplares diferentes de un mismo tipo (de estado), amnesia; los estados mentales de Enrique y Eugenia en la Nochevieja de 1996 son ejemplares de un mismo tipo, creencia de que en el Año Nuevo de 1997 lloverá. Dos particulares son o no del mismo tipo dependiendo de las propiedades que se tomen en consideración. Si consideramos cierta propiedad, el vehículo de José y el de Adela son del mismo tipo, un automóvil Opel Corsa, y de diferente tipo que el de Eduardo, un Seat Ibiza. Si consideramos otra propiedad, los tres son del mismo tipo, a saber, "vehículo a motor ligero de cuatro rue.das3', y de diferente tipo, por ejemplo, que la motocicleta de Luis. Y aún, según otra propiedad, los coches de Adela, Eduardo y José y la motocicleta de Luis son del mismo tipo "vehículo terrestre a motor", y de diferente tipo que la bicicleta de Pedro o el barco de vela de Ana. Etcétera. Y lo mis~noocurre con 10s acaecimientos. Según se considere cierta propiedad, lo que le pasó a Juan ayer en la Costa Brava y lo que le pasó en Nochevieja a Rosa son acaecinljentos del mismo tipo, accidentes de auto, y de diferente tipo a lo que le ha pasado esta mañana a Luis, un accidente de tren. Pero si consideramos otra propiedad más abstracta o general, los tres acaecimientos son de1 mismo tipo, accidentes, y d e diferente tipo que lo acaecido en Año Nuevo a Marta, recibir un premio de lotería. Etcétera. Así pues, hablar de tipos de objetos o acaecimientos no es en el fondo sino otro modo de hablar de determinada propiedad que ejemplifican. Esta distinción es importante para no confundir cuestiones diferentes. La pregunta acerca de si la creencia de Enrique de que lloverá en el Año Nuevo de 1997 es o no la misma entidad que el acaecimiento cerebral de tener las neuronas H en el estado 23, es ambigua. Una cosa es si son el mismo acaecimiento tokelt y otra si son el mismo acaecimiento Qpe, esto es, el mismo tipo de acaecimiento: si la propiedad de ser tal creencia es la misma propiedad que la de tener tales neuronas en tal estado. Como veremos, puede defenderse que son el mismo acaecimiento-ejemplar pero diferentes acaecimientos-tipo, es decir, que es un único acaecimiento particular que tiene dos propiedades diferentes (análogamente a
como eso que ocurrió sobre la estatua dc Colón tiene propiedades diferentes). En lo que sigue será esencial tener presente esta distinción.
El grado máximo de dependencia entre una ciencia especia1 y una ciencia básica, o mejor entre predicados de la primera y de la segunda, es el reduccionismo sernántico: los dos predicados significan lo mismo, son sinónimos, expresan el mismo concepto. 0, si se prefiere, uno da el significado del otro: el concepto expresado por el predicado 'E' de la ciencia especial se reduce a, se identifica con, el concepto expresado por determinado predicado 'B' de la ciencia básica. Se trata pues de una identidad entre los conceptos expresados o significados por ambos predicados. Ejemplos independientes de la relación entre ciencias especiales y ciencia básica provienen de los casos usuales de sinonimia en los que una expresión explicita el significado conceptual de otra. Por ejemplo, 'soltero' y 'varón adulto no casado'; o más interesante, 'agua' y (supongamos) 'sustancia inodora e insípida, que en estado líquido es (sin impurezas) incolora y que (en diversas disoluciones) confornla los lagos, ríos y mares; que en estado sólido constituye las nieves, hielos, etc.'. Así, aunque las expresiones lingüísticas 'agua' y 'sustancia incolora, [etc.]' son expresiones linpüísticas diferentes, los conceptos agua y sustancia incolora, [etc.] son el mismo concepto, análogamente a como las diferentes expresiones 'silla' y 'chair' expresan el mismo concepto silla (aunque en este caso una no "da" el significado de la otra). Ésta es la tesis que defendía el cond~ictianológico sobre la relación entre lo mental y lo conductual. Según los conductistas lógicos (cf. p.ej. Hempel, 1949; Ryle, 1949 y Wittgenstein, 1958), los predicados mzntales expresan conceptos conductuales disposicionales. Por ejemplo, 'tener sensación de dolor' y 'tener la disposición a chillar en tales circunstancias, a retorcerse en tales otras, a [etc.]' tienen el mismo significado conceptual; e1 concepto sensación de dolor y el concepto tener la disposición a chillar si ..., a retorcerse si... [etc.] son el mismo concepto, en el mismo sentido en que aglia y sustancia inodora, ins@ida [etc.] son el mismo concepto. Y análogamente, por ejemplo, con los predicados 'creer que va a llover la próxima hora' y (p.ej.) 'tener la disposición a tomar un paraguas si se desea salir de casa, a recoger la ropa si no se quiere que se moje, a [etc.]'. Si el conductismo lógico fuese correcto, esto sucedería con todo predicado mentalista. El modo de evaluar una hipótesis sobre una identidad conceptual específica es determinando si es o no conceprrialtnetirs posible que se ejernplifique una propiedad sin que se ejemplifique otra. Si 'E' expresa el mismo contenido conceptual que 'B', entonces una situación en la que un particular tensa la propiedad E y no tenga la propiedad B es conceptualmente imposible. Alternativamente: si tal situación es conceptualmente posible (incluso aunque no sea nómicamente posible), entonces los conceptos expresados por ambos predicados no pueden ser el mismo (sobre posibilidad conceptual y nómica, cf. cap. 5, $1). Ésta es la estrategia que usó Putnam para "refutar" el conductismo lógico. Putnam (cf. 1963) diseñó un experimento mental que a su juicio presenta una situación
perfectamente concebible (aunque quizá biológicamente imposible) en la que unos sujetos (super-super-espartanos, los denomina) tienen dolor pero no tienen ninguna disposición a la conducta, no ya gestual sino ni siquiera verbal. El conductismo lógico radical tiene otros problemas, como los derivados del holismo de lo mental, que no vamos a comentar aquí. Tras su, por lo general reconocido, fracaso, algunos filósofos de la psicología han propuesto otra alternativa también re-duccionista conceptual pero mucho más plausible. Se trata delfirl~cioilalisinoai7alític0, según el cual los predicados mentalistas significan conceptos funcionales, donde un concepto funcional es un concepto que establece las relaciones de causa-efecto, el rol causal, de los estados de un sistema computacional (cf. p.ej. Putnam, 1967; Fodor, 1968 y Lewis, 1972; para una buena exposición, García-Carpintero, 1995).
El reduccionismo sernántico, incluso si se da en algunas ocasiones (por ejemplo, entre predicados mentalistas y funcionalistas, si los funcionalistas analíticos tienen razón), es demasiado fuerte para dar cuenta de todas las situaciones en que consideramos intuitivamente que unas explicaciones dependen de otras. Es obvio que si los conceptos expresados son los mismos, las propiedades denotadas también lo serán. Pero muchas veces ocurre lo segundo sin lo primero, los predicados denotan la misma propiedad aunque signifiquen conceptos diferentes. Este tipo de situación en la que términos lingüísticos que expresan contenidos conceptuales diferentes denotan o refieren una misma entidad son conocidas de antiguo y tematizadas en semántica al menos desde Frege. La distinción fregeana entre el sentido y la referencia de una expresión pretende justamente dar cuenta de ella; esto es lo que sucede con las descripciones 'la mujer de Edipo' y 'la madre de Edipo', puesto que ambas nombran a Yocasta, o en el ejemplo preferido de Frege, entre 'la estrella de la mañana' y 'la estrella de la tarde', que nombran a Venus. Pues bien, algo anáIogo sucede con algunos predicados o términos generales. Los casos interesantes, a nuestros actuales efectos, son aquellos en los que (contrariamente a lo que sucede con las diferentes descripciones para Venus o Yocasta) uno de los predicados se puede considerar más básico o más fundamental que el otro. Esto es lo que sucede, por ejemplo, con 'agua' y 'H2Oy, o con 'temperatura' y 'energía cinética media'. Hemos visto que 'agua' no significa conceptualmente lo mismo que 'H-O', 'agua' no expresa el concepto sustancia corzstiruida por ntoléculas foritzadas por dos átomos de hidrógeno y lrito de o.xíge?zo. Si significara dicho concepto, todo usuario competente del predicado 'agua' debería poseer dicho concepto, lo que no es el caso; dicho término se ha usado competentemente durante siglos antes del descubrimiento de la química molecular, antes de disponer del concepto de ri~olécula,y todavía hoy muchos de los usuarios competentes de dicho término no tienen ni idea de química. Y lo mismo sucede con 'temperatura', un predicado del lenguaje ordinario, y también de una teoría científica sencilla, la termodinámica fenomenológica, y 'energía cinética media', un predicado de la mecánica estadística. Aunque 'temperatura' y 'energía cinética media' significan conceptos diferentes (el primero se
usaba correctamente antes de saber nada de mecánica, y menos de mecánica estadística) de hecho denotan la misma magnitud física (algo que ignoran la mayoría de los usuarios competentes del primer predicado). La temperatura es la energía cinética media, como e1 agua es HrO. En este sentido una propiedad se redlee a, depende de, o descansa en otra; no son sólo los mismos fenómenos-ejemplar, sino los mismos fenómenos-tipo. Por tanto, no hay en realidad dos propiedades diferentes tales que una descanse en otra. SóIo hay diferentes conceptos, la propiedad es la misma. El reduccionismo ontológico, la identidad de propiedades, es la posibilidad más fuerte después del reduccionismo semántico. El modo más radical de explicar cómo es que fenómenos que describimos mediante aparatos conceptuales diferentes son tales que uno descansa en otro, consiste en que no haya en realidad dos tipos de fenómenos sino sólo uno. Ésta es la tesis que defienden en filosofía de la psicología los llamados teóricos de la identidad psicofísica (cf. p.ej. Feigl, 1958 y Smart, 1959). Según estos autores, aunque el concepto sentir dolor no es el mismo concepto que tener Iasfibras H activadas, la propiedad de sentir dolor es de hecho la propiedad cerebral de tener las fibras H activadas, en exactamente el mismo sentido en que ser de agua es la misma propiedad que ser de H20, o "tener mayor temperatura que" es la misma propiedad (relacional) que "tener mayor energía cinética que". Los predicados mentalistas son nombres diferentes, que expresan conceptos diferentes, para las propiedades cerebrales.
Las hipótesis sobre identidades ontológicas son hipótesis empíricas y se deben evaluar por tanto empíricamente, investigando si de hecho el predicado 'E' denota efectivamente la misma propiedad o sustancia que el predicado 'B'. En muchos casos es sencillo ver que no es así, que el reduccionismo ontológico es todavía una hipótesis demasiado fuerte. El ejemplo más sencillo lo ofrecen las propiedades disposicionales, como las denotadas por los predicados 'elástico', '~oluble','frágil' o 'rojo'. Estos predicados expresan un concepto según el cual un objeto tiene la propiedad en cuestión si en determinadas circunstancias reacciona de cierto modo (cf. cap. 8, $4). Así, por ejemplo, un objeto es frágil si en caso de que se aplicara sobre él determinada presión tangencia1 el objeto se quebraría; o una superficie es roja si en caso de que incidiera sobre ella luz blanca la superficie absorbería tales frecuencias del espectro. Pues bien, las propiedades disposicionales descansan en propiedades físicas. Si un objeto es frágil lo es en virtud de ser microfísicamente como es; si una superficie es roja lo es en virtud de ser microfísicamente como es. Se dice entonces que las propiedades disposicionales macro se reali,-mz mediante propiedades físicas micro. Lo característico de estos casos es que ahora no podemos explicar esta dependencia entre propiedades macro y propiedades micro del modo más sencillo, a saber, mediante la identidad de propiedades, pues claramente cada propiedad disposicional no se puede ide~ztlficarcon rrna ~ínicapropiedad nzicrofisica. Las propiedades disposicionales se reafizalz mediante propiedades microfísicas, pero simplemente ocurre que 13 propiedad microfísica que realiza la propiedad disposicional no es la
misma en todos los casos. En cada caso particular de objeto frágil, la fragilidad "se debe" a cierta propiedad microfísica del objeto, pero en diferentes objetos la propiedad rea!izadora es diferenre. En unos objetos, por ejemplo los de yeso, la fragilidad se realiza mediante una propiedad física; en otros, por ejemplo los de vidrio, se resliza mediante otra diferente. El yeso y el vidrio son ambos frágiles y sin embargo microfísicamente no tienen nada en común (salvo, claro está, que ambos "realizan" la fragilidad). Lo mismo sucede con el resto de las propiedades disposicionales. Por ejemplo, una determinada tela y una determinada superficie plástica pueden ser ambas rojas, pero microfísicamente no tienen nada en común; la propiedad microfísica que realiza la rojez es diferente en cada caso. A esta característica, ejemplificada típicamente por las propiedades disposicionales, se la suele denominar tnúltiple realizabilidad. Una propiedad macro es múltiplemente realizable si: a ) el que cada objeto particular la tenga depende de que el objeto tenga determinada propiedad micro, pero b) en diferentes objetos particulares la propiedad corresponde a diferentes propiedades rnicro. En tal caso, no sólo el concepto expresado por el predicado macro es diferente al expresado por predicados rnicro, sino que ni siquiera se puede identificar la propiedad macro con una propiedad micro determinada. Cuando las propiedades macro son múltiplemente realizables no es posible explicar la dependencia entre propiedades macro y propiedades rnicro reduciendo o ident@caiído las primeras con las segundas. En estos casos la identidad de tipos-propiedades, el reduccionismo ontológico, no es una explicación viable. Se puede pretender quizá que la propiedad inacro es idéntica, no a una propiedad micro "atómica" sino a una propiedad rnicro "disyuntiva". Así, si la propiedad macro E se realiza múltiplemente mediante las propiedades atómicas micro B1, B2, ..., Bn se podría identificar quizá la propiedad E con la "propiedad disyuntiva" B1-o-B2-...-o-Bri. Sin embargo esta estrategia del reduccionista requiere aceptar que cualquier disyunción (en general combinación) de propiedades es también una propiedad, lo cual en opinión de muchos requiere a su vez una metafísica de las propiedades inaceptable. Es muy implausible que cualquier predicado molecular denote una propiedad, al menos una propiedad izatural, que es de lo que aquí se trata. Una vez más surge aquí la cuestión de la diferencia entre propiedades "naturales" y "no naturales" en la que no vamos a detenemos aquí (cf. cap. 5, $2 y S6, y cap. 7,95 y $6). Según muchos críticos de la teoría de la identidad psicofísica, esta teoría está condenada al fracaso precisamente porque con las propiedades mentales pasa lo mismo que con las disposicionales, a saber, que aunque se realizan mediante propiedades neurobio-físicas, son también múltiplemente realizables y por tanto no se puede identifícar cada propiedad mental con una propiedad neuro-bio-física (de hecho, para muchos, las propiedades mentales son un tipo de propiedades disposicionales, a saber, propiedades funcionales). No sólo atribuimos algunas propiedades mentales básicas (p.ej. percepción de formas) a seres que no tienen una morfología neniosa como la nuestra (p.ej. pulpos), sino que, limitándonos a los humanos, ocurre que un mismo proceso mental, especialmente en capacidades complejas, puede realizarse mediante procesos cerebrales de diferente tipo; por ejemplo, cuando una zona del cerebro ha resultado dañada, una zona vecina morfológicamente diferente asume la función de la dañada (en esto consiste parte de la denominada plasticidad del cerebro).
RELACIONES IINTERTE~RICAS
DE PROPIEDADES CON IDENTIDAD DE EIEXIPLARB 5.5. DUALISMO
Y SUPERVENIENCIA
Cuando las propiedades macro se realizan múltiplemente mediante propiedades micro, no podemos explicar la dependencia de las primeras respecto de las segundas apelando a la identidad de tipos, a que simplemente las propiedades son idénticas. Y sin embargo hay que elucidar esa dependencia de algún modo, pues en un sentido preanalítico intuitivo unas "descansan" en otras (claramente en casos como las disposicionales y quizá también en otros casos). La dificultad reside en que en estos casos las propiedades micro realizadoras son efectivamente otras, esto es, dverentes a las propiedades macro que realizan. Así pues, cuando hay múltiple realizabilidad la identidad de tipos es inviable. Se pensará que todavía queda la identidad de ejemplares, pero la identidad de ejemplares por sí sola es demasiado poco, no puede dar cuenta de la dependencia entre los dos niveles. Pensemos en el acaecimiento en que se vio envuelto Juan ayer en la Costa Brava. Tenemos un mismo acaecimiento-ejemplar con diversas propiedades, por ejemplo, la propiedad de ser un accidente y la propiedad de ocurrir en primavera. Ambas propiedades son propiedades diferentes de[ mismo acaecimiento particular. Y no pensamos que haya una dependencia entre ambas propiedades, no pensamos que el que haya sido un ejemplar del tipo "accidente" depende de que haya sido un ejemplar del tipo "ocurrido en primavera", o viceversa. Sin embargo, en muchos casos, como los que involucran propiedades disposicionales, sí consideramos que hay tal dependencia. Aceptamos que un mismo objeto particular tiene diversas propiedades, la propiedad de ser frágil y la propiedad de tener tal y cual estructura microfísica, pero no nos basta con eso, pues creemos además que el que dicho objeto particular tenga la primera propiedad depende de que tiene la segunda. Aceptamos que un mismo acaecimiento-ejemplar tiene diversas propiedades, la propiedad de ser una sensación de dolor y la propiedad de activarse las fibras H, pero no nos basta con eso pues creemos además que el que dicho acaecimiento particular tenga la primera propiedad depende de que tiene la segunda. Debe quedar claro que si lo único que tenemos es identidad de ejemplares dicha dependencia queda inexplicada. Para dar cuenta de estos casos se recurre a la noción de szlperveniencia, un tipo de dependencia más débil que la identidad de tipos (aunque la incluye como caso extremo). La idea es la siguiente. Lo que distingue a los casos en que no hay dependencia (como el del accidente) de aquellos en que sí la hay (como el de la fragilidad) es, por decirlo tautológicamente, que en el primero la ejemplificación de una propiedad no depende de la ejemplificación por el mismo particular de otra propiedad. Es decir: el particular puede r un tener una propiedad y no tener la otra. El suceso de la Costa Brava podría ': ~ b e sido accidente sin haber ocurrido en primavera. Que un acaecimiento particular ejenplifique la propiedad de ser un accidente no depende de que se ejemplifique la de ocurrir en primavera. Eso no es así en los otros casos. Que un particular tenga la propiedad de ser frá,oil depende de que tenga determinada propiedad microfísica en el siguiente sentido: no puede ser que tenga ésta y no tenga aquélla. En general, pues, una propiedad rnacro E depende de (descansa en, se realiza mediante) una propiedad micro B si no es (fsicarnente)posible que un particular .r ejemplifique B y no ejemplifique E. Nótese que la conversa puede no
388
FUNDAhlEhTOS DE F I L O S O F DE ~ ~ LA CIENCIA
ser cierta, y de hecho no lo es, debido a la múltiple realizabilidad.pues E puede realizarse mediante otras propiedades micro B', B", ..., por lo que x puede ser E sin ser B (la conversa sólo es cierta cuando vale la identidad de tipos). Ésta es la idea de dependencia que intenta expresar la noción de supeweniencia. Una propiedad A superviene en otra B si no puede ser que un particular ejemplifique B y no ejemplifique A. En realidad la relación de supenreniencia se suele caracterizar, no para propiedades sueltas, sino para grupos de propiedades. Así, por ejemplo, decimos que las propiedades cromáticas supervienen sobre propiedades rnicrofísicas si no puede ser que dos particulares tengan las mismas propiedades microfísicas y no tengan la misma propiedad cromática; o que las propiedades mentales supervienen sobre propiedades bio-físicas si no puede ser que dos sujetos estén en el mismo tipo de estado bio-físico (el misnw en seno, e.e. compartiendo todas las propiedades bio-físicas) y estén en diferente estado mental. En general, las propiedades de la clase
CIENCIA ESPECIAL
CIENCIABASICA
-
~ l ( x ) 62(x)...
En(*...
BMx)...
8'1(fi
B'2(y) ...
Wp(y)...
Esta situación ilumina, según Fodor, un hecho aparentemente paradójico, a saber, que las leyes de las ciencias especiales tengan excepciones a pesar de que descansan sobre leyes de la ciencia básica que no tienen excepciones. Si la situación de dependencia es la mostrada por el gráfico, entonces podemos explicar las excepciones de la ley especial aun en los casos en que todas las leyes de la ciencia sobre la que descansa sean estrictas. Las excepciones corresponderían a los casos en que la propiedad macro (E) del acaecimientotipo antecedente de la ley especial se realiza mediante alguna propiedad micro (p.ej. Bn) que no está nómicamente conectada mediante una ley básica con ninguna propiedad micro que realiza la propiedad macro (E*) del acaecimiento-tipo consecuente (de todas formas, el propio Fodor ha cuestionado la viabilidad de esta explicación cuando se trata de propiedades funcionales, cf. Fodor, 1991). Para concluir con la noción de superveniencia conviene enfatizar que esta noción por sí sola simplemente elucida qué entendemos por dependencia, pero (salvo en el caso extremo de que la superveniencia se derive de la identidad) no explica metafísicamente a qué se debe tal dependencia. ¿Cómo es que unas propiedades supervienen sobre otras en 10s casos en que no hay identidad?, ¿qué vínculo metafísico hay entre ambas propiedades del que se deriva la superveniencia? Una posibilidad es tomar la relación de superveniencia como un primitivo metafísico bruto, algo que muchos se niegan a aceptar. Los recelos hacia esta posición hacen que algunos terminen cuestionando la legitimidad de las propiedades macro y sostengan que hay conceptos macro pero no propiedades macro; los predicados macro serían términos como 'jade' o 'cáncer', que no denotan una única propiedad, son términos ambiguos que en cada ocasión denotan alguna de entre varias propiedades básicas. O de otro modo, si se quiere considerar que denotan propiedades, éstas deben ser en todo caso propiedades "de segundo orden", donde una propiedad de segundo orden es la "propiedad consistente en tener alguna de entre tales y cuales propiedades básicas".
5.6. D u ~ ~ r s hDE f o PROPIEDADES CON IDEhTiDAD DE EJEMPLARES Y EPIFENOMENISMO
En relación con el último problema apuntado surge otra cuestión relativa a la eficacia causal de las propiedades macro y que aquí sólo apuntaremos. La cuestión es la
390
FUNDAXfE3TOS DE F I L O S O FDE ~ L.4 CIENCIA
siguiente (ignoraremos ahora las excepciones de la ley macro). Si cada acaecimiento antecedente de la ley especial es también un acaecimiento antecedente de una ley básica (de diferentes leyes en diferentes casos) y las propiedades micro son sin duda causalmente eficaces, ¿para qué son necesarias las propiedades macro? Un acaecimien:~ particular causa o produce otro en virtud de que ejemplifica determinada propiedad (cf. cap. 5, 93). Si hay causalidad básica, la propiedad en virtud de la cual un acaecimiento causa otro es determinada propiedad micro Bi, pero entonces parece que la propiedad macro E es superflua, causalmente ineficaz o causalmente redundante. Éste es el problenza de la exclusiór~e~plicatii~a (cf. p.ej. Kim, 1987), y es lo que motiva las posiciones epifenornenistus. Se dice que una propiedad A es un epifenómeno de una propiedad P si A "se debe" a la presencia de B pero A es causalmente ineficaz. En filosofía de la psicología se ha atribuido esta posición al monisiíto anóinalo de Davidson (aunque él mismo no acepta ser calificado de epifenomenista, cf. Davidson, 1970 y McLaughlin, 1984).
El epifenomenismo acepta la existencia de las propiedades macro, la identidad de ejemplares y la superveniencia, pero rechaza que las propiedades macro sean causalmente eficaces. Son "un lujo ontológico", por así decir. Esta posición le parece inaceptablemente conservadora al eliminacionista, que comparte con aquél los recelos sobre la eficacia causal de las supuestas propiedades macro pero no tiene sus escrúpulos conservadores. Si no hay eficacia causal, no hay propiedad. Según el eliminativista, los predicados macro expresan conceptos a los que no corresponde ninguna propiedad en el mundo, como ocurrió con el predicado 'flogisto' de la química del siglo XI~III. Hay concepto pero no hay propiedad, por tanto lo mejor, como en el caso del flogisto, es dejar de emplear el término, eliminarlo del lenguaje de la ciencia (exactamente igual que se eliminaron del lenguaje de la meteorología !os nombres de los dioses griegos y de sus "estados"). En filosofía de la psicología defienden una postura semejante los Churchland (cf. p.ej. Churchland, 1981 y 1984). Debe quedar claro que el eliminativismo ni siquiera admite la identidad de ejemplares, el motivo es obvio: si no hay propiedades macro (ni idénticas ni diferentes de las propiedades rnicro), entonces ni siquiera se puede plantear la cuestión de si un evento que ejemplifica una propiedad macro es o no el mismo acaecimiento-ejemplar que ejemplifica una propiedad rnicro; no hay propiedades macro y no hay por tanto acaecimientos que tienen propiedades macro.
El eliminacionismo (acerca de una determinada ciencia especial) rechaza la identidad de ejemplares, pero porque no hay propiedades macro (denotadas por los predicados de dicha ciencia especial). Pero se puede rechazar la identidad de ejemplares incluso si se acepta la existencia de propiedades macro. Esto es lo que defiende el dualista de ejempla-
res. Hay efectivamente propiedades de los dos niveles y son propiedades diferentes, pero se ejemplifican en acaecimientos particulares también diferentes. En filosofía de la psico-
logía se puede asimilar a esta posición 10s diversos tipos de dualismo de sustancias (p.ej. Descartes, Eccles) y de paralelismos (p.ej. la armonía preestablecida de Leibniz o el ocasionalisn~ode Malebranche).
En el capítulo 3 examinamos la metodología de la contrastación de hipótesis sin detenernos en los aspectos filosóficamente problemáticos. En particular, aplazamos la discusión epistemológica de dos cuestiones centrales en la contrastación, a saber, la naturaleza de la inferencia inductiva y el estatuto de la Condición 2 relativa a la relación entre la falsedad de la hipótesis y la improbabilidad de la predicción. En el presente capítulo vamos a volver sobre estas cuestiones en el marco más amplio del probIema de la inducción. Éste es un problema de larga tradición filosófica que ha recibido diversas fonnulaciones y tratamientos, algunos de los cuales entroncan directamente con las cuestiones que entonces aplazamos. En este sentido, la finalidad principal del presente capítulo es estudiar .los problemas epistemológicos relativos a la metodología de la contrastación de hipótesis. En la presentación metodológica advertimos que no distinguíamos en ese contexto entre leyes y teorías, refiriéndonos indistintamente a ambas como hipótesis teóricas. Después del camino recorrido, sabemos ahora que leyes y teorías son entidades muy diferentes; las teorías, como establecieron informaImeiite los filósofos historicistas y precisan después algunas concepciones semánticas, son entidades estructuralmente complejas y estratificadas (redes teóricas). Cabe presumir que esta complejidad estructural de las teorías es relevante a la hora de su evaluación epistémica y que, por tanto, la diferencia entre leyes y teorías debe desempeñar alguna función en el problema de la inducción. Sin embargo, como veremos, hasta hace relativamente poco dicha diferencia no ha desempeñado apenas papel alguno. El motivo es que el problema de la inducción se ha planteado mayoritariamente en el marco de la concepción axiomática, donde la diferencia entre leyes y teorías tiene menor trascendencia pues el análisis axiomático tradicional, tal como se realiza en la Concepción Heredada, no refleja el caráctzr estratificado y reticular de las teorías. Por ello, en las primeras secciones vamos a ver el problema de la inducción referido a cualquier tipo de hipótesis, esto es, indistintamente a leyes y teorías; deberemos esperar a las críticas de los historicistas al refutacionismo de Popper (sección 5 ) para ver el papel que juega la complejidad estructural de las teorías a la hora de su evaluación episténiica y su eventual aceptación o rechazo. Antes de ello, presentaremos en las dos
393
F L ~ N D - ~ ~ ~ ~ DE E ~ HLOSOF~A TOS DE LA CIENCIA
primeras secciones el problema tradicional de la inducción en términos generales y las principales aproximaciones al mismo. En las secciones 3 y 4 examinaremos dos de tales aproximaciones, el inductivismo y el falsacionismo (para un estudio más detallado cf. p.ej. Kneale, 1949; Lakatos, 1968a; Glymour, 1980, caps. 11 a IV y Rivadulla, 1991; algunas buenas antologías sobre el tema son Kyburg y Nagel (eds.), 1963; Lakatos (ed.), 1968; Camap y Jeffreys (eds.), 1971 y Cohen y Hesse (eds.), 1980). Para simplificar la exposición, dejaremos ahora al marzen tanto las leyes probabilistas como las no estnctas (cf. cap. 5) y limitaremos por tanto el problema de la inducción a hipótesis estnctas no probabilistas.
1. Evaluacióii epistémica. El problema de la inducción
Presentado del modo más conciso posible, el problema de la inducción consiste en determinar el sentido preciso en que podemos decir que ciertos datos empíricos confieren apoyo o justificación a una hipótesis, hipótesis que no es implicada deductivamente por los datos; y la dificultad básica a la que se enfrentan una y otra vez los diversos intentos de resolver este problema es, en sus diversas versiones, la infradeterminación de la hipótesis por la experiencia. La justificación de la hipótesis mediante los datos se supone que representa algún tipo de itlfei-eizcia de los datos hacia la hipótesis, pero la inferencia no es deductiva, la hipótesis no está "plenamente contenida" en los datos-premisas. La hipótesis excede el contenido de los datos y por tanto la inferencia no es explicitativa sino auntentativa o at>zpliatii~a.
Es común caracterizar la inducción (del griego 'epagogé') como el paso o inferencia de lo particular a lo general y el problema de la inducción como el problema de identificar el método-procedimiento correspondiente a dicho paso o inferencia. Pero esta caracterización es ambigua, pues hay dos sentidos de 'paso' o 'inferencia'. En un primer sentido, pasar de lo particular a lo general, inferir lo segundo de lo primero, significa fonnular o idear hipótesis (leyes, teorías) generales a partir de la observación de hechos particulares. si por 'inducción' se entiende eso, entonces no hay ningún problema de la inducción, pues simplemente no hay ningún método-procedimiento para idear una determinada hipótesis general a partir de cierta serie finita de hechos particulares observados. Es cierto que hay un procedimiento para generar rodas las correlaciones funcionales posibles compatibles con una serie de datos particulares, pero en la formulación de hipótesis científicas concretas no interviene dicho procedimiento. Los científicos formulan sus hipótesis generales sin partir de la colección de las (infinitas) alternativas lógicamente posibles. Usualmente se formula una única hipótesis, y más raramente dos o a lo sumo tres, y la formulación o invención de estas hipótesis no se atiene a ningún procedimiento
mecanizable. La formulación de hipótesis es un proceso esencialmente creador (conjetural, dirá Popper) e irreducible a un conjunto de reglas metodológicas. Seguro que hay algunas prácticas o "trucos" que a veces los científicos siguen, o incluso constricciones metodológicas generales relativas a la simplicidad, la elegancia, la coherencia con otras hipótesis, etc., pero ello no basta para dar cuenta del proceso de formación d e hipótesis, pues siempre hay más hipótesis alternativas lógicamente posibles que satisfacen estas constricciones que las que finalmente se formulan. Así pues, en el primer sentido de 'inducción', inducción como proceso de ideación y formulación de hipótesis generales, no hay un método ind~ictivo.La vieja aspiración de F. Bacon y de Mill (si se entienden de este modo sus cuatro reglas inductivas de las diferencias, las semejanzas, los residuos y las variaciones concomitantes, cf. Mill, 1904) es irrealizable. El proceso cognitivo de creación de hipótesis contiene elementos psicológicos ineliminables cuya explicación corresponde más a la psicología de la ciencia que a la metodología. En este sentido tampoco hay, por tanto, un problema metodológico de la inducción. Como ya vio parcialmente Whewell (1 858). el problema de la inducción no es relativo a la creación de hipótesis sino a su jrtstificación. En este segundo sentido de 'inducción', la inducción como paso de lo particular a lo universal (inferir lo segundo de lo primero) significa justQicar hipótesis generales a partir de hechos particulares. Es aquí donde se plantea el problema de la inducción, pues toda justificación es por su propia naturaleza normativa y la cuestión es qué normas o rzglas rigen la justificación inductiva. Estos dos sentidos de 'inducción' se corresponden, grosso modo, con la famosa distinción de Reichenbach (1935) entre contexto de describrimiento y contexto de justifícación. El problema epistemológico de la inducción no es un problema relativo al contexto de descubrimiento sino al contexto de justificación. O en términos más actuales, al contexto de evaluación episrémica. Hay varios respectos en que se puede evaluar una hipótesis (ley, teoría) científica, y el epistémico es sólo uno de ellos, el que corresponde a la noción tradicional de justificación (para una crítica y ampliación de la distinción de Reichenbach, cf. Echeverría, 1995, cap. 11). En adelante nos vamos a limitar aquí al segundo sentido de 'inducción'; por tanto, salvo advertzncia en contra, por 'inferencia' se deberá leer 'inferencia justificativa'. Por otro lado, vamos a usar aquí 'inducción (justificativa)' en su acepción más general, esto es, para cualquier tipo de inferencia ampliativa. Las inferencias demostrativas, o deducciones, proporcionan también justificación: si de a,,..., a, se deduce p, entonces la verdad de (o la creencia justificada en) a,, ..., a,justifica la verdad de (la creencia en) p. Pero, como ya vimos en el capítulo 2, estas inferencias no son ampliativas: el contenido factual de B está incluido en el contenido factual de a,A ... A cr,, justamente por eso no puede ocurrir que a,, ..., a, sean verdaderas y B falsa. Si hay inferencias que no son de este tipo, si hay justificación no demostrativa (y éste es precisamente el problema de la inducción), entonces tales inferencias son ampliativas: el contenido de lo justificado no está incluido en el contenido factual de lo que le proporciona justificación. A cualquier justificación de este tipo la consideraremos inductiva. Algunas veces se usa el término 'inducción' en una acepción más estricta, aplicado sólo a uno de entre los diversos tipos de inferencias ampliativas. De entre ellos, los
son los siguientes. En la i~lditcciónpor enitmeración se justifica una generalización a partir de la constatación de una serie de sus instancias, p.ej. cuando infiero que todas las esmeraldas son verdes a partir de que todas las esmeraldas que he observado lzasta la feclza son verdes. La inducción por enumeración, aunque quizá es la más smcilla, no es el único tipo de inferencia ampliativa, ni siquiera el más usual en contextos científicos. En la iiiducción estadístico-probabilisra se justifica una hipótesis particular a partir de una regularidad estadística o probabilista, p.ej. cuando infiero que Juan tendrá problemas pulmonares a partir de que es un fumador compulsi\~oy de que la práctica totalidad de los fumadores compulsi~~os padecen enfermedades pulmonares. En la itducciórz por eliminación infiero cierta hipótesis a partir de la eliminación del resto de hipótesis alternativas; para que este método sea propiamente inductivo, y no deductivo, al menos una de las eliminaciones de las alternativas ha de ser a su vez inductiva. En la inferencia a la inejor euplicación, llamada también por algunos autores abducción, se justifica una hipótesis porque ella explica (implica) cierto hecho observado; p.ej. cuando infiero la presencia de humanos a partir de la presencia de ciertas huellas en la playa (esta inferencia se reduce en .el fondo a la estadística si se considera que incluye como premisa implícita una premisa del tipo "usualmente las huellas de humanos son producidas por humanos"). Otra inferencia ampliativa, la más usual en contextos científicos, es la que constituye el denominado inétodo hipoféfico-deductivo,que es ni más ni menos que el patrón evaluativo que presentamos en el capítulo 2: de la hipótesis (junto con ciertos supuestos y condiciones iniciales) se deduce determinada predicción, que caso de cumplirse proporciona cierto prado de justificación a la hipótesis. Después del examen que hicimos, debe estar claro que debería denominarse 'método hipotético-deductivo-inductivo', pues contiene elementos claramente inductivos. En la versión que dimos de este método, se trata en realidad d e un caso complejo de inducción probabilista, pues la inferencia incluía una premisa probabilista, la Condición 2. Éstos son los principales tipos de inferencias ampliativas (cuando la hipótesis justificada no es ella misma probabilista). En todas ellris el contenido factual de la hipótesis justificada no está incluido en el contenido factual de la base de justificación, de los datos que se usan de evidencia; es posible que la base de justificación sea verdadera y la hipótesis sea falsa, en eso consiste su carácter ampliativo o no demostrativo. Esta caracterización pone inmediatamente de manifiesto el problema principal con que se enfrentan estas inferencias en tanto que presuntamente justificativas: si, aun siendo verdadera la base d e justificación, la hipótesis justificada puede ser falsa, ¿en qué sentido la base de justificación justifica la hipótesis? Éste es, brevemente formulado, el problema de la inducción; todas las formulaciones del mismo no son más que variantes de esta cuestión básica. O mejor dicho, en tanto que problema, surge de aceprar que hay inferencias anlpliativas justificativas. Pero es difícil negar que hay inferencias ampliativas. Desde una perspectiva empirista mínima, todo conocimiento empírico se inicia en la experiencia y la experiencia es siempre experiencia de hechos particulares. Sin embargo el conocimiento empírico contiene aseveraciones genuinamente generales. En la medida en que las aseveraciones empíricas generales estén justificadas, su base de justificación se retrotrae en última instancia a una serie finita de
E V A L U A C I ~ NDE LAS TEOR~:\SY EL PROBLEbIA DE LA I N D U C C I ~ N
1
l
I
1
1
i
I
1
1
397
hechos particulares. Pero a ) las aseveraciones generales estún justificadas, de otro modo no las consideraríamos conocimiento, y b) su contenido factual excede el de la serie de hechos particulares que constituye su base de justificación. Así pues, parece que el conocimiento en general, y la ciencia en particular. usa justificaciones ampliativas, inducciones. Es aquí donde se plantea la cuestión: ¿en qué sentido estas inferencias ampliativas son justificativas? Como sabemos, fue Hume el primero en cuestionar esta estrategia empirista. La solución (o disolución) escéptica de Hume consiste en rechazar a): ningún tipo de inferencia arnpliativa es justificativa, las creencias generales o sobre el futuro, incluso si resultan de hecho verdaderas, no constituyen conocimiento pues no están justificadas (cf., para lo que sigue, Hume, 1748, Libro 1, Parte 111, sec. VI). El paradigma de inferencia arnpliativa es para Hume la inducción por enumeración, la proyección de casos observados a nuevos casos. Para que tal proyección fuese "conforme a la razón", debería disponerse de un principio de rtrziformidnd de la natrtraleza, que establece que "los casos de los que no hemos tenido experiencia deben ser semejantes a aquellos en que sí la hemos tenido". Este principio debe ser, o bien a priori ("basado en argumentos demostrativos"), o bien empírico. No puede ser a priori, justificable mediante una inferencia demostrativa, pues las inferencias demostrativas descansan en el principio de no contradicción y no es contradictorio suponer (concebir) "un cambio en el curso de la naturaleza". Pero su justificación tampoco puede ser empírica, pues tal justificación se basaría en casos observados y requeriría del mismo principio para ser justificativa. Así pues, tal principio no está justificado conforme a razones y sin él las inferencias ampliativas no proporcionan justificación: "[D]espués de que la experiencia nos haya informado de su conexión constante, nuestra razón es incapaz de convencemos de que tengamos que extender esa experiencia más allá de los casos particulares observados" (lb. primero, parte 111, sec. IV). Como declara explícitamente Hume, no se niega la "justificación psicológica" de la proyección, sino que a dicha tendencia psicológica corresponda una justificación objetiva: "Suponemos que debe haber una semejanza entre los objetos experimentados y los que están más allá de nuestra experiencia actual, pero nunca podremos probarlo" (ibid., cursivas nuestras). Después de doscientos cincuenta años la epistemología sigue buscando una respuesta satisfactoria al reto escéptico de Hume. Nótese que, planteado en sus estrictos términos, el argumento de Hume no tiene escapatoria. Si por ' a justifica p' se entiende que la verdad de a garantiza plenamente la verdad de P, no hay nada más que hablar. En ese sentido, las únicas inferencias justificativas son las demostrativas; las inferencias ampliativas, por su propia definición, no son justificativas. Eso es así aunque se pretenda algo aparentemente más débil, a saber, que aunque no todas las inferencias ampliativas garantizan la verdad de la conclusión, la mayoría sí lo hace. El argumento de Hume no se ve afectado por esa aparente variación. Lo que el argumento muestra no es sólo que no podemos justificar que todas las inferencias ampliativas con premisas verdaderas tienen conclusiones verdaderas, sino que no podemos justificar eso de ninguna de ellas. El argumento de Hume, de ser conecto, obliga a rechazar una de las tres cosas siguientes: (1) la ciencia (caso de ser verdadera) proporciona conocimiento, esto es, creencia (verdadera) jrtstificada; (2) la ciencia usa inferencias ampliativas; (3) la justificación
preserva la verdad. Hume rechaza (l), la ciencia procede de hecho inductivamente pero la inducción no proporciona justificación. Popper aparentemente rechaza (2), la ciencia no pretende justificar hipótesis a partir de datos empíricos (cf. más adelante 34). La mayoria de los restantes filósofos rechazan (3). Para este último grupo de filósofos, hay justificaciones que no preservan la verdad. Eso no quiere decir que renuncien a vincular las nociones de justificación y ilerdad, sólo renuncian a establecer dicho vínculo en los términos tan fuertes de Hume. Algunas justificaciones (las ampliativas) no preservan la verdad pero, por así decir, sí la "transfieren parcialmenteo'. El problema es precisamente si se puede concretar esa idea de modo suficientemente preciso sin perder el vínculo entre justificación y verdad. Las diferentes alternativas recurren casi siempre de alguna forma u otra a la probabilidad. En las inferencias ampliativas la verdad de la base de justificación (premisas) no garantiza plenamente la verdad de la conclusión, sólo la garantiza parcialmente, hasta cierro grado, con cierra probabilidad: las justificaciones no demostrativas nos justifican en creer que si las prernisas son verdaderas la conclusión es probablemente verdadera. Ésta es la idea que defienden los inductivistas y que sus detractores consideran conceptualmente inconsistente. El reto de los primeros es dar un sistema de justificación ampliativa a la vez preciso y consistente.
N NUEVO ENIGMA DE LA INDUCCIÓN 1.2. LASPARADOJAS DE LA C O N F I R ~ ~ A CYI ~EL
La intuición básica que hay tras el inductivismo se encuentra ya explícitamente formulada en la rudimentaria teoría de la confirmación de Nicod para afirmaciones condicionales generales: la presencialausencia de B en un caso de A confirma/invalida la ley "A ilnplica B" (cf. 1930, p. 219). La confirmación de una ley se produce mediante la constatación de instancias posirivas o ejemplificaciones de la ley. Nicod considera la confirmación como inferencia ampliativa, pues acepta que un dato e confirme una ley o hipótesis h y que a pesar de el10 pueda ocurrir que e sea verdadero y h falso. Este concepto de confirmación es puramente cualitativo, no recoge el aspecto gradual de la justificación inductiva. Este concepto es tal que, dados e y 11, determina simplemente si e confirma (apoya, justifica) o no la hipótesis h. Para recoger la dimensión gradual de Ia justificación inductiva es preciso al menos un concepto coniparaiivo de confirmación, según el cual dados e, 11, e' y h' se pueda determinar si e confirma h tanto o más que e' confirma h'. Si este concepto comparativo es suficientemente rico, permite generar un concepto niétrico de confirmación (cf. cap. 4, 64 sobre la relación entre conceptos métricos y comparativos), esto es, uno según el cual dados e y h se pueda determinar que e confirma h en grado r. Para cada uno de estos tres conceptos usaremos, respectivamente, las letras 'C', 'K' y 'c': 'C(h, e)' significará que la evidencia e confirma la hipótesis h; '(11, e)K(hf, e')' que e confirma 12 tanto o más que e' confirma h'; y 'c(h, e) = r' que e confirma h en grado r. Más adelante nos detendremos en los conceptos comparativo y, sobre todo, métrico de justificación inductiva. En esta introducción nos basta el concepto puramente cualitativo para ver ya algunos aspectos problemáticos de la noción de confirmación entendida en el sentido de Nicod. Vamos a ver, en particular, las paradojas de la confinnaciólt de Hempel
EVALUAC~~': DE LAS TF.OR~ASY EL PROBLEMA DE L A I N D U C C I ~ N
399
y el nuevo enigma de la inducción de Goodman, sobre el que ya dijimos algo en el capítulo 5 (52). Hempel toma el criterio de confirmación de Nicod para afirmaciones generales condicionales sólo como condición suficiente (no necesaria) para la confirmación cuaiitativa de tales afirmaciones y presenta algunos ejemplos que resultan prima facie paradójicos (cf. 1943, 1945, 1966b). El ejemplo más famoso es el de la contraposición. Consideremos la ley (L1) "Todos los cuervos son negros".' Según el criterio en cuestión, L1 es confirmada por la presencia de una cosa que sea a la vez cuervo y negra. Por otro lado, L1 es lógicamente equivalente a (L2) "Todas las cosas no-negras no son cuervos", que de acuerdo con el criterio es confirmada por instancias positivas, p.ej. una hoja verde. Ahora bien, parece razonable aceptar cierta condición de eq~iivalenciasegún la cual si una evidencia e confirma una hipótesis h, entonces confirma toda hipótesis h' equivalente a h. La idea es que la confirmación afecta al contenido, independientemente de la forma específica en que éste se exprese. De lo anterior se sigue la consecuencia aparentemente paradójica de que la presencia de una hoja verde confirma la ley de que todos los cuervos son negros. En general, puesto que (HI) "Vx(Ax -+ Bx)" es equivalente a su contraposición (H2) "Vx (7 Bx + Rr)", la ocurrencia de Aa A -I Bu" es según el criterio de Nicod una confirmación de H1. Lo mismo sucede con otras equivalencias. Por ejemplo, HI es equivalente al condicional (H3) "Vx (AYv -I AY+ 7 Ax v Bx)", que según el criterio, para el ejemplo que nos ocupa, es confirmado por la presencia, tanto de cualquier cosa que no sea cuervo (sea o no negra), como de cualquier cosa negra (sea o no cuervo), y por la condición de equivalencia las mismas evidencias confirmarían el original '"Todo cuervo es negro". Por otro lado, H1 también es equivalente a (H4) "Vx (Ax A Bx + Bx A 7 Bx)", pero H3 no puede tener ninguna instancia positiva en el sentido de Nicod, pues su consecuente es contradictorio, y entonces puesto que es equivalente a H1 ésta tampoco podría tenerla. Hempel concluye que, contra lo que en principio parece, no hay nada realmente problemático en estos hechos. Para empezar con H4, que no pueda tener instancias positivas sería un problema si el criterio de Nicod se considerase una condición necesaria además de suficiznte, pero ya hemos advertido que no es así. Los casos interesantes son H2 y H3. La posición de Hempel, que considera correctas tanto la idea básica de Nicod como la condición de equivalencia, es que la impresión de que una instancia positiva de H2 (o H3) no constituye una confirmación de H1 es errónea si nos restringimos al concepto puramente cualitativo de conjnnación. La impresión la produce la idea errónea de que una generalización "habla sólo" de las cosas que satisfacen la propiedad antecedente. Supongamos, dice Hempel, que en la habitación de al lado hay un objeto x que no es negro. L1 dice algo de él, a saber, que no es cuervo, y por tanto si efectivamente x resulta 7
''7
1. Mantenemos el ejemplo de Hempel por haberse institucionatizado en la literatura sobre inducción, pero sería más adecuado usar otro. El motivo es que, como vimos en el capítulo 5 (§2), la confirmación por instancias no se aplica a cualquier regulxidad sino sólo a Ias nómicas o leyes, y entonces dijimos que la regularidad sobre el color de los cuervos muy probablemente no se podía considerar nómica. El lector puede aplicar todo lo que se diga en adelante a cualquier otra regularidad clxmente nómica, p.ej. "Los metales se dilatan al calentarlos".
no ser cuervo, podemos considerar legítimamente que nuestra hipótesis se ha confirmado. Así, Hempel no considera estas supuestas paradojas de la confirmación como una objeción contra el criterio cualitativo. Ahora bien, dice Hempel, ello no iguala a todas estas hipótesis en todos los respectos; hay algo acertado en la intuición de que hay alguna diferencia en el valor confirmatorio para H1 de "Aa A Ba", "7Aa A 1 Ba" y "1Aa v Bu", pero para mostrarlo es necesario abandonar el concepto puramente cualitativo y pasar al comparativo. Decir que las tres confirman H1 es compatible con decir que las tres lo hacen en diferente grado, y es posible dar cuenta de esta diferencia si se maneja un concepto comparativo o métrico de confirmación (cf. 1966b, pp. 120-121). En la versión de Nicod, el criterio cualitativo tiene importantes limitaciones, pues sólo es aplicable a afirmaciones generales condicionales. Para superar estas limitaciones, conservando el núcleo de la idea, Hempel construye un concepto alternativo de confirmación cualitativa. Más adelante nos detendremos en él; por ahora sólo nos interesa señalar que, como Hempel insiste, es también como el de Nicod un concepto puranterzre si~zráctico: toma en consideración exclusi\~amenteel tipo lógico de los predicados y la forma lógica de la afirmación, nada en el criterio depende del significado o contenido semántica de los predicados involucrados, de cuáles sean las propiedades denotadas. Y esta característica, como Hempel acabará reconociendo, lo convierte en inadecuado. Cualquier concepto cualitativo de confirmación por instancias positivas que sea puramente sintáctico se enfrenta a una dificultad fundamental, a saber, su incapacidad para dar una respuesta adecuada al nuevo eriignza de la i~zducciórzde Goodman (1955). Mencionamos ya este enigma cuando nos ocupamos de las leyes (cap. 5. $2), haciendo referencia a la distinción entre predicados proyectables y no proyectables y su función en la distinción entre regularidades nómicas y accidentales. Como entonces dijimos, el enigma tiene directamente que ver con la posibilidad de justificar inductivamente hipótesis alternativas incompatibles entre sí. La evidencia de que todas las esmeraldas observadas hasta el año 1950 son verdes confirma, según el criterio que venimos considerando, tanto "Todas las esmeraldas son verdes" como "Todas las esmeraldas son verdules" (donde 'verdul' significa "observado antes del año 2000 y verde, u observado después del 2000 y azul"; aunque nótese que en este caso no se trata de hipótesis incon~patiblesen sentido estrictamente lógico, son incompatibles sólo si se observan esmeraldas después del 2000). Si queremos distinguir ambos casos, negando que dicha evidencia confirme igual ambas generalizaciones, la noción de confirmación no puede ser puramente sintáctica, pues ambas generalizaciones son sintácticamente semejantes. La única posibilidad es que la noción de confirmación involucre características no puramente sintácticas, esto es, que haga referencia, o (1) a características semánticas (al contenido d e los predicados), o (2) a relaciones entre la generalización que se confirma y otras aceptadas. Goodman llama proyecrables a las generalizaciones cuyos casos observados se proyectan hacia los no observados, o lo que es lo mismo, a las generalizaciones que se confirman por instancias; derivadamente, se denominan también proyectables los predicados que intervienen en tales generalizaciones. La cuestión es qué hace a un predicado proyectable. Como vimos, es común apelar aquí a condiciones semánticas y proponer que los predicados proyectables son aquellos que significan propiedades (géneros, cla-
ses) naturales, pero la dificultad es entonces dar una elucidación satisfactoria de esta noción. Recuérdese que apelar aquí a la noción de ley, diciendo p.ej. que las propiedades naturales son las que intervienen en generalizaciones nómicas, no sirve de mucho, pues la diferencia entre leyes y generalizaciones accidentales requiere a su vez elucidación. Goodman prefiere la segunda opción, y sostiene que los predicados que intervienen en generalizaciones proyectables (e.e. leyes) se caracterizan por estar bien atrincherados ('entrenched'), con lo que quiere decir que se han usado frecuentemente y de forma integrada con otros del conjunto de la ciencia. Como el lector advertirá, ello no es sino apelar a criterios de integración teórica: una generalización proyectable es, en este sentido, una con apropiadas relaciones de integración con otras generalizaciones de nuestro cuerpo de conocimiento. Una tercera posibilidad, que es en realidad una variante de la segunda, es apelar a consideraciones de simplicidad, esto es, establecer que entre las diversas alternativas la evidencia confirma la más simple. Pero esto también es probIemático. En primer lugar, cualquier criterio de simplicidad permite que pueda haber diferentes teorías igual de simples. En segundo lugar, la simplicidad depende casi siempre del lenguaje, y por tanto de los predicados que se elijan como primitivos (cf. cap. 7, $6). Y en tercer lugar, incluso si se pudiera determinar un sentido neutral de la simplicidad, esta alternativa supondría que la naturaleza "maximiza" la simplicidad, que "prefiere" leyes más simples, y este principio de simplicidad de la natiiralera es algo que requeriría a su vez de justificación. Pero la justificación de un principio tal parece sujeta a las mismas dificultades humeanas que la justificación de un principio de regularidad. El nuevo enigma de la inducción de Goodman no es en realidad sino una nueva versión de un viejo problema, a saber, que cualquier serie finita de datos es subsumible bajo infinitas generalizaciones diferentes. Si visualizamos los datos como puntos en un plano, un teorema elemental del análisis establece que cualquier conjunto finito de puntos pertenece a infinitas funciones o curvas diferentes. El problema de la inducción consiste entonces en establecer criterios que permitan decir que la serie finita de datos confirma sólo una de las funciones, o menos dramáticamente pero igual de problemático, que confirma más a unas que a otras. El problema de la inducción es pues el problema de la infradeterminación de la teoría por la experiencia, que ha ido reapareciendo en diversos lugares de esta obra: por muchos que sean los datos experimentales recogidos, siempre serán subsumibles bajo hipótesis teóricas diferentes e incompatibles. Como acabamos de ver, apelar a un principio de simplicidad de la naturaleza es problemático por apelar a la problemática noción misma de simplicidad, y además es elusivo, pues él mismo requiere justificación. Debe notarse que este problema, aunque con pequeñas variaciones, es el mismo en Hempel que en Goodman. En ambos casos se trata de determinar si hay un sentido preciso en que se puede decir que ciertos datos justifican una hipótesis, o equivalentemente, si dadas dos hipótesis alternativas incompatibles, los datos justifican más una que otra.
402
FL;ND.ASIEhTOS DE FlLOSOFL4 DE LA CIENCIA
2. Aproximaciones al problema de la inducción
En las próximas secciones vamos a centrarnos en las dos principales aproximaciones al problema de la inducción dentro de la filosofía de la ciencia contemporánea, el inductivismo de Camap y su escuela, y el falsacionismo de Popper. Puesto que estas concepciones no agotan las diferentes aproximaciones al problema, antes de detenemos en ellas haremos en esta sección una breve mención a las principales alternativas involucradas (para una comprensión cabal de las mismas, que no podemos proporcionar aquí, consúltense las fuentes reseñadas en cada caso).
Algunos de los llamados filósofos del lenguaje ordinario han defendido que el supuesto problema de la justificación del razonamiento inductivo es sólo aparente (cf. p.ej. Strawson, 1952). El análisis lingüístico muestra que tal demanda de justificación es ella misma injustificada y por tanto el problema, más que resolverse, se disuelve. En su opinión, casi siempre que se exige una justificación de la inducción lo que se busca es un fundamento que la haga tan "firme" como la deducción, pero ello es simplemente un error conceptual, la inducción no puede ser tan firme como una inferencia demostrativa pues, simplemente, es por definición una inferencia no demostrativa. La inducción no requiere justificación. Es parte del significado de las palabras 'evidencia', 'grado de convicción' y 'creencia razonable' que es razonable aumentar el grado de convicción con la evidencia. "Es una proposición analítica aquella que dice que es razonable creer en cierta medida en un enunciado, medida que es proporcional a la fuerza de la evidencia [y es analítica en virtud de] lo significado por 'ser razonable"' (Strawson, 1952, cap. 9, $11.10). El problema, sin embargo, es que esta concepción no da cuenta del aspecto normativo de la inferencia inductiva, no explica en qué consiste la diferencia entre inferencias inductivas correctas e incorrectas (o más o menos correctas), y ése es el problema de la inducción. Las nociones defuerza de la evidencia y de creelzcia razonable proporcioizal a la fuerza de la evidencia dependen conceptualmente de la de (mayor o rnertor) corrección de la iriferencia rzo demostrativa, y el problema es determinar de modo preciso dicha dependencia.
La mejor justificación de la inducción, se puede decir, es que ha funcionado muy bien hasta el momento. Y aquí se pueden traer a colación los impresionantes logros tecnológicos de la ciencia a lo largo de la historia. Esta línea de argumentación supone que la ciencia ha procedido de hecho inductivamente, cosa que algunos niegan. Pero concediéndolo, el principal problema de esta posición es, obviamente, su circularidad. De lo que se trata es de justificar que podemos proyectar la experiencia observada a la no observada, y como caso particular la experiencia pasada al futuro. Si la justificación es que hasta el
E V A L U A C I ~ NDE LAS TEOR~ASY EL PROBLEMA DE LA I N D U C C I ~ N
403
momento eso nos ha ido bien, que la mayoría de las predicciones realizadas con tal método han sido exitosas, etc., entonces se está tomando por garantizado el punto en discusión, a saber, que en el futuro podemos esperar que las cosas sigan yendo igual de bien que en el pasado. Como ya advirtió Hume, justificar inductivamente un principio inductivo de regularidad de la naturaleza es circular. Algunos filósofos, sin embargo, sostienen que a pesar de las apariencias esta línea de defensa no es inadecuada. Braithwaite (1959, cap. 8)) sostiene que la circularidad es sólo aparente. Black (1954) que no es viciosa, pues las reglas inductivas son autoaplicativas por naturaleza. Skyrrns (1966) apela a una jerarquía sucesiva de niveles inductivos, pero entonces eIude la circularidad al precio del regreso.
Como sabemos, Kant respondió al reto de Hume defendiendo la existencia de juicios sintéticos a priori. Si existieran tales juicios, podría pensarse que la inferencia inductiva podría justificarse mediante algún tipo de principio inductivo general que fuese sintético a priori: su carácter sintético haría a la inferencia ampliariva, y su carácter a priori proporcionaría el componente de necesidad (epistémica) que requiere en tanto que inferencia justificativa. Pero aquí hay que distinguir dos tipos de principios o afirmaciones. Por un lado, principios-syuda muy generales del tipo "la naturaleza se comporta regularmente" o "la naturaleza se comporta simplemente". Éstos podrían ser candidatos a ser principios sintéticos a priori, caso de haber tal cosa, pero, como veremos, no resuelven el problema de la inducción, pues dejan demasiadas alternativas abiertas. Por otro, principios más específicos que sí podrían justificar hipótesis específicas, pero que no parecen buenos candidatos a principios a priori pues, como se verá, son en el fondo tan específicos como las hipótesis empíricas que pretenden justificar (si es que no son ellas mismas). Aunque en la actualidad hay pocos defensores decididos de los juicios sintéticos a priori, se sigue recurriendo de diversos modos a ambos tipos de principios (cuyo estatuto se debe elucidar). En general, se puede recumr a ellos como premisas implícitas adicionales, o como principios-reglas de inferencia. A estas alternativas corresponden, respectivamente, las dos próximas concepciones.
Una posibilidad es considerar que las inferencias inductivas son en realidad inferencia~deductivas con premisas implícitas u ocultas, esto es, entimemas. Una vez explicitadas las premisas ocultas, la inferencia es perfectamente demostrativa. La justificación de (1) "Todas las esmeraldas son verdes" a partir de (2) 'Todas las esmeraldas observadas antes de 1950 son verdes" consistiría en una deducción añadiendo una premisa adicional. Pero, enprimer lugar, esta opción se debe enfrentar al problema de la justificación de esta premisa adicional. Y en segundo lugar, ni siquiera es claro que (independientemente de su
justificación) una premisa tal siniera. La premisa adicional no puede ser un principio inductivo general del tipo (3) "La naturaleza se comporta regularmente", pues la naturaleza se puede comportar regularmente de itzjirzitas maneras diferentes, p.ej. siendo todas las esmeraldas verdes, o siendo todas verdules, etc. Así que añadiendo (3) a (2) no se deduce (1). Tampoco sirven variantes aparentemente más específicas, como (3') "Las esmeraldas no observadas son del mismo color que las obsenadas hasta 1950", pues (3') es ambigua, ya que estas esmeraldas además de verdes son verdules. Sólo serviría como premisa implícita para deducir (1) una premisa implícita como (3") "Las esmeraldas futuras son verdes", pero claro, eso es justamente lo que queríamos justificar. Esto muestra directamente el problema principal de esta alternativa: sean cuales sean las pre~nisasadicionales de las que efectiva?nenrese deducca la hipótesis original a justificar, el problema es que se pretende resolver la dificultad que plantean las inferencias ampliativas convirtiéndolas en demostrativas, pero al precio de trasladar su carácter arnpliativo a una premisa ociilta que requiere al menos tanta justificación como la hipótesis original.
Esta alternativa (que examinaremos en detalle en la próxima sección) es en principio la menos revisionista de todas: acepta que hay inferencias inductivas esencialmente diferentes de las demostrativas y que se rigen por sus prepias reglas lógicas, y trata de determinar cuiles son esas reglas y construir un sistema de 16gica inductiva. Esta propuesta comparte con la primera la idea de que el que cierta evidencia justifique no demostrativamente cierta hipótesis es una verdad analítica que se deriva de los conceptos de evidencia, grado de justificación, etc. Pero a diferencia de aquélla, no considera que ello ya resuelve, o disuelve, el problema. Asume la necesidad de distinguir entre inferencias ampliativas correctas e incorrectas, o más o menos correctas, y a tal fin procura desarrollar un sistema de lógica inductiva. Estos sistemas casi siempre recurren de un modo u otro al concepto de probabilidad. Como veremos, también necesitan algún tipo de principios de regularidad o simplicidad, que ahora estarán contenidos en los axiomas y reglas de la Iógica y cuya justificación se supone que es a yriori.
El desarrollo de una Iógica inductiva no es el único modo de abordar el problema de la inducción en términos probabilísticos. Desde el campo de la estadística matemática y la teoría matemática de la decisión se han hecho numerosos intentos de fundamentar de diversos modos la inferencia estadística. Entre los más destacados están Keynes (1921), Savage (1954), Fisher (19561, Neyman y Pearsons (19671, de Finetti (19721, Kyburg (1974), Jeffrey (1965), Howson y Urbach (1989) y Pollock (1990). A diferencia de lo que ocurre con la Iógica inductiva de Carnap, en estos autores la perspectiva metateórica no siempre está clara. Es difícil determinar si lo que se propone es algún tipo de deductivis-
mo, esto es, si la inferencia estadística (o la decisional) es una inferencia demostrativa que incluye como premisas adicionales ciertos principios matemáticos probabilistas (decisionales), o si se trata de alguna forma de inductivismo, esto es, si estas inferencias son propiamente ampliativas y la teoría matemática fundamenta las reglas inferenciales. Casi todos los autores de esta familia parten de un resultado clásico de la teoría de la probabilidad conocido como teorema de Bayes (para una buena exposición del bayesianismo, cf. Salmon et al., 1992, cap. 2). Uno de los principios fundamentales de la teoría de la probabilidad es que la probabilidad de la conyunción de dos sucesos es igual a la probabilidad de un suceso por la probabilidad del segundo condicionado al primero: p(x A y) = p(x) pblx). Este principio se deriva de la noción de probabilidad condicionada: la probabilidad de que ocurra y si ha sucedido x es, sobre la probabilidad de que ocurra x, la probabilidad de que adetnás de x ocurra y: pbl.~)= p(.r A y) 1 p(x). Ahora, puesto x A y es lógicamente equivalente a y A x, y las probabilidades de sucesos equivalentes son iguales, tenemos p(x A y) = p b A x) y por tanto (si p(x) # O # p b ) ) pblx) = p(x1y) - pCy)lp(x),que es el famoso teorema de Bayes. En los casos de confirmación o justificación inductiva de una hipótesis h mediante la evidencia e nos interesa la probabilidad condicionada de la hipótesis dada la evidencia, e.e. p(hle). Puesto que, en los casos de confirmación, e es un hecho implicado por h, y si a implica /3 la probabilidad condicionada p(j3la) es 1, tenemos que el teorema de Bayes aplicado a un caso de predicción exitosa toma la siguiente forma: p(hle) = p(h)lp(e). De aquí se infieren dos cosas. Primero (y dado que p(h)lp(e)está entre O y 1 ) p(h) < p(e): la hipótesis h es menos probable que la evidencia e, como cabía esperar, ya que h implica e pero no al revés. Segundo (y dado que p(hle) es igual a p(h) dividido por un número mayor que O y menor que 1) p(hle) > p(h): la probabilidad de la hipótesis h dada la evidencia positiva e es mayor que la que tiene h sin tomar en cuenta e. Este segundo hecho proporciona para los bayesianos la justificación teórica de la intuición que hay tras la noción cualitativa de confirmación: la ocurrencia de ciertos hechos implicados por la hipótesis aumenta la probabilidad de la hipótesis; la idea es entonces conceptualizar el grado de apoyo o justificación como la probabilidad de la hipótesis condicionada a los hechos implicados por ella. El teorema tiene otra consecuencia intuitivamente satisfactoria. Es fácil probar que una versión equivalente del mismo es p(h1e) = p(h) l [p(h) + ( p ( 7 h) p ( e l 7 h ) ) ] ,de donde se sigue que p(hle) es tanto mayor cuanto menor es p ( e l 7 h). Esto es, la evidencia positiva confirma tanto más la hipótesis cuanto más improbable sea e si h es falsa (recuérdese que la exigencia de que la predicción sea improbable si la hipótesis es falsa es justamente la Condición 2 que vimos en el capítulo 3, $3). El teorema de Bayes permite calcular, en casos de conuastaciones exitosas, cómo la evidencia e modifica la probabilidad anterior de la hipótesis h, pero ello no permite establecer el valor de p(h1e) a no ser que se disponga de las probabilidades anteriores p(h) y p(e), sobre cuya determinación nada dice la teoría. Se podría pensar que eso no es un problema, pero no es así. Es justamente en este punto donde aparece el problema de la inducción en toda su crudeza, pues lo que nos interesa es determinar si la misma evidencia e, predicha exitosamente por dos hipótesis diferentes h y h', justifica más a una que a otra. Y el teorema de Bayes no dice, por sísolo, nada al respecto. Todo lo que dice es que, dado
406
FUh'D.4hIE\TOS DE FILosoFÍ.~ DE LA CIENCIA
e, la justificación de h. pode), será mayor que la de h', p(hlle), si y sólo si la probabilidad anterior de h es mayor que la de 11': p(Iz/e) 2 p(hl/e) syss p(k) 2 p(h') (debe recordarse que este bicondicional sólo vale en los casos en que e es predicha por las hipótesis, e.e. tanto h como Iz' implican e). Es decir, que la evidencia presenla en las probabilidades posteriores el orden de las probabilidades asignadas antes de tener en cuanta la evidencia, lo cual no es de mucha ayuda; parece que la evidencia no aporta nada nuevo (al menos mientras nos mantenemos en el nivel cualitativo): lo mismo que se puede decir antes de tomarla en cuenta, se puede decir después. El teorema de Bayes por sí sólo no ilumina la cuestión sobre cuánto más apoyan a una de dos hipótesis cienos datos (predichos por ambas), lo único que establece es que una hipótesis es más probable relativamente a la ocurrencia de datos predichos por ella de lo que lo era "antes". Para que tenga efectos en la comparación de grados de apoyo entre dos hipótesis, para poder disponer de la medida cuantitativa, es necesario determinar las probabilidades anteriores, y si éstas son subjetivas, objetivas o a priori. En este punto, los bayesianos tienden por lo general a defender alguna forma de subjetivismo, aunque también los hay objetivistas (cf. p.ej. Pollock, 1990). Como veremos, la lógica inductiva de Carnap pretende ser una propuesta apriorista al problema de las probabilidades anteriores.
Algunos filósofos han aceptado que la inducción no se puede justificar ni a priori ni empíricamente, pero no están dispuestos a renunciar a ella y proponen que se acepten a modo de postulados algunos principios que la garantizan. El caso más conocido es el de Russell. Russell mantiene que el problema de la inducción en los términos de Hume es irresoluble, pero a la vez sostiene que la ciencia procede de hecho mediante inferencias ampliativas y que es imposible hacer inferencias ampliativas sin asumir ciertos principios sintéticos. Russell propone cinco postulados específicos (1948, parte VI), algunos muy problemáticos, en cuyo contenido no vamos a detenemos ahora. Sólo conviene insistir en que, para él, esta especie de argumento trascendental no supone una justificación a priori de 10s postulados y, con ellos, de la inducción. No hay justificación a priori ni a posteriori de estos postulados, su única "justificación" es que su rechazo conduce al escepticismo radical, al solipsisino del tnonzeizro presente. Sin embargo, esta línea de defensa parece inestable, colapsa en una de las tres siguientes posibilidades: o bien se convierte en una defensa a priori de los postulados, o bien en una empírica, o bien es una defensa meramente pragmática del método inductivo. Insistir en que no es ninguna de las tres cosas sin especificar qué es no la hace más inteligible.
Reichenbach (1935, 1938) propone abiertamente una defensa pragmática de la inducción. Hume tiene razón en cuanto a que no podemos asegurar que el método inducti-
1
E V : \ I ~ . \ ~ ~ / \ CDE I ~ XLAS TEOR~ASY EL PROBLEMA DE LA I N D U C C I ~ N
407
vo sea correcto. pero apostando por la inducción no tenemos nada que perder y sí mucho que ganar. La idea es que si hay algún método correcto para hacer predicciones sobre lo inobsewado, entoizces la inducción es ese método. Aunque no podemos justificar racionalmente el antecedente de este condicionai, sí podemos justificar el condiciona\. ESposible que la naturaleza no siga un curso regular, pero si lo sigue entonces el mejor modo de dar con él es el inductivo. Por eso apostar por la inducción es pragmáticamente correcto, no tenemos nada que perder y si mucho que ganar. Consideremos otro método para hacer predicciones además del inductivo, por ejemplo, predecir siguiendo las visiones de un mago con su bola de cristal. Quizá ninguno tenga éxito, pero si alguno lo tiene es el inductivo. Se dirá que el mago, quién sabe por qué motivos, podría también tener éxito en sus predicciones. Reichenbach no niega esa posibilidad, pero señala acertadamente que en tal caso el método inductivo daría el mismo resultado (pues s610 si la naturaleza es regular puede tener éxito el mago). Así, puede haber otros métodos tan exitosos como el inductivo, pero no mcis exitosos que él. Eso es suficiente para apostar por el método inductivo. 0, quizá se objete, por cualquier otro de entre los más exitosos. Pero no. En primer lugar, no habría ninguna diferencia práctica, pues los eventuales métodos alternativos igualmente exitosos darían los mismos resultados. Y en segundo lugar, y lo que es verdaderamente importante, sólo de la inducción podemos saber que está entre los más exitosos. Resumiendo: si algún método funciona, entonces la naturaleza se comporta regularmente; y si la naturaleza se comporta regularmente, entonces el Único método para realizar predicciones del que podemos saber que es correcto es el inductivo. Ésta es la justificación del mencionado condicional. Nótese, sin embargo, que esta defensa nada resuelve en cuanto a la aplicación del método inductivo, pues como hemos señalado en diversas ocasiones, la naturaleza se puede comportar regularmente de muy diversos modos; el curso seguido en el pasado es compatible con infinitos cursos futuros diferentes todos ellos regulares (infradeterminación de la teoría por la experiencia).
'
Hasta aquí todas las concepciones aceptan que la ciencia procede inductivamente e intentan justificar tal procedimiento. La última posibilidad consiste en negar justamente eso, en negar que la ciencia proceda inductivamente. Ésta no es la posición de Hume, que rechaza que la inducción proporcione justificación pero acepta que la ciencia procede inductivamente (y por ello la ciencia no proporciona conocimiento justificado). El único filrjsofo influyente que rechaza, o dice rechazar, que la ciencia es inductiva es Popper. Introducimos esta cautela en la descripción de su postura porque, como veremos en la sección 4, su teoría de la conoboración se parece mucho a una nueva conceptualización del soporte evidencia]. Éstos son los principales enfoques clásicos al problema de la inducción. Vamos a examinar ahora en detalle dos de ellos, el justificacionismo de C m a p y su escuela y el refutacionismo de Popper.
308
FUND.451EhTOS DE FILOSOFLADE LA CIENCIA
3. Justificacionismo, grado de confirmación y lógica inductiva (*)
La tesis central de la lógica inductiva es que la relación de co)?firinaciciizi~1d~ictii-a apoyo evidencial, o jusrificación inductii3a)es una relación lógica. Esto es, la expresión 'confirmar inductivamente' es análoga a 'implicar deducti~amente',ambas expresiones no denotan relaciones empíricas sino relaciones analíticas o lógicas. En realidad, como veremos, para Carnap la confirmación es iiiiplicació~~ lógica parcial. La idea es que, dados Ir y e, para establecer si e confirma h o no, o el grado en que lo hace, no hace falta información e~npíricaalguna, basta conocer el contenido lingüístico de 11 y e. Por tanto, "e confirma h (en grado r)", si es verdadera, es verdadera en virtud de reglas lingüísticas, en virtud del significado y la forma lógica de e y h. La intuición que hay detrás es que saber que e confirma Iz no es saber nada sobre el mundo. Por supuesto que saber e y saber 11 es saber cosas sobre el mundo, pero saber que lo primero confirma lo segundo no. La información sobre el mundo la proporciona e, necesitamos información empírica para saber si e ocurre o no. Y si e ocurre, entonces disponemos también, yarcialinelzre asegurada, de otra información empírica, 11. Pero lo que permite pasar de una información empíri-. ca a otra no es información empírica adicional sino, como en la deducción, información lingüístico-lógica. En este sentido la confirmación no es una relación empírica, como la causalidad, sino lógica, como la deducción. (O
La idea básica de que la confirmación es una relación lógica se encuentra ya en la definición pulurizeilre sinrácrica de la confim~acióncualitativa que da Hempel (cf. 1943 y 1945), como lo estaba también tras la propuesta de Sicod. Hempel pretende dar una definición de confirmación que no tenga las fuertes limitaciones del criterio de Nicod, el cual, además de ser sólo condición suficiente, se restringía a los casos en los que la hipótesis es una afirmación uni~.ersalcondicional. La definición de Hempel se aplica a cualquier hipótesis expresable en lógica de primer orden que contenga predicados y relaciones. Hempel da cuatro condiciones que en su opinión debe satisfacer cualquier concepto de confirmación (cf. 1945, S8 y $9; recuérdese que 'C(lr,e)' significa que e confirma h). ( C l ) Condición de implicación: si e implica Ir entonces C(12,e). (C2) Condición de consecuencia para hipótesis: si C ( h , e) y 11' es consecuencia Iógica de h, entonces C(Ii', e). (C3) Condición de consecuencia para evidencias: si C ( k , e ) y e es consecuencia lógica de e' entonces C(h, e'). (C4) Condición de consistencia: si e y h son cada una consistentes por sí solas y C(li, e ) entonces e A 12 también es consisrente. La definición de Hempel, que se ajusta a los requisitos establecidos, está basada en lo que se denomina desarrollo de iriia a$nlzación para zrila serie (fiiiita) de individuos.
I I 1
, i
l t
Puesto que las sencencias, o no contienen variables o, si las contienen, estarán ligadas par cuantificadores existenciales o universales, para caracterizar esta noción basta especificar los siguientes tres casos: (DI) si la afirmación es universal, "x a(x)",su desarrollo para la A ... A serie de individuos a , , ..., ri, es la conyunción de todas sus instancias, e.e. "a(ai) ~ ( a , ) " ;(D2) si es existencial, "3x cr(,~)", su desarrollo es la disyunción de todas sus instancias, e.e. "u(ai) v ... v a(a,)"; (D3) si no contiene variables, su desarrollo es ella misma. Con ayuda de esta noción, Hempel da la definición de confirmación cualitativa en dos pasos. Primero define la confir~nc~ciórzdirecta: e confirma directarnenre h syss e implica lógicamente el desarrollo de lz para los objetos de que habla e. Como se advertirá, esto no es más que la generalización de la idea de confirmación por instancias de Nicod. En el segundo paso se procede a una nueva generalización para cerrar la noción bajo las relaciones lógicas apropiadas: C ( h , e ) syss It es implicada por una clase de hipótesis cada una de las cuales es directamente confirmada por e. A partir de esta definición de confirmación cualitativa, Hempel define del modo natural las de discoi7firtnncióil y neiirr-rrlidod,también cualitativas: e disconfirma h syss e confirma la negación de h; e es neutral respecto a h syss e ni confirma ni disconfirma h. Por último, identifica verificncióti y refrrtnciótz con los casos extremos de confirmación y disconfirmación: e verifica 11 syss e implica A; e refuta h syss e implica la negación de h. Hempel enfatiza que las nociones de verificación y refutación, como las de confirmación y disconfirmación, son relativas, esto es, una hipótesis resulta verificada o refutada respecto (le [itin ei~irle~rcio e. Ahora bien, la posibilidnd de verificación y refutación de una hipótesis ya no es relativa sino absoluta, pues depende sólo de que piieda haber evidencia verificadora o refutadora. Una hipótesis es verficnblelref~itc101esi es lÓ,oicamente posible que haya un informe observacional que verifiquelrefute la hipótesis. Como señala Hempel, que una hipótesis sea verificable/refutable depende, si no se excluyen universos de discurso con infinitos objetos, sólo de su forma lógica: si no contiene cuantificadores es tanto verificable como refutable; si es puramente existencia1 es verificable pero no refutable; si es puramente iiniversal es refutable pero no verificable; si es cuantificacional mixta, no será en general ni verificable ni refutable.
Como se habrá percibido, la noción de confirmación cualitativa así construida, y todas sus derivadas, son puramente analíticas en el sentido antes indicado: dados h y e, la información que permite establecer si C(h. e) es o no el caso, es exclusivamente lingüístico-formal. Por ello la propuesta de Hempel participa plenamente del espíritu de la lógica inductiva. Pero se trata, por así decir, de una lógica inductiva cualitrrtiva. Puesto que el concepto de confirmación o justificación inductiva es intuitivamente gradual, una lógica inductiva meramente cualitativa no es dc mucha ayuda. Lo deseable es disponer de un concepto de confirmación cuando menos comparativo, y si es posible mitrico. Ésta es la pretensión que inspira el programa de Carnap y la escuela inductivista en ei desarrollo de una ntediricl del grndo de confirniocióti. El programa inductivista se inicia con la monu-
mental obra de Carnap Logical Fou~zdatio~ts of P r o b a b i l i ~(1950) y pasa por diversas formulaciones como resultado de las modificaciones que van introduciendo el propio Carnap y sus colaboradores para responder a las dificultades internas y las críticas externas. Entre la inmensa literatura que el programa generó, destacan Carnap, 1950, 1952, 1960, 1963 y 1968; Kemeny, 1955 y 1963; Bar-Hillel, 1968; Hintikka, 1965, 1966 y 1968, y Kuipers, 1978. Aquí sólo vamos a ver las ideas centrales, la primera versión de las mismas, las principales objeciones y las líneas de respuesta que dan lugar a nuevas versiones. La idea básica que inspira el programa de Carnap está contenida en la crítica que hace al concepto cualitativo de confirmación de Hempel. Carnap no tiene nada que objetar a un concepto cualitativo de confirmación en cuanto tal. Es mejor uno comparativo, o mejor todavía métrico, pero un concepto cualitativo puede ser, aunque de limitada utilidad, perfectamente legítimo. Pero sí tiene algo que objetar al concepto cualitativo de Hempel por no satisfacer un requisito que, en su opinión, debe satisfacer todo concepto cualitativo de confirmación. Según este requisito (cf. Carnap, 1950, secs. 86-88), si e confirma h entonces e debe incrementar la probabilidad de 11, e.e. C(12, e) debe implicar p(1zle) > p(h) y, como reconoce Hempel, el concepto por él definido es incompatible con esta condición (cf. Hernpel, 1966b, n. 17). Esta crítica, y el requisito que la inspira, muestra claramente la otra idea básica de la lógica inductiva tal como se desarrolla en el programa de Carnap. Una primera idea, común a todo concepto analítico o a priori de confirmación, es que la confirmación es una relación lógica. La segunda idea, específica de este programa y que acompaña a todas sus versiones, es que la confirmación es probabilista, esto es, la medida del grado de confirmación, el concepto métrico de confiimación, se ajusta a la teoría matemática de la probabilidad. Es más, como ya mencionamos en el capítulo 5 , para Carnap la confirmación cuantitativa corzsrituye uno de los sentidos de la noción de probabilidad, la que denomina probabilidadi o probabilidad lógica. Carnap define el grado de confirmación c de k por e como el cociente entre m(h A e) y m(e), donde m es una medida de lo que él llama peso probabilista de los hechos (sucesos, enunciados, proposiciones): c(lz, e) = ni(lz A e) l m(e). Recuérdese que según la teoría de la probabilidad, el principio que relaciona la probabilidad de la conyunción con la probabilidad condicionada es p(lz A e ) = p(e) . p(hle). Puesto que m es una medida probabilista, lo que está haciendo Carnap no es sino ide~zrificarel grado de confirmación c(k,e) con la probabilidad condicionada p(hle), y denotar mediante 'm' las probabilidades anteriores incondicionadas de e y de 11 A e. Hasta aquí todo es bastante bayesiano, aunque con una pretensión más general. En los casos de contrastación, en los que 11 implica e, el cociente p(lt A e) 1 p(e) se puede simplificar, pues en ese caso p(lz A e) = ~(11);pero Carnap tiene buenos motivos para no utilizar la forma abreviada c(h, e) = m(lz)lm(e), pues la noción de grado de confirmación, o probabilidad~,que está definiendo es una noción general que no se limita a los casos en que 11 implica e. La función c mide el grado en que e apoya (soporta inductivamente) h, sean e y h lo que sean; la contrastación de hipótesjs constituye tan sólo una aplicación. especialmente importante, de esta noción general.
1
I
ii
¡
I
1
i
41 1
EK\LUACIÓN DE LAS TEOR~ASY EL PROBLEMA DE LA INDL'cC~~N
La idea que inspira la medida carnapiana de grado de corroboración o soporte inductivo es que la inducción es una implicación parcial, y que dicha parcialidad se mide en términos probabilistas. En la inferencia demostrativa, a implica "totalmente" en el sentido de que en todas las situaciones o mundos posibles en que ocurre a,ocurre también p; P está "totalmente contenida" en a. La idea de Carnap de Ia inducción como implicación parcial es la siguiente: en la inferencia ampliativa, cl "implica parcialmente" en el sentido de que en parte (en algunas) de las situaciones o mundos posibles en que ocurre a, ocurre también B; B está "parcialmente contenida" en a. La función c es entonces una función general que mide el grado en que un estado de cosas (suceso, proposición, hecho, enunciado) está contenido en otro. La medida se hace sopesando las situaciones en que ambos ocurren; calibrando, de entre las situaciones en que ocurre e, la proporción de ellas en que también ocurre h. Ésta es la idea que hay tras la medida c(h, e) = m(h A e) l m(e), y el principal problema, fuente de todos los demás, es cómo se determinan las probabilidades anteriores m(h A e) y m(e). Recuérdese que la confirmación o probabilidad inductiva pretende ser a priori y que eso significa que dados e y h se debe poder determinar a priori c(h, e ) . Por tanto, m(h A e) y m(e) han de estar determinados a priori por el contenido y forma lógica de e y h, sin información empírica adicional alguna. En caso contrario se está abandonando la idea de una lógica inductiva.' Carnap formula inicialmente su sistema para lenguajes muy simples, que incluyan sólo predicados cualitativos monarios. Para la construcción de c impone algunas condiciones generales o axiomas que corzceptunlmente debe satisfacer cualquier función para poder ser considerada una medida de soporte inductivo. Algunos de esos axiomas están destinados a que c sea efectivamente una medida probabilista, p.ej. "si h implica h' entonces c(h, e) 1 c(hf, e)". Otros establecen condiciones adicionales pretendidamente derivadas del concepto de confirmación, p.ej. "si e y h no contienen variables, entonces el valor de c(h, e) depende sólo de los individuos mencionados en e y Iz" (esto es, los datos relativos a otros individuos que no intervienen en e no cuentan para determinar el apoyo que e confiere a h). El problema es que los axiomas solos no bastan para determinar c. Son posibles muchas funciones c diferentes que satisfacen los axiomas y la cuestión es cómo se determina una de ellas, si es que ha de haber una lógica inductiva. El problema (como ocurría con los bayesianos) es cómo determinar las probabilidades anteriores m, pues de ellas depende la medida c; hay tantas funciones de confirmación posibles como posibles determinaciones de probabilidades anteriores.
P
P
3.3. PROBABILIDADES ANTERIORES En la primera versión del sistema, de 1950, Carnap aborda la determinación de las probabilidades anteriores mediante la noción de descripción de estado ('state descrip2. Nótese que esta lógica. inductiva "incluye" la deductiva. De la definición de c y de que m es probabilista obtenemos: a implica deductivamente P si y sólo si c(P, a ) =m(p A a) / m(a),y como, si a implica B entonces P A a es equivalente a a,tenemos c(D, a)= m ( a )1 m(a)= 1.
112
FlJNDAhIEhTOS DE F I L O S O F ~DE ~ L.4 CIENCIA
riolz'), semejante como se verá a la de situación o mundo posible del Tractatils. Si el lenguaje contiene 11 predicados 'Fl', ..., 'F.' y k constantes individuales 'al', ..., 'am', cada descripción de estado especifica para cada individuo qué propiedades tiene y cuáles no. Una de las descripciones de estado para ese lenguaje es, por ejemplo, Flal A. 1 Fla2 A ... F.akw.Puesto que hay n k A F,ar., A 7 F l a k , A7 F2aiA ... A F2akA ... A Fnal A ... A estados de cosas atómicos, el número total de descripciones de estado es 2". '. Así. por ejemplo, si hay un único predicado 'F y tres constantes individuales 'a', 'b' y 'c', hay ocho diferentes descripciones de estado: 'L
Como se notará, cada descripción de estado describe exhaustivamente un mundo o situación posible. Entonces, como en el Pactarus, se puede identificar cada afirmación a con el conjunto de descripciones de estado en que es verdadera; por ejemplo, "Fb" se identifica con el conjunto (1, 2,4, 61, "Fb A 7 Fc" con {4,6}, y ''7 Fc" con (4, 6, 7, 8). La idea ahora es asignar a cada descripción de estado un número entre O y 1 de modo que entre todas las asignaciones sumen 1, esto es, asignar probabilidades a las descripciones de estado. Dada esa asignación, la función m se obtiene inmediatamente: m asigna a a la suma de las asignaciones de las descripciones de estado en que es verdadera. El problema consiste entonces en determinar el modo de asignar pesos probabilistas a cada descripción de estado. La posibilidad que parece más inmediata, puesto que desde un punto de vista a priori no se sabe ni se puede saber nada más, es aplicar el principio de indiferencia y asignar a cada descripción de estado el mismo peso; en el caso del ejemplo, 118 a cada una. Esta asignación genera una función de probabilidades anteriores específica, digamos m+, y con ello una medida de confirnlación específica, c+. Carnap desestima esta posibilidad porque, aunque parece intuitivamente plausible, tiene una consecuencia inaceptable, a saber, que la evidencia no puede alterar la probabilidad de la hipótesis. la deja siempre invariante: c+(lt,e ) = m+(h)para todo 11 y e. Aunque es sencilla, no vamos a transcribir la demostración (puede pensarla el lector), baste a modo de ejemplo ver que efectivamente es así en un caso concreto donde esta consecuencia resulta particularmente contraintuitiva desde el punto de vista de la lógica de la confirmación. Por ejemplo, si h es "Fb" y e es "Fa A Fc", tenemos m'(Fb) = 4(1/8) = 112 y c+(Fb,Fa A Fc) = m+(FbA Fa A Fc) 1m+(Fa A Fc) = 1(1/8) / 2(1/8) = 112. La probabilidad de Fb relativa a que se hayan dado ya dos casos de F (en realidad, en este caso, relativa a que todos los demás individuos sean F) es la misma que la probabilidad anterior incondicionada de Fb. Esto es claramente contraintuitivo si las probabilidades condicionadas han de servir para elucidar la noción de apoyo evidencial. Así pues, para que la evidencia pueda incrementar la probabilidad de la hipótesis es necesario asignar pesos desiguales a las descripciones de estado. La cuestión es cómo seleccionar, entre las infinitas alternativas, una de ellas. Para ello Carnap recurre a la
T;V,\LU,.\CI~NDE LAS TEOR~ASY EL PROBLESIA DE 1x1 INDL'CCIÓN
413
noción de de.rcripción de estrt4ctura ('srrucrrrre description'). Una descripción de escmctu-
ra a ~ r u p a l a sdescripciones de estado en grupos isornorfos. En nuestro ejemplo, las descripciones 2, 3 y 4 son isomorfas (cf. Apéndice), y las 5, 6 y 7 también, así que hay un total de cuatro descripciones de estructura: [ l ) , 12. 3, 41, 15.6. 7) y (8). Las descripciones de estado describen el total de situaciones, las diferentes posibilidades de ejernplificarse las propiedades en los individuos. Las descripciones de estructuras describen el total de situacione.r estruct~~raltnente diferentes.Aunque "-Fa A Fb A Fc" y "Fa A Fb A Fc" son diferentes situaciones, no son situaciones estructuralmente diferentes, son isomorfas. Las descripciones de estado quedan identificadas al determinarse qué individuos tienen cada propiedad; las descripciones de estructura, en cambio, quedan determinadas al determinarse el número de individuos que tienen cada propiedad. Carnap realiza ahora la asignación aplicando el principio de indiferencia a) a las descripciones de estructura, y b) a las descripciones de estado dentro de cada descripción de estructura. Esta asignación genera una función de probabilidades anteriores específica, m*,y con ello una medida de confirmación específica, c.. En nuestro ejemplo, este procedimiento asigna a cada descripción de estructura 114, quedando la asignación para las descripciones de estado del siguiente modo: 114 para la 1 y la 8 y 1/12 para cada una de las restantes. Es fácil comprobar que ahora la evidencia puede incrementar la probabilidad de la hipótesis. No siempre es así, no se pretende que cualquier evidencia aumenta la probabilidad de la hipótesis, sino sólo que pueda haber evidencia que sí lo haga. Por ejemplo, en el caso visto, de acuerdo a las intuiciones, la hipótesis "Fb" es apoyada positivamente por los datos "Fa A Fc", pues mW(Fb)= 112 y c'(Fb, Fa A Fe) = 314; y en otros casos ocurre lo contrario, por ejemplo con esa misma hipótesis y los datos "1Fc" obtenemos ca(Fb,7 Fc) = 113. Por tanto, las instancias positivas semejantes confirman la hipótesis y las instancias negativas semejantes la disconfirman. Así, m' garantiza que podamos aprender inductivamente de la experiencia. Hasta aquí las líneas generales del programa inductivista iniciado por Camap. Concluiremos comentando brevemente las principales dificultades del mismo y las modificaciones que se proponen para su solución.
Lenguaje cuantitativo. Las formulaciones iniciales que hace Carnap del programa inductivista se limitan a lenguajes muy pobres que contienen sólo predicados cualitativos. Esto representa un grave problema para la aplicabilidad del programa a casos de la ciencia real, pues la mayoría de las teorías científicas usan habitualmente conceptos cuantitativos. Aunque no es una dificultad de principio, Carnap la percibió como una grave limitación y en los Últimos tiempos trabajó en sistemas que incluyeran conceptos cuantitativos. Dependencia del lenguaje. La primera dificultad seria es la dependencia del grado de confirmación c de la riqueza expresiva del lenguaje. Cada uno de los métodos para asignar las probabilidades anteriores m arroja resultados diferentes en función de
cuáles sean los estados de cosas elementales posibles y eso depende del lenguaje que se use. En el sistema examinado es fácil ver que el modo de asignar los pesos a las descripciones de estructura y de estado hace depender los valores asignados, y con ellos m' y ca, del número de predicados del lensuaje. Esto es así tal como se ha construido m', pero un problema análogo tendría cualquier otra función determinada a priori por niétodos semejantes. En e1 sistema continuo de 1952 se manifiesta explícitamente este problema. Generalizando el tratamiento anterior, Carnap da una fórmula para determinar c(h, e) que además de h y de e, depende también de la riqueza del leitgriaje L (y de cierto parámetro numérico 3L que comentaremos más adelante). Ya en el sistema inicial, Camap introduce al efecto un requisito de completud expresiva, según el cual L debe contener todos los predicados necesarios para poder expresar todos los atributos de los individuos del universo de discurso (cf. 1950, p. 75). Más adelante introduce como axioma la exigencia de que c no debe v+ar con la inclusión de nuevos predicados (cf. 1963, p. 975). Pero, como hemos visto, esta exigencia no la satisface el sistema general de 1952, y tampoco lo hacen los posteriores. La única posibilidad parece ser partir de lenguajes expresivamente completos. Pero aquí sobreviene una dificultad de p~irzcipio: quien determina qué propiedades hay en el universo de discurso susceptibles de ejemplificarse en los individuos son las propias teorías científicas. Por lo tanto, la determinación de cuál es el Ieltguaje expresii)ameittecolnplero es relativa a una teoría o familia de ellas. La situación es pues la siguiente. Por un lado, la determinación de la función de confirmación c de acuerdo con la cual se evalúan las teorías científicas depende de.la determinación previa del lenguaje completo L. Por otro, la determinación de qué lenguaje L es expresivamente completo depende de las teorías científicas que consideremos describen correctamente el mobiliario de propiedades del universo. De ambas cosas se sigue que la medida de justificación inductiva depende de las hipótesis empíricas que hacen las teorías científicas. Esto tiene dos consecuencias fatales para el pro~ectoinductivista. En primer lugar, queda socavado el pretendido carácter a yriori de la lógica inductiva. En segundo lugar, o la justificación de la inducción es circular, o la inducción no es el método con el que evaluamos qué teorías son (más) correctas. En efecto, si la corrección de las teorías que permiten determinar el lenguaje completo L se evalúa inductivamente, caemos en una circularidad, pues la función inductiva c depende de cuál sea L; la alternativa sólo puede ser que se evalúen las teorías que detern~inanL por un método no inductivo. Nótese que no es posible eludir estos problemas rechazando que c dependa del lenguaje; es esencial que c dependa del lenguaje, pues sólo así constituye una Iógica inductiva. La única posibilidad.parece ser que (como ocurre en la lógica deductiva) c dependa sólo de aspectos generales del lenguaje, aspectos cuya determinación no varíe de una teoría científica a otra. Éste es seguramente el sentido del nuevo axioma que introduce Carnap (la invarianza de c respecto de la inclusión de nuevos predjcados), aunque al final se queda en una exigencia programática incumplida. En realidad es difícil concebir una lógica inducrii9a,no deductiva, que dependa sólo de esas propiedades tan generales del lenguaje. Arbitrariedad. La segunda dificultad importante se deriva de la aparente arbitrariedad en la elección de la función m que determina la medida c. ¿Por qué elegir m' y no
cualquier otra (diferente de m-)?Hay numerosas funciones que tienen 13s mismas consecuencias intuitivas que m', a saber, que crecen con las instancias positivas y decrecen con I,is negativas; ¿por qué quedarse con una más que con cualquiera de 13s otras? Hemos anunciado en el punto anterior que e n 1952 Carnap generaliza su sistema y establece u n a fórmula para determinar c(h, e) que, además de h, de e y del lenguaje L, depende de cierto prirsmetro numerico h. Este patrímetro puede variar entre O y -a, coriespondiendo c- y c., respectivamente, a íos casos con h = y A = 2. Tenemos pues a nuestra disposición un continuo de métodos inductivos diferentes e incompatibles que dependen del valor que frjzmos para el parárnetro h. La medida c' correspondz a h = 2, ¿qué razones hay para considerar que esa, o cualquier otra, es la lógica inductiva correcta? A veces se expresa esta dificultad acusando a Carnap de apt-ioristno. Pero ésa no es una acusación para el inductivista. Si el grado de confirmación c ha de expresar tina Iógicn inductivri, las probabilidades anteriores m se deben detennitzar a priori. El problema no es el apriorismo sino la arbitrariedad puesto quz no parece haber más razones n priori en favor de una m que de otras, jcórno se jrlstifca nuestra elección de una determinada? Los inductivistas, incluido Carnap, suelen identificar los diversos valores de h con los diversos grados posibles de uniformidad de la naturaleza; h sería una medida de la complejidad del mundo. Pero entonces, aceptar un valor determinado para h equivale a aceptar un principio especij7co de regularidad-simplicidad de la naturaleza y la cuzstión. obviamente, es qué justifica esa elección. Dicha justificación no parece poder ser a priori, pues el concepto de justificación no basta para determinar una única h. Carnap y otros sugieren a veces que h puede determinarse empíricamente, por ejemplo atendiendo a frecuencias observadas (cf. p.ej. Carnap, 1950, p. 181, y 1952, p. 55). Pero en primer lugar, y caso de ser viable optar por esta alternativa, ello supone renunciar al proyecto entero de una lógica inductiva, pues tal lógica no puede depender de hipótesis empíricas sustantivas. Y en segundo lugar, la alternativa es simplemente inviable, pues una hipótesis empírica sobre el valor de h requeriría, cor;io cualquier hipótesis empírica, dz justificación. lo cual conduce a un círculo o a un regreso infinito, ambos viciosos. Carnap mismo acaba desestimando explícitamente esta vía: "no es necesario referirse a la experiencia para juzgar la racionalidad de la función c" (1965, p. 263). En algunos lugares parece proponer que la elección de c descansa en nuestra intiiición indzicriva (cf. 1963, p. 978), pero eso hace que la lógica inductiva sea n priori en un sentido muy problemático. En la medida en que esa intuición pueda variar entre individuos o comunidades se estaría despIazando hacia el subjetivismo (al respecto, cf. también 1960). En definitiva, ninguna razón a priori determina una única función c entre todas las conceptualmente posibies, pero tampoco evidencia empírica alguna puede justificar inductivamente su determinación, pues antzs de determinar c no sabernos lo que significa 'justificar inductivamente'. Estamos una vez más ante el viejo problema de Hume; la indlicción no se puede justificar ci priori, pues su negación no es inconcebible, ni n posteriori, pues su justificación empírica presupondría la validez de un principio inductivo, que es lo que está en juego.
-
Ateoricisrno. Adem5s de las dificultades anteriores que afectan a la concepción misma del programa inductivista, hay otras más específicas. Una de las más graves es que, tal como se formula al principio, la lógica inductiva no se puede aplicar a aquello para lo que se había pensado, a saber, hipótesis generaIes o teorías. Como enfatizaron Popper y otros, y Caniap reconoció inmediatamente, Ias primeras y más acabadas versiones del programa (1950 y 1952) tienen la siguiente consecuencia: si el lenguaje contiene infinitas constantes individuales entonces, para cualquier h que sea una hipótesis condicional general (ley, teoría) y cualquier e que sea una afirmación particular (o un conjunto de ellas), c(k/e) = O. Eso se ve claramente con c' (compruébelo el lector), pero no depende de esa elección específica; lo mismo ocurre con cualquiera de las c que generan los diferentes valores de h. Así pues, cualquier cantidad finita de evidencia particular confirma (apoya, justifica) una hipótesis general en grado cero, esto es, no la confirma en absoluro. La lógica inductiva de Carnap es pues ateórica, no se aplica a hipótesis generales o teorías. Las teorías quedarían al margen de la justificación, serían dispeizsables en el contexto de justificación (aunque no en el de descubrimiento). Esta consecuencia no le parece a Camap, en principio, tan insatisfactoria. De hecho, ella se compadece bastante bien con la postura instmmentalista respecto de las teorías que durante mucho tiempo mantuvo Carnap, a saber, con la tesis de que las teorías son instrumentos para manejar datos de experiencia, para inferir unos a partir de otros, pero ellas no tienen "significación óntica" real. Sin embargo, incluso dejando al margen la cuestión de fondo del instrumentalismo, este ateoricismo tiene algo de contraintuitivo. Como dice Lakatos (1968a, 33b), Carnap primero exriende el problema clásico de la justificación inductiva, incluyendo hipótesis particulares, y después suprime la parte original, las hipótzsis generales. Para resolver este aspecto contraintuitivo, Carnap introduce la noción de confinnación cualificada por casos ('qualified insrance cor~firmariort') de una ley. La idea que hay detrás, y que en su opinión permite ajustar nuestras intuiciones, es que el grado de confirmación de una hipótesis se puede identificar con la fiabilidad o cocienre de apuesta raciortal a la luz de la evidencia disponible. Si eso es así, entonces podemos dar cuenta de lo que los científicos consideran justificación de las teorías en los siguientes términos. Cuando un científico sostiene que una teoría (hipótesis general) está bien fundamentada empíricamente, o que es fiable, no quiere decir que apostaría a que la teoría es verdadera (seguramente no apostaría nada a ello, e.e. c(lt, e) = O), sino que apostaría a que un nuevo caso (predicción) encajará en la teoría. Así, si It es la ley "Todo A es B", el grado de confirmación cualificada cc(lt, e) de la hipótesis-ley por la evidencia e es el grado de confirmación de un caso nuevo de la ley: cc(Vx(Ax + B.;), e) = c(Aa 4 Ba, e), siendo a cualquier individuo no involucrado en la evidencia e. Es inmedjato que cc, como c, sólo depende de la ley y de la evidencia, y además que aumenta hacia 1 al aumentar el número de instancias positivas de la ley de las que se tiene evidencia. Esta innovación es considerada inaceptablemente ad ltoc por Popper, Lakatos y muchos otros, pues consideran que su única finalidad es resolver lo que de contraintuitivo tiene la ateoricidad. Esto no es en realidad una objeción, si ése fuese el único problema. Pero no lo es. En el sistema de Carnap, si e implica la negación de 11 entonces c(h, e) = O pues m(h A e) = O. Aplicado a leyes, eso quiere decir que el grado de confirmación c de la
ley "Todo A es 8"por evidencia que contenga un caso de A que no sea B. "Aa y no Bu", es cero. La lógica inductiva de la confirmación basada en c incluye pues la refutación como caso especial. Pero con fa confirmación cualificada las cosas cambian, cc(V.r(Ax 4 B.r), e) puede ser muy cercano a 1 aunque e contenga muchos contraejemplos de la ley. Es fácil ver que el valor de cc aumenta hacia 1 al aumentar la proporción de casos positivos respecto de Ios negativos; esto es, si de los casos contemplados en e el x % son instancias positivas de la ley y el resto contraejemplos, el valor de cc es ~1100.Eso le parece a Popper completamente inaceptable, pues una medida que tenga esa consecuencia no tiene nada que ver con las nociones intuitivas de confirmación, apoyo evidencia1 o evaluación empírica (cf. p.ej. 1963, cap. 11, 46). Por ejemplo, si la e~idenciadisponible al lanzar una moneda varias veces es que la mitad son caras y la mitad cruces, según cc esa evidencia apoya la ley "Al lanzar una moneda siempre sale cara" en grado 0,5.A Popper eso le parece inadmisible, pues considera que esa evidencia no apoya esa ley etz absoluto. A Camap no le parece tan objetable, pues según él cc mide el cociente de apuesta racional, y en esas circunstancias es racional apostar a caras la mitad. La cuestión de fondo es hasta qué punto cc es una medida de evaluación de la ley. Si de evaluar la ley se trata, dice Popper, en el caso del ejemplo la evaluación debería ser totalmente negativa (a no ser que se rschace e, pero esa es otra cuestión de la que hablaremos más adelante). Y parece que en esto tiene razón. Pero Camap se resiste porque en realidad no acepta que se puedan evaluar las leyes en sentido estricto, en eso consiste su ateoricismo. Lo único que según él pretende cc es explicar qué quieren decir los científicos cuando dicen que una ley está bien fundamentada experimentalmente. Pero ni siquiera eso parece ser así si nos tomamos las leyes en serio, como objetos susceptibles de evaluación; en el caso del ejemplo es muy dudoso que los científicos considerasen mediarrnrnente fundada la ley de que en todos los lanzamientos saldrá cara. Lo que ocurre simplemente es que con esta innovación Camap tiene no uno, sino dos conceptos de confirmación y pretende tomar uno y dejar otro, o viceversa, cuando la situación lo requiera. Pero eso no se puede hacer sin más. Puesto que dan diferentes valores, jcuál es el que recoge la intuición de la justificación inductiva, del grado de apoyo eviilencial? El problema de la inducción, del grado de confirmación, se inició con las hipótesis generales. Carnap lo "ensancha" incluyendo hipótesis particulares. Entonces define una medida c de soporte inductivo que sólo se aplica a las hipótesis particulares, no a las generales. Para recoger las intuiciones sobre la confirmación de hipótesis generales define otra medida, cc, según la cual una ley cuya evidencia disponible contiene igual número de instancias positivas que de contraejemplos, está tan confirmada como disconfirmada por dicha evidencia. Ésta no parece una buena solución al problema del ateoricismo. Y de hecho Camap apenas fue seguido en este punto. La mayoría de los inductivistas, principalmente Hintikka, intentaron resolver el problema desarrollando sistemas de lógica inductiva en los que aun conteniendo L infinitas constantes individuales las hipótesis generales pueden tener grados de confirmación no nulos. El más conocido es el sistema bidimensional de Hintikka en el que c no depende de un único parámetro real h sino de dos. Estos sistemas son extremadamente complejos y no vamos a detenemos aquí en ellos (cf. Hintikka, 1965, 1966 y 1968; para una buena exposición simplificada, Kuipers, 1975).
Condicioizes de aplicacióit y guía para la racioi~alidad. Carnap, c o r o en general todos los teóricos de las inferencias ampliativas, pretende vincular su lógica inductiva con la teoría de la creencia y la acción racionales. La creencia racional se supone que idealmente está cerrada bajo relaciones inferenciales. En el caso de las inferencias deductivas es claro. Si alguien cree a, de a se deduce P, y el sujeto es racional, entonces debería idealmente creer P; o si alguien está justificado en creer a y de a se deduce P, está justificado en creer 0. En este sentido la inferencia inducti\.a también debería ser guía de racionalidad. Sin embargo aquí la cuestión es un poco más complicada, pues la aplicación de la lógica inductiva requiere condiciones adicionales (cf. Carnap, 1950, 634 SS.).La más manifiesta es la condición de eiidencia total. Aunque c(h, e) sea muy próximo a 1 y se esté justificado en creer e, no se debe "inferir" sin más h, pues la inclusión de evidencia adicional puede invertir drásticamente el soporte inductivo, esto es, c(lzle A e') puede ser cercano a O (ya mencionamos esto anteriormente, cf. cap. 2, 53, cap. 5, $5 y cap. 7, $2 y 93). Si la evidencia adicional e' está disponible en esas circunstancias, tomar esa decisión sin tenerla en cuenta no es racional. Por ello, el requisito de evidencia total exige que para aplicar Ia probabilidad inductiva racionalmente es necesario, además de que c(hle) sea alto y e esté justificado, que e incluya toda la evidencia relevante disponible. La satisfacción del requisito de evidencia total no basta. Es necesario además que se especifique cónto usar el grado de confirmación. Consideremos por ejemplo que lo vamos a aplicar para hacer apuestas, o para sostener creencias más o menos intensamente. Hay varias aplicaciones posibles. Una podría ser: si c(1zle) supera 0,5, apuesta todo a h. Otra de este mismo tipo exigiría un límite mayor. Éstas son condiciones de tipo ulí~br-al:si c supera cierto umbral (y se cumple e) apuesta todo a h. La condición que establece Carnap no es de este tipo sino propolrio~zal:apuesta proporcionalmente a c. Si c(lz1e) = r (y se cumple e), apuesta por h "r a 1-r"; p.ej. si c(h1e) = 0,75 apuesta 3 a 1 por I?. Por eso califica el grado de confirmación c de cociente de apuesta racional. Aquí Carnap presenta ciertas inconsistencias terminológicas (hemos visto más arriba que en el caso de hipótesis generales el cociente de apuesta racional es cc y no c, pero dejaremos esta inconsistencia de lado ahora). A veces parece que con el cociente de apuesta racional no se refiere a c(h, e) sino, justamente, al cociente de la apuesta c(h, e) l 1-c(h. e) (el cociente de la apuesta 3 a 1 no es 0,75 sino 0,75/0,25). Pero otras veces lo identifica con el grado de apojo evidencial, entendiendo por tal la diferencia c(h, e ) - m(lz), e.e. el i11crer7íentode probabilidad que e confiere a h. La idea es que lo que mejor expresa la fuerza evidencial de e es el efecto producido por e , la comparación entre las probabilidades de h antes y después de e (otros inductivistas usan el cociente p(hle) l p(lz)). Estas oscilaciones presentan algunos problemas no meramente terminológicos, pero no vamos a detenemos en ellos ahora (cf. p.ej. Lakatos, 1968a, 64). 4. Falsacionismo, grado de corroboración y verosimilitud (*)
Como consecuencia de los problemas vistos, y de otros que no hemos mencionado, el progranla inductivista de Camap y su escuela entra a finales de los sesenta y principios
EVALUACI~NDE LAS TEORÍAS
Y EL PROLiLE.Llr\ DE Lr\ ISI)UCCI~N
de \os setenta en una fase de estancamiento de la que no se ha recuperado.
419
Uno de 10s más
feroces detractores del programa inductivista es K. Popper, que comanda la escuela epistemológica rival conocida comofalsacionismo o refutacionisrno. Este programa alternativo es iniciado por Popper en los años treinta con la publicación de Logik der Forschlirtg (1935). pero permanece prácticamente ignorado, salvo por unos pocos, durante más de veinte años hasta que se traduce la obra al inglés a finales de los cincuenta. El falsacionismo se consolida a partir de los sesenta y constituye durante casi dos décadas la epistemología dominante en 10s países anglosajones y nórdicos, influencia q u e ha ido muchas veces más allá de la comunidad de especialistas y se ha extendido al gran público. Junto con el fundacional Popper, 1935-1958, otros trabajos destacados son Popper, 1956-1983, 1963, 1972 y 1974a; Watkins, 1968; Musgrave, 1973, y Niiniluoto, 1977, 1982 y 1984. El lema del falsacionismo de Popper es el siguiente: el método científico no es inductivo, el método de la ciencia es el de conjetlrras y refiltaciones. Ésta es la esencia del famoso racionalismo crítico de Popper. Sin embargo, este lema es parcialmente confundente. Es cierto que Popper niega que la ciencia proceda inductivamente, pero sólo si por 'inducción' se entiende estrictamente lo que los camapianos entienden. Como veremos, y aun a pesar de las protestas de su fundador, la metodología popperiana se puede calificar de inductiva en un sentido amplio.
Algunos de los problemas del inductivismo carnapiano que hemos visto habían sido planteados por Popper ya en 1935 pensando, a partir de ideas de Keynes y Reichenbach, en sistemas similares a los desarrollados posteriormente por Carnap. La crítica de Popper es pues incluso anterior a la primera versión acabada del programa carnapiano en 1950, y continuaría implacable ante las sucesivas modificaciones. Muchos de esos problemas no los señala sólo Popper, sino tambiin muchos otros autores (incluidos los propios inductivistas). Pero hay una crítica adicional específica de Popper que según él le separa del resto de los críticos. No la hemos incluido en la sección anterior porque no se refiere a la dificultad que tiene Carnap para desarrollar sus intuiciones sino a las intuiciones mismas, a saber, a la tesis de que el apoyo evidencial se mide en términos probabilistas. Así pues, a lo que Popper objeta especificamente es a la versión probabilista de1 grado de apoyo evidencia¡, que, como hemos visto, constituye el núcleo de la versión carnapiana de la inducción. Popper rechaza de plano la idea de una lógica indllctivn probnbilista. Cuando el grado de apoyo de una proposición por otras no es total (deducción), no se puede medir el apoyo parcial con una función probabilista. El grado de apoyo evidencial no es una probabilidad. Popper dice haber dado con un arsumento que prueba definitivamente que cualquier medida razonable del apoyo evidencial no puede ser probabilista. Hay varias versiones del argumento, pero la esencia del mismo es la siguiente (cf. p.ej. 1935-1958, SS3 y apéndice *iXy 1963, cap. 11, $6). (1) El contenido informacional varía inversamente con la probabilidad; cuanto más fuerte es una hipótesis, cuanto más dice, menor es su pro-
430
F U N D A S I E X ~ SDE FILOSOF~ADE LA CIENCIA
habilidad (las tautologías tienen probabilidad 1 al precio de ser vacías). (2) La ciencia
persigue hipótesis cada vez más informativas, con más contenido. (3) La ciencia persigue hipótesis cada vez mejor apoyadas por la evidencia. Por tanto (3), el apoyo evidencial no es una probabilidad. Nótese que si e1 argumento es válido se puede concluir también algo más fuerte, a saber, que ninguna medida que varíe directamente con la probabilidad puede medir el apoyo evidencial. La ciencia no avanza hacia hipótesis más probables sino más improbables. La aparente fuerza de este argumento depende de su ambigüedad; para que las premisas sean verdaderas, o convincentes, el término 'probabilidad' debe significar algo diferente en alguna de las premisas y en la conclusión. Si el término significa siempre lo mismo, el argumento es formalmente válido pero alguna premisa es claramente inaceptable; y si todas las premisas se interpretan de modo que sean aceptables, entonces el argumento es inválido por constituir una falacia de equivocidad (cf. cap. 2, $2). La equivocidad en cuestión involucra los sentidos incondicionado y condicionado de 'probabilidad'. Una cosa es la probabilidad de determinada hipótesis sin más, incondicionada (o condicionada sólo a cierto conocimiento de fondo), y otra diferente es la probabilidad de una hipótesis relativa o condicionada a una determinada evidencia. Y estas dos probabilidades pueden ser muy desemejantes, una hipótesis puede ser muy improbable "por sí sola" pero muy probable relativamente a ciertos datos. En concreto, para que la premisa (1) sea aceptable debe referirse a probabilidades incondicionadas, y en conlbinación con (2) dice que la ciencia persigue hipótesis cada vez menos probables, que es verdadero sólo en este sentido absoluto o incondicionado. Pero la conclusión (4) debe referirse a la probabilidad condicionada a la evidencia, pues de otro modo no se seguiría de la premisa (3), que habla del apoyo evidencia]. Lo único que se infiere válidamente de este argumento es (4') que el grado de apoyo evidencial no es una probabilidad incondicionada, algo que ningún inductivista ha defendido. Debe quedar claro que el sentido en que (1) + (2) es verdadero es el sentido incondicionado. En el sentido en que la probabilidad involucra 13 referencia a evidencia específica para la evaluación es fácil mostrar que en ciencia no siempre se prefieren las hipótesis menos probables. Supongamos que h, implica e y que e ocurre, con lo que e apoya evidencialmente (en el grado que sea) /ti; por ejemplo, h , puede ser la mecánica celeste newtoniana y e la reaparición del cometa Halley. Ahora tomemos una hz que no tenga intuitivamente nada que ver con e, por ejemplo la teoría de la combustión de Lavoisier. La conyunción hl A 1z2 es una nueva hipótesis que tambjén implica e, y además es más informativa o improbable en el sentido precisado, efectivamente ocurre que p(1t1 A h2) 5 p(h1). Pero en esta situación nadie diría que, relativameltte a la ei~idenciadisponible, la reaparición del cometa Halley, la ciencia prefiere la hipótesis de más contenido h , A 1z2. En cualquier caso, en opinión de Popper la idea de las probabilidades inductivas está inspirada en la vieja concepción de "La Ciencia" como conocimiento cierto, demostrable. La idea se ha modif cado, pues se reconoce que la certeza plena es inalcanzable, pero "como la inducción se considera una especie de generalización debilitada de la deducción, el antiguo ideal se ha modificado sólo ligeramente" (1956-1983, cap. IV,
S27). La pretensión que persisue el inductivismo es establecer nuestras hipótesis ernpiricas, si no con certeza plena, sí con certeza silfícietzte, con alta probabilidad. Pero esta pretensión es vana. En su opinión, no sólo los intentos específicos para desarrollarla están, como los propios inductivistas reconocen, llenos de problemas, sino que la idea misma de inducción probabilista, según cree haber probado con su argumento, está condenada al fracaso por principio: "Nuestra ciencia no es conocimiento (episteme); nunca puede pretender que ha alcanzado la verdad, ni siquiera el sustituto de ésta que es la probabilidad" (1935-1958, $85).
I: I
i 5
i
i I
!
1
11
El método científico no es inductivo. La ciencia no pretende establecer o justificar sus hipótesis. Sin embargo, aprendemos de la experiencia, aunque no por inducción. El método de la ciencia, el método por el que aprendemos de la experiencia. es el de las conjeturas y las refutaciones. El método científico es la máxima expresión del modo mediante el que todo organismo aprende de su entorno: por ensayo y error. En primer lugar, conjeturamos, inventamos libre y creativamente hipótesis generales sobre el mundo, cuanto más arriesgadas mejor (el objetivo de la ciencia no es buscar hipótesis más probables sino más improbables). En segundo lugar, sometemos las hipótesis a prueba mediante tests severos. De nuestras hipótesis (y del coiiocimiento de fondo) inferimos hechos particulares constatables mediante obser~acióno experimentación. Si el hecho particular predicho no acaece, la hipótesis no pasa el test y es refutada por ese informe observacional; si el hecho acaece, la hipótesis pasa el test y sobrevive provisionalmente. Todo lo que por el momento podemos afirmar en este segundo caso, a la espera de nuevos tests, es que la hipótesis puede ser verdadera. Se diseñan nuevos tests para refutarla hasta que no resista la contrastación y quede refutada, en cuyo caso la abandonamos e ideamos otra mejor que supere todas las contrastaciones de la primera y otras nueLas. Así es como se desarrolla y progresa la ciencia, por ensayo y error. El método científico es por tanto un método de contrastación de hipótesis, pero mediante la contrczstación la ciencia no pretende justificar sus hipótesis sino refictarlas. En esto consiste el racionalismo crítico, en hacer todo lo que está en nuestras manos para demostrar que estamos equivocados. Hacer todo lo que esté en nuestras manos incluye usar toda la lógica que podamos, pero no hay más lógica que la deductiva y por tanto no hay más inferencia posible en la contrastación que el ~nodztstollens, la refutación. Si el rnodus tollens no se puede aplicar porque la predicción es exitosa, no hay nada más que aplicar. La lógica sólo permite refutar hipótesis, nunca confirmarlas, ni total ni parcialmente. Al final de su Logik der Forschltng concluye: "No conocemos: sólo podemos conjeturar" (1935-1958, $85). Y nunca podemos saber, ni siquiera aproximadamente, si hemos acertado con nuestras conjeturas, sólo podemos saber que nos hemos equivocado. Ésta es la idea central del falsacionismo de Popper. Conviene enfatizar que no pretende establecer sólo cómo debe proceder la ciencia, sino cómo de hecho procede. Hay un problema lógico de la inducción, que resolvió Hume de una vez por todas (esto es, no
hay lógica inductiva). Pero no hay un problema ~~~erndológico de la induc~iónpues. simplemente, la ciencia no sigue de hecho un supuesto método induc~i\~o. La ciencia sigue de hecho el método de las conjeturas y las refutaciones, como muestra en su cpinión una correcta revisión de la historia de la ciencia, de la que él mismo extrae numerosos ejemplos (cf. p.ej. 1956-1983, "Introducción de 1982"). Conviene insistir en que no hay que interpretar estas afirrnliciones. hay que tomar literalmente la afirmación de que mediante la conuastación la ciencia 170 P K I C I Ijustificar ~ ~ SUS hipótesis sino refutarlas. Popper no dice que se pretende justificarlas empíricamente pero que tal pretensión es ilegítima, pues la justificación inductiva es impositile. Dice literalmente que no se pretende tal cosa, que cuando los científicos contrastan sus hipótesis no tienen la intención de justificar sus conjeturas sino de refutarlas. Eso. nuevamente, es un juicio metaempírico sobre las intenciones de los científicos que. cuando menos, dista de ser evidente sin cualjficaciones ulteriores. Como \*eremos, su teoría de la corroboración cabe entenderla como una importante cualificación al respecto. Hasta aquí cabria considerar la epistemolo,oía de Popper como una epistemología ~legatii-aen el sentido de que el único saber justificado sobre el mundo no es saber sobre cómo es el mundo sino sobre cómo no es. Se puede aducir que eso es efectivamente un modo de saber: saber que cierta hipótesis es falsa es saber algo del mundo. Pero aunque eso sea así, es cuando menos algo conuaintuitivo defender que ése es todo el saber al que aspira la ciencia, esto es, el tipo de saber que caracteriza al conocimiento científico (dejamos por el momento de lado el saber sobre hechos de obsen-ación particulares, sobre el que volveremos más adelante). La ciencia sólo podría aspirar a ser una especie de docra ignot-anria. Y, ciertamente, muchas veces Popper parece asumir abiertamente y sin reparos esta posición ("Fue mi viejo rnaesuo ebanista quien me enseñó l...] que cualquier saber al cual pudiera aspirar sólo podía consistir en conocer cada vez más la infinitud de ini ignorancia", 1973~7,8 1). Sin en~bargo.es difícil rechazar completamente la idea de que las contrastacjones exitosas permiten decir algo po~iti\~o de las hipótesis, esto es, que cuantos más datos resulten acordes con la hipótesis, ésta está, en algún sentido a especificar, mejor "justificada". Ésta es la intuición que hay tras el inductivismo y que parece difícil rechazar plenamente. La teoría de la corroboración de Popper matiza este rechazo incorporando ri su falsacionismo. pace Popper. un grano de intuición inductivicta.
La noción popperiana de grado de corroboracióií pretende expresar cierra evaluación de una hipótesis en virtud de e\idencia pasada favorable. Para ello no sólo importa la cantidad de la evidencia sino ~imbiénla calidad, el rigor de las contractaciones. Popper afirma que no todas las contrastaciones son jgua!es, unas son más rigurosas que otras, y es fácil ~ e que r esa diferencia sólo se considera relevante cuando la hipótesis supera el test, pues si sucuníbe a la contrastación queda refutada sin importar cuán riguroso haya sido el test; en la refutación no hay grados. El rigor de los tests depende de algunos elen~entos pragm5ticos ineliminables (como la autenticidad y sinceridad en la intención de refutar la
1 í
i
!
E V A L U A C I ~ NDE LAS TEOR~AS Y
EL PROBLEMA DE LA INDL'CCIÓN
423
hipótesis). Pero, fijados esos elementos, los restantes se pueden precisar formalmente en términos del contenido de las proposiciones involucradas. Ya hemos visto que, según Popper, se debe aspirar a hipótesis de mayor contenido y que por 'contenido' se debe entender improbabilidad, esto es, el contenido Ct de una afirmación Cl es el complemento de su probabilidad: Ct(a) = J - ~ ( a ) . ~ Popper identifica por lo general ia noción de contenido (o irnprobabilidad) con la de falsabilidad (o corroborabilidad), y ésta con la de explicatividad. La falsa'oilidad de una afirmación depende de la cantidad de sus falsadores porenciales: cuantos más hechos particulares puedan falsar a,tanto más falsable es. Hay casos en que es inmediato ver cuál de dos afirmaciones es más falsable: "Todos los seres inteligentes habitan en la Tierra" es más falsable que "Todos los seres inteligentes habitan en el Sistema Solar'', pues hay más hechos que falsarían la primera que la segunda (todo hecho que falsa la segunda falsa también la primera, p.ej. la presencia de inteligencia en Alfa Centauro, y la primera es falsada además por hechos que no falsan la segunda, p.ej. la existencia de un marciano inteligente). Aunque para otros pares de afirmaciones no sea tan fácil de determinar, se supone que también son comparables en cuanto a falsabilidad. Este concepto comparativo de falsabilidad sugiere otro absoluto que "mida" la falsabilidad de cada afirmación, y el mejor candidato al mismo es el contenido o improbabilidad. Aunque en general Popper recomienda proponer hipótesis de mayor contenido, el rigor de una contrastación no depende del contenido de la hipótesis. Lo que se quiere es determinar cuán riguroso es el test de h mediante la evidencia e y ello no depende del contenido de h sino de la relación entre h y e, y del contenido de e; dos hipótesis con diferente grado de falsabilidad se pueden contrastar con igual rigor. El ri;or depende, en primer lugar, del contenido de e, esto es, de la improbabilidad absoluta de e sin tensr en cuenta h (teniendo en cuenta tan sólo el conocimiento de fondo). Y en segundo lugar, de lo probable que sea e teniendo en cuenta h. La idea es que la contrastación de h a la luz de la evidencia e es tanto más rigurosa cuanto más probable sea e suponiendo que h es verdadera y menos probable sea e independientemente de h. La intuición que hay detrás es que un test en el que la predicción es muy probable tanto si ocurre h como si no, no es un buen test. La medida de rigor S(e, h) del test de h mediante e se puede identificar pues con p(e1h) - p(e) (en realidad, por motivaciones técnicas, Popper define la medida de un modo un poco más coinplicado, S(e, h) = [p(elh) - p(e)] / [p(elh) + p(e)], pero ello no afecta al núcleo de la cuestión y no tendremos en cuenta esta complicación técnica); esta medida S(e, h) se puede considerar también, según Popper, como una medida del poder explicativo de h respecto de e (cf. 1963, Apéndice, 42). En los casos de contrastación usuales en los que e se predice a partir de h (y del conocimiento de fondo), h implica e con lo que p(elh) = 1 y la medida del rigor es 1 - p(e), justamente la improbabilidad de e. Apreciará el lector que esta condición de Popper para un buen test no es sino la recurrente Condición 2 sprobabilidades relativizadris a un conocimiento de fondo h, por lo que 3. Popper considera todas 1 las probabilidades "incondicionadas" p(a) se han de interpretar como p(cllh). Aquí no intraduciremos la complicación notacional correspondiente; en adelante, salvo advertencia en contrario, $(a)'abrevia 'p(co'h)' y 'p(P1oc)' abrevia 'p(P/cr A h)'.
que vimos en el capítulo 3 ($2): e es altamente inesperada en ausencia de A (en cuanto a la Condición 1, Popper es más liberal. pues no exige que h implique e). Ahora estamos en situación de ver la noción de grado de corroboración. Popper dice que S mide "la severidad de los tests como elemento de juicio favorable" (ibid.). Esta afirmación resulta sorprendente si, como él mismo sugiere en numerosas ocasiones, se interpreta su crítica al inductivismo como un rechazo de cualquier concepto que quiera expresar "los elementos de juicio favorables". Pero no se debe interpretar así. Popper sostiene que hay dos sentidos en los que coloquialmente se usan los términos 'probable' y 'probabilidad' (cf. para lo que sigue 1956-1983,cap. IV). Según uno de ellos, la probabilidad de un suceso o una hipótesis está en relación con sus oportunidades para ocumr. Según el otro, la probabilidad de una hipótesis está en relación con los resultados de las contrastaciones. Los dos sentidos son diferentes, el primero satisface el cálculo matemático de las probabilidades, el segundo no (cf. más adelante). Coloquialmente no se distingue entre ellos y el error de los inductivistas consiste en identificarlos. Para distinguirlos, en su primera obra de 1935 reservó 'probabilidad' para el primero y acuñó 'grado de confirmación' para el segundo. Pero puesto que los inductivistas se apropiaron de esta expresión haciéndola sinónima de la primera, y puesto que le pareció después que su uso de 'confirmar' era desafortunado por sus connotaciones verificacionistas, terminó sustituyéndola por 'grado de corroboración'. Al principio Popper usa el concepto de corroboración sólo en un sentido comparativo. Una hipótesis h está tanto o más corroborada que otra h' si h ha pasado con éxito al menos tantos tests, y tan rigurosos, como h'. Pero este concepto comparativo es de poca utilidad. Si h y h' han sido refutadas en realidad ninguna está corroborada. Si h' ha sido refutada y 11 no, h está corroborada y h' no. Así, para que sea una noción interesante debe poder aplicarse a los casos en que ambas han resistido todas las contrastaciones, pero esta noción puramente cualitativa no permite de momento tal cosa. Para ello introduce una medida C del grado de corroboración. La función de C(h, e) es medir el éxito con que una hipótesis h ha superado las contrastaciones hasta cierto momento, contrastaciones cuyos resultados se expresan conjuntamente en e. C es. por tanto, una medida de apoyo evidencial. Advierte que, como en el caso de S, la corroboración depende en parte de aspectos no analizables formalmente, como la ingeniosidad o la "sinceridad" de las contrastaciones (e.e. la realización de la contrastación con la intención de refutar la hipótesis), pero que considerados fijados tales aspectos, el grado de corroboración se representa satisfactoriamente mediante la medida formal C. Popper afirma que los valores numéricos concretos que asigne C no son lo importante, sino ciertas condiciones según él intuitivas que debe satisfacer, y establece nueve desideruta (axiomas) para C (cf. 1935-1958, apéndice *m). No podemos detenemos en ellos aquí. Algunos parecen bastante arbitrarios, como (11) exigir que C esté entre -1 y 1; otros dudosamente intuitivos, como (N) C(x, x) = Cr(x) = 1 - p(.x). Y, como comentaremos más adelante, otros tienen un aspecto bastante inductivista (VI1 y VIII). Popper considera que la medida más intuitiva para C(lt, e) es la que corresponde al rigor de los tests pasados por h cuyos resultados contiene e, esto es, p(el1z) - p(e). Sin embargo, este valor incumple algunos de los desiderata (p.ej. 11), y opta conlo recurso técnico por dividirlo por el factor p(e1h) - p(h A e) + p(e), del que reconoce que no tiene significación intuitiva alguna y que se escoge sólo porque lleva a los resultados deseados
EV~ILUACI~N DE LAS TEOR~XSY EL PROBLEMA DE LA IXDUCCI~H
425
(cf. 1956-1983, $31). La definición del grado de corroboración queda entonces del siguiente modo: C(h, e) = [p(elh) - p(e)] / [p(e/h) - p(h A e) + p(e)l, donde el numerador contiene toda la intuición expresable por el concepto. Esta medida del grado de corroboración como grado de apoyo evidencial tiene en opinión de Popper muchas consecuencias satisfactorias. Primero, es una medida no probabilista y muestra que el grado de apoyo evidencial no es. una probabilidad. La probabilidad p (como el grado de confirmación carnapíano c ) varía entre O y 1, el grado de corroboración C varía entre -1 y 1 (másadelante discutiremos si esta razón basta como argumento antiinductivista); la interpretación pretendida es que la evidencia es favorable, irrelevante o desfavorable si C es, respectivamente, mayor, igual o menor que 0. Segundo, si e implica no-h (refutación), tanto p(elh) como p(h A e) son O y por tanto C(h1e) = -1. Tercero, si e y h son lógicamente independientes, entonces p(h A e) = p(h) p(e) y por tanto C(h/e) = O. Cuarto, la máxima corroboración C(hle) = 1 se obtiene cuando h implica e (e.e. p(h A e) = p(h)) y p(e) = 0; eso quiere decir que en casos de predicción exitosa, en los que e se deduce de h, el grado de corroboración se aproxima tanto más a 1 cuanto más se aproxima p(e) a 0, esto es cuanto mayor es el contenido de e. Éste es el núcleo de la teoría de la corroboración de Popper. Si la evidencia es contraria a una hipótesis, ésta queda refutada. Si la hipótesis resiste la contrastación, se puede mantener provisionalmente y considerarla "apoyada" por la experiencia en grado proporcional al contenido de e. Pero Popper sostiene que este apoyo evidencial no es probabilista. La experiencia no permite establecer la verdad de una hipótesis, ni ningún sucedáneo suyo como la probabilidad. Su grado de corroboración, insiste Popper, no es como el probabilista grado de confirmación de los camapianos. Lo que debemos perseguir son hipótesis mejor corroboradas, no más probables. Y no se ha de pensar por eso que el grado de corroboración es indicio de la aptitud para salir indemne de contrastaciones futuras. S610 expresa la nota con que ha pasado contrastaciones pasadas, y de ahí no se puede inferir nada del futuro. A pesar de ello, la corroboración es guía para la acción: "Desde un punto de vista racional no podemos~umosde ninguna teoría [...] sin embargo, debemos elegir la teoría mejor contrastada como base para la acción" (1972, $9).
De la anterior caracterización del grado de corroboración surge un problema. Si Popper tiene razón y su medida C no tiene nada de "sucedáneo de la verdad", nada de probabilista, entonces perseguir un mayor grado de corroboración no es acercarse hacia la verdad. ¿Qué tiene que ver en ese caso la investigación científica con la verdad? Para un antirrealista eso no representa mayor problema, pero para un realista declarado como Popper sí. Los carnapianos tenían al menos un sucedáneo de la verdad, Popper no. Por lo que a la verdad se refiere, de las hipótesis corroboradas sólo podemos decir que pueden ser verdaderas. Y podemos decir eso de todas las no refictudas, sean cuales sean sus diferentes grados de corroboración. Por tanto, hasta aquí la metodología de Popper debe tratar, por lo que a la verdad se refiere, a todas las hipótesis no refutadas exactamente del
inistno t~iodo.Aunque Popper se dice realista, la verdad no juega hasta ahora ningún papel. Lo único que se puede decir de ella es tan débil, a saber, que cierta hipótesis puede ser \,erdadera, que eso mismo se puede decir de todas las hipótesis (las no falsadas:~por igual. Popper intenta resolver esta dificultad mediante el concepto de \jerosiinili;ud ('trurhlikness'). La verosimilitud de una afirmación expresa su "distancia" respecto de la verdad. La idea es que, aunque dos hipótesis sean falsas, una puede estar objetivamente "más próxima" a la verdad que la otra. Una hipótesis falsa puede tener, además de consecuencias falsas, un gran número de consecuencias verdaderas, piénsese, p.ej., en el geocentrismo, o en la mecánica newtoniana. mies bien, una hipótesis (empírica) está tanto más cerca de la verdad, es tanto más i~erosfinil,cuanto mayor sea la diferencia entre su conreilido de verdad y su co~ttenidode falsedad (cf. para lo que sigue 1963, Apéndice, $3). Si hTes el conjunto (o conyunción) de consecuencias verdaderas de 11, Popper identifica el contenido de verdad de 11, Ctdh), con el contenido de 117, e.e. 1 - p(h~);y para que se cumplan ciertas condiciones que considera deseables, identifica el coltte~zidode falsedad de h, Ctdh), con 1 - p(ldhT).Así definidos los contenidos de verdad y falsedad, la verosimilitud de h es Vs(h) = Ctdh) - Ctdk) = p(Mh~)p(ltT). De nuevo, para que la medida satisfaga ciertos desiderata que le parecen iiituitivos, cambia a una versión normalizada dividiendo por p(ldhT)+ p(lzT): Vs(h) = [ ~ ( W ~ I-Tp(h~)] ) 1 [p(Idh~)+ y(h~)].En esta nueva forma, esta medida de distaizcia de la verdad genera los siguientes resultados: vaná entre -1 y 1; es -1 para las contradicciones; es O para las tautologías; es mayor que O cuando 11 es verdadera y tanto más próxima a O cuanto más alta sea p(h). Concluiremos el estudio del problema de la inducción en Popper con una breve discusión de las principales dificultades.
Verosii?zilinrd. Como ha reconocido el propio Popper, su definición precisa de verosimilitud es defectuosa, pues produce inconsistencias (cf. 1956-1983, "Introducción de 1982", $V, también p.ej. Rivadulla, 1991, cap. III). Algunos popperianos, especialmente Niiniluoto, han trabajado en definiciones alternati~as(Niiniluoto, 1977. 1982 y 1984). Pero el principal problema no es ése. El principal problema es que dicho concepto, independientemente de la medida específica que se dé, no resuelve el problema para el que el realista recurre a él. Simplemente, esa "distancia objetiva a la verdad es relativa exclusivamente a h, izo tiene en cuenta evidencia alguna eií absoluto. Pero entonces, ¿qué relación tiene con la corroboración? Ninguna. Debemos elegir las hipótesis mejor corroboradas, pero nada garantiza que corroboración y verosimilitud vayan de la mano. Es perfectamente posible que hipótesis cada vez más corroboradas sean cada vez menos verosímiles. La verdad sigue estando ausente de la investigación científica. Que la ciencia avanza hacia la verdad es un supuesto injustificado y, por tanto, gratuito. El realismo de Popper es puramente testimonial. Algo análogo sucede con la revisión de Niiniluoto. Define una verosimilitud objetiva que es independiente de la evidencia y que no tiene ninguna relación con la contrastación. Después define una verosimilitud estitnada que toma.en cuenta la evidencia, pero que puede diferir total~nentede la verosimilitud objetiva.
EV:\LUACI~N DE LAS TEOR~AS Y EL FRODLE\fX DE LA I N D U C C I ~ N
427
Severidad de los tests y falsación. En la medida S = p(e1h) - p(e) de severidad d e los tests. e contiene los datos empíricos resultantes del test o conjunto de tests realizados. En los casos de contrastación favorable, e es predicho por h. h implica e. En los casos d e contrastación desfavorable, e refuta h porque h predice-lo contrario de e, h implica no e y por eso e implica no h. Pero eso supone que los tests desfavorables nunca son severos, pues si h implica no e entonces p(elh) = O y S = - p(e). Esto es completamente contraintuitivo, pues la medida de severidad de un test no puede depender de que el test resulte favorable o desfavorable. Intuitivamente el rigor de un test determina cuán útiles son los resultados, sean éstos favorables o desfavorables. La medida de Popper de severidad d e los tests no se aplica a los casos de refutación, pero entonces tampoco se puede considerar que mida eso en los casos de corroboración. Simplemente S no es una medida de severidad de los tests. Y así parece reconocerlo implícitamente Popper cuando dice que S mide la severidad de los tests "como elementos de juicio favorables" (1963, Apéndice, $2). En realidad, como muestra la construcción de C. S es indicio del grado de corroboración, la "parte intuitiva" de ambas medidas es la misma: p(elh) - p(e). Corroboración e implicación. Según Popper, su medida C tiene consecuencias claramente satisfactorias en tanto que medida del apoyo evidencial. Pero, incluso si eso es así (cf. más abajo los próximos problemas), tiene otras consecuencias que son claramente contraintuitivas. La primera es que si e implica h, entonces C(h, e) = 1 - p(h). Esto es, cuando de los datos se deduce la hipótesis, C coincide con el contenido Ct de la hipótesis. En particular, C(.r, x) = Ct(,r): el "grado en que x se apoya a sí misma" no es el máximo, 1 (salvo que x sea una contradicción). Aunque eso no le parece a Popper contraintuitivo, e incluso lo exige como uno de los axiomas (cf. 1935-1958, apéndice *N,desiderata 111), no se ve entonces qué tiene C de medida del grado de corroboración o apoyo. Parece constitutivo de la noción de apoyo que si e y h son lo mismo, e apoya h en grado máximo. Y por supuesto lo mismo sucede si e implica deductivamente h. Ateoriciano. Popper es uno de los que más duramente ataca la ateoricidad del grado de confirmación c carnapiano (y la introducción, en su opinión ad hoc, del grado de confirmación cualificada cc; cf. p.ej. Popper, 1963, cap. 11, $6). Pero a su medida de corroboración le ocurre algo parcialmente semejante, con el agravante de que, contrariamente a Camap, él no está dispuesto a ser instmmentalista. En Camap, si el lenguaje es infinito, c asigna a toda hipótesis general el valor mínimo 0. Con la medida C de Popper no ocurre eso, pero ocurre que, relativamente a l mismo cuerpo de predicciones exitosas e, todas las hipótesis generales son corroboradas en el misino grado. En efecto, en los casos en que los datos e son los predichos, e es implicado por h y por tanto p(e1h) = 1. Si además h es universal (y, como en la situación problemática para Carnap. el lenguaje infinito), p(h) = O y por tanto también p(h A e) = O. Pero entonces, sustituyendo estos valores en la medida de Popper, tenemos que para cualquier hipótesis universal h, C(h, e) = (1 - p(e)) 1 (1 + p(e)). Como puede verse, este valor no depende de h, esto es: los mismos datos corroboran en igital grado crlalquier hipótesis general que los prediga. Ello representa sin duda otra forma de ateoricismo, pues el grado de corroboración es insensi-
ble a diferencias teóricas, es independiente de las diferencias entre las hipótesis generales
en juego. No se ve, entonces, cómo se va a poder "perseguir" o "elegir" entre diferentes hipótesis la mejor corroborada si de hipótesis generales (e.e. teorías) se trata. iA~zriitiductivismo? "El inodus tollens sin corroboración es vacío, el ~nodustoIlens con corroboración es inducción" (Salmon, 1966, p. 160). Muchos, como Salmon, han acusado a Popper de ser un inductivista encubierto, pues su grado de corroboración es despues de todo una medida de apoyo evidencial. Popper rechaza la acusación e insiste en que su medida no pretende decir nada del rendimiento futuro ofiabilidad de las hipótesis. Además de esta réplica general. demasiado vaga por sí sola, el único aspecto diferenciador concreto en que insiste es el probabilista. Su grado de corroboración, sostiene reiteradamente, no es probabilista. Pero, como vamos a ver, en la medida en que esta afirmación es verdadera, no establece ninguna diferencia interesante, y en la medida en que establecería diferencias interesantes su afirmación no es cierta. Popper dice que su medida C no es probabilista porque, a diferencia de la camapiana c, no satisface los principios del cálculo de probabilidades. Por ejemplo, C varía de -1 a 1 y no de O a 1; o, para 111y 112 incompatibles, no ocurre que C(hi v hz,e) = C(hl,e) + C(h2, e); o tampoco que C(h, e) = 1 - C(no-h. e). Todo esto es verdad, pero no establece una diferencia inreresaizte respecto al carácter probabilista de la medida. En primer lugar, y antes de entrar en el fondo de la cuestión, hay que recordar que C varía de -1 a 1 sólo porque así se ha definido ad Izoc. La parte intuitiva de C, el numerador p(e,h) - p(e), vana de -p(e) a 1 - p(e) y sólo consigue que varíe de -1 a 1 dividiendo por el factor reconocidamente a d hoc p(e, h) - p(h A e) + p(e). En general, todos los supuestos beneficios intuitivos de que C varíe en concreto entre -1 y 1 no son tales, pues estos límites son totalmente arbitrarios y satisfechos ad hoc. Es realmente sorprendente que, entre los axiomas o desiderata que según Popper cabe exigir intuitivamente a toda medida de apoyo evidencial, se incluya la exigencia de que C varíe de -1 a 1, y otras más que presuponen esto, cuando reconoce (cf. 1956-1983, $3 1) que, para que su propia medida satisfaga estas exigencias, debe introducir un factor sin significación intuitiva alguna. A pesar de ello, se dirá, la parte intuitiva de C varía entre -p(e) y 1 - p(e), y no entre O y 1. Cierto, pero eso no es por sí solo demasiado interesante, pues, como vimos, el propio Carnap afirma a veces que se puede medir la fiabilidad de h dado e mediante la diferencia c(h, e) - m(h), medida que varía entre -m(k) y 1 - m(h) y que tampoco cumple los principios del cálculo de probabilidades. Otra aparente diferencia en cuanto al comportamiento probabilista de estas medidas es que, cuando e implica deductivamente 11, c(h, e) (o su derivado c(h, e) - m(h)) alcanza, como la probabilidad, el valor máximo posible, mientras que C(lz, e) (o su parte intuitiva p(e, h) - p(e)) no. Pero, en primer lugar, como vamos a ver, esto no basta para liberar a C de todo espíritu probabilístico-inductivista. Y en segundo lugar, aquí las intuiciones están claramente en contra de Popper, pues si los datos implican la hipótesis parece claro que el grado de apoyo en este caso ha de ser el máximo de la medida. Lo que realmente importa para ver si una medida de apoyo evidencia1 es o no de inspiración probabjlista es si crece o no con las probabilidades anteriores. La insistencia
EVALUACIÓNDE LAS TEOR~AS Y EL PROBLEMA DE LA I N D C C C I ~ N
429
de Popper en que lo que cuenta, y hay que perseguir, no es la probabilidad sino la improbabilidad sugiere que su medida no es de inspiración probabilista. Incluso a veces Popper afirma explícitamente que apoyo evidencial e improbabilidad van juntas: "la corroborabilidad de una teoría, y el grado de corroboración de una que haya pasado realmente contrastaciones muy duras, se encuentran en razón inversa a la probabilidad" (1935-1958, 983); "contenido e improbabilidad tienen una relación tan estrecha con el grado de corroboración como la propia contrastabilidad" (1956-1983, $30). Pero, en la interpretación más natural. eso es simplemente falso. Es cierto que la contrastabilidad tiene una relación directa con la improbabilidad (o contenido), de hecho muchas veces las identifica sin más. Y la corroborabilidad también, pues es lo mismo que la contrastabilidad. Pero grado de corroborabilidad y grado de corroboracicín no son lo mismo, el primero mide cierta propiedad de h. su fuerza o contenido, el segundo mide cierta relación entre h y e, el apoyo a h de los resultados e de los tests pasados con éxito. Y aunque Popper diga lo contrario, simplemente no es cierto que ambas medidas tengan la misma relación con la probabilidad. De nuevo, se está mezclando la probabilidad incondicionada de la hipótesis y la probabilidad de la hipótesis condicionada a los datos. Nótese que cuando Popper afirma que el grado de corroboración es inverso a la probabilidad, debe estar refiriéndose a la probabilidad de la hipótesis h. No puede refirirse a la probabilidad de e, pues es inmediato que (en los casos de contrastación exitosa, en los que h implica e) la medida de Carnap c(h, e) = m(h A e)lm(e) también crece con la improbabilidad de e. Pero si de p(h) se trata, es simplemente falso que C(h, e) crezca al disminuir p(h). Y no sólo es falso de Ia C concreta que da Popper, sino de cualquier medida que satisfaga sus axiomas, pues el axioma VI11 establece que cualquier medida de apoyo evidencial aceptable debe satisfacer la siguiente condición: si h implica e, entonces C(h, e) y p(h) crecen a la vez. Así, no sólo no es cierto que C(h, e) decrece siempre con p(h), sino que en los casos más interesantes, cuando h predice e, ocurre justamente lo contrario, el grado de corroboración crece con la probabilidad anterior de la hipótesis. S e podría pensar que esto no hace necesariamente de C una medida probabilista, que lo importante no es si C crece con la probabilidad anterior de h sino si crece con la probabilidad posterior de h condicionada a los datos e. Según esta réplica, una medida de apoyo evidencial sólo puede ser calificada de inductivista-probabilista si crece con las probabilidades condicionadas p(h1e). Pues bien, es fácil ver que el anterior resultado, en combinación con otro de sus axiomas, el VII, tiene justamente esa consecuencia: en los casos de contrastación positiva (predicción exitosa) C(hle) crece con p(hle), esto es, el grado de corroboración y la probabilidad condicionada son citalirativamente indistinguibles. En efecto, para hl, h~ que impliquen e tenemos: (i) C(hl,e) 2 C(h2, e) syss p(hJ 2 p(h2), por a.~.VIII; (ii) p(hi) = p(hi A e) y p(h2) = p(h2 A e), pues ambas hipótesis implican e; (iii) p(h1le) 2 p(hJe) syss p(hl A e) 2 p(h2 A e), pues p(hle) = p(h A e)lp(e). De estos tres colorarios se sigue inmediatamente C(hl, e) I C(h2, e) syss p(hlle) 1 p(h:le). Por otro lado, su axioma VI1 establece en general (salvo que h sea contradictoria) que C(h, el) 2 C(h,ez) syss p(Wel) 1 p(hle2). En consecuencia, de las condiciones que según Popper cabe conceptualmente exigir a la noción de grado de corroboración o apoyo evidencial, cuando e es implicada (predicha) por Iz se siglie tanto C(h1, e) L C(h2, e) syss p(hile) 2 p(hile)
430
FUND,4hlE?;TOS DE FILOSOFLADE L.4 CIENCIA
como C(lz, e,) 2 C(h, e:) syss p(Wei) 1 p(lzlez). Ello significa que, en los casos de apoyo positivo por predicciones exitosas, el grado de corroboración popperiano y el grado de confirmación camapiano son cualitativamente indistinguibles. Si añadimos su insistencia en que lo que importa no es la asignación numérica específica, y si prescindimos de las condiciones derivadas de los límites -1 y 1 impuestos ad Aoc, entonces hay muy serias razones para considerar que el grado de corroboración de Popper, a pesar de sus declaraciones en sentido opuesto, es una medida de evaluación de carácter probabilista. Su lema "no hay que perseguir hipótesis altamente probables sino altamente corroboradas" es equívoco. De nuevo se fluctúa entre las probabilidades incondicionadas y las condicionadas, y si, como en Carnap, la cuestión es qué pasa con estas últimas, entonces también en Popper cuanto más corroborada está 1%por datos predichos e, más probable es h relativamente a e.
Carga teórica de los lzecltos y lílnires de la falsación. En el capítulo 8 (95) vimos que Popper fue de los primeros en llamar la atención sobre la carga teórica de los heclzos, en la que insistirían después los historicistas. En la contrastación, e contiene los datos empíricos "dados" en la observación-experimentación, es la base empírica o base de contrastación. Popper reconoce abiertamente el carácter teórico, hipotético, de la base de contrastación: "El paso siguiente consistió en aplicar el punto de vista crítico a los enunciados contrastadores, la 'base empírica': subrayé el carácter hipotético de toda observación y de todo enunciado observacional. Esto me llevó a pensar que todo lenguaje estáimpregnado de teoría" (1972, cap. 1, $13). Y también reconoce que eso tiene consecuencias para la contrastación: "Siempre que una teoría se somete a contrastación, ya resulte su corroboración o su falsación, el proceso tiene que detenerse en algún enunciado básico que decidirnos aceptar: si no llegamos a decisión alguna a este respecto [...] la contrastación no lleva a ninguna parte" (1935-1958, cap. V, 929). Pero entonces la lógica de la -falsación pierde gran parte de su fuerza. Si la refutación de lz es relativa al informe observacional e, y la aceptación de e equivale a la aceptación de otra hipótesis h', que como máximo sólo puede estar, como toda hipótesis, provisionalmente no refutada, lo que sucede en realidad en un caso de refutación de una hipótesis h mediante datos e es el conflicto lógico entre dos hipótesis Iz y h'. Esto nos conduce a toda una familia de críticas, provenientes de los filósofos de la ciencia historicistas, sobre el carácter radical o no del falsacionismo de Popper, que examinamos a continuación. 5. Complejidad de las teorías, anomaIías y falsación Cuando en los años sesenta los llamados ?luevosfilósofos de la cie~iciairrumpen en escena, el programa inductivista ya había entrado en decadencia. Aunque alguno de estos nuevos filósofos contribuye con sus críticas a aumentar los problemas del inductivismo (cf. Lakatos, 1968a), por lo general no dirigen su munición contra el inductivismo en crisis sino contra el falsacionismo popperiano que había cobrado nueva fuerza después de su redescubrimiento a finales de los cincuenta. Entre estos críticos, los más activos son
EVI\LUI\CIÓS DE LAS TEOR~ASY EL PROBLEXIA DE LA I N D U C C I ~ N
43 1
Toulmin (1961, 1970). Hanson (1958, 1967, 1971). Feyerabend (1963, 1965, 1 9 7 0 ~ . 1975), Kuhn (1962-1970, 1 9 7 0 ~ .1970b, 1970c) y Lakatos (19686, 1970. 1971. 1973a, 1974b, 1977). La crítica de casi todos ellos consiste en llevar hasta las últimas consecuencias algunos elementos que ya están presentes en la filosofía de Popper, especialmente la carga teórica de los hechos, pero que éste se resiste a asumir. Aquí nos detendremos sólo en Feyerabend, Kuhn y Lakatos, y especialmente en los dos Últimos. L a crítica de Kuhn y Lakatos muestra además la necesidad de distinguir, por lo que a la evaluación empírica se refiere, entre hipótesis y teorías. Aunque ellos mismos no lo hacen explícito, su crítica al falsacionismo popperiano aplicado a las teorías depende esencialmente de la nueva concepción de teoría empírica que estos autores están gestando (cf. cap. 9).
Feyerabend, el más provocador de los nuevos filósofos, comienza arremetiendo contra lo que considera los dos principios o reglas básicas del neoempirismo: (1) hay que desarrollar hipótesis teóricas consistentes con los hechos; y (2) hay que desarrollar hipótesis teóricas consistentes con otras teorías aceptadas. Feyerabend arremete contra ellos por razones tanto históricas como conceptuales. Si atendemos a la historia, y él presenta multitud de esrlidios de cosos que en su opinión avalan su tesis, debemos reconocer como cuestión de hecho que la ciencia pocas veces se atiene a tales principios, y en momentos cruciales nunca. Pero, además, la ciencia no debe comportarse así. La razón tiene que ver directamente con la carga teórica de los hechos: la ciencia no debe seguir (2), pues la ciencia evoluciona eliminando teorías y la evidencia en contra de una teoría sólo puede extraerse a la luz de otra teoría incompatible con ella. Los datos empíricos constituyen evidencia contra una teoría sólo cuando se contemplan a la luz de otra teoría incompatible. Puesto que los enunciados empíricos incluyen supuestos teóricos, los motivos para rechazar (2) constituyen a su vez motivos para rechazar (1). Esta crítica se dirige contra todas las formas de neoempirismo de la filosofía de la ciencia clásica, tanto contra el confirmacionismo de Carnap como contra el falsacionismo de Popper. Las consecuencias ruinosas para el neoempirismo explícito de Carnap y su escuela son inmediatas, pero en opinión de Feyerabend su crítica arruina igualmente el neoempirismo encubierto de Popper: proponer alternativas sólo tras la refutación es poner el carro delante del caballo, pues sólo con alternativas previamente disponibles es posible la "refutación". Feyerabend propone proceder contraindrtctivamente: elaborar hipótesis inconsistentes con los hechos y, por tanto, con teorías ya aceptadas. Más que una propuesta se trata de una supuesta constatación: así es como opera la ciencia en sus mejores momentos. El resultado natural de estas tesis es la defensa de una metodología irrestrictamente pluralista: proponer y sostener hipótesis no importa de qué tipo, incluso si los especialistas-guardianes no las consideran científicas. Éste es el origen de su famoso "todo vale" (hasta las ideas más descabelladas). No pretende defender con ello un nuevo método sino, como le gusta decir, un antimétodo, una (anti)teoría anarquistaldadaísta del conocimiento. No tiene ningún reparo, por supuesto, en admitir el irracionalismo que estas ideas implican. El mito
432
FUI\'DAhlE'\X)S DE FILOSOFL~ DE LA CIENCIA
de la racionalidad de la ciencia frente a la presunta irracionalidad de otros sistemas de creencias representa una amenaza para una sociedad libre, conduce a una sociedad sometida a la tiranía de los expertos. Feyerabend reconoce que la ciencia tiene también una tendencia a la re~lacidad (que tiende a valorar negativamente). pero eso no contradice sus tesis, pues no cree que la tenacidad sea el factor dominante en ningún período histórico. No acepta la parcelación kuhniana en períodos de ciencia normal y ciencia extraordinaria. Las crisis no se producen sólo por problemas internos a una teoría; para que surja una crisis es precisa la interacción entre diversas teorías. Por ejemplo, para el surgimiento de la crisis de la mecánica clásica fueron esenciales resultados de la electrodinámica y la teoría del calor. Según Feyerabend, los elementos dogmáticos y críticos actúan simultáneamente, se da una constante tensión entre las tendencias a la tellacidad y a la prolifel-ación que no se traduce en períodos cualitativamente diferentes.
Las críticas de Kuhn y Lakatos también explotan la carga teórica de los hechos señalada ya por Popper, aunque tienen consecuencias menos radicales que las de Feyerabend, principalmente porque disponen de una nueva noción de teoría que les permite configurar una alternativa metodológica. Las posiciones de Kuhn y Lakatos no son plenamente coincidentes (en general Lakatos es un poco más matizado en sus juicios sobre Popper), pero aquí vamos a obviar sus diferencias y a centramos sólo en un núcleo mínimoque comparten en líneas generales. Kuhn y Lakatos critican el falsacionismo ingenuo que, en su opinión, cabe atribuir a Popper a pesar de sus declaraciones en contra. El falsacionismo ingenuo es doblemente inaceptable. Es inaceptable de heclw, pues la historia nos muestra que no siempre, enrealidad muy raramente, se abandonan las teorías tras contrastaciones desfavorables. Las teorías están permanentemente llenas de arzomalías enlpíricas, experiencias que no enca. jan en la teoría, que son inconsistentes con ella y por tanto instancias refutadoras en el esquema falsacionista. Si fuera por eso, todas las teorías nacen ya refutadas y no dejan de estarlo jamás. Y también es inaceptable de derecho, pues las teorías no deben abandonarse ante cualquier contrastación desfavorable. El motivo es que los datos empíricos no son neutrales, no constituyen un tribunal "teóricamente neutral" sino que encubren hipótesis teóricas muchas veces de alto nivel. Lo que hay, pues, es un conflicto entre hipótesis teóricas: "No se trata de que nosotros propongamos una teoná y la Naturaleza pueda gritar NO; sino que nosotros proponemos una red de teorías y la Naturaleza puede gritar INCONSISTENTES'~ (Lakatos, 1970, p. 130). Las teorías nunca pueden considerarse falsadas concluyentemente, siempre se pueden arreglar las cosas modificando, en lugar de la hipótesis central en.juego, algunos de los supuestos auxiliares involucrados en la aceptación de los datos (es más, como ahora veremos, incluso si los datos se aceptan como aproblemáticos, siempre es posible preservar el núcleo de lo que está en juego y modificar aspectos específicos del cinturón protector).
EV,\LUACI~NDE LAS TEOR~AS Y EL PRORI-E\l;\ DE LA IN[IUCCIÓN
433
Popper se declara sorprendido por esta crítica pues, afirma, estas ideas no sólo no se oponen sino que coinciden plenamente con las suyas propias formuladas treinta años antes. En parte así es. Hemos visto sus tesis sobre la carsa teórica de los hechos contenidas ya en su primera obra, en las que insiste en su revisión para la traducción inglesa: "Las observaciones son siempre interpretaciones [...] a la luz de teorías" (1935-1958, $30, nota 2 añadida a la edición inglesa de 1958). Y también desdc el principio reconoce las limitaciones que ello supone a la idea de una refutación efectiva: "no es posibIe jamás presentar una refutación concluyente de una teoría" (ibid., $9); "siempre es posible encontrar una vía de escape a la falsación" (ibid., $6); "siempre he mantenido que nunca es posible demostrar concluyentemente que una teoría científica empírica es falsa" (1956-1983, $1). Pero coinciden sólo en parte, pues al mismo tiempo Popper hace numerosas afirmaciones que no se compadecen completamente con las anteriores, p.ej. "[las teorías científicas] deben ser eliminadas si entran en conflicto con observaciones" (1963, cap. 1, SIV), "ha de ser posible refutar por la experiencia un sistema científico empírico" (1935-1958, $6).Y lo que es más importante, aunque reconoce la posibilidad lógica de escapatorias a la falsación, anuncia que va "a proponer que se caracterice el tnérodo empírico de tal forma que excluya precisamente aquellas vías de eludir la falsación que mi imaginario crítico señala insistentemente, con toda razón, como lógicamente posibles" (ibid.). Y en plena polémica con Kuhn afirma que "[dlebería subrayarse que la incertidumbre de toda falsación empírica (que yo he señalado repetidas veces) no debe tomarse demasiado en serio (como también he señalado)" (1956-1983, $1). Estas afirmaciones, y muchas otras semejantes, hacen que Kuhn replique que "aunque no es un falsacionista ingenuo, sir Karl puede, sugiero, ser tratado legítimamente como tal" (1970a, p. 13). No es éste el lugar para seguir el detalle de la polimica, en la que cada parte dice no ser comprendida por la otra y a la vez, sorprendentemente, estar defendiendo en el fondo lo mismo (para un estudio detallado de la misma, cf. Díez, 1998). Lo importante es que el desacuerdo no se puede explicar atendiendo sólo a sus afirmaciones, aparentemente coincidentes, sobre la posibilidad o no de falsación. Tras la aparente congruencia en la superficie del problema hay una diferencia de fondo sobre la naturaleza y estructura de las teorías que hace entender a cada uno las mismas afirmaciones de diferente modo. Éste es uno de los puntos en los que, como expusimos en el capítulo 1 (S2), la dimensión interpretativa de la filosofía de la ciencia interacciona con la normativa o evaluativa. Popper tiene dificultades para articular coherentemente sus ideas sobre las normas que rigen la contrastación de las teorías porque maneja un concepto de teoría demasiado pobre. Si Kuhn y Lakatos pueden hacer "las mismas" afirmaciones de modo más coherente, y expresando en parte un contenido nuevo, es porque tras esas afirmaciones está emerpiendo un nuevo concepto de teoría empírica mucho más rico que el axiomático tradicional. La importancia de sus diferencias sobre la naturaleza de las teorías para el problema de la evaluación empírica se pone de manifiesto en una cuestión sobre la que Popper y Kuhn reconocen discrepar abiertamente, a saber, la existencia y el valor de la ciencia normal. Lo que está verdaderamente en juego no es el reconocimiento de la posibilidad lógica de escapatorias a la falsación, que ambos bandos reconocen, sino la valoración de las mismas. Kuhn afirma que las estrategias anti-falsación no sólo son extremadamente
434
F U K D A M E ~ ~DES FILOSOFL~ DE LA CIENCIA
comunes sino necesarias y las valora en general positivamente. Este tipo de estrategias son "normales" en el sentido kuhniano del término, son consustanciales al modo como nor~nalrnentese lleva a cabo la actividad científica, consustanciales a la ciencia normal. En este punto está plenamente de acuerdo con Lakatos y su idea de un cinturón protector al que se dirigen las refutaciones salvaguardando el núcleo de los programas-paradigmas. Para Kuhn y Lakatos, estas prácticas deben valorarse positivamente, pues son consustanciales a la práctica científica; simplemente, sin tales prácticas no sería posible la ciencia, pues no existe ni puede existir algo así como ciencia sólo revolucionaria y... la frase de sir Karl 'revoluciones permanentes', al igual que 'círculo cuadrado', no describe un fenómeno que pueda existir", Kuhn, 1970b, p. 242). Popper acepta que siempre se puede atener uno a tales estrategias, pero las califica casi siempre de ad hoc y las valora negativamente. Que además ese proceder pueda ser usual durante ciertos períodos le parece un serio peligro. Éste es el punto de abierto desacuerdo. Popper reconoce que Kuhn ha descubierto un fenómeno que a él se le pasó por alto, pero disiente radicalmente d e la valoración que Kuhn hace del mismo y llega a calificar al científico "normal" kuhniano de un peligro para la ciencia y hasta para la civilización (cf. 1970). Las reticencias y temores de Popper frente a la ciencia normal de Kuhn, y a ideas parecidas de Lakatos, y sus esfuerzos por admitirla-pero-desaprobarla, se deben a que no se apercibe de que lo que hacen Kuhn y Lakatos es básicamente llamar la atención sobre la complejidad estructural de las teorías y sobre el hecho obvio de que las teorías, entendidas de este modo, duran cierro tiempo. Los paradigmas de Kuhn y 10s programas de investigación de Lakatos son las teorías científicas contempladas emz toda su conzplejidad estructural. Los períodos normales son entonces aquellos en que las teorías "viven y se desarrollan" y los revolucionarios aquellos en que "nacen" y "mueren" (se suplantan). Aunque Kuhn y Lakatos contribuyen muchas veces a oscurecer el panorama, éste es el núcleo del que dependen el resto de sus afirmaciones sobre la evaluación de las teorías. Para la cuestión que ahora nos ocupa, los prjncipaies elementos de la nueva concepción de las teorías de Kuhn y Lakatos son dos (cf. para esto el capítulo 9, $2 y 33). En primer lugar, y aceptado ya por Popper, el carácter teórico de la base de contrastación; los datos experimentales están cargados con hipótesis teóricas implícitas. En segundo lugar, y no reconocido, o al menos no tematizado, anteriormente, la complejidad estructural de las teorías. Las teorías no son entidades monolíticas sino entidades estructuralmente muy complejas organizadas en diferentes niveles de esencialidad, con un núcleo programático formado por principios muy generales cuasi-vacíos que se desarrollan mediante un sistema de hipótesis-leyes progresivamente más específicas. Ante una experiencia refutadora siempre es posible "revisar los hechos", esto es, revisar las hipótesis implícitas que conceptualizan la experiencia. Pero incluso si se aceptan los hechos, la lógica no obliga a abandonar la teoría, siempre es posible retocar una o varias hipótesis específicas preservando el núcleo central. Popper no contempla esta posibilidad, o cuando lo hace la considera ilegítima, porque no la conceptualiza así. En línea con la tradición, concibe las teorías como entidades simples, monolíticas, ante las cuales la única opción es de tipo todo-onada; no distingue entre teorías, hipótesis y leyes. Y con esta concepción es imposible
diferenciar cambios de teorías y cambios en las teorías. Las teorías, según Kuhn y Lakatos, son entidades con diferentes niveles de esencialidad, con unas partes esenciales y otras accidentales. Una vez se ha reparado en esta complejidad estructural, lo que sostienen sobre la irrefutabilidad de las teorías (incluso no cuestionando los hechos) es casi una obviedad. Seguramente Popper no negaría que la Mecánica es, en un sentido del término 'teoría' que es cmcial para entender la ciencia real, una misma teoría de Newton a Laplace (con todos sus cambios). Pero en su metodología ese sentido no juega ningún papel, y es ese sentido el que le hubiera permitido articular coherentemente un falsacionismo no ingenuo, o no radical. Cuando discute con Kuhn y Lakatos sobre la falsación de teorías no está pensando en ese tipo de entidad, mientras que ellos sí. Popper tiene razón al decir que cuando las cosas van mal algo hay que hacer, pero no la tiene al decir que lo que hay que hacer es cambiar de teoría. Para aceptar lo primero sin verse obligado a aceptar lo segundo es preciso disponer de un concepto más rico y dúctil de teoría que permita distinguir entre cambio dentro de una misma teoría y cambio de una teoría por otra. Se dirá que, después de todo, Popper está en lo cierto respecto de su sentido estrecho de teoría: incluso desde la perspectiva de Kuhn y Lakatos, las hipótesis o leyes específicas sí se deben abandonar ante datos refutadores no cuestionados. Así es y así lo aceptan Kuhn y Lakatos. Éste es el grano de verdad del falsacionismo, aunque así presentado, sin cualificaciones ulteriores, es desorientador como análisis de la evaluación de teorías. Si no se añade nada más, se corre el riesgo de considerar cualquier cambio teórico al mismo nivel. Pero hay muy buenas razones para no hacer tal cosa. Consideremos los dos siguientes ejemplos de cambio teórico: a ) la introducción de un nuevo epiciclo en la órbita de Venus dentro de la teoría geocéntrica y b) la sustitución de la Tierra por el Sol como centro de giro en la revolución copemicana. Está claro que se trata de cambios teóricos cualitativamente diferentes. En el análisis de la evaluación de las teorías es esencial reconocer esta diferencia y, junto con ella, que la lógica sola jamás obliga a optar por una opción u otra. La diferencia cualitativa entre ambos tipos de cambio es, por supuesto, la que se da en cualquier entidad persistente entre cambios accidentales y cambios esenciales. En el caso de las teorías científicas, entre cambios intrateóricos- y cambios interteóricos. De ambos tipos de cambio nos ocuparemos en el próximo capítulo. Debe enfatizarse que no se trata de que Popper negara la complejidad estmctural de las teorías de la que depende una apreciación correcta de la lógica de la contrastación, sino que simplemente esta complejidad, puesta de manifiesto por los historicistas, no juega antes de ellos ningún papel, ni en Popper ni en ningún otro filósofo de la ciencia clásico. Seguramente, si se le hubiera planteado la cuestión abiertamente en estos términos, Popper mismo hubiera articulado su falsacionismo del modo "sofisticado" (e.e. no ingenuo) que pretendía.
6. Consideraciones finales En el capítulo 3 presentamos la metodología de la contrastación .de hipótesis aplazando para el presente la discusión de las cuestiones filosóficas sustantivas. Después
del recorrido realizado puede parecer que el panorama no es muy alentador. En parte así es. El viejo problema de la inducción y la evaluación tebrica sigue planteado, en sus aspectos centrales, en toda su crudeza. Pero algo se ha adelantado, cuando menos en el análisis de las prjncipales dificultades. Y a pesar de todas las dificultades, la intuición básica de que las predicciones exitosas suponen alzún tipo de apoyo empírico y que las predicciones fallidas se lo restan, sigue tan fuerte como al principio. El problema sigue siendo precisar esta intuición de modo satisfactorio. En términos generales se pueden extraer las siguientes conclusiones. 1. La aceptación de los datos empíricos mediante los que se realiza la contrastación comporta la aceptación de hipótesis teóricas de las que depende el uso que en la contrastación se hace de esos datos. Por tanto todo proceso de evaluación de unas hipótesis supone la aceptación de otras. Ésta es una nueva manifestación del carácter holista de la actividad científica que discutimos brevemente en el capítulo anterior. 2. Dejando provisionalmente al margen el problema del carácter hipotético de los datos de contrastación, la relación entre los datos (aceptados) y las hipótesis a evaluar presenta, como sabía la tradición, mayores dificultades en los casos de confirmación que en los de refutación. La idea de que la relación de confirmación va asociada a una lógica, en sentido estricto, parece abocada al fracaso. El principal problema es el de la determinación a priori de las probabilidades anteriores de las que dependen las relaciones de inferencia inductiva. No hay de momento un modo no circular o no arbitrario de determinar a priori una de las asignaciones y, con ella, una lógica inductiva. 3. A pesar de lo anterior, vaya o no vaya asociada la relación de apoyo evidencial a una lógica en sentido estricto, sigue siendo plausible que sea una relación de tipo probabilista. La alternativa presuntamente antiprobabilista del grado de corroboración de Popper participa en Última instancia del espíritu probabilista. En el curso de la discusión ha quedado claro que, si hay un modo de precisar la idea de grado de apoyo evidencial, éste debe crecer con las probabilidades posteriores relativas a los datos disponibles. Dado el fracaso de los intentos logicistas, sólo parecen disponibles alternativas en las que las probabilidades anteriores sean subjetivas (individuales o comunitarias); el problema entonces es articular esta alternativa sin caer en el relativismo. Una vez se tienen las probabilidades básicas, las relaciones entre ellas son objetivas (las de la teoría de la probabilidad, las de la teoría de la decisión, etc.); la cuestión todavía no resuelta es cómo analizar el apoyo evidencial para que el resultado sea invariante respecto de las diferentes posibilidades para las probabilidades básicas. 4. Sea cual sea el modo de precisar una medida de apoyo evidencial, la fuerza del apoyo no puede depender sólo del número de casos sino también de su variedad y calidad. Si lo que se evalúa es una teoría entera, el análisis de su estructura en términos reticulares, al modo de Kuhn-Lakatos o del estructuralismo, ayuda a clarificar estas dependencias. Por ejemplo, despuis de una serie limitada de predicciones exjtosas en una parte de la red, unas pocas predicciones exitosas en otra parte de la red puede conferir incomparablemente más apoyo que un número ilimitado de nuevas predicciones exitosas en la parte anterior. Lo mismo se aplica a cualquier hipótesis que tenga algún tipo de ramificación.
5. El mayor problema filosófico que comporta la confirmación es el de la infradeterminación de la teoría por la experiencia, el viejo enigma renovado por Goodman. Ante sistemas teóricos incompatibles igualmente avalados por la experiencia, ei único modo de optar por uno frente a otro es el de recurrir a sus relaciones con otros sistemas teóricos. Pero siempre hay varias integraciones teóricas posibles. Esto conduce nuevamente a cierto holismo cuyo "tamaño" hay que calibrar. 6. Además, la elección entre alternativas compatibles con los datos pero incompatibles entre sí parece que no puede ser una cuestión de lógica en sentido estricto. Es probable que se deba abandonar la idea de que hay relaciones lógicas objetivas entre datos y teorías a las que después hemos de ajustar nuestras decisiones. Quizá no haya modo de plantear la cuestión del soporte entre hipótesis y datos sin tomar en consideración desde el comienzo las decisiones de los sujetos. Ésta es la vía que exploran algunas concepciones sobre la elección de hipótesis en el marco de las teorías matemáticas de la acción racional, principalmente la teoría de la decisión y la teoría de juegos (para referencias clásicas sobre estas teorías, cf. von Neumann y Morgenstern, 1944; Luce y Raiffa, 1957 y Resnik, 1987). Según estos enfoques, las únicas propiedades objetivas que se pueden atribuir a una hipótesis en virtud de ciertos datos son las derivadas de su función en las estrategias de elección racional (para una discusión, y propuesta propia, cf. p.ej. Giere, 1988, cap. 6). Esta alternativa, sin embargo, en la medida en que, como es usual en las teorías de la elección racional, se recurre a probabilidades subjetivas, debe enfrentarse también al reto de explicar la elección teórica sin caer en el relativismo. 7. En los casos de contrastación negativa, la racionalidad teórica obliga a modificar algo, no podemos ser racionales e ignorar teóricamente las contradicciones. Eso es compatible con que la racionalidad práctica haga recomendable a veces (o siempre hasta cierto grado) comportarse como si no existieran contradicciones con la experiencia . Pero desde el punto de vista teórico, y por tanto como idea regulativa de la actividad científica, el conflicto con la experiencia exige revisión. Cuando teoría y experiencia se contradicen (y dejando a un lado las urgencias prácticas) algo hay que hacer. Pero siempre hay varias alternativas. Una es revisar los datos. esto es la5 hipótesis implícitas presupuestas por ellos. Otra es revisar el sistema teórico. Si dicho sistema es una única hipótesis "atómica", hay que rechazarla. Pero las cosas nunca son tan simples. Casi siempre lo que está en juego es un sistema complejo de hipótesis con relaciones de dependencia a diferentes niveles, una red teórica más o menos grande. En estos casos, incluso si aceptamos los datos, tenemos dos alternativas. Una, retocar la red. Otra, cambiar radicalmente e intentar desarrollar una teoría diferente. Pero como dice Kuhn, nada hay en la lógica que obligue a una opción frente a otra. La decisión no es cuestión de lógica sino de pragmática, de pérdida de confianza.
ANÁLISIS DIACRÓNICO DE TEORÍAS: EL CAMBIO TEÓRICO
1. La perspectiva diacrónica en filosofía de la ciencia La ciencia en la actualidad consiste en un vasto y complicado sistema de teorías, junto con un gran número de métodos específicos, aplicaciones y prácticas asociadas a ellas. Hoy día es una obviedad constatar que este enorme sistema representa un componente esencial de la cultura humana actual. Sin embargo, ello no siempre fue así. Si aceptamos que la ciencia es una manifestación cultural autónoma, claramente distinta de otras manifestaciones también de "alto nivel" como la religión, el arte, el derecho o la tkcnica, entonces también hay que admitir que estas otras manifestaciones culturales germinaron y se desarrollaron en diversos puntos del globo muchos siglos, incluso milenios, antes del surgimiento de las primeras formas de lo que hoy día reconocemos como conocimiento científico. Puede discutirse si el espíritu científico propiamente tal surgió en Grecia por primera vez apenas en el siglo vi a.c. con los filósofos jonios y la Escuela de Pitágoras, o bien hay ya expresiones indiscutiblemente científicas de aproximación a la realidad en una época bastante anterior (pongamos por caso en el Antiguo Egipto, en las civilizaciones mesopotárnicas, en la Lndia o en China); pero, en cualquier caso. incluso si tomamos este último punto de vista, más liberal o laxo, respecto a lo que pueden ser producciones culturales de carácter específicamente científico, incluso en los casos más antiguos ellas son decididamente muy posteriores a las primeras manifestaciones de los demás fenómenos culturales mencionados. Así, pues, la ciencia representa un fenómeno relativamente reciente en la historia de la Humanidad; pero precisamente por ello, al estudiar sistemáticamente la ciencia y sus componentes, conviene no olvidar su dimensión histórica. Es decir, debemos tener siempre presente (aun cuando para examinar ciertas cuestiones epistemológicas concretas lo tengamos en cuenta sólo de manera implícita) que las teorías científicas y todo lo que va asociado a ellas constituyen entidades que existen en el tiempo histórico; no son entidades connaturales al ser humano y mucho menos entidades que lo trasciendan, sino que tuvieron un nacimiento en determinado momento histórico, se desarrollaron y cambiaron de cierta manera y eventualmente desaparecieron en otra fase histórica, al igual que lenguas, naciones, códigos jurídicos o religiones.
Ahora bien, podría alegarse que. aun cuando el carácter histórico del fenómeno "ciencia" es obvio, ello no tiene por qué incidir en un estudio filosófico sistemático (metacientífico) de las teorías científicas y sus componentes. Podría alegarse que el t o m a en cuenta la dimensión histórica de la ciencia es tarea de otra disciplina, la Historia de la Ciencia (o Historiografía de la Ciencia, como preferimos denominarla para evitar una confusión entre la disciplina misma y su objeto de estudio), y no asunto de la Filosofía de la Ciencia en cuanto tal. Esta última procedería de manera puramente sincrónica, es decir, tratando de detectar las estructuras esenciales al conocimiento científico que son universales y comunes a las diversas fases históricas de su desarrollo. La Historiografía de la Cjencja sería así la disciplina que se ocupa de lo particular-histórico en la ciencia, mientras que la Filosofía de la Ciencia o Metaciencia se ocuparía de lo universal-sistemático en la misma, con exclusión de la dimensión diacrónica. El punto de vista puranlente sincrónico en Filosofía de la Ciencia fue el predominante en nuestra disciplina hasta mediados de la década de los sesenta. Es también la perspectiva metodológica que ha predominado en este libro hasta el presente capítulo. Esta decisión metodológica no es arbitraria. En efecto, puede señalarse que, aun cuando nuestro objeto de estudio sea de carácter inherentemente histórico, es conveniente y fructífero analizarlo ante todo desde una perspectiva teórica que sea puramente sincrónica. Así como podemos emprender un valioso estudio teórico de la gramática del castellano, pongamos por caso, haciendo abstracción de cómo y por qué esta lengua evolucionó a partir del latín vulgar en la Alta Edad Media, o examinar la estructura argumentativa formal del Código Civil sin preocupamos demasiado por sus antecedentes en el Derecho Romano, así también parece no sólo posible sino conveniente examinar la estructura y modos de funcionamiento de los diversos componentes de la ciencia sin ocupamos especialmente de los avatares y circunstancias de su desarrollo histórico. Ahora bien, aunque esta forma de proceder tiene su razón de ser metodológica y es la que hemos adoptado en este libro hasta esre punto, sería un error equiparar la distinción disciplinar entre Filosofía de la Ciencia e Historiografía de la Ciencia con la distinción metodológica entre perspectiva sincrónica y perspectiva diacrónica en el estudio metacientífico. Ésta es la lección que puede sacarse de las grandes controversias (meta-)filosóficas que tuvieron lugar a partir de la llamada reruelra hisroricisra en la década de los sesenta, algunos de cuyos elementos ya hemos examinado en el capítulo 9. A veces se ha interpretado el enfoque "historicista" como la propuesta de identificar Filosofía e Historiografía de la Ciencia, o de reducir la primera a la segunda, y es cierto que algunos de los propagandistas más radicales de dicho enfoque, parecieron abogar en ese sentido. Sin embargo, significaría un tremendo empobrecimiento conceptual identificar ambas disciplinas (como también lo sería identificar la gramática teórica con la filología, la Filosofía del Derecho con la Historia del Derecho, o la Musicología con la Historia de la Música, etc.). Aunque existen sin duda vínculos importantes entre Filosofía e Historiografía de la Ciencia, ambas disciplinas son, tanto por su temática como por su metodología, netamente distintas (cf. cap. 1, 6 1 ; para una discusión más detallada, cf. Moulines, 1991, cap. 1.4). El modo más constructivo de interpretar la 1-evuelra Izisroricista es como la pro-
puesta, no de reducir la Filosofía de Ia Ciencia a Ia Historiografía de la Ciencia, sino de enfatizar la necesidad de una perspectiva diacrónica también en Filosofía de la Ciencia, que complemente el análisis sincrónico, pero que sea igual de teórica, sistemática y general que aquél. En cualquier caso, éste es el punto de vista adoptado en este libro: aunque el análisis metateórico diacrónico ha resultado hasta la fecha más difícil de realizar de la manera precisa y sistemática característica del análisis sincrónico, no por ello debemos desesperar de la empresa, y de hecho se han elaborado ya diversos modelos de cambio científico que son lo bastante sistemáticos y articulados como para constituir la base de una futura Filosofía diacrónica de la Ciencia. Los dos fenómenos históricos más básicos de los que debe dar cuenta cualquier modelo de la Filosofía diacrónica de la Ciencia son, descritos brevemente, el de la identidad a través del cambio y el de la continuidad a través de la ruptura. Más concretamente, por el primero entendemos el hecho de que parece tener sentido (al menos ello corresponde a la autocomprensión de los practicantes de la ciencia) adjudicar a cada teoría científica (y a los demás elementos asociados a ella) una identidad a pesar de las modificaciones a que están sometidas en el transcurso del tiempo histórico: las teorías, de manera análoga, aunque no idéntica, a las personas, las lenguas o las naciones, pueden cambiar en una serie de constituyentes y, no obstante, seguir siendo las mismas. Esto es, las teorías científicas poseen la propiedad que se conoce como genidentidad (identidad diacrónica). La primera tarea de la Filosofía diacrónica de la Ciencia consiste, pues, en elucidar la genidentidad de las teorías científicas, en ofrecer un análisis diacrónico de la naturaleza y estructura de las teorías en tanto entidades que se extienden en el tiempo. Los conceptos de parndig~nao matriz disciplinar en Kuhn, de programa de ini~estigaciónen Lakatos, de tradición de investigación en Laudan o de evolrición teórica en el estructuralismo son respuestas con diverso grado de precisión a este reto (para los aspectos sincrónicos de los tres primeros, cf. cap. 9; el último, que veremos en el presente capítulo, se construye sobre el concepto sincrónico de red teórica, estudiado en el cap. 10, $5). El otro gran problema para la Filosofía diacrónica de la Ciencia consiste en dar cuenta de cambios radicalmente más dramáticos que los recién mencionados, cambios que, desde la obra pionera de Kuhn, suelen llamarse "revoluciones científicas". A pesar de su popularidad, esta denominación probablemente no es muy apropiada, no tanto por parecer exagerada dadas las asociaciones que despierta con su parangón, las revoluciones políticas, sino porque aparece como esenciaImente equívoca o ambigua, como explicaremos en seguida. En cualquier caso, llamemos como llamemos a estos fenómenos más dramáticos en la historia de una disciplina científica, parece incuestionable que ellos se dan y que se caracterizan en general porque a través de ellos se pierde precisamente la genidentidad de una teoría. La teoría en cuestión, después de tal tipo de cambios, "ya no es lo que era": es "subsumida", "reducida", "absorbida", "reemplazada" o, en fin, "desplazada" por otra u otras teorías. En adelante, y para usar una terminología lo menos cargada de connotaciones posible, al primer tipo de cambio científico lo denominaremos 'cambio itttrateórico' porque tiene lugar dentro de una misma teoría; mientras que al segundo tipo de cambio lo llamaremos 'cambio interteórico' porque consiste en un cambio de teoría, involucra teo-
fias distintas. Vamos a examinar a continuación estos dos tipos de cambio teórico. El de cada uno procederá en dos pasos: en primer lugar daremos una caracterizacidn 10 m i s intuitiva y neutral posible del fenómeno en cuestión, y a continuación proporcionaremos una elucidación más formal y "comprometida", que toma en cuenta las ideas de Kuhn y Lakatos pero que se basa esencialmente en la metodología de reconstrucción estnicturalista. Los ejemplos históricos aducidos en cada caso, en cuyo detalle naturalmente no podemos entrar aquí, tienen como misión solamente ayudar al lector a comprender la elucidación general y comprobar su plausibilidad. Por último, nuestro análisis diacrónico se va a limitar en general a los aspectos cinemáticos del cambio teórico. Los fenómenos diacrónicos son susceptibles de dos niveles de análisis, uno ci~zemáticoy otro dinámico. El análisis cinemático se centra en la descripción de las entidades in~rolucradasy de las formas o tipos de cambio d e las mismas. El análisis dinámico se ocupa de las causas o factores desencadenantes de los (diversos tipos de) cambios; debe quedar claro que, al igual que en física, el estudio dinámico presupone otro cinemático previo. El estudio de la cinemática del cambio teórico es una tarea básicamente analítica y corresponde por tanto básicamente a la Filosofía de la Ciencia, aunque para realizarla debe apoyarse en otras disciplinas metacientíficas, principalmente la Historiografía de la Ciencia, pero también en la Sociología de la Ciencia. El estudio de la dinámica del cambio científico es una tarea a la vez analítica y empírica. Es analítica, no sólo porque la dinámica presupone la cinemática, sino porque además deben elucidarse algunos aspectos conceptuales propiamente dinámicos, como los relativos a las actitudes intencionales, intereses, mecanismos de interacción, etc.; esta parte de la tarea corresponde realizarla a la Filosofía de la Ciencia. Pero es también una tarea (meta)empírica, pues se requiere investigación empírica sobre los factores psico-sociales que de hecho operan como agentes causales en el cambio teórico; esta parte de la tarea corresponde realizarla a disciplinas metacientíficas empíricas, principalmente la Sociología de la Ciencia y la Psicología de la Ciencia. En ambas partes del estudio dinámico, como en el cinernático, es esencial además el concurso de la Historiografía de la Ciencia. Pues bien, como hemos anunciado, aquí nos vamos a limitar a los aspectos conceptuales del cambio teórico, y ni siquiera a todos ellos sino principalmente a los cinemáticos. Esto es, vamos a centramos en la tipología de los diferentes cambios teóricos y en la n~orfología estructural de cada uno. 2. Cambio intrateórico 2.1.
CARAOERIZAC~~N GENERAL
Éste es el tipo de desarrollo científico más reconocido y estudiado dentro de la filosofía diacrónica de la ciencia, y para el que se han elaborado modelos (metateóricos) de un nivel razonable de precisión conceptual. Kuhn ha llamado a este tipo de proceso ciencia 1zo17íra1,ternlinología que se ha popularizado desde entonces. Dentro del enfoque de Kuhn, este tipo de actividad científica tiene lugar bajo la égida de un pul-adignza, una
matriz disciplinar algunos de cuyos constituyentes son paradigmáticos y esenciales. Para
Lakatos, el cambio consiste en el desarrollo de un programa de investigación regido por un niícleo que se desarrolla mediante un cinturón protector de hipótesis auxiliares. Laudan, a su vez, caracteriza estos procesos históricos como una tradición de investigación o de resolución de problemas, en que se aplican ciertos principios básicos. Dentro de la concepción estructuralista, la estructura de la ciencia normal aparece, como veremos a continuación, descrita en términos de una serie de redes teóricas que cumple ciertas condiciones, serie que constituye una evolución teórica. Todos estos modelos de cambio científico están basados en las nociones correspondientes del análisis sincrónico de cada enfoque particular. Ya hemos explicado en detalle dichas nociones sincrónicas subyacentes (cf. cap. 9 y cap. 10, S5), por lo que no es necesario volver a ellas. Baste hacer notar que la intuición básica común a todos estos enfoques es que, en el tipo de' desarrollo que aquí llamamos cambio intrateórico, existe una entidad estnictural persistente a través del tiempo, un marco teórico que permanece invariable a pesar de los cambios y que es justamente el elemento sobre el que descansa la identidad de la teoría involucrada en el proceso, aquello que permite hablar de "la teoría" en cuestión, teoría que sigue siendo la misma aunque se produzcan inodificaciones más o menos significativas en ella, tanto a nivel puramente teórico como empírico. Este elemento permanente en el cambio intrateórico es lo que Kuhn llamó primero 'paradigma' y, más tarde, 'matriz disciplinar',' lo que Lakatos denomina 'núcleo duro del programa' y en el estructuralismo aparece como "elemento teórico básico" (de una red determinada). Tanto para Kuhn como para el estructuralismo, este elemento identificatorio de cada teoría a través de los cambios es, a su vez, una entidad de articulación bastante compleja, como ya se ha señalado en los capítuloscorrespondientes. La intuición básica que acompaña a todas estas caracterizaciones es la misma: una teoría en sentido diacrónico, como entidad que se extiende en el tiempo, es una sucesión de .teorías en sentido sincrónico que comparten un elemento común; la imagen de una teoría en sentido diacrónico es la de una película cuyos fotogramas son los diferentes estadios o versiones por las que la teoría va pasando (cada una de las cuales se considera aproximadamente estable durante el lapso que dura). Para ello es esencial que, sincrónicamente consideradas, las teorías sean entidades dúctiles, con una parte esencial en la que descanse su identidad y otras partes más específicas o complementarias que se puedan "perder" sin alterar la esencia. Si aceptamos la descripción sociohistórica que hace Kuhn de los períodos de ciencia normal en una disciplina dada, cuando todos los cambios que se producen ocurren dentro de la matriz disciplinar aceptada y son por tanto intrateóricos en nuestro sentido, entonces estos períodos se caracterizan sociolópicamente hablando por ser relativamente homogéneos y "pacíficos": la disciplina viene representada por una sola comunidad cientíjica, dentro de la cual hay consenso acerca de los principios y aplicaciones fundamentales, y las controversias entre los científicos se refieren solamente a la oportunidad o adecua1. O la parte pxadigmática de ella, según se considere que la matriz en un momento dado es todo el conjunto de supuestos compartidos o sólo los esenciales (cf. cap. 8, 92).
ción de ciertas hipótesis secundarias y aplicaciones concretas. Según Kuhn, el consenso
básico se rompe únicamente durante el proceso que él denomina revolució?l cientfica, cuando una teoría fundamental o matriz disciplinar es reemplazada enteramente por otra. Durante la ciencia normal, la comunidad cambia las leyes especiales y las aplicaciones concretas, pero no los principios fundamentales ni las aplicaciones paradigmáticas. Abundan los ejemplos históricos claros de cambio intrateórico, en el sentido aquí especificado, sobre todo en las disciplinas físico-químicas. Un ejemplo notorio de tal tipo de desarrollo es el de la astronomía ptolemaica, es decir, la teoría geocéntrica de epiciclos para explicar el movimiento de los planetas, teoría cuyo desarrollo tiene sus inicios no en Ptolomeo, sino en Apolonio e Hiparco unos siglos antes. Esta teoría estuvo vigente hasta fines del siglo x v ~y, por tanto cubrió un lapso de casi 2.000 años. Sin embargo, y contra lo que sugieren algunas descripciones superficiales, no hay que creer que se tratara de un período de "estancamiento" de la astronomía. Al contrario, durante su larga vida la teoría sufrió diversos e importantes refinamientos y modificaciones, y estuvo asociada a deterrninaciones conceptuales y empíricas cada vez más precisas y diferenciadas, todo ello, claro está, regido por el principio "intocable" geocéntrico-epicíclico. Otro ejemplo claro de tal desarrollo intrateórico es el de la mecánica clásica de partículas, iniciada por Newton en los años ochenta del siglo xvr~y que tuvo un desarrollo relativamente largo y en cualquier caso muy fructífero hasta fines del siglo x u , durante más de dos siglos. También aquí se dieron durante este período una serie de cambios importantes en la teoría, con la postulación de nuevas leyes y la adquisición de nuevos casos de aplicación empírica o el abandono de casos propuestos anteriormente. Y, sin embargo, la teoría siguió siendo la misma, puesto que en ningún momento se cuestionaron las leyes fundamentales de Newton y sus aplicaciones paradigmáticas (sistema planetario, caída de graves, proyectiles, etc.). Podemos añadir algunos ejemplos más dentro de la física, muy plausibles, de cambio intrateórico en un período que Kuhn llamaría de ciencia normal: el desarrollo de la el de la teoría del calórico entre la Revolución teoría del flogisto a lo largo del siglo XVIII; Francesa y 1830; el de la termodinámica gibbsiana del equilibrio desde 1870 hasta la Segunda Guerra Mundial; el de la teoría general de la relatividad desde la Primera Guerra Mundial; y sin duda muchos otros. Dentro de las ciencias naturales, pero fuera de las ciencias físico-químicas, posiblemente no sea tan fácil encontrar muchos ejemplos de "cambio bajo permanencia", pero sin duda es plausible caracterizar así en biología el desarrollo de la teoría danviniana de la selección natural desde mediados del siglo xrx y el de la genética llamada "mendeliana" (es decir, en realidad, "morganiana"), desde la Primera Guerra Mundial hasta los años cincuenta. En geología, el desarrollo de la teoría de las placas tectónicas desde los años sesenta parece mostrar también esta estructura. En el caso de las ciencias sociales se ha argüido con frecuencia, en base a la noción kuhniana de paradigma, que no puede hablarse de períodos de ciencia normal en el sentido de Kuhn, puesto que tales períodos se caracterizan por estar dominados por un solo paradigma, y las ciencias sociales en cambio se hallan en una situación pr-e-yaradigmática, con múltiples enfoques radicalmente en competencia. Ahora bien, puede que esta conclusión sea correcta si se toman las ideas de Kuhn al pie de la letra y se
hace especial hincapié en los aspectos sociológicos o institucionales de las mismas; en efecto, la situación sociológica actual de disciplinas tales como la psicología, la economía o las ciencias de la cultura se caracteriza por la existencia de diversas comunidades científicas en agria competencia dentro de la misma disciplina, que no aceptan los postulados más básicos de las comunidades rivales. No obstante, si prescindimos de la caracterización sociológica de la ciencia normal y nos atenemos sólo a su aspecto metodológico-estructural, como desarrollo en que los cambios son meramente internos a cada teoría, entonces la diferencia entre las ciencias "paradigmáticas" y las "pre-paradigmáticas" se desvanece, o cuando menos se diluye considerablemente. En efecto, aun cuando. en una disciplina dada existan diversas subcomunidades rivales que "no se entienden entre sí", cada una de ellas puede operar con su propia teoría fundamental del mismo modo como lo haría una comunidad científica "total" en una etapa de ciencia normal en el sentido kuhniano, es decir, variando las componentes especiales de la teoría pero dejando incólume el núcleo fundamental. Tenemos, por así decir, varias teorías "simultáneas". Así, por ejemplo, es plausible describir el desarrollo histórico tanto del psicoanálisis como del conductismo en psicología desde principios del siglo XX hasta fechas recientes como "cambios intrateóricos" en nuestro sentido, aun cuando no haya habido el menor acuerdo entre psicoanalis'tas y conductistas acerca de los principios fundamentales de la psicología. En ambos casos se fueron introduciendo, modificando y desechando hipótesis particulares y explicaciones de fenómenos psicológicos concretos sin afectar los supuestos básicos de partida, aunque claro que estos últimos son completamente dispares en el psicoanálisis y el conductismo.
Veamos ahora cómo podemos precisar el aspecto estructural esencial de lo que hemos denominado cambio intrateórico. Para ello utilizaremos el aparato modeloteórico de la concepción estructural. En el capítulo 10 ( $ 5 ) presentamos la noción de red teórica y dijimos que ella expresa de modo plenamente satisfactorio toda la riqueza estructural de las teorías sincrónicamente consideradas, pero que para abordar los fenómenos diacrónicos el análisis debe dar un paso más. Este nuevo y definitivo análisis lo constituye la noción de evolución teórica. Ya hemos sugerido más arriba que un período de cambio intrateórico en una disciplina puede reconstruirse como una sucesión (en el tiempo histórico) de redes teóricas conectadas entre sí por ciertas condiciones, que explicitaremos en seguida. Recordemos que una red teórica es un conjunto de elementos teóricos conectados entre sí por la relación de especialización. En las redes arbóreas hay un elemento teórico básico del cual todos los demás elementos teóricos de la red son especializaciones. Es decir, si N = c{T,},o>es una red teórica arbórea con n elementos y Tosu elemento básico, entonces ocurre que para todo E { K } (T To. Recordemos, además, que cada elemento teórico T consta de un núcleo K (K = Mp, Mpp, M, GC>) y de un dominio de aplicaciones I, T =
'
fundamentales de la teoría, mientras que 10representa el dominio total de aplicaciones intencionales de la teoría. Podemos entonces reconstmir lo esencial de la idea intuitiva de un cambio jntrateórico de la siguiente manera: un desarrollo científico de tipo cambio irzrrareórico es un proceso evolurivo gradual que podemos representar formalmente como una sucesión finita O,, N2, ..., N,,> de redes teóricas (donde cada subíndice representa un determinado período histórico en Ia evoIución de la teoría) que satisface ciertas condiciones de continuidad parcial tanto a nivel teórico como aplicativo. Estas condiciones quedan recogidas en la siguiente definición de evolución teórica, reconstrucción formal del fenómeno de cambio intrateórico. (En lo que sigue, los supraíndices indican la red a la que los elementos pertenecen, y los subíndices fijan el elemento teórico concreto de que se trate. Así, 'E' denota el tercer elemento teórico de la segunda red de la sucesión, aunque recuérdese que los elementos de las redes no están ordenados en secuencias; y análogamente para núcleos y dominios de aplicaciones: ' K f ' y 'G'denotan, respectivamente, el núcleo y el dominio de aplicaciones de dicho elemento.)
Sean N,, N*, ..., N,, n redes teóricas (arbóreas). Diremos que E =
Koes el rzúcleo básico de la evolución, y I, el clo~ni~zio de aplicaciones perinane~zres. Así, pues, en una evolución teórica, la identidad de la teoría a través del cambio la determinan las leyes fundamentales, junto con (eventualmente) las condiciones de ligadura básicas entre los modelos, y además ciertas aplicaciones reconocidas siempre como tales a lo largo de la historia de la teoría y que podemos interpretar precisamente como los "ejemplares paradigmáticos" de los que habla Kuhn. Nótese que no hace falta añadir una condición intuitivamente obvia, a saber, que el aparato conceptual no varíe, esto es, que todos los elementos de todas las redes de la evolución tengan los mismos conjuntos Mp y Mpp. Eso se deriva de la condición (1) y de que en cada red la relación de especialización preserva tales conjuntos. Lo que no queda invariable en el cambio intrateórico son las redes de la sucesión
rico, con la cual son compatibles requerimientos de continuidad más fuertes que parezcan convenientes en un análisis más pormenorizado. Para fijar las intuiciones sobre la idea que está detrás de la noción formal de evoluci.ón teórica y de la reconstrucción propuesta de los cambios intrateóricos vamos a representar tales evoluciones mediante sucesiones de grafos en los que cada grafo representa una red teórica. Vamos a considerar como ilustración la evolución de una teoría que atraviesa por tres fases, es decir, tres períodos históricos sucesivos de una teoría en los que ocurren cambios importantes tanto a nivel teórico como respecto a las aplicaciones empíricas, pero que sigue siendo la misma teoría. Por lo tanto, la evolución consistirá en tres redes: E = dVI, N:, N+. Supongamos que, en una primera fase, la teoría (o sea, N,) consta del núcleo básico KOy tres especializaciones del mismo. Cada una de estas especializaciones tiene su propio dominio de aplicaciones; dos de estos dominios, por ejemplo, pueden traslaparse, o sea, hay aplicaciones comunes a núcleos diversos; otro dominio, en cambio, puede que aparezca "aparte". En cualquier caso, el dominio total de aplicaciones intencionales abarcará esos dominios parciales más quizá alguna otra aplicación "suelta" (necesariamente no paradigmática) para la que no se ha contemplado o no se ha encontrado todavía una ley especial. En la segunda fase de la evolución de la teoría (Nz) aparecen, digamos, tres especializaciones más y algunas aplicaciones más. En la tercera fase (N,) se rechaza, por las razones que sean, una de las anteriores especializaciones junto con una de las aplicaciones que le correspondían; en contrapartida, ese elemento teórico es sustituido por otros dos distintos que se encargan de algunas de las aplicaciones intentadas antes por el núcleo que ha sido eliminado. Esta situación se recoge en los siguientes gráficos. Los núcleos teóricos van enmarcados en cuadrángulos, las aplicaciones se representan mediante pequeños puntos, blancos para las paradigmáticas, negros para las restantes; sus conjuntos se representan mediante elipses que las contienen. Las flechas continuas representan la relación de especialización entre núcleos; Ias flechas discontinuas representan al aplicación de un núcleo a un dominio de aplicaciones. Dentro de cada red, y para facilitar la visualización, prescindimos de los supraínciices pues queda claro a qué red pertenecen los núcleos y los dominios de aplicaciones. Además, no incluiremos la correspondiente flecha entre cada núcleo y su dominio de aplicaciones para todos los núcleos. Salvo en el caso del núcleo básico, prescindiremos de ella cuando el núcleo tenga especializaciones y consideraremos por tanto que el dominio de aplicaciones de un núcleo con especializaciones es la unión de dominios de sus especializaciones. Esto es una idealización, pues puede ocurrir, como con el núcleo básico, que en un núcleo intermedio se proponga alguna aplicación que todavía no se sabe muy bien cómo encajar en una ley especial (v. gráf. págs. siguientes). Estos tres fotogramas constituyen la película de esta supuesta teoría. De acuerdo con las estipulaciones históricas que acordamos para el ejemplo, debe quedar claro que se dan las siguientes relaciones entre los núcleos teóricos de las diferentes redes: Kt = K? = G; K! = G = K$; Kj = = M ;K;- = E ; G = Kj; $ # k2;KS # G . Es fácil ver que esta secuencia ejemplifica adecuadamente las condiciones que definen una evoluci6n teórica: Kopermanece invariable y las cuatro aplicaciones paradigmáticas se preservan en toda la evolución, aunque cambien los núcleos específicos que se aplican a ellas. Este ejemplo,
RlNDAMEhTOS DE F I L O S O F ~DE LA CIENCU RED N,
RED
4
,\N,~LISISUIACRÓNICO DE TEORÍAS RED N,
contiene pues todo lo esencial de un cambio intrateórico. Todo cambio intrateórico de la ciencia real sigue este patrón de nuestra teoría imaginaria; es importante enfatizar que los casos reales son conceptualmente idénticos a éste, sólo se diferencian de él por su mayor complejidad, tanto en el número de redes de la secuencia como en el número de elementos en cada red (para una aplicación de este esquema a casos históricos concretos de teorías reales en evolución, cf. Balzer, Moulines y Sneed, 1987, cap. 5, donde se exponen en detalle la evolución de la mecánica newtoniana de Newton a Laplace y de la termodinámica desde Gibbs hasta la Segunda Guerra Mundial).
3. Cambio interteórico en general
La estructura de los cambios interteóricos, en los que se produce algún tipo de "innovación dramática" o revolución, es más difícil de capturar formalmente que la de los cambios intrateóricos: Ello es debido en parte a razones historiográficas, porque el rnaterial histórico correspondiente y su interpretación es asunto más sujeto a controversias. Pero en parte también es debido a razones epistemológicas y metateóricas, porque el estudio sistemático de estos casos presupone una (meta)teoría general de los cambios sernánticos en los conceptos científicos y de las complejas relaciones interteóricas típicas de estos casos consideradas en perspectiva diacrónica, y hay que admitir que ésta es una
temática de la filosofía de la ciencia que apenas ha empezado a abordarse de manera sistemática en los últimos años. Por lo demás, también parece claro que la expresión 'cambio interteórico' engloba tipos bastante distintos de fenómenos diacrónicos. La idea intuitiva de Kuhn según la cual en una re~~olución científica se sustituye o elimina completamente un paradiama por otro parece aplicarse sólo a un número limitado de casos de cambio interteórico, probablemente sólo a una pequeña minoría. Es bastante ardua la tarea historiográfica de probar la existencia de tales revoluciones científicas, al menos en el caso de las ciencias avanzadas, si se interpretan dichas revoluciones en el sentido kuhniano literal de que una teoría desaparece por completo en aras de otra nueva, en un plazo relativamente breve y sin que la primera resulte inteligible ("conmensurable") desde el punto de vista de la segunda. De hecho, no es fácil encontrar ejemplos claros de sustitución total de un paradigma por otro en las ciencias físico-químicas. Sólo la sustitución de la dinámica aristotélica por la newtoniana y de la teoría del flogisto por la teoría de la oxidación de Lavoisier parecen adecuarse bastante bien a la idea de rupturas radicales, acompañadas de inconmensurabilidad semántica, propug~iadapor Kuhn. Con cierta dosis de buena voluntad quizá también podrían subsumirse bajo este esquema algunos otros ejemplos importantes que aparecen con frecuencia en la literatura historiográfica: la transición de la astronomía ptolemaica a la copemicana, de la mecánica cartesiana a la newtoniana o de la teoría del calórico a la termodinámica fenomenológica. En cualquier caso, n~uchosde los ejemplos mencionados por Kuhn y sus seguidores como candidatos a revoluciones científicas responden, en realidad, a un esquema de cambios mucho menos dramáticos: no se trata 1,erdaderamente de rupturas totales, ni al nii1el conceptual, ni al metodológico, ni al aplicativo. Tales casos se distinguen más bien por las siguientes características: a) la teoría anterior al cambio es suplantada sólo en parte por la posterior; b) algunos, o incluso muchos, de los conceptos, principios y casos paradigmáticos de aplicación de la primera teoría quedan incorporados, con modificaciones semánticas leves, a la segunda teoría; c) la primera teoría es reinterpretada como un caso "especial", "idealizado" o "aproximado" de la segunda; d) a nivel sociológico, la comunidad científica afectada por el cambio izo queda dividida en dos comunidades rivales e irreconciliables, sino que una parte de la misma comunidad, aunque "oficialmente" adherida a la nueva teoría, sigue trabajando con la teoría anterior, al menos a fines didácticos, o para resolver problemas de cierto ámbito restringido o aplicaciones puramente tecnológicas.
A estas características responden, en efecto, muchos de los ejemplos concretos de "revoluciones científicas" que (generalmente prescindiendo de análisis historiográficos detallados) se han propuesto en la literatura sobre el tema: la transición de la teoría planetaria de Kepler a la mecánica newtoniana, de ésta a la relativista especial y de ésta finalmente a la teoría general de la relatividad; la transición de la termodinámica fenomenológica a la mecánica estadística; la transición de la óptica geométrica a la ondulatoria y
de ésta a la electrodinámica; la transición de la teoría atómica clásica a la química cuántica; la transición de la genética "mendeliana" a la teoría cromosómica de la herencia y de ésta a la biología molecular; la transición de la teoría darwiniana de la evolución a la teoría "sintética" de Mayr y sus seguidores; y sin duda batantes casos más. En vista de estos ejemplos y sus características esenciales, conviene, por lo tanto, distinguir netamente por lo menos dos grandes tipos de cambio interteórico: ( 1 ) la suplantación de teorías acompañada de inconmensurabilidad (semántica); (2) la incorporación de teorías sin inconmensurabilidad.
Sólo el primero de estos dos fenómenos corresponde aproximadamente a la noción kuhniana de revolución cientlJfica (aunque Kuhn mismo veía muchos casos del segundo tipo como revoluciones). Para abreviar, al primer tipo lo llamaremos simplemente 'suplantación' y al segundo 'incorporación' de teorías. Ambos tipos pueden elucidarse formalmentemediante el aparato conceptual del estructuralismo, aunque en el caso de la suplantación la elucidación es algo más problemática que en el caso de laincorporación. Empecemos por esta última.
4.
Cambio interteórico como incorporación
La incorporación de teorías como fenómeno diacrónico está inspirada en un tipo particular de relación interteórica sincrónica: la reducción (estructural, cf. cap. 11, $3). ya sea "exacta" o bien "aproximada" (en la inmensa mayoría de casos históricos se tratará más bien de lo segundo, o sea, de una "reducción aproximada" o "aproximación reductiva", como se la prefiera llamar). La intuición biísica detrás de la noción de reducción estructural se resume en las tres siguientes condiciones: a ) Existe una correspondencia formal entre los marcos conceptuales respectivos de la teoría reducida y la reductora, o sea, en perspectiva diacrónica, entre la teoría incorporada y la incorporadora. b) Las leyes fundamentales de la teoría incorporada son implicadas, al menos aproximativamente, por las leyes fundamentales de la teoría incorporadora reforzadas por alguna(s) ley(es) especial(es) de esta última. c) Todas las aplicaciones intencionales exitosas de la teoría incorporada pueden reinterpretarse (al menos aproximativamente) como aplicaciones intencionales exitosas de la teoría incorporadora; pero en general no será válida la relación inversa: habrá aplicaciones intencionales exitosas de la teoría incorporadora que fueron "fracasos" para la teoría incorporada o incluso que no fueron contempladas en absoluto por esta última.
Veamos cómo pueden precisarse estas intuiciones mediante las entidades que, según el estructuraIismo, componen una teoría cualquiera. Para simplificar y restringir nuestra
atención a lo esencial haremos uso solamente de las nociones de conjunto de modelos potenciales (Mp),conjunto de modelos potenciales parciales (Mpp), conjunto de modelos actuales (M) y dominio de aplicaciones intencionales I. Recordemos (cf. cap 10, $5) que las relaciones entre estos componentes son las siguientes: Mpp = r[MpJ,M G Mp. I G Mpp. Recuérdese también que en las redes teóricas arbóreas, que por lo general representan modelo-teóricamente las teorías científicas, hay siempre un subconjunto MOde Mp pnvilegiado que es el conjunto básico de modelos actuales de la red, es decir, el conjunto de modelos determinado por las leyes fundamentales. Por otro lado, y como venimos haciendo, usaremos 'M;' como variable para clases de modelos actuales especiales, los determinados por leyes especiales de la teoría (que, naturalmente, presuponen la ~alidezde las leyes fundamentales). Para referimos a la teoría incorporadora, o a cualquiera de sus componentes, usaremos los signos usuales seguidos de un asterisco: para referirnos a la teoría incorporada, o a sus componentes, usaremos los signos usuales solos. Finalmente, usaremos '=' como subíndice de relaciones conjuntistas para denotar que la relación en cuestión no es "exacta" sino "aproximada"; así, 'x E A' y 'A c B' significan, respectivamente, que los correspondientes casos de pertenencia e inclusión son aproximados.' Con estos instrumentos en la mano podemos definir ahora la relación de incorporación anunciada (de nuevo, cf; cap. 11, def. 11.3, p, es la relación que genera p a nivel no-teórico, entre modelos parciales; e.e. p, = r (p)). u
Sean N, N* redes teóricas. N es incorporable a N* syss existe una relación p c Mp* x Mp tal que: ( 1 ) p es función, es efectivamente calculable y Rec(p) = Mp. tales que (2) Existen n conjuntos no vacíos M , ..., M? incluidos en ~ [ M : u ... c-Mo. (3) lo n r[MolG pJlj8 n r[M'831.
~m
Estas condiciones definitorias de la incorporación de una red teórica N (una "teoría" en.genera1) en otra red teórica N* corresponden intuitivamente a las tres condiciones intuitivas de una reducción aproximativa presentadas más arriba. La definición formal aquí presentada, sin embargo, permite establecer una serie de precisiones y clarificaciones ulteriores. Veamos cuáles son y cuál es su razón de ser. En primer lugar, es importante notar que la relación de incorporación se establece entre redes enteras y no entre elementos teóricos aislados, lo cual responde a la idea de que son teorías en su totalidad y no sólo algunas leyes especiales de las mismas las que quedan incorporadas en una teoría distinta. Por supuesto que, desde un punto de vista puramente formal, podríamos contemplar la posibilidad de incorporación de una red teórica "degenerada", que constase de un solo elemento teórico; esta posibilidad extrema no 2. Esta noción puede precisarse formalmente con instrumentos topológicos (cf. Bnlzer, hfoulines y Sneed, 1987, cap. VlI, o bien, para una exposición m S sucinta, Moulines, 1982, cap. 2.9).
queda excluida formalmente por nuestra definición, pero está claro que no representa los casos normales. Ahora bien, aunque la relación de incorporación.quede definida entre redes en su totalidad, la incorporación atañe, por el lado de la teoría incorporada, directa y explícitamente sólo al elemento teórico básico To.Ello no significa una restricción indebida. En efecto, dado que los demás elementos teóricos de la red incorporada son especializaciones del elemento básico, podemos decir que la incorporación de este último en una red distinta "arrastra" consigo, indirectamente, la incorporación de sus especializaciones. Nótese que esta determinación deja abierta la posibilidad de que, a pesar de que hayamos establecido la incorporación de N en N* y por tanto de los conceptos y principios básicos de N en los de N*, no obstante, no dispongamos explícitamente para alguna ley especial de N de su correlato en N*, o simplemente lo ignoremos. Podría quizá argüirse que ello representaría una situación metodológicamente inaceptable para una "buena" incorporación, y que para que ésta sea verdaderamente satisfactoria debe indicarse qué elemento(s) teórico(s) especial(es) de N* corresponde(n) a cada uno de los elementos teóricos especiales de N. Desde un punto de vista puramente formal, sería fácil añadir una estipulación en este sentido a nuestra definición general de incorporación. Sin embargo, desde el punto de vista de la praxis real de las incorporaciones históricamente dadas, no parece necesario ni conveniente añadir esta condición tan restrictiva. En efecto, en la mayoría de casos se acepta una incorporación cuando se ha mostrado que ella ha podido establecerse para los conceptos y leyes fundamentales, así como las aplicaciones en general, de la teoría a ser incorporada, y no se espera a que se haya especificado, para cada ley especial de la red incorporada, cuál es su correlato concreto en la red incorporadora. En teorías con un mínimo de complejidad sería sumamente tedioso encontrar o construir tales correlatos para cada una de las numerosas leyes especiales; ello sólo se lleva a cabo para algunas leyes especiales cuyos correlatos incorporadores parecen especialmente interesantes por alguna razón concreta. Así, por ejemplo, para aceptar el éxito de la incorporación de la mecánica newtoniana en la mecánica relativista especial, cadie esperó a ver cómo las numerosas leyes dinámicas especiales de la mecánica newtoniana (incluyendo complicadas ecuaciones que ni siquiera aparecen en los manuales de física, sino sólo en los formularios de ingenieros dedicados a problemas mecánicos muy especiales) encontraban su correlato en la mecánica relativista; bastó comprobar cómo los conceptos y principios fundamentales de la mecánica newtoniana, y a lo sumo algunas otras leyes de alto nivel de generalidad, podían asimilarse a otras relativistas. Así, pues, para la relación interteórica que estamos analizando aquí, lo único esencial es la incorporación del elemento básico de la teoría anterior .al cambio. Esta incorporación ha de realizarse con respecto a los tres componentes más importantes de dicho elemento: el marco conceptual Mp (que, por definición, es el mismo para todos los elementos de la red N), las leyes fundamentales recogidas en M0 (de las cuales todas las demás leyes de N son especializaciones) y el dominio general 10 de aplicaciones (que abarca todos los casos de aplicación contenidos en la red). A estos tres componentes del elemento básico se refieren las tres condiciones de la Definición 13.2. Según la condición (l), la relación de incorporación queda formaImente fijada como una relación entre los modelos potenciales de ambas teorías que además es una
firi~ciónefecriifaiíre~~re calcz~lablede la clase incorporadora sobre la clase incoqorada; en general, sin embargo, la relación inversa p-' 110 será una función. Estas determinaciones de ]a relación tienen una serie de consecuencias dignas de ser notadas. En primer lugar, que p sea efectivamente calculable significa que entre Mp* y Mp no sólo se estipula la existencia de una relación cualquiera (lo cual siempre es trivialmente válido), sino que la relación p escogida debe ser tal que, en un número finito de pasos, pueda determinarse qué modelo de Mp corresponde a cuál de Mp* o a la inversa. Que además p cubre todo Mp significa que todo modelo potencial de h' tiene al menos un correlato en N*, es decir, queda efectivamente incorporado a N*. Pero, por otro lado, como p-' no es necesariamente una función, es posible que los modelos potenciales de N tengan ivat-ios correlatos distintos en N*. La idea intuitiva es que cada modelo incorporado puede traducirse en versiones diferentes en la teoría incorporadora, lo cual, a su vez, expresa el hecho de que esta última suele tener mayor poder de diferenciación o de análisis en la representación de los fenómenos. Por otro lado, el hecho de que el dominio de p esté incluido en Mp*, sin ser necesariamente idéntico a este conjunto, significa que, en general, habrá muchos modelos potenciales de la teoría incorporadora que no tienen ningún correlato en la teoría incorporada: intuitivamente, la teoría incorporadora puede tratar de algunos sistemas que caen por completo fuera del marco conceptual de la teoría incorporada. La condición (2) es, en lo esencial, una reconstrucción modeloteórica de la idea intuitiva acerca de la reducción de una teoría a otra según la cual las leyes fundamentales de la teoría reducida se "deducen" de las leyes fundamentales y algunas de las especiales de la teoría reductora. Recordemos el teorema elemental (pero metateóricamente muy relevante) de la teoría de modelos, según el cual si una fórmula a implica otra P, entonces 10s modelos de a, es decir, las estructuras que satisfacen a, constituyen un subconjunto del conjunto de modelos de P: U: r=
p
syss M,
c Mp.
La condición (2) reproduce, en lo esencial, esta idea pero generalizándola al caso en que las leyes de una y otra teoría pertenecen a "lenguajes", esto es, a marcos conceptuales diferentes aunque correlacionados por la función p. Tomamos primero cierto número de leyes especiales incorporadoras a!,..., a, (puede ser una sola), todas las cuales presuponen las leyes fundamentales (esto es, las clases de modelos que satisfacen esas leyes especiales A continuación construimos su "traducción" al lenguaje de N son subconjuntos de mediante p y ello ha de ser suficiente en cualquier caso para implicar las leyes fundamentales de N. Al tomar la unión M? u ... u M~contemplamosla posibilidad de que, según el tipo de sistema considerado, se necesiten diversas leyes especiales de N* para llevar a cabo la "deducción" de las leyes fundamentales de N. Dado que con frecuencia, si no casi siempre, la relación de incorporación ha de concebirse como una relación apt-oximativa entre las teon'as involucradas, la implicación de una teoría por la otra valdrá en general sólo de manera aproximada; en términos modeloteóricos ello se traduce en el hecho de que las relaciones conjuntistas de la condición (2) en general no se cumplen de manera exacta sino sólo aproximada. Por supuesto que el caso eventual en que la incorporación
m.
valga con exactitud también queda subsumido bajo este esquema, pues c-contiene como casos especiales aquellos en los que vale c. La condición (3) se refiere a la parte "empírica" o "base de datos" de una y otra teoría. Para que la incorporación sea realmente exitosa no basta con la correlación entre marcos conceptuales y la implicación (aproximativa) de leyes, sino que debe estar garantizado que todas las apIicaciones intencionales exitosas de N quedan engIobadas por la p-traducción de las aplicaciones intencionales exitosas de N*, o más exactamente, por un entorno topológico de las mismas, pues también aquí debemos tomar en cuenta el fenómeno de la aproximación. Esta condición relativa a las aplicaciones puede parecer quizá demasiado restrictiva o contraintuitiva en el sentido de que podría ocumr (y parece haber ejemplos históricos de ello) que algunas aplicaciones intencionales de la vieja teoría sean consideradas fuera de lugar por la nueva teoría y por tanto no se esperen conelatos pertinentes de aquellas en el nuevo dominio de aplicaciones intencionales. Para reflejar esta posibilidad podríamos debilitar de alguna manera la condición (3), por ejemplo, exigiendo sólo que una porción considerable de 10 n r[Mo] sea subconjunto de su correlato aproximativo en N*. Sin embargo, aquí mantendremos la formulación estricta de la condición (3), y no sólo a efectos de simplicidad expositiva sino, además, porque la posibilidad mencionada de que algunas de las aplicaciones intencionales exitosas de N caigan "en desuso" es menos probable de lo que parece a primera vista y de lo que algunos ejemplos históricos quizá sugieren. En efecto, la relación entre N y N* no ha de ser concebida en el sentido de que N* recoja toda la evolución de la teoría anterior desde sus inicios y con todos los cambios en el dominio de aplicaciones que el proceso lleva parejo, sino sólo lo que es la teoría en su último estadio. Es decir, la red N que hay que incorporar es sólo el último término de cierta sucesión
456
FUNDAMEhTOS DE FILOSOF~ADE LA CIENCIA
científicas, o cambios de paradigma, constituyen en realidad casos de competencia entre programas de investigación rivales, en los que uno de los prosramas acaba por ser "superado" ("incorporado", diríamos aquí) por el otro, pero sin que esta superación pueda ser nunca definitiva, ya que el programa aparentemente "perdedor" puede subsecuentemente recobrar fuerzas y mostrar éxitos empíricos para los que su rival no estaba preparado. Ahora bien, independientemente de si Lakatos tiene razón en su tesis historiográfica de que existe mayor fundamento histórico para su idea de programas en competencia que para los cambios de paradigma de Kuhn, está claro intuitivamente que ambas ideas son netamente distintas. Es por ello conveniente, si no es que necesario, precisarlas de tal modo que la diferencia resulte detectable en términos exactos; ello, a su vez, puede contribuir a dirimir la cuestión historiográfica de si, en la historia real de la ciencia, hay más casos "lakatosianos" que "kuhnianos7', o a la inversa (o quizá ni unos ni otros). La intuición lakatosiana es precisable, al menos en parte, mediante nuestra noción formal de incorporación de la siguiente manera.
Definición 13.3: Sean E =
5. Cambio interteórico como suplantación Según la metateoría de Kuhn, en las genuinas revoluciones científicas se da la suplantación total de una teoría (un paradigma o matriz disciplinar) por otra. Ahora bien, este proceso de suplantación es radical en el sentido de que no sólo se abandona una teoría que hasta ahora se tenía por verdadera y a partir del cambio se la considera falsa: la suplantación no consiste en una mera falsación o refutación de una teoría y su sustitución por otra, sino que el cambio va acompañado, si Kuhn está en lo cierto, de un fenómeno semántico más profundo: la inconinensurabilidad entre ambas teorías. Ello significa que ocurre una verdadera ruptura entre los marcos conceptuales de una y otra teoría: no hay manera de correlacionar semánticamente los conceptos básicos de una teoría con los de la
i
1
I
1
i
;
1I t
i
!
I l
otra, y por lo tanto tampoco puede establecerse ninguna relación lógica entre los principios de una y otra teoría. Cada teoría se vuelve "ininteligible" para la otra. En consecuencia, no es que una teoría sea, propiamente hablando, falsa respecto de Ia otra, sino algo peor: carece de sentido. La tesis de la inconmensurabilidad d e Kuhn (defendida también, independientemente, por Feyerabend, aunque en un contexto algo distinto) ha tenido un gran impacto en la filosofía diacrónica de la ciencia de las últimas décadas. Se trata de una tesis acerca de los aspectos semánticos de los cambios interteóricos. Más concretamente, la tesis de Kuhn es que en la forma de cambio científico que él trata de apresar se da un tipo de relación especial entre los conceptos básicos antes y después del cambio que es precisamente lo que él llama "inconmensurabilidad" (la cual, según el propio Kuhn, no debe confundirse con la incomparabilidad: dos conceptos o principios pueden ser comparables en el sentido de apresar más o menos eficientemente el mismo tipo de fenómenos y, no obstante, ser inconmensurables en el sentido de que no pueda traducirse el uno al otro, de que no haya una base semántica común). Al darse la relación de inconrnensurabilidad en un cambio interteórico revolucionario, no sólo cambian de significado los términos básicos de una y otra teoría, sino también sus respectivos '*universos del discurso"; es decir, la ontología fundamental, que sirve de base a la interpretación de los términos y enunciados de una y otra teoría se vuelve completamente dispar: los científicos portadores de una y otra teoría "viven en mundos distintos" como dice Kuhn. Ejemplos clásicos de tales cambios sernánticos profundos, que implican cambios ontológicos fundamentales serían: el paso del concepto ptolemaico de planeta al concepto copemicano; el paso del concepto cartesiano de res extensa al concepto newtoniano de partícula; el paso del concepto de "aire deflogistizado" de la química del flogisto al concepto de oxígeno de Lavoisier. Ahora bien, si examinamos con un poco de atención la idea de la inconmensurabilidad como relación ontosemántica entre los conceptos básicos de dos teorías, nos percataremos pronto de que. aun admitiendo la realidad histórica de tales rupturas,. ellas no pueden (como parecen sugerir Kuhn y Feyerabend) ser un asunto de todo-o-nada. Dadas dos teorías separadas por un cambio revolucionario puede haber mayor o menor inconmensurabilidad entre ellas. Dicho en términos más técnicos, la inconmensurabilidad como relación ontosemántica entre teorías ha de concebirse como concepto comparativo, como una relación gradual. La inconmensurabilidad puede atañer sólo a un concepto básico de cada teoría (y a su correspondiente universo del discurso), o a varios, o quizá incluso a todos (las diversas posibilidades tienen que ver con cuán "holista" sea el sistema conceptual de las teorías involucradas). Ahora bien, hay que tener en cuenta que, cuantos más conceptos básicos de dos teorías queden involucrados en la relación de inconmensurabilidad, tanto más radical será ésta... pero también tanto más desprovista de interés, tanto más inverosímil para describir un cambio interteórico real en la historia de la ciencia. Pueden detectarse, sin duda, casos de inconmensurabilidad total entre dos teorías, incluso entre dos teorías que se suceden en el tiempo, pero es muy dudoso que tales casos tengan la menor significación para la filosofía diacrónica de la ciencia. Tomemos, por ejemplo, el siguiente par de teorías: la teoría del catastrofismo en geología y la teoría del valor en la economía marxia-
na; es muy plausible admitir que ambas teorías son totalmente inconmensurables; además, la primera teoría fue abandonada aproximadamente por las mismas fechas (alrsdedor de 1850) en las que emergió la segunda. Pero nadie estará dispuesto a hablar aquí de cambio revoluciona~o;por supuesto que no es en casos de esta naturaleza en los que piensan Kuhn y sus seguidores. Inconmensurabilidad total, incluso acompañada de sucesión temporal inmediata, no es un buen criterio para detectar revoluciones científicas. Cuando dos teorías "no tienen nada que ver entre sí", entonces ciertamente serán todo lo inconmensurables que se quiera, pero ello no es indicio del fenómeno de suplantación de teorías. En realidad, si examinamos con atención los ejemplos de revoluciones que han presentado los adalides de la tesis de la inconmensurabilidad, notaremos que los casos verdaderamente interesantes de inconmensurabilidad son aquellos en que ésta se da parcialmente: algunos de los conceptos de las dos teorías involucradas están ciertamente correlacionados pero carecen de una base ontosemántica común (no pueden "traducirse"), mientras que otros están correlacionados y además son interpretables sobre una base ontosemántica común. En términos modeloteóricos podemos decir que, en tales casos, algunas subestructuras de los modelos de una y otra teoría son comunes a ambas, o por lo menos formalmente conectables, mientras que otras subestructuras no lo son (y son las que causan el problema semántico al tratar de comparar ambas teorías). Por lo que respecta al contenido proposicional de dos teorías separadas por un cambio interteórico de suplantación, parece plausible suponer que, como sugieren los "inconmensurabilistas", las leyes fundamentales de la teoría suplantadora no pueden implicar (por razones estrictamente lógico-semánticas) las leyes fundamentales de la teoría suplantada, y por supuesto que tampoco a la inversa; de lo contrario, no tendría sentido hablar de "suplantación". En ello estriba la diferencia esencial entre un cambio interteórico con incorporación y uno con suplantación. Por otro lado, no obstante esta inconmensurabilidad a nivel proposicional, si no queremos que la relación entre teoría suplantada y teoría suplantadora se reduzca a un caso de mera inconmensurabilidad trivial como es el de la relación entre la geología catastrofista y la economía marxiana, tendrá que haber algo en común entre teoría suplantada y suplantadora: a saber, al menos algunos (tipos de) aplicaciones intencionales. En ellas, en cuanto que en general son subestructuras de los modelos potenciales de una y otra teoría (y por tanto admiten total disparidad a nivel de las "superestructuras" teóricas respectivas), radica la clave de la comparabilidad a pesar de la inconmensurabilidad. En efecto, supóngase que constatamos que algunas de las aplicaciones intencionales comunes a ambas teorías (como se verá a continuación, ello no supone que los sistemas de datos son literalmente los mismos, sino s61o que son conectables) y que consideramos especialmente importantes para nuestro conocimiento de la realidad o para nuestra praxis de manipulación de la misma, resultan ser de tal naturaleza que no pueden expandirse teóricamente para constituir modelos actuales de una teoría pero sí pueden convertirse en modelos actuales de la otra. Intuitivamente, ello significa que esas aplicaciones, aunque pertenecen al campo de lo que ambas teorías se proponen sistematizar, sólo lo son exitosamente por la segunda teoría. Ello es razón suficiente y plausible para que suplantemos la teoría menos exitosa por la más exitosa (incluso si para ello hay que pagar el precio, como sugiere Kuhn, de que algunas aplicaciones intenciona-
les de la primera teoría, que se consideran "menos importantes", quedan relegadas al olvido por la teoría suplantadora). No hay en todo este proceso de suplantación así concebido nada que suene a "irracionalidad", como han pretendido muchos críticos de Kuhn. No sólo es un proceso racionalmente comprensible, sino que los rasgos esenciales del mismo son formalmente apresables mediante el aparato modeloteórico del que ya hemos hecho uso en las páginas anteriores de este capítulo. Veámoslo con la definición de suplantación que se propone a continuación (recuérdese que p,es la relación generada por p a nivel no-teórico: p, = r(p)).
Dejnición 13.4: Sean N, N* dos redes teóricas distintas. Diremos que N es suplantable (inconmensurablemente) por N* syss existen una relación p c Mp" x . Mp y un conjunto no-vacío 1, tales que: (1) p no es efectivamente calculable. (2) p, es función, es efectivamente calculable y Rec(p,) = Mpp. ( 3 ) NO existen n conjuntos no vacíos M?, ..., Mnincluidos en i l í Ttales que ~ [ M...uU M;TI c,Mo. (4) (i) I, c lonp,[fl y (ii) para todo y E 1, (y E r[:m A y E r[Mo]). Comentenios el sentido de estas condiciones. Que p, en cuanto relación entre los aparatos conceptuales enteros de una y otra teoría, no sea efectivamente calculable significa que no hay manera de correlacionar sistemáticamente los modelos (y por tanto todos los conceptos básicos) de una y otra teoría. En esto, y en la condición (3) de no-deducibilidad de las leyes fundamentales de la teoría suplantada a partir de las leyes de la suplantadora, consiste la inconmensurabilidad. Determinamos pues dos factores de inconmensurabilidad distintos: uno conceptual, condición (l), otro proposicional, condición (3). Kuhn y otros partidarios de la tesis de la inconmensurabilidad también se refieren a veces a estos dos aspectos de la inconmensurabilidad, pero suelen dar la impresión de quererlos reducir a un solo factor. Nótese que aunque estos dos factores de inconmensurabilidad suelen ir juntos, estrictamente uno no se sigue de otro, (1) no implica (3); podría ocurrir que p no sí lo fuese. Por tanto, incluso si de fuese calculable pero que p restringida a M: u ... u hecho van siempre acompañados, es importante distinguir conceptualmente entre ambos factores. Por otro lado, por la condición (2), la inconmensurabilidad no es total, puesto que a nivel no-teórico o "empírico" hay manera de correlacionar efectivamente las estructuras parciales de una y otra teoría (la base de "datos") mediante el reducto no-teórico de p; éste tiene una estructura formal enteramente análoga a la relación de incorporación, pues la intuición básica es la misma. Con respecto a las aplicaciones intencionales de una y otra teoría, en-el caso de la incorporación hemos exigido una condición fuerte de superioridad de la teoría incorporadora frente a la incorporada: en lo esencial, que todas las aplicaciones exitosas de la segunda queden englobadas por la primera también. En el caso de la suplantación, la
460
FüXD.4hlEh'TOS DE FILoso~í.4 DE LA CIENCIA
condición homóloga respecto a las aplicaciones intencionales es mucho más débil: sólo exigimos que haya un subconjunto coiízlín de aplicaciones que hayan representado un fracaso para la teoría suplantada y resulten un éxito para la teoría suplantadora. A este subconjunto I, lo podemos interpretar como el conjunto de las anoríza~ías(en e1 sentido de Kuhn) de que adolece la -teoría suplantada (claro que la teoría suplantadora puede tener también sus propias anomalías, pero ellas no están en el punto de mira de la comparación entre ambas teorías). Para expresar esta idea (4) exige de este conjunto dos cosas: en primer lugar, que esté formado por aplicaciones pretendidas por ambas teorías; y en segundo lugar, que tales aplicaciones no sean subsumibles bajo las leyes de la suplantada pero sí bajo las de la suplantadora. Aunque esta estipulación respecto a las aplicaciones intencionales es más débil que en el caso de la incorporación, no obstante ella es suficiente para establecer la superioridad de la teoría suplantadora frente a la suplantada: la primera explica las cosas que la segunda quería explicar pero no podía. Es perfectamente comprensible entonces que la comunidad científica acabe por preferir una teoría frente a la otra, sobre todo en aquellos casos en los que, por razones cognoscitivas o tecnológicas, el conjunto I, se considere especialmente importante para la comunidad. Tampoco hay en esta preferencia ningún elemento que sea sospechoso de "irracionalidad".
6. Consideraciones finales: Las formas del progreso científico Concluiremos con unas breves obsenlaciones sobre la noción de progreso cient@co. Aunque las siguientes consideraciones están ya de hecho contenidas en lo dicho anteriormente, conviene explicitarlas aquí claramente a modo de conclusión, dado que la debatida cuestión del progreso científico pertenece sin duda a la problemática que debe abordar toda filosofía diacrónica de la ciencia. La idea de progreso en general es muy controvertida, pero no es éste el lugar para tratarla. Sin duda, hay una relación estrecha (aunque no una identidad, ni siquiera un condicionamiento absoluto) entre progreso científico y progreso técnico. También puede que haya algún tipo de relación interesante entre progreso científico y progreso moral o político-social, aunque esto ya sea una cuestión mucho más problemática. Pero el debatir sobre estos temas rompería el marco de este libro. Aquí nos hemos de limitar a hacer aIgunas sugerencias sobre el modo de precisar lo que pueda ser el progreso científico sensu stricto. Algunos autores, inspirados en una interpretación radicalmente relativista de las nociones kuhnianas, han sacado la conclusión de que la noción de progreso científico es vacía, que ella proviene sólo de ciertos prejuicios ideológicos calificados de "cientificistas": el desarrollo de las disciplinas científicas a través de la historia no es progresivo en ningún sentido objetivamente determinable, sino que más bien es comparable a una sucesión de modas. Y así como a nadie se le ocurre describir el paso de la falda corta a la falda larga (o al revés) como un progreso objetivo en el modo de vestir, así tampoco hay por qué hablar de progreso objetivo en el conocinliento cuando se pasa de una
teoría a otra en una disciplina. Ahora bien, independientemente de la constatación general de que el relativismo epistémico representa una posición argumentativamente insostenible (tema en el que no podemos detenemos aquí, cf. para ello Moulines, 1991. cap. 11.1). el hecho es que si se admiten los análisis de nociones diacrónicas propuestos en este capítulo, es fácil caracterizar de manera plausible y precisa al menos tres distintas formas de progreso científico, de las cuales, además, pueden detectarse nurnerosos ejemplos históricos. 1. En el caso del cambio intrateórico, determinaremos que hay progreso simplemente cuando las redes que componen una evolución teórica son cada vez más ramificadas y al mismo tiempo su dominio de aplicaciones exitosas cada vez mayor. Podemos formular estas dos condiciones más precisamente. Denotaremos mediante ' 1 N ) ' el número de elementos teóricos de que consta una red. Supongamos que Ni y N, son dos redes de una determinada evolución teórica E tales que i <j, esto es, N;precede a Ni.Diremos que la transición de N a N, ha representado un progreso si: (i) N; c 1.4 o (ii) Ió n r[Mó] c li n r [ ~ i ] Por . la primera condición, el progreso estriba en una mayor capacidad de discriminación y diferenciación de la teoría, lo cual va acompañado en general de un mayor potencial de explicación y predicción. Por la segunda condición, ese progreso a nivel de las leyes va acompañado de una mayor aplicabilidad de la teoría. Nótese que no exigimos que se den ambas condiciones sino sólo alguna de ellas, pues, aunque ambas formas de progreso suelen ir juntas, a veces se produce progreso sólo en uno de los ámbitos, bien el teórico, bien el aplicativo. 2. En contra d e l o que suponen muchos autores, también en el caso del cambio interteórico podemos dar cuenta "racionalmente" y objetivamente de lo que significa un progreso. En efecto, la relación de incorporación representa por sí misma un caso claro de progreso, por cuanto las leyes de la teoría incorporadora son a la vez más amplias y lógicamente más fuertes (tienen más consecuencias) que las leyes de la teoría incorporada; y además, también el dominio de aplicaciones exitosas de la primera abarca el de la segunda (y normalmente otras aplicaciones adicionales). 3. Finalmente, como ya hemos sugerido al final del apartado anterior, incluso en el caso.de la suplantación con inconmensurabilidad, podemos hablar de progreso de manera natural, al menos al nivel de las aplicaciones: la teoría suplantadora explica las anomalías de la teoría suplantada (además de muchas otras cosas).
1 1
1
Estos tres tipos de progreso científico ciertamente no son los únicos que pueden definirse con precisión. Las condiciones que hemos señalado son suficientes pero no necesarias para la idea intuitiva de progreso científico en general, tanto si nos restringimos al cambio intrateórico como si lo hacemos al cambio interteórico. Por ejemplo, una forma muy importante de progreso científico, en la que no hemos entrado aquí pero que sin duda es caracterizable formalmente, es la que representa el aumento en el grado de aproximación con el que el núcleo de un elemento teórico se aplica a sus aplicaciones correspondientes (cf. p.ej. Balzer, Moulines y Sneed, 1987, cap. VII). Esta forma de progreso ha tenido mucha importancia en la evoluciún de la astronomía y la física, por ejemplo. En
462
NNDAMENTOS DE FILOSOFÍA DE LA CIENCIA
cualquier caso, basten las formas señaladas para poner de manifiesto que la noción de progreso científico es precisable según diversos tipos y que es verosímil admitir que ellos tienen múltiples realizaciones en casos reales de la historia de la ciencia. Las consecuencias que se derivan de cada una de estas formas de progreso para otras nociones más fuertes, como la de progreso hacia la verdad, y su relación con otros problemas filosóficos sustantivos, como el del realismo cientifico, quedan fuera de los límites de esta obra.
1. Conjuntos 1.1. PERTENENCIA, EXTENSIONALIDAD Y CONJUNTO VACÍO Los conjuntos, o clases, son colecciones de cosas, son entidades que consisten en tener otras entidades como miembros. Ejemplos de estas entidades son el conjunto de los filósofos alemanes del siglo XIX, el conjunto de las letras de este libro, el conjunto de los números primos, el conjunto de los números primos menores que 10, el conjunto de los conceptos termodinámicos, el conjunto de las virtudes teologales, el conjunto de las teorías biológicas, el conjunto de los conjuntos de tres elementos, etc. Podemos nombrar estas entidades en lenguaje ordinario, como acabamos de hacer, pero para abrevix se suele usar el s i g o '( ... )', que se lee "el conjunto formado por ...". Este signo se puede usar de dos modos: a ) poniendo en los puntos suspensivos un nombre de todos y cada uno de los objetos que constituyen el conjunto; 6) poniendo una variable y dando una condición que satisfacen todos y sólo los objetos que constituyen el conjunto, e.e. '.(x1cp(x)}', que se lee "la clase de objetos d e s que cumplen la condición 9''(no toda condición determina un conjunto, pues eso conduce a paradojas, pero no podemos detenemos aquí en ello). En el primer caso decimos que nombramos el conjunto por extensión, en el segundo que lo nombramos por comprehensión; obviamente, sólo se pueden nombrar por extensión los conjuntos finitos. Son ejemplos de nombres de conjuntos por extensión '(1,2,3,5,7)', '(Churchill, Staiin, Roosevelt}', '{fe, esperanza, caridad}', etc.; y de nombres por comprehensión '(x l x es una letra de este libro)', '(x / x es un número primo)', '(x 1x es un número primo menor que lo}', ( x / x es una virtud teologal}', {xlxes un conjunto con exactamente tres elementos}', etc. Para referirse a la relación que se da entre un objeto y un conjunto del que es miembro se usa el signo de pertenencia ' E ', que debe estar flanqueado por un signo de objeto a su i~quierday por un signo de conjunto a su derecha. En general usaremos letras mayúsculas cursivas para variables de conjuntos; así, 'x E A' se lee "(el objeto) x pertenece a, es miembro de, es elemento de, (el conjunto) A", y su negación 'x E A' se lee "x no pertenece a (no es miembro de, no es elemento de) A". Son pues ejemplos de afirmaciones conjuntistas verdaderas "3 E ( 1, 2, 3,5, 7}", "3 E (x / x es un número primo)", "Schopenhauer E (x / x es filósofo alemán del siglo XK}", "(Churchill, Stalin, Roosevelt) E ( x / x es un conjunto de tres elementos}", "4 e ( 1, 2,3, 5, 7}", "4 E {xI x es un número primo}", "Stalin e ( x / x es un conjunto de tres elementos}", etc.
El principio básico que rige la identidad de los conjuntos es el principio de exfensionalidad, a saber, los conjuntos son extensionales, su identidad depende sólo de su extension, de cuáles son los elementos que los constituyen: Axioma de extensionalidad: Si dos conjuntos tienen los mismos elementos son el mismo conjunto: VA, B (VX(XE A XE
++
B)+A=B)
Así, por ejemplo, { 1, 2, 3,5, 7 ) y ( x / x es un número primo menor que 10) son el mismo conjunto, pues todo objeto que está en uno está en otro y viceversa; '{ 1,2, 3,5, 7)' y ' { x / x es un número primo menor que 10)' son nombres diferentes de la misma entidad. Es esencial notar que la extensionalidad de los conjuntos es una propiedad de las entidades mismas y que, por tanto, no depende de cómo se nombren. Que nombremos un conjunto por comprehensión, apelando a una propiedad que satisfacen sus miembros, no afecta para nada la extensionalidad del conjunto. Las propiedades pueden ser intensionales (e.e. puede haber propiedades diferentes que se apliquen a las mismas cosas), pero los conjuntos de cosas que las satisfacen no lo son. Así, { x1x es un número primo mayor que 2 y menor que 8) y (x / x es un número impar mayor que 2 y menor que 8) son el mismo conjunto, y { x/ x es un animal racional) y { x / x es un bípedo implume) también son el mismo conjunto; y eso independientemente de que las propiedades ser un número primo (entre 2 y 8) y ser un número impar (entre 2 y 8), o ser un animal racional y ser un bljledo implume, sean diferentes. Aunque intuitivamente un conjunto es una colección de cosas y no es claro que haya colecciones vacías en sentido intuitivo, es esencial para la teoría poder disponer de un conjunto que no tenga elementos. Este conjunto al que nada pertenece es el conjunto vacío, y se le denota mediante '0'. 1.2. INCLUSI~N Y CONJUNTO POTENCIA Los conjufitos pueden estar en diversas relaciones entre sí. Por ejemplo, dados A y B puede ocumr que todos los objetos que están en A estén también en B, o que no lo esté ninguno, o que estén unos pero no otros. De los dos últimos casos nos ocuparemos más adelante. Cuando ocurre lo primero se dice que el conjunto A está incluido en, o es un subconjunto de, B, y denotamos esta relación mediante el signo ' c ': A c B syssdefV x ( x E A + x E B). Así, por ejemplo, { ],S)E { 1,2, 3, 5), { l . 2, 3, 5 } E {1,2,3,5),{ x 1 x es un número primo menor que 10) c { x / x es un número primo), pero no { 1,2,8) c { 1,2,3,5), etc. Como se ve, todo conjunto esta incluido en sí mismo. Cuando los elementos de A están en B pero B tiene elementos que no están en A decimos que A está incluido esrricramente en, o que es un subconjunro propio de, E, y denotamos esta relación median. c (1,2,3,5},perono {1,2,3,5) c {1,2,3,5].Por te 'c':AcBsyssd4A G B A A # B . A s ~{1,2) tanto, todo conjunto está incluido en sf mismo, pero ninguno lo está estrictamente; por otro lado, es fácil ver que 0 está incluido en todo conjunto y además lo está estrictamente en todo conjunto diferente de él. A veces es útil poder hablar de todos los subconjuntos de un conjunto dado. Para ello acuñamos la noción de conjunro potencia o conjunto de las partes de un conjunto. El conjunto potencia, o conjunto de.las partes, de un conjunto A, 'Pot A' es el conjunto consistente en todos los subconjuntos de A: Pot A = hf { B / B E A). Así, por ejemplo, si A = {1,2), Pot A = ( 0 , Il)>I2)7Il211.
Dados dos conjuntos podemos formar otros reuniendo los elementos de los primeros de modo específico. Los modos más comunes son la intersección,-la unión y la diferencia. operaciones a las que denotamos, respectivamente, mediante 'n', 'u' y ' - '. La intersección A n B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los elementos comunes a A y a B: A n B = ( x 1 x E A A x E B ) . La unión A u B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los e l e m e n t o s d e a m b o s : A u B = ~ , ~ ( x lAxV~ X E B ) . La diferencia A-B de dos conjuntos A y B es un nuevo conjunto que tiene por elementos los elementos de A que no pertenecen a B: A-B = ( x 1x E A A x E B}. Así,p.ej.siA=(1,3,5,7}yB=(3,4,5,6},AnB=(3,5},AuB={1,3,4,5,6,7], A-B = ( 1 , 7 ) y B-A = (4,6}; si A = ( x / x es un número primo} y B = (A 1x es un número par), A n B = ( x / x es un número primo par} = {2},A u B = ( x 1 x es un número primo o par], A-B = ( x / x es un número primo impar} y B-A = ( x / x es un número par no primo} = ( x / x es un número par diferente de 2}. Nótese que tanto la intersección como la unión son conmutativas y asociativas, mientras que la diferencia no es ninguna de las dos cosas. Cuando dos conjuntos son tales que no tienen ningún elemento en común decimos que son disjuntos; por tanto, dos conjuntos son disjuntos si y sólo si su intersección es el conjunto vacío. J C ~
2. Relaciones 2.1.
PARES ORDENADOS Y PRODUCTO CARTESUNO
Los conjuntos en general se identifican sólo por los elementos que los integran, sin importar el orden en que se consideran tales elementos. Así, el conjunto de las letras de este libro es el mismo tal como estdn que cambiándolas de posición. En general, y si nos restringimos provisionalmente a conjuntos sólo con dos elementos, el conjunto ( x , y} es el mismo conjunto qae el conjunto (y, x ) . O de otro modo, si ( x , y} = ( 2 , t ) , no podemos asegurar que x = z e y = t ; puesto que en los conjuntos usuales el orden de los elementos no altera el conjunto, lo único que se sigue de ( x , y 1 = ( z , t } es "(x = z e y = t ) o (x = t e y = 2)". Sin embargo, como veremos a continuación, a veces es necesario referirse a conjuntos de elementos en los que sí se quiere que importe el orden. Para ello utilizamos el signo '< ... >'. Para dos objetos, hablaremos del par ordenado ~ r , y > ;para tres objetos, del trío ordenado <~,y,z>;y en general, paran objetos, de la n-tupln ordenada «,, .x?, ..., x,>. La propiedad fundamental de los pares ordenados es que en ellos sí ocurre "«,y> = <:,t> syss x = z e y = r". Esta propiedad se puede obtener definiendo los pares ordenados como conjuntos binarios (pares desordenados) de cierto tipo. Hay varias alternativas, todas con lo misma consecuencia; la más usual es: «,y> = ( (x},(x,y}} (el lector puede comprobar que, así definidos, los pares tienen efectivamente la propiedad deseada). Los tríos ordenados se pueden entonces definir así: a, y, z> = d,/ , i>. Y así sucesivamente con las restantes tuplas. A partir de ahora nos limitaremos en general para simplificar a ejemplos binarios, pero todo lo que se diga se puede generalizar a tuplas cualesquiera. Dados dos conjuntos A y B, a ciertos efectos es útil disponer del conjunto completo de todos los pares ordenados posibles con primer miembro de A y segundo miembro de B. A este conjunto se le denomina el producto cartesiano de A y B, y se le denota mediante ' A x B'.
Formalmente este conjunto es el resultado de realizar una operación entre ambos conjuntos: A x B =&, {e, y> 1 x E A A y E B ] . Así, si A = {1,2,3) y B = {a,b), A x B = {
2.2. RELACIONES; DOMINIO, RECORRIDO Y CAMPO Una relación R es cualquier conjunto de pares ordenados, o en general de tuplas ordenadas: si es un conjunto de pares, la relación es binaria; si es un conjunto de tríos, la relación es tenzaria; y en general, si es un conjunto de n-tuplas la relación es n-aria (por tanto, todo producto cartesiano de n conjuntos es una relación n-aria). Así, por ejemplo, P = {<1, a>, <1, b>, <3, b>} y Q = {a, y> / x es un varón, y es una mujer y x es padre de y) son relaciones; esta última relación podemos nombrarla abreviadamente mediante '{a, y> E V x M 1x es padre de y}'. El dominio de una relación binaria R, 'Dom R', es el conjunto de todos los primeros y> E R } . El recorrido (o conrradominio) de miembros de los pares de R: Dom R = def { X 1 3y a, una relación binaria R, 'Rec R', es el conjunto de todos los segundos miembros de los pares de R: Rec R = del {X/ 3y
2.3. OPERACIONESENTRE RELACIOSES Las relaciones son cierto tipo de conjuntos, conjuntos de pares, en general tuplas, ordenados. En tanto que conjuntos, a ellas se aplican las operaciones generales entre conjuntos (unión, intersección, etc.). Pero además, en tanto que conjuntos de tuplas, se pueden definir para ellas ciertas operaciones especiales. Las más comunes, y útiles, son la resrricción a determinado conjunto, la imagen bajo un conjunto, la conversa (o inversa) y el producto ~elativo.Para simplificar, nos limitaremos a relaciones binarias, e.e. a conjuntos de pares ordenados. La restricción de una relación R respecto de un conjunto cualquiera A, que se denota mediante 'RLA', es una nueva relación formada por los pares de R cuyo primer miembro es elemento de A: RIA =dg {e, y> / a, y> E R A x E A ) . La imagen de una relación R bajo un conjunto A, 'R[A]',es el conjunto de los segundos miembros de los pares de R cuyo primer miembro pertenece f / 3x (a, y> E R A x E A ) ] = Rec RLA. Así, p.ej., si R = a A, esto es, el recorrido de RLA: R[A] = ~ {y {
(, ,
Las relaciones, en tanto que conjuntos de pares, pueden tener propiedades, pueden ser de cierto tipo en función de qué les ocurra a sus pares conjuntamente considerados. Por ejemplo, una relación puede ser tal que, siempre que tenga un par, tenga también su par opuesto (p.ej. "ser hermano de"), o que no tenga nunca dos pares opuestos (p.ej. "ser progenitor de"), o que todo elemento del campo esté relacionado consigo mismo (p.ej. "ser tan o más alto que"). Las propiedades más destacadas son las siguientes: Reflexividad. Todo objeto del campo está relacionado consigo mismo: R es reflexiva H J ~Vx(x ~ E Cam R + e, x> E R). Irreflexividad. Ningún objeto está relacionado consigo mismo: R es irreflexiva *drf V X ( XE Cam R -+ e, x> E R). Simetría. Para todo par, el par converso está también en la relación: R es simétrica t ) d e f V x , y ( a , y > E R + < y j > E R). Asimetría. Ningún par está invertido en la relación: R es asimétrica t)defVx,y(-, y> E R +
Así, por ejemplo: R = (<1, 1>, <1, 2>, <2, 2>, d ,3>, < l . 3>, <3, 3>} es reflexiva, antisimétrica, transitiva, conexa y fuertemente conexa; S = (<1, 2>, <2, 1>, <2, 3 > , c3, 2 > } es irreflexiva,
e intransitiva; T = {
2.5. REIACIONES DE EQUIVALENCLA Y PARTICIONES Una relación de equivalencia relaciona individuos que son "equivalentes bajo cierto aspecto", como tener los mismo progenitores. haber nacido en el mismo país o ser del mismo sexo; Las relaciones de equivalencia se caracterizan por tener determinado grupo de propiedades: son reflexivas, pues todo individuo es "equivalente" (en el correspondiente respecto) a sí mismo; son simétricas, pues si un individuo equivale en cierto respecto a otro, éste también equivale en ese respecto a aquél; y son transitivas, pues la equivalencia se "hereda", los equivalentes a un tercero son equivalentes entre sí. Así pues, estas propiedades son las que definen las relaciones de equivalencia:
R es una relación de equivalencia ++kjR es reflexiva, simétrica y transitiva. Son ejemplos de relaciones de equivalencia: R = {<1,2>, <1,3>, <3, 1>, <3,2>, el, l>, <2,2>, Q, 1>, <2,3>, <3, 3>, <4,4>}, S = (
Las relaciones de equivalencia tienen el efecto de dividir el campo de objetos en "clases de equivalencia", en grupos disjuntos de individuos equivalentes bajo el correspondiente respecto; o como se dice técnicamente, generan puniciones del campo. Para ver que ello es así necesitamos antes los conceptos de coclase de un individuo bajo una relación y de conjunio cociente del campo bajo la relación. La coclase de un individuo x bajo la relación R, '[x]R' es simplemente el conjunto de individuos que x tiene a su derecha en R: [ x ] =~&J {y / -a,y> G R). Así, para los ejemplos anteriores: [ i ] =~{ 1, 2 , 3 ) = [ 2 ] = ~ [3]R, [4]R = { 4 ); picas so]^ = { x 1 Picasso ha nacido en el mismo país que x } , etc. Nótese que esta noción es general, no se exige que la relación sea de equivalencia sino que está definida para cualquier relación. Por ejemplo, si W = {<1, 2>, <1,3>, <3, 2>, <2,4>, <2, 3>, <3, 4>), [I]w= (2, 31, [ 2 ] w = { 3 , 4 ) ;si P = {u, y> / x ama a y ) , [Picassolp = (y 1 Picasso ama a y } . Cuando la relación es de equivalencia, entonces a las coclases se las denomina clases de equi~*aalencia. El conjunto cociente de un conjunto A bajo una relación R, '[AIIR', es el conjunto de todas las coclases de los individuos de A bajo la relación R: [AIIR =M { [ x ]/~x E A ) . Lo interesante, por lo general, es cuando el conjunto A es el campo de R. Así, en los ejemplos anteriores, [ { l , 2, 3, 4 ) ] / W = {{2, 31, (3, 4 ) , {2, 4 ) . 0)y [{l, 2, 3, 4)IlR = ( ( 1 , 2, 3), {4)). El conjunto cociente del campo de una relación bajo dicha relación se puede considerar como una "división" del campo
generada por la relación. Así, toda relación "divide" su campo agrupando los individuos entre sí de diverso modo. Pero, como se observará, para la mayoría de las relaciones, como en el caso de W. esa "división" es muy imperfecta, hasta el punto de que apenas cabe hablar propiamente de división genuina. Sólo con las relaciones de equivalencia tenemos la garantía de que la división generada es una "buena" división. Este concepto de "buena división" (de un conjunto) es el que expresa la noción d e partición (de un conjunto). Una partición de un conjunto A es un conjunto de subconjuntos de A tales que: a) ningún individuo está en dos subconjuntos diferentes, 6) todo individuo está en algún subconjunto, y (c) ningún subconjunto es vacío: H e s u n a p a r t i c i ó n d e A # ~ ~ ~ V BH ( B+~B ~ A A B + ~ ) A V B , C ( BHEA C E H j B ~ C = @ ) A ~ X ( AX -E+ ~ B ( B H E A X EB)).
Así, ( [ 1,2, 31, ( 4 ) ) es una partición de (1, 2,541, mientras quz ((2, 31, (3,4}, (2,4]. 0) no lo es, pues incumple las tres condiciones (aunque bastan'a con que incumpliera una sola de ellas). Las particiones son por tanto las "buenas divisiones" de conjuntos y es inmediato que para cada conjunto (de dos o más elementos) puede haber varias. Hemos visto una partición del conjunto {1,2,3,4}, HI = ((1,2,3}, (41),perohayotrascomoH:= {(1,21, (31, (41) 0H3= ((1,4}, (2, 3)). Cuando dos particiones diferentes son tales que los subconjuntos de una son subdivisiones de los de la otra, decimos que la primera es másfina que la segunda; por ejemplo, Hz es más fina que H1 pero H3 no es ni más ni menos fina que ninguna de las anteriores. Ahora podemos expresar el hecho mencionado acerca de las relaciones de equivalencia: toda relación de equivalencia genera una partición, a saber, el conjunto cociente de su campo bajo ella. Aunque puede haber quizá alguna relación que no sea de equivalencia cuyo conjunto cociente sea también una partición (p.ej. { c l , 2>, <2, 3>, c3, 4>, <3, l>]), lo distintivo de las relaciones de equivalencia es que ellas siempre generan particiones; sólo de ellas sabemos en general que su conjunto cociente es una partición. En realidad es prácticamente equivalente hablar de relaciones de equivalencia o de particiones. Toda relación de equivalencia genera una partición, su conjunto cociente. Pero es fácil ver que también toda partición genera una relación de equivalencia. Llamemos relación asociada a un conjunto H (de conjuntos), 'RH'.a la relación que consiste en unir 10s productos cartesianos de cada elemento de H consigo mismo. Por ejemplo, para H = { ( 1, 21, (2, 4)), RH = { < I r l>, <1, 2>, <2, 1>, c2, 2>, <2, 4>, <4, 2>, c4, 4>}. Por lo general, como en este caso, si H no es una partición entonces la relación asociada no es de equivalencia; sólo si es una partición, la relación así generada es una relación de equivalencia (compruébelo el lector con Hz y H3). Por tanto, las relaciones de equivalencia generan particiones, sus conjuntos cocientes, y las particiones generan relaciones de equivalencia, sus relaciones asociadas.
2.6. RELACIONESDE ORDEN Las relaciones de orden "ordenan" los individuos del campo según determinado criterio comparativo, como la edad o la altura de las personas, el peso o la longitud de los objetos, etc. Hay muchos tipos de relaciones de orden, más o menos fuertes según los casos, pero en todas se han de dar ciertos hechos mínimos que son los que garantizan que se pueda hablar propiamente de orden. por muy débil que éste sea. Estos hechos mínimos asociados a toda idea de orden son básicamente dos: a) que no haya "círculos" o "bucles", y b) que se "herede" o "transmita". La segunda condición se plasma siempre del mismo modo, a saber, la relación ha de ser al menos transitiva. La
primera condición parece exigir que la relación sea al menos antisimétnca y en general así es, pero como veremos hay un tipo de orden que puede no ser antisimétrico y que a pesar de ello cabe considerarlo como un orden (aunque débil). En los órdenes antisimétricos tenemos dos tipos de condiciones adicionales. En primer lugar, según sea la relación reflexiva o irreflexiva; esto es, se permite que haya individuos relacionados consigo mismos, pero se exige que eso ocurra siempre o no ocurra nunca. Los órdenes irreflexivos se denominan estrictos, y los órdenes reflexivos, no esrricros. En segundo lugar, dependiendo de si la relación es conexa. A los órdenes conexos se les denomina lineales o fuertes, y a los que quizá no lo son, parciales. La combinación de estas posibilidades genera los siguientes cuatro tipos de orden.
R es un orden parcial no estricto H ~ esRreflexiva, antisimétrica y transitiva. Ejemplos: { < l . 1>, <1, 2>, <2, 2>, <2, 5>, <1, 5>, <3, 5>, <3, 3>, <4, 5>, < 4 , 4 > , <5, 5 > ) , {<1, 1>, <1,2>, <2,5>, <1,5>, <2,2>, < 5 , 5 > ) , {a, y> 1 x 2 ) ' ) . R es un orden lineal no estricto w W R es reflexiva, antisimétrica, transitiva y conexa. Ejemplos: {<1, 1>, <1,2>, <2,5>. <1,5>, c 2 , 2 > , <5, S>}, {e, y> l x 2 y } . R es un orden parcial estricto H ~ esRirreflexiva, antisimétrica y transitiva. Ejemplos: {<1, 2>, <2, 5>, <1,5>, <3,5>, <4, S>, < 4 , 5 > ) , { < 1 , 2 > , <2, 5>, <1; 5 > ) , {a, y> 1 (el objeto físico) x es más pesado que (el objeto físico) y ) , {a, y> / x > y ) . R es un orden lineal estricto tjdcf R es irreflexiva, antisimétrica, transitiva y conexa. Ejemplos: {<1,2>,<2,5>, < l . 5 > } , {e, y> l x > y } . En esta lista falta un tipo de orden que es muy débil pero que cabe todavía considerarlo orden y que, como hemos anunciado, no es antisimétnco. Un ejemplo de ello es la "versión no estricta y conexa" de "ser más pesado que", a saber, "ser tan o más pesado que". Intuitivamente, si "ser más pesado que" se puede considerar una relación de orden, entonces parece que "ser tan o más pesado que" también lo será, y sin embargo en este caso la relación no es antisimétrica, pues hay pares de individuos difereittes tales que el primero es tan o más pesado que el segundo y éste es tan o más pesado que aquél, a saber, cuando objetos diferentes son igual de pesados. A estos órdenes se les denomina débiles: R es un orden débil w d c f R es reflexiva, transitiva y conexa. Ejemplos: (además de los del orden lineal no estricto:) { < 1 , 2 > , < 1 , 1>, <2, 1 >, < 2 , 2 > , <2,4>, <1,4>, € 1 , 3>, <2,3>, <3, 3>, <3,4>, < 4 , 4 > ) , {a, y> 1 (el objeto físico) x es tan o más pesado que (el objeto físico) y).
3. Funciones 3.1. FUNCIONES; IMAGEN En las relaciones, un mismo objeto puede "tener a su derecha" varios objetos diferentes; por eso no podemos por lo general, para cada individuo, hablar de "el que está a su derecha". En la relación "ser más alto que" no tiene sentido hablar de "el más alto que Napoleón", pues hay varios. Para ello seria necesario que la relación fuese de un tipo especial, a saber, tal que cada individuo del dominio sólo estuviera relacionado con un único individuo del recomdo; en términos coloquiales, que no haya dos pares ordenados diferentes con idéntico primer miembro. A estas relaciones
especiales que tienen esta propiedad se las denomina funciones (y para ellas se suelen usar como variables las letras cursivas S , 'g', 'h', ... ).
f es una función ~
f es una relación A Vx, y, z (a, zsE f A
d , /
E f-)
= Y).
Así, por ejemplo,f = { c l , 2>, c2, 3>, <3, 3>, <4, .1>), g = (a, y> / x tiene por madre a y } y h = {-a, y> I 2=y} son funciones; mientras que {<1,2>, <2,3>, <3,3>, <,4,2>, <4. 1>), {a, y> / x es y> l x = 7 )(siendo x e y números reales cualesquiera) no lo son. hermano de y) y {a, En tanto que relaciones, a las funciones se les aplica las mismas nociones de dominio, recorrido, etc., que a aquéllas. Por el tipo especial de relaciones que son, se puede definir para las funciones la noción de "el que está relacionado con" a que hemos hecho referencia. Ésta es la noción de imagen de un objeto bajo una función. La imagen del objeto x bajo la función f (en cuyo dominio está x), 'flx)', es el objeto y que está a la derecha de x enf: siendo f una función, f(x) =def el objeto y tal que -a,y> E f. Así, en los ejemplos anteriores, f(2) = 3, g(Edipo) = Yocasta, h(-3) = 9.
Una función se caracteriza porque cada objeto del domino sólo está relacionado con uno del recomdo, pero lo inverso puede no ser cierto, como en el caso de la anterior funciónf, en la que el 3 es imagen tanto de 2 como de 3. Por tanto, no siempre la relación inversa de una función es a su vez una función. A las funciones en que ello sí pasa las denominamos biyectivas o biunívocas, porque cada objeto del dominio está relacionado con un único objeto del recorrido y a la vez cada objeto del recomdo está relacionado con un único objeto del dominio. f es una función biyectiva ++de, f es función A f -' es función.
Así, por ejcmplo, (<1,2>, c2, 3>, <4, 1>), {a, y> / x es cónyuge de y } (en sociedades monógamas) y {a, y> / x + 8 = y ) son funciones biyectivas, mientras que {<1, 2>, <2, 3>, <4, 2>) y {<x, y> / x tiene por madre a y ) no lo son.
3.3. COMPOSICIÓNDE FUNCIONES I
i
¡
! i
1 (
En tanto que conjuntos, a las funciones se aplican las operaciones generales entre conjuntos, y en tanto que relaciones, a ellas se aplican las operaciones generales entre relaciones. Por ser un tipo especial de relaciones, se pueden definir operaciones específicas para ellas. La más importante es la composición, que se puede definir a partir del producto relativo de relaciones. La idea es que la función compuesta de dos funciones f y g, 'gof, es una nueva función tal que la imagen de un individuo x se obtiene aplicándole primero f y aplicando despues g al resultado así obtenido; esto es, g.ljx) es la imagen bajo p de Ir imrecn de x b a j o j g c j = d C f {a, y> i y = gflx))). Por ejemplo, si f = (si,22. <2, 2>. <3. 1>} y g = ( < l . a>, <2, 0.<4, 0,. t6. b > ) , gof(1) = g(J(1)) = g(2) = c, y la composición completa es gof = (cl,o , <2, o , <3, a > ) ; si h = {a, y> / y = x + S} y j = (cr,y> l y = 3 2 ) (en ambos casos sobre todos los números reales),j.h (-6) =j(h(4)) =j(2) = 12, y la composición completa es joh = (a, y> 1 y = 3(x + 8)'). Ei lector puede comprobar que la composición entre funciones no es más que el producto relativo en el orden opuesto: gaf =flg.
4. Sistemas y morfismos
Un sisrema o una estructura A es una secuencia o tupla ordenada consistente en un conjunto de individuos, llamado el universo del sistema, y una serie de relaciones y10 funciones sobre dicho dominio: A = 4,Ri,..., R.,$. ...,f,>. Una estructura expresa un modo en que puede cornponarse una parte de la realidad, es un mundo o situación posible en el que ciertos individuos, los miembros del universo, se comportan de cierto modo, guardan ciertas relaciones y están vinculados por ciertas funciones. Así, por ejemplo, tenemos las siguientes estructuras, constituidas todas ellas, además del universo, por una relación binaria y una función monaria (N es el conjunto de los número naturales, P el de los naturales pares y Z el de los enteros):
A = < ( 1 , 2 ) , {<1,1>,<1,2>,<2,2>}, { < 1 , 2 > , R , 1>)} B = <{a,b ) , {, , }, {, 4, a>}} C = <{+, *}, {<+, *>, <+, +>), (<+, +>, <*, *>}} N = < N , { e , y > l x S y ] ,{ a , y > l y = x + l } > P=