2016-04-05t6_ref.pdf

  • Uploaded by: Manuel Martel Pérez
  • 0
  • 0
  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View 2016-04-05t6_ref.pdf as PDF for free.

More details

  • Words: 3,282
  • Pages: 51
´ ESTAD´ISTICA BASICA PARA ESTUDIANTES DE CIENCIAS Javier Gorgas Garc´ıa Nicol´as Cardiel L´opez Jaime Zamorano Calvo

Departamento de Astrof´ısica y Ciencias de la Atm´osfera Facultad de Ciencias F´ısicas Universidad Complutense de Madrid

Cap´ıtulo 1

Introducci´ on “La Ciencia es m´as una forma de pensar que una rama del conocimiento.” Carl Sagan (1934-1996)

1.1.

La Estad´ıstica como ciencia

La Estad´ıstica es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los datos. En la vida diaria somos bombardeados continuamente por datos estad´ısticos: encuestas electorales, econom´ıa, deportes, datos meteorol´ ogicos, calidad de los productos, audiencias de TV. Necesitamos una formaci´on b´asica en Estad´ıstica para evaluar toda esta informaci´on. Pero la utilidad de la Estad´ıstica va mucho m´as all´ a de estos ejemplos. La Estad´ıstica es fundamental para muchas ramas de la ciencia desde la medicina a la econom´ıa. Pero sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos que se obtienen de la investigaci´on cient´ıfica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen saber el significado de los datos. Es por lo tanto una herramienta de trabajo profesional. Se recomienda leer la Introducci´ on de Estad´ıstica: modelos y m´etodos de Daniel Pe˜ na, para conocer el desarrollo hist´ orico de la Estad´ıstica. La Estad´ıstica (del lat´ın, Status o ciencia del estado) se ocupaba sobre todo de la descripci´ on de los datos fundamentalmente sociol´ogicos: datos demogr´aficos y econ´omicos ( censos de poblaci´on, producciones agr´ıcolas, riquezas, etc.), principalmente por razones fiscales. En el siglo XVII el c´alculo de probabilidades se consolida como disciplina independiente aplic´andose sobre todo a los juegos de azar. Posteriormente (s. XVIII) su uso se extiende a problemas f´ısicos (principalmente de Astronom´ıa) y actuariales (seguros mar´ıtimos). Posteriormente se hace imprescindible en la investigaci´on cient´ıfica y es ´esta la que la hace avanzar. Finalmente, en el siglo XIX, nace la Estad´ıstica como ciencia que une ambas disciplinas. El objetivo fundamental de la estad´ıstica es obtener conclusiones de la investigaci´on emp´ırica usando modelos matem´ aticos. A partir de los datos reales se construye un modelo que se confronta con estos datos por medio de la Estad´ıstica. Esta proporciona los m´etodos de evaluaci´on de las discrepancias entre ambos. Por eso es necesaria para toda ciencia que requiere an´alisis de datos y dise˜ no de experimentos.

3

4

Introducci´on

1.2.

Para qu´ e sirve la Estad´ıstica

Ya hemos visto que la Estad´ıstica se encuentra ligada a nuestras actividades cotidianas. Sirve tanto para pronosticar el resultado de unas elecciones, como para determinar el n´ umero de ballenas que viven en nuestros oc´eanos, para descubrir leyes fundamentales de la F´ısica o para estudiar c´omo ganar a la ruleta. La Estad´ıstica resuelve multitud de problemas que se plantean en ciencia: An´ alisis de muestras. Se elige una muestra de una poblaci´on para hacer inferencias respecto a esa poblaci´ on a partir de lo observado en la muestra (sondeos de opini´on, control de calidad, etc). Descripci´ on de datos. Procedimientos para resumir la informaci´on contenida en un conjunto (amplio) de datos. Contraste de hip´ otesis. Metodolog´ıa estad´ıstica para dise˜ nar experimentos que garanticen que las conclusiones que se extraigan sean v´ alidas. Sirve para comparar las predicciones resultantes de las hip´otesis con los datos observados (medicina eficaz, diferencias entre poblaciones, etc). Medici´ on de relaciones entre variables estad´ısticas (contenido de gas hidr´ogeno neutro en galaxias y la tasa de formaci´ on de estrellas, etc) Predicci´ on. Prever la evoluci´ on de una variable estudiando su historia y/o relaci´on con otras variables.

1.3.

El m´ etodo cient´ıfico

Citando a Martin Gardner: “La ciencia es una b´ usqueda de conocimientos fidedignos acerca del mundo: c´omo se estructura y c´ omo funciona el universo (incluyendo los seres vivos)”. La informacion que maneja la ciencia es amplia, al ser amplio su ´ ambito. Pero se suele reunir en tres apartados: los hechos, las leyes y las teor´ıas. No es una partici´ on estanca, aunque podemos entender aqu´ı nos referimos con alg´ un ejemplo. Los hechos se refiere a casos espec´ıficos y/o u ´nicos. Por ejemplo la Tierra tiene una luna (sat´elite natural). La primera ley de Kepler (ya que estamos con planetas) es un buen ejemplo de ley: los planetas describen orbitas el´ıpticas en torno al Sol, que ocupa uno de los focos de la elipse. Como se ve, frente al hecho, concreto yu ´nico, la ley se refiere a muchos casos, como lo son los planetas que orbitan en torno al Sol. La generalizaci´on de la ley de Kepler permite aplicarla a cualquier par de cuerpos ligados por la gravedad. Una teor´ıa es una abstracci´ on, con entidades inobservables, que explica hechos y leyes. Por ejemplo la teor´ıa newtoniana de la gravitaci´ on. En ella se habla de fuerzas (o de campos gravitatorios) que no son entes observables, pero esta teor´ıa explica hechos y leyes. Sucede que el conocimiento cient´ıfico no es completamente seguro en ninguna de las precedentes categor´ıas. Podr´ıa existir otra luna en torno a la Tierra. O, como sabemos, la teor´ıa newtoniana de la gravitaci´on no es completa, porque no da cuenta de algunos fen´omenos. De ah´ı vino su evoluci´on a nuevas teor´ıas de la gravitaci´on. No hay as´ı un conocimiento completamente seguro: los enunciados absolutamente ciertos s´olo existen en el ´ ambito de las matem´ aticas o la l´ogica. Pero la ciencia usa una correspondencia con estas dos disciplinas. La matem´ atica y la l´ ogica aplicadas a las ciencias facilitan poder establecer hechos, leyes y teor´ıas con coherencia interna y con un alto grado de certeza. Y la Estad´ıstica proporciona una herramienta para poder evaluar esta certeza, o proporcionar pautas para realizar inferencias a partir de lo que se conoce. Estad´ıstica B´ asica para Estudiantes de Ciencias

Febrero 2009

1.4 El proceso experimental

5

Lo que distingue a una teor´ıa cient´ıfica es que ´esta, a diferencia de la que no lo es, puede ser refutada: puede existir un conjunto de circunstancias que si son observadas demuestran que la teor´ıa est´a equivocada. A continuaci´on se ofrece una visi´ on simplificada del m´etodo cient´ıfico. Hacemos observaciones en la naturaleza y a trav´es de un proceso creativo generamos una hip´ otesis de c´omo funciona cierto aspecto de la naturaleza (modelos). Bas´andonos en esa hip´otesis dise˜ namos un experimento que consiste en que un conjunto de observaciones deben tener lugar, bajo ciertas condiciones, si la hip´otesis es cierta. En el caso de que estas observaciones no ocurran nos enfrentamos a varias posibilidades: nuestras hip´otesis necesitan ser revisadas, el experimento se llev´o a cabo de forma incorrecta, o nos hemos equivocado en el an´alisis de los resultados del experimento. Hace algunos cientos de a˜ nos se estableci´ o un m´ etodo para encontrar respuestas a los interrogantes que nos planteamos al contemplar la naturaleza. Este m´ etodo, conocido como m´ etodo cient´ ıfico, se basa en tres pilares fundamentales: observaci´ on, razonamiento y experimentaci´ on. El m´ etodo cient´ıfico no es una simple receta, sino que es un proceso exigente que requiere, entre otros ingredientes, juicio cr´ıtico. De forma resumida, el m´ etodo cient´ıfico incorpora las siguientes facetas: Observaci´ on: aplicaci´ on atenta de los sentidos a un objeto o a un fen´ omeno, para estudiarlos tal como se presentan en realidad. Descripci´ on: las mediciones deben ser fiables, es decir, deben poder repetirse. Las observaciones u ´ nicas e irrepetibles no permiten predecir futuros resultados. En este sentido la Cosmolog´ıa se enfrenta, a priori, a un grave problema. El Universo es u ´ nico y no podemos volver a repetirlo modificando las condiciones iniciales. Predicci´ on: las predicciones de cualquier fen´ omeno deben ser v´ alidas tanto para observaciones pasadas, como presentes y futuras. Control: capacidad de modificar las condiciones del experimento para estudiar el impacto de los diferentes par´ ametros participantes. Esto se opone a la aceptaci´ on pasiva de datos, que puede conducir a un importante sesgo (bias) emp´ırico. Falsabilidad o eliminaci´ on de alternativas plausibles: Este es un proceso gradual que requiere la repetici´ on de los experimentos (preferiblemente por investigadores independientes, quienes deben ser capaces de replicar los resultados iniciales con la intenci´ on de corroborarlos). Todas las hip´ otesis y teor´ıas deben estar sujetas a la posibilidad de ser refutadas. En este sentido, a medida que un a ´rea de conocimiento crece y las hip´ otesis o teor´ıas sobre la que se sustenta van realizando predicciones comprobables, aumenta la confianza en dichas hip´ otesis o teor´ıas (uno de los defensores fundamentales del criterio de falsabilidad es Karl Popper (1902–1994); ver, por ejemplo, La l´ ogica de la investigaci´ on cient´ıfica en Popper 1935). Explicaci´ on causal: los siguientes requisitos son normalmente exigibles para admitir una explicaci´ on como cient´ıfica: Identificaci´ on de las causas. Las causas identificadas deben correlacionarse con los observables. Las causas deben preceder temporalmente a los efectos medidos.

1.4.

El proceso experimental

La experimentaci´ on est´ a lejos de estar carente de dificultades. Algunas t´ecnicas experimentales exigen un aprendizaje largo y, en muchas ocasiones, el volumen de datos a manejar puede ser tan grande que sea necesario un trabajo de an´ alisis intenso. La paciencia y la perseverancia son grandes aliadas en este sentido. Las razones para realizar un experimento son diversas y de alcance muy variable. Preguntas t´ıpicas son, por ejemplo: ¿C´ omo de aplicable es una teor´ıa particular? ¿Es posible mejorar una t´ecnica de medida? ¿A qu´e temperatura debe fundir una nueva aleaci´on? ¿Qu´e ocurre con las propiedades magn´eticas de un material al someterlo a temperaturas de trabajo muy bajas? ¿Se ven alteradas las propiedades de un semiconductor debido al bombardeo por radiaci´ on nuclear? De una forma esquem´ atica, el proceso experimental suele desarrollarse siguiendo el siguiente esquema: 1. Definir la pregunta o problema a resolver. Cuanto m´as claro y definido sea el objetivo del experimento, mucho m´ as f´ acil ser´ a realizar su planificaci´on y ejecuci´on. Estad´ıstica B´ asica para Estudiantes de Ciencias

Febrero 2009

6

Introducci´on 2. Obtener informaci´ on y recursos. Una vez definido el objetivo del experimento, es necesario elaborar un plan de trabajo para poder alcanzarlo. Hay que identificar qu´e equipos son necesarios, qu´e cantidades hay que medir, y de qu´e manera se va a realizar el experimento. 3. Formular hip´ otesis, acerca de los resultados de nuestro experimento. Hacerlo antes de su ejecuci´on evita el sesgo personal de identificar los resultados que ya se conocen como objetivos iniciales (no debemos enga˜ narnos a nosotros mismos). 4. Realizar el experimento y obtener las medidas. Esta tarea se subdivide en varios pasos: Preparaci´ on: el equipo debe ser puesto a punto para su utilizaci´on. Si el experimento requiere la utilizaci´ on de aparatos con los que no estamos familiarizados, es necesario leer atentamente los manuales de utilizaci´ on, e incluso consultar a experimentadores con experiencia previa en su manejo. Todo ello evita perder tiempo y cometer errores de bulto, a la vez que preserva la integridad del equipo (¡y la nuestra!). Experimentaci´ on preliminar: suele ser muy aconsejable realizar una peque˜ na experimentaci´on de prueba antes de iniciar la toma definitiva de medidas. Esto facilita el uso correcto del equipo instrumental, permitiendo identificar los aspectos m´as dif´ıciles o en los que resulta m´as f´acil cometer errores. Toma de datos: el trabajo cuidadoso y detallado son fundamentales en todo proceso experimental. Ejecutar dicha labor siguiendo un plan de trabajo bien definido resulta b´asico. No hay nada m´as frustrante que descubir, tras largas horas de medidas, que hemos olvidado anotar alg´ un par´ametro esencial o sus unidades. En este sentido resulta imprescindible tener presentes varias cuestiones • ¿Cu´ ales son las unidades asociadas a cada medida? • ¿Cu´ al es la incertidumbre asociada? • ¿Qu´e variabilidad presentan las medidas? • ¿C´ omo puedo tener una idea del orden de magnitud de una medida antes de realizarla y saber as´ı que los resultados que se van obteniendo son razonables?

• ¿Qu´e informaci´ on debe ser incluida en la tabla de datos? Comprobaci´ on de la repitibilidad: siempre que sea posible, todo experimento deber´ıa repetirse varias veces para comprobar que los resultados obtenidos son repetibles y representativos. Y aunque, obviamente, la repetici´ on de un experimento no proporciona exactamente los mismos n´ umeros, discrepancias muy grandes deben alertarnos acerca de la existencia de efectos sistem´aticos que pueden estar distorsionando el experimento. 5. Analizar los datos: una vez obtenidas las medidas es necesario su tratamiento estad´ıstico para poder obtener magnitudes (e incertidumbres asociadas) representativas del objeto de nuestro estudio. 6. Interpretar los datos y extraer conclusiones que sirvan como punto de partida para nuevas hip´otesis. El ´exito de esta interpretaci´ on depender´a, b´asicamente, de la calidad de las medidas y de su an´alisis. Las herramientas estad´ısticas que se describen en este libro nos permitir´ an tomar decisiones de manera objetiva. 7. Publicar los resultados. Los resultados de cualquier proceso experimental deben ser comunicados de manera clara y concisa. Esto incluye desde un sencillo informe de laboratorio, como el que se exigir´a en los diversos laboratorios en los que se trabajar´a durante la licenciatura de F´ısicas, hasta la publicaci´on de un art´ıculo cient´ıfico en una revista reconocida. Estad´ıstica B´ asica para Estudiantes de Ciencias

Febrero 2009

1.5 Bibliograf´ıa complementaria

7

No es extra˜ no que, aunque la pregunta inicial a responder haya sido establecida de una forma clara, tras el desarrollo del experimento y el an´ alisis de los resultados, se descubran fen´omenos no previstos que obliguen a modificar y repetir el proceso descrito. De hecho, si el resultado de un experimento fuera completamente predecible, tendr´ıa poco sentido llevarlo a cabo. Por ello, de forma pr´actica el esquema anterior se ejecuta siguiendo un proceso iterativo entre los puntos 3 y 6. Una vez obtenido un conocimiento significativo, ´este ha de ser explicado en una publicaci´ on, permitiendo a nuevos investigadores corroborar o refutar las conclusiones.

1.5.

Bibliograf´ıa complementaria

La consulta de libros es necesaria para conocer diferentes enfoques y, desde luego, se hace imprescindible para ampliar la colecci´ on de ejemplos y ejercicios, ya que la Estad´ıstica es una disciplina eminentemente pr´actica. A continuaci´ on se enumeran algunos de los textos en castellano m´as frecuentes en las bibliotecas de las Facultades de Ciencias, con una peque˜ na descripci´on en relaci´on a los contenidos cubiertos por este libro: Curso y ejercicios de estad´ıstica, Quesada, Isidoro & Lopez, Alhambra 1988. Cubre casi todos los temas. Buen formalismo matem´atico. Amplia colecci´on de problemas. Probabilidad y Estad´ıstica, Walpole & Myers, McGraw-Hill 1992. Muy bien explicado. Con multitud de ejemplos. Es m´as amplio. De car´acter pr´actico. V´alido para todos los temas excepto el primero. Probabilidad y Estad´ıstica, Spiegel, McGraw-Hill 1991. Con muchos problemas. La teor´ıa se encuentra muy resumida. Vale para todos los temas excepto el primero. Este tema se desarrola en otro libro de Spiegel: Estad´ıstica (Teor´ıa y Problemas). M´etodos Estad´ısticos, Viedma, Ediciones del Castillo 1990. Muy sencillo. Cubre todos los temas, aunque algunos no de forma completa.

Estad´ıstica B´ asica para Estudiantes de Ciencias

Febrero 2009

Cap´ıtulo 2

Fundamentos de Estad´ıstica Descriptiva “Se cometen muchos menos errores usando datos inadecuados que cuando no se utilizan datos.” Charles Babbage (1792-1871)

La aplicaci´on del tratamiento estad´ıstico tiene dos fases fundamentales: 1. Organizaci´ on y an´ alisis inicial de los datos recogidos. 2. Extracci´ on de conclusiones v´ alidas y toma de decisiones razonables a partir de ellos. Los objetivos de la Estad´ıstica Descriptiva son los que se abordan en la primera de estas fases. Es decir, su misi´on es ordenar, describir y sintetizar la informaci´on recogida. En este proceso ser´a necesario establecer medidas cuantitativas que reduzcan a un n´ umero manejable de par´ametros el conjunto (en general grande) de datos obtenidos. La realizaci´ on de gr´ aficas (visualizaci´ on de los datos en diagramas) tambi´en forma parte de la Estad´ıstica Descriptiva dado que proporciona una manera visual directa de organizar la informaci´on. La finalidad de la Estad´ıstica Descriptiva no es, entonces, extraer conclusiones generales sobre el fen´omeno que ha producido los datos bajo estudio, sino solamente su descripci´on (de ah´ı el nombre).

2.1.

Variables estad´ısticas

El concepto de variable estad´ıstica es, sin duda, uno de los m´as importantes en Estad´ıstica. Pero antes de abordar su definici´ on, es necesario introducir anteriormente diversos conceptos b´asicos.

2.1.1.

Poblaci´ on y muestra

Se denomina poblaci´ on al conjunto completo de elementos, con alguna caracter´ıstica com´ un, que es el objeto de nuestro estudio. Esta definici´ on incluye, por ejemplo, a todos los sucesos en que podr´ıa concretarse un fen´omeno o experimento cualesquiera. Una poblaci´on puede ser finita o infinita. 11

12

Fundamentos de Estad´ıstica Descriptiva Los habitantes de un pa´ıs, los planetas del Sistema Solar, las estrellas en la V´ıa L´ actea, son elementos de una poblaci´ on finita. Sin embargo, el n´ umero de posibles medidas que se puedan hacer de la velocidad de la luz, o de tiradas de un dado, forman poblaciones infinitas.

Ejemplo I–1

Cuando, aunque la poblaci´ on sea finita, su n´ umero de elementos es elevado, es necesario trabajar con solo una parte de dicha poblaci´ on. A un subconjunto de elementos de la poblaci´on se le conoce como muestra. Si se quiere estudiar las propiedades de las estrellas en nuestra Galaxia, no tendremos la oportunidad de observarlas todas; tendremos que conformarnos con una muestra representativa. Obviamente, elegir de forma representativa los elementos de una muestra es algo muy importante. De hecho existe un grave problema, conocido como efecto de selecci´ on, que puede condicionar el resultado de un estudio si uno no realiza una selecci´ on correcta de los elementos que forman parte de una muestra.

Ejemplo I–2

Al n´ umero de elementos de la muestra se le llama tama˜ no de la muestra. Es f´acil adelantar que para que los resultados de nuestro estudio estad´ıstico sean fiables es necesario que la muestra tenga un tama˜ no m´ınimo. El caso particular de una muestra que incluye a todos los elementos de la poblaci´on es conocido como censo.

2.1.2.

Caracteres cuantitativos o cualitativos

El objeto de nuestra medida pueden ser caracteres de tipos muy diversos. De ah´ı que normalmente se clasifiquen en: caracteres cuantitativos: aquellos que toman valores num´ericos. Por ejemplo la altura o la velocidad de un m´ ovil. caracteres cualitativos: tambi´en llamados atributos, son aquellos que no podemos representar num´ericamente y describen cualidades. Por ejemplo, un color o el estado civil. Aunque existen algunas diferencias, el tratamiento para ambos casos es similar, pudi´endose asignar, en muchas ocasiones, valores num´ericos a los diferentes caracteres cualitativos.

2.1.3.

Variable estad´ıstica

Se entiende por variable estad´ıstica al s´ımbolo que representa al dato o car´acter objeto de nuestro estudio de los elementos de la muestra y que puede tomar un conjunto de valores. En el caso de que estemos tratando con caracteres cuantitativos, la variables estad´ısticas pueden clasificarse en: discretas, cuando solo pueden tomar una cantidad (finita o infinita) numerable de valores, y continuas, cuando pueden tomar te´oricamente infinitos valores entre dos valores dados. Es la diferencia b´asica que existe entre contar y medir. Ejemplo I–3

El n´ umero de electrones de un ´ atomo es una variable discreta. La velocidad o la altura de un m´ ovil son variables continuas.

Por otra parte, las variables se pueden asimismo clasificar en unidimensionales, cuando solo se mida un car´acter o dato de los elementos de la muestra, o bidimensionales, tridimensionales, y en general n–dimensionales, cuando se estudien simult´aneamente varios caracteres de cada elemento. Ejemplo I–4

La temperatura o la presi´ on atmosf´erica (por separado), son variables monodimensionales. La temperatura y la presi´ on atmosf´erica (estudiadas conjuntamente), o la longitud y el peso de una barra conductora, son ejemplos de variables bidimensionales. La velocidad, carga el´ectrica y masa de un i´ on es tridimensional.

Estad´ıstica B´ asica para Estudiantes de Ciencias

Febrero 2009

More Documents from "Manuel Martel Pérez"