Introduccion A La A

  • April 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Introduccion A La A as PDF for free.

More details

  • Words: 4,289
  • Pages: 19
1.1 ¿Qué significa “ESTADISTICA”?

La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas de negocios e instituciones gubernamentales. La Estadística se divide en dos ramas: a) Estadística Descriptiva b) Inferencia Estadística

a)

ESTADISTICA DESCRIPTIVA

Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información.

La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores. En resumen, la Estadística Descriptiva se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar.

b)

INFERENCIA ESTADÍSTICA

Es una parte de la estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). Es decir, se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo (población), partiendo de lo específico (muestra). Las cuales llevan implícitos una serie de riesgos. Para que éstas generalizaciones sean válidas, la muestra deben ser representativa de la población y la calidad de la información debe ser controlada. Además, puesto que las conclusiones así extraídas están sujetas a errores, se tendrá que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto. La estadística inferencial es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico procedimiento del manejo de datos de la muestra. La estadística inferencial comprende:

• • • • •

La Teoría de muestras. La estimación de parámetros. El Contraste de hipótesis. El Diseño experimental. La Inferencia bayesiana.

En conclusión, la Estadística Inferencial, se usan esencialmente para determinar la probabilidad de que una conclusión sacada a partir de los datos de una muestra sea cierta en la población muestreada.

SIMILITUDES Y DIFERENCIAS ENTRE ESTADÍSTICA DESCRIPTIVA E INFERENCIA ESTADÍSTICA. SIMILITUDES ESTADISTICA DESCRIPTIVA INFERENCIA ESTADISTICA Ambas son estudios estadísticos, pero analizan de diferente manera los datos obtenidos para el estudio de ciertas situaciones. En ambas, los datos analizados, se representan a través de gráficos. En ambas, parámetros como la media y desviación estándar son de vital importancia.

DIFERENCIAS ESTADISTICA DESCRIPTIVA INFERENCIA ESTADISTICA La estadística descriptiva trata de La inferencia estadística es una desde parte de la estadística que una metodología recolección, presentación, comprende los métodos y descripción, análisis e procedimientos para deducir interpretación de una colección de propiedades (hacer inferencias) datos, esencialmente consiste en de una población, a partir de una resumir éstos con uno o dos pequeña parte de la misma elementos de información (muestra).La bondad de estas se mide en (medidas descriptivas) que deducciones probabilísticos, es caracterizan la totalidad de los términos decir, toda inferencia se acompaña mismos. de su probabilidad de acierto, llevando implícito mas riesgos en la exactitud de sus resultados.

1.2 DEFINICIÓN DE TERMINOS USADOS EN LA ESTADÍSTICA. Dentro de la Estadística Descriptiva se utilizan diferentes términos, siendo importante su identificación y definición. 1. Unidad Experimental: Unidad a la cual se le asigna lo que se esta midiendo, por ejemplo: un área de terreno; cantidad de pacientes; una unidad de tiempo, etc.-, es decir, identifica de manera lógica lo solicitado a investigar, ya sea para entregar información o lograr una mejora en el proceso a perfeccionar. 2. Población: De una manera general, una población es un conjunto de individuos u objetos que poseen la característica que se desea estudiar. Estadísticamente, una población es el conjunto de mediciones de una cierta característica en todos los individuos u objetos que poseen dicha característica. Por ejemplo: Las edades de todos los estudiantes de una Universidad, Cantidad de hectáreas plantadas, Otro ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

3. Muestra: Es una parte de la población, y es el conjunto de mediciones que han sido realmente recolectados. La extracción de la muestra es un paso bien importante porque es a partir de ella que se sacan conclusiones acerca de la población. El tamaño de una muestra depende del esquema que se usa para su selección.



Si el diseño es sencillo la muestra tiene que ser relativamente grande, alrededor de un 10% del tamaño de la población.



Si el diseño es bien sofisticado el tamaño de la muestra puede ser bien pequeño y aún dar conclusiones confiables. Por ejemplo, en las encuestas políticas de un país donde hay millones de electores una muestra de tamaño entre 1,000 y 2,000 puede dar excelentes conclusiones.

Por ejemplo: si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. Algo importante que hay que mencionar es que no siempre se trabaja con todos los datos. Ésto por diversas razones, que pueden ser desde prácticas hasta por economía. Por ejemplo, resultaría muy costoso obtener los datos de todos los seres humanos, o impráctico (y a la vez destructivo) obtener como datos el tiempo en el que se funden las bombillas producidas por una cierta marca realizando la medición de toda la producción. El estudio conduciría a la empresa a la ruina, pues la producción entera desaparecería. Por esta razón se considera un subconjunto del total de los casos, sujetos u objetos que se estudian y que se les obtienen los datos, es decir, MUESTRAS, las que son subconjunto de la población, la cual tiene que contener datos que pueden servir para posteriores generalizaciones de las conclusiones. Un estudio más detallado de las características de las muestras para permitir tales generalizaciones se realizará más adelante.

4. Variables: Es la característica que se desea estudiar. Ejemplos: edad, peso, opinión, raza, tipo de sangre. Las variables pueden ser de dos tipos: •



Variables cualitativas o atributos: son aquellas que clasifican las unidades en categorías. Las categorías pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas también se llaman “variables categóricas”. Con estas variables podemos contar número de casos, comparar entre categorías, pero no podemos realizar operaciones numéricas, es decir, no se pueden medir numéricamente, por ejemplo: nacionalidad, color de la piel, sexo. Variables cuantitativas: tienen valores numéricos que representan medidas (largo, peso, etc.) o frecuencias (número de). Tiene sentido realizar operaciones numéricas con estas variables. Además distinguimos dentro de las variables cuantitativas las discretas y las continuas. Una variable discreta es aquella en la cuál se puede contar el número posible de valores. Una variable continua puede tomar cualquier valor en un intervalo dado. Estas variables tienen valor numérico (edad, precio de un producto, ingresos anuales).

A la vez, dichas variables se pueden clasificar en:

• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). •

Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).



Variables pluridimensionales o infinidecimales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

Dependiendo del tipo de variables tiene su escala de medición.

TIPOS DE VARIABLES

CUANTITATIVAS

CUALITATIVAS

NOMINALES

ORDINALES

DISCRETAS

CONTINUAS

5. Datos: son medidas o valores de las características susceptibles de observar y contar, se originan por la observación de una o más variables de un grupo de elementos o unidades. Los datos son colecciones de un número cualquiera de observaciones relacionadas entre si, para que sean útiles se deben organizar de manera que faciliten su análisis, se puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones lógicas y tomar decisiones bien fundamentadas; por esa razón es necesario conocer lo métodos de Organización y Representación, la finalidad de éstos métodos es permitir ver rápidamente todas las características posibles de los datos que se han recolectado. Dentro de sus representaciones, tenemos: a) Representación Tabular: Presenta las variables y las frecuencias con que los valores de éstas se encuentran presentes en el estudio. Por ejemplo: Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (m):

Alumno

Estatura

Alumno

Estatura

Alumno

Estatura

Alumno 1

1,25

Alumno 11

1,23

Alumno 21

1,21

Alumno 2

1,28

Alumno 12

1,26

Alumno 22

1,29

Alumno 3

1,27

Alumno 13

1,30

Alumno 23

1,26

Alumno 4

1,21

Alumno 14

1,21

Alumno 24

1,22

Alumno 5

1,22

Alumno 15

1,28

Alumno 25

1,28

Alumno 6

1,29

Alumno 16

1,30

Alumno 26

1,27

Alumno 7

1,30

Alumno 17

1,22

Alumno 27

1,26

Alumno 8

1,24

Alumno 18

1,25

Alumno 28

1,23

Alumno 9

1,27

Alumno 19

1,20

Alumno 29

1,22

Alumno 10

1,29

Alumno 20

1,28

Alumno 30

1,21

Donde el total de alumnos que entran en el análisis de estudio son 30. Si presentamos esta información estructurada obtendríamos la siguiente tabla de frecuencia: Variable

Frecuencias absolutas

(Valor) x

Simple x

Frecuencias relativas

Acumulada X

Simple x

Acumulada x

1,20

1

1

3,3%

3,3%

1,21

4

5

13,3%

16,6%

1,22

4

9

13,3%

30,0%

1,23

2

11

6,6%

36,6%

1,24

1

12

3,3%

40,0%

1,25

2

14

6,6%

46,6%

1,26

3

17

10,0%

56,6%

1,27

3

20

10,0%

66,6%

1,28

4

24

13,3%

80,0%

1,29

3

27

10,0%

90,0%

1,30

3

30

10,0%

100,0%

b) Representación Gráfica: Se llaman gráficas a las diferentes formas de expresar los datos utilizando los medios de representación que proporciona la geometría.

Gráfico de Barras

Gráfico Lineal

Gráfico Circular

6. Escalas de Medición: Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón. Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí.

a) Escala Nominal: es cuando la variable se mide utilizando nombres para establecer categorías. Para distinguir los agrupamientos se establecen símbolos, letras e incluso números, aunque estos últimos solo cumplen una función de carácter simbólico y no numérico. Los cálculos numéricos con estos números no tendrían sentido. Ejemplo: el estado de una persona para determinada enfermedad se puede clasificar como “sano” o “enfermo”, o bien, como “1” o “2”.

Importante mencionar, es que ninguna de las categorías definidas tiene mayor jerarquía que las otras, solo reflejan las diferencias en la variable.

b) Escala Ordinal: en este nivel también se definen varias categorías, pero además de mostrar un ordenamiento, existe una relación de “mayor o menor que” entre ellas. Las etiquetas, símbolos o números asignados, SI indican jerarquía, aunque no es posible conocer la magnitud de la diferencia entre cada una de las categorías.

Ejemplo:

PRESIDENTE (10)

VICEPRESIDENTE (9)

DIRECTOR GENERAL (8) GERENTE (7) JEFE (6)

EMPLEADO (5)

Analizando el ejemplo, el “presidente (10)” es más que el “Director General (8)”, y así sucesivamente, aunque no puede precisarse, en cada caso, cuanto más.

El orden jerárquico de los militares (Subteniente, Teniente, Capitán, Mayor, Teniente Coronel, Coronel, General) y la clasificación académica de los profesores universitarios ( Instructor, Asistente, Agregado, Asociado, Titular) son ejemplos de escala ordinal.

c) Escala De Intervalo: esta escala mide las variables de manera numérica. Los números de esta escala, permite establecer “distancia” entre dos individuos, y las operaciones aritméticas de suma y resta son perfectamente realizables y significativas, no así la multiplicación y división. En esta escala, el 0, es un valor que NO indica ausencia de la característica o variable medida, y es colocado arbitrariamente en algún lugar de la escala. Ejemplo: La temperatura es medida en grados Centígrados, kelvin o Fahrenheit, donde un valor 0, no significa que exista ausencia de temperatura.

d) Escala de Razón: es la escala mas fuerte, debido que utiliza un sistema numérico, donde el valor 0, SI indica la ausencia de la característica que se está midiendo. Las operaciones aritméticas de multiplicación y división adquieren significación. Ejemplo (1): si no existen ingresos de venta en una tienda de ropa, se interpreta de manera lógica que no se han producido ventas. Ejemplo (2): si un producto pesa 6 Kg, tiene el doble de peso de otro producto que pesa 3 Kg.

A continuación, se presenta un cuadro resumen de los tipos de escala de medición. ESCALAS NOMINAL: sólo permite asignar un

nombre al elemento medido. Esto la convierte en la menos informativa de las

EJEMPLOS • • •

Nacionalidad. Uso de anteojos. Número de camiseta en un equipo

escalas de medición. A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados para identificar a los individuos medidos. ORDINAL: además de las propiedades de la escala nominal, permite establecer un orden entre los elementos medidos.



• • • •

DE INTERVALO: además de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias entre las mediciones.

• • • •

DE LA RAZÓN: permite, además de lo de las otras escalas, comparar mediciones mediante un cuociente.

• • • •

de fútbol. Número de Cédula Nacional de Identidad.

Preferencia a productos de consumo. Etapa de desarrollo de un ser vivo. Clasificación de películas por una comisión especializada. Madurez de una fruta al momento de comprarla. Temperatura de una persona. Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta 5). Sobrepeso respecto de un patrón de comparación. Nivel de aceite en el motor de un automóvil medido con una vara graduada. Altura de personas. Cantidad de litros de agua consumido por una persona en un día. Velocidad de un auto en la carretera. Número de goles marcados por un jugador de básquetbol en un partido.

Pruebas Estadísticas Descriptivas mas frecuentes de acuerdo a la escala de medición de variable en estudio. Escala de la Variable

Método o Técnica Estadística

Categórica (Nominal y Ordinal)

Frecuencias, proporciones o porcentajes, representados por gráficos de barras, pastel o pictogramas. Distribución de frecuencias en clases. Frecuencias acumuladas Percentiles Medidas de tendencia central, dispersión, curtosis y oblicuidad.

Numérica (Intervalo y Razón)

1.3 Etapas de una investigación por muestreo (Recolección de Datos) El primer paso que se debe realizar es definir que es lo que se desea analizar o investigar, para luego comenzar con la recolección de datos, los cuales serán el pilar fundamental para el inicio de mi estudio o investigación. Los datos se pueden recopilar por los siguientes métodos: Haciendo entrevistas personales. Haciendo entrevistas por teléfono. Mediante cuestionarios y/o encuestas. Por observación directa. ™ A través de la Internet. ™ ™ ™ ™

1.4 Tipos de Muestreos Dentro de la Estadística Descriptiva, encontramos distintos tipos de muestreo, como se indican a continuación: a. Muestreo aleatorio simple Es la extracción de una muestra de una población finita, en el que el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra. Esta condición garantiza la representatividad de la muestra porque si en la población un determinado porcentaje de individuos presenta la característica A, la extracción aleatoria garantiza matemáticamente que por término medio se obtendrá el mismo porcentaje de datos muestrales con esa característica. El muestreo aleatorio simple puede ser de tres tipos: 1. Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.

2. Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea. 3. Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición. cada elemento extraído se descarta para la subsiguiente extracción. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. NOTA: Un número aleatorio es un resultado de una variable al azar especificada por una función de distribución. Cuando no se especifica ninguna distribución, se presupone que se utiliza la distribución uniforme continua en el intervalo [0,1). Un Generador de números aleatorios es un componente o funcionalidad que crea números o símbolos para un programa software en una forma que carezca de un patrón evidente, y que así parezcan ser números aleatorios. La mayor parte de los generadores de números aleatorios son, en realidad, pseudoaleatorios: se calcula (o introduce internamente) un valor X0, que llamaremos semilla, y, a partir de él, se van generando X1, X2, X3, ... Siempre que se parta de la misma semilla, se obtendrá la misma secuencia de valores. Por Ejemplo: A continuación se verá algunos usos del muestreo en diversos campos: - Política. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinión pública y el apoyo en las elecciones.

- Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan para determinar la eficiencia de una técnica o programa de enseñanza. - Industria. Muestras de los productos de una línea de ensamble sirve para controlar la calidad. - Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban la eficacia de una técnica o de un fármaco nuevo. - Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la producción los efectos de un fertilizante nuevo. - Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

b. Muestreo estratificado. Dividimos la población en grupos relativamente homogéneos, llamados estratos. Después, se utiliza uno de estos planteamientos: • •

Seleccionamos aleatoriamente de cada estrato un número específico de elementos correspondientes a la fracción de ese estrato en la población como un todo. Extraemos un número igual de elementos de cada estrato y damos peso a los resultados de acuerdo con la porción del estrato con respecto a la población total.

Con cualquiera de estos planteamientos, el muestreo estratificado garantiza que cada elemento de la población tenga posibilidad de ser seleccionado. Este método resulta apropiado cuando la población ya está dividida en grupos de diferentes tamaños y deseamos tomar en cuenta este hecho (por ejemplo: categorías profesionales de la población). La ventaja de las muestras estratificadas es que, cuando se diseñan adecuadamente, reflejan de manera más precisa las características de la población de la cual fueron elegidas. Por ejemplo: para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de

mujeres y un 45% de hombres, se tomaría una muestra que contenga también esa misma proporción. Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y si2, respectivamente. c. Muestreo sistemático. En el muestreo sistemático, los elementos son seleccionados de la población dentro de un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio. El muestreo sistemático difiere del aleatorio simple en que cada elemento tiene igual probabilidad de ser seleccionado, pero cada muestra no tiene una posibilidad igual de ser seleccionada (Por ejemplo: tomar cada elemento de 10 en 10: el Nª 1, 11, 21...) En este tipo de muestreo, existe el problema de introducir un error en el proceso de muestreo. Aún cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrón secuencial, este método puede requerir menos tiempo y algunas veces tiene como resultado un costo menor que el método aleatorio simple. Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno. Esto quiere decir que si tenemos un determinado número de personas que es la población y queremos escoger de esa población un número más pequeño el cual es la muestra, dividimos el número de la población por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden del intervalo.

d. Muestreo por estados múltiples Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel. Por ejemplo: si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción. e. Muestreo por conglomerados o racimos. Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio. Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral. Las ideas de estratificación y conglomerados son opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí. Recolección y organización de datos: Una vez identificada la población se procede a recoger los datos en muchos ocasiones la población es muy grande y no seria posible realizar

la investigación totalmente con el fin de obtener todos los datos asignados a cada uno. Dividimos la población en grupos, o racimos, y luego seleccionamos una muestra aleatoria de estos racimos. Suponemos que estos racimos individualmente son representativos de la población como un todo (Por ejemplo: las cuadras o barrios de un pueblo). Un procedimiento de racimo bien diseñado puede producir una muestra más precisa a un costo considerablemente menor que el de un muestreo aleatorio simple. Tanto en el muestreo estratificado como en el de racimo, la población se divide en grupos bien definidos. Usamos el muestreo estratificado cuando cada grupo tiene una pequeña variación dentro de sí mismo, pero hay una amplia variación dentro de los grupos. Usamos el muestreo de racimo en el caso opuesto, cuando hay una variación considerable dentro de cada grupo, pero los grupos son esencialmente similares entre sí.

Related Documents