Slides A A

  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Slides A A as PDF for free.

More details

  • Words: 4,260
  • Pages: 44
1

Objecto da Estatística

 Recolha de

dados;

 Organização

de dados;

 Classificação

de dados;

 Apresentação

de dados.

 Interpretação

de dados.

2   



Notas Históricas

Censo mais antigo, 2002 a.C., solicitado pelo imperador chinês Yao; Na Babilónia, Nabucodonosor, mandou registar em placas de argila todos os seus bens; No Egipto, devido as cheias provocadas pelo rio Nilo era necessário efectuar registos de propriedades e bens; Na Grécia antiga efectuavam-se inquéritos com o fim de lançar impostos;

3 

  

O império Romano foi o primeiro Estado a reunir dados organizados sobre a população e os bens do império; A Bíblia testemunha um recenseamento como causa da viagem de Maria e José a Belém; Em Portugal, no reinado de D. Afonso III (1260-1279) realizou-se um dos primeiros inquéritos estatísticos O ultimo levantamento estatístico (XIV Recenseamento Geral da População) o Censos 2001 esteve a cargo do Instituto Nacional de Estatística.

4  

Notas Históricas

Estatísticas ≠ Estatística

Estatísticas: factor ou dados numéricos Estatística:  Um objecto de estudo;  Uma ciência;  Conjunto de princípios e métodos de recolha, classificação, síntese e apresentação de dados numéricos.

5

Relevância da sua utilização

 Descrever

e compreender as relações

entre as variáveis;  Decisões optimizadas e  Facilita

mais rápidas;

a tomada de decisões face à

mudança;

6 Estatística Descritiva / Indutiva População

Produção de dados

Características Populacionais Estatística Indutiva

Características amostrais

Amostra Estatística Descritiva

Estudo amostra

7 Estatística Descritiva / Indutiva 

Estatística Descritiva: Estudo descritivo dos



Estatística

dados de uma amostra ( ou de uma população) em que se resume a informação contida no conjunto de dados, evidenciando as suas características principais.

Indutiva:

Conhecidas certas propriedades (a partir de uma analise descritiva da amostra), expressas por meio de proposições, imaginam-se proposições mais gerais que exprimam a existência de leis na população.

8 Etapas do Método Estatístico Identificação do Problema

Recolha de dados Critica dos dados

Análise e Interpretação

Apresentação dos dados

9 Identificação do Problema

Identificação do problema Identificação do problema ou situação Objectivo da análise a efectuar;  Definição da população correspondente e da amostra (caso necessário); 

Recolha de dados Critica dos dados Apresentação dos dados



Análise e Interpretação

10

Esta etapa é a mais uma identificação problema, invalidade subsequentes.

importante, pois incorrecta do todas as etapas

População ou Universo

Definição: Conjunto de elementos (seres, objectos, acontecimentos, etc.) com uma ou mais características em comum, acerca da qual pretendemos efectuar um estudo. População

Finita Infinita

Exemplos: Temperaturas dos recém nascidos registadas durante o dia de hoje na UCERN Conjunto de pressões atmosféricas que se verificam num determinado instante à superfície terrestre.

Amostra

11

Definição: Subconjunto finito da população, em que as características a estudar são, com a maior aproximação possível, iguais às da população de origem. Existem vantagens na utilização de uma amostra? E desvantagens?

12 

População com dimensão infinita; 



Exemplo: população constituída pelas pressões atmosféricas

Custo excessivo do processo de recolha e tratamento de dados; 



Vantagens da amostra

Exemplo: Características geológicas do subsolo no fundo do mar.

Tempo excessivo; 

Exemplo: preferência televisiva dos portugueses

13 

Inacessibilidade a alguns elementos da população; 



Exemplo: por razões de ordem legal não é possível caracterizar o saldo médio da conta à ordem de todos os médicos portugueses.

Recolha de informação através de métodos destrutivos; 

Exemplo: Verificação das características mecânicas de um lote de perfis de aço, recorrendo a testes destrutivos

14 



Vantagens da amostra (cont.)

Recenseamento/Sondagem

Recenseamento ou censo – estudo estatístico realizado sobre toda a população. Tem-se o propósito de adquirir dados sobre todos os elementos da população e fazer juízos quantitativos acerca das suas características. Sondagem – estudo estatístico realizado a partir de uma amostra.

Recolha de dados

15 Identificação do Problema Recolha de dados



Critica dos dados Apresentação dos dados Análise e Interpretação



Dados recolhidos de forma: Directa – quando os dados são obtidos de forma originária Dados Primários Indirecta – quando os dados provêm de uma recolha directa Dados Secundários

16 Dados primários/secundários 

Dados Primários Disponíveis em registos ou ficheiros;  Resultantes de inquéritos feitos directamente à população;  Disponíveis em estatísticas publicadas pelo INE. 



Dados Secundários 

Calculados a partir dos dados primários

17 

Fontes dos dados

Internas Exemplo: serviços de contabilidade, produção, marketing, etc. de uma organização



Externas Exemplo: informação proveniente de organismos públicos, tais como o Governo, o INE ou revistas da especialidade

18 

Periodicidade

Continua - quando realizada permanentemente Exemplo: custos de produção



Periódica - quando realizadas segundo um dado intervalo de tempo Exemplo: Censos



Ocasional - quando realizadas esporadicamente Exemplo: realização de um trabalho académico

19 

Processos de recolha

Experimentais – exerce-se um controlo directo sobre os factores que potencialmente afectam a característica ou o conjunto de características em análise. Exemplo: efeito de um poluente sobre a água do rio considerando a fábrica a laborar e parada.



Observacionais – os factores que afectam potencialmente as características em analise não são controlados Exemplo: estudo do tráfego num túnel durante uma semana com medições diárias.

20 Identificação do Problema Recolha de dados

Crítica dos dados Recolha de dados Revisão crítica

Critica dos dados Apresentação dos dados Análise e Interpretação

Suprimir valores estranhos ou eliminar erros capazes de conduzir a conclusões enviesadas.

Apresentação dos dados

21 Identificação do Problema



Principal objectivo da Estatística Descritiva (classificar e apresentar)

Recolha de dados Critica dos dados



Classificação Agrupar em classes

Apresentação dos dados Análise e Interpretação



Análise e Interpretação

22 Identificação do Problema

Apresentação Tabelas, gráficos



Apresentação de dados ajustada

Recolha de dados

Interpretação facilitada

Critica dos dados Apresentação dos dados Análise e Interpretação



Conclusões enviesadas: Propositadas  Não propositadas 

23

Apresentação dos dados

Quadros;  Gráficos;  Distribuição de frequências. 



Quadros Cabeçalho – informação sobre os dados, em que consistem e a que se referem (local, época, etc.)  Corpo – representado por colunas e sub colunas dentro das quais se apresentam os dados  Rodapé – deve incluir a fonte dos dados e outra informação pertinente. 

24 Apresentação de dados - Gráficos 



Objectivo da representação gráfica: transmitir uma ideia imediata e clara sobre os resultados obtidos Gráficos: Linhas;  Barras;  Sectores;  Pictogramas. 

Gráfico de Linhas

25  

Mais utilizado; Fácil interpretação e execução 100 90 80 70 60 50 40 30 20 10 0

Mulheres Homens

1° Trim. 2° Trim. 3° Trim. 4° Trim.

Gráfico de Linhas

26

Temperatura Operativa Instantânea To 26,1 26,0 26,0 25,9 25,9 25,8 25,8 25,7 25,7 0

20

40

60

80

100

120

140

Tempo [s] Média

Estudo realizado na unidade de diálise do Hospital Amato Lusitano 

Gráfico de Barras

27  

Mais utilizado; Fácil interpretação e execução 100 90 80 70 60 50 40 30 20 10 0

Mulheres Homens

1° Trim. 2° Trim. 3° Trim. 4° Trim.

Gráfico Circular

28 

Representação gráfica dos resultados num circulo, por meio de sectores Facha etária dos funcionários

29%

14% 30_35 anos 35_40 anos 40_45 anos 57%



Estudo realizado na unidade de diálise do Hospital Amato Lusitano

29 

Gráfico Polar

Representa os dados estatísticos por meio de um polígono. Utilizado sobretudo para séries temporais Janeiro

1200 1000 800

Julho

Fevereiro

600 400 200

Homens Mulheres

0

Março

Junho

Maio

30 





Abril

Pictogramas

Utilizam figuras sugestivas, relacionadas com o problema em estudo; As dimensões da imagem devem ser proporcionais ás frequências observadas (ver gráfico nº 10 das folhas anexas); Em alternativa cada imagem corresponde á unidade que se repete tantas vezes quantas as ocorrências.

Exercício nº1

31

Com base no seguinte estudo, construa um gráfico de barras e dois diagramas circulares (um para os médicos e outro para os enfermeiros) e faça um pequeno comentário relacionandorelacionando-os.

Regiões

Médicos

Enfermeiros

Norte

9622

11618

Centro

5251

7086

Lisboa e V.T

13953

14087

Alentejo

732

1578

Algarve

777

1069

Açores

370

981

Madeira

418

1328

32 Resposta exercício nº1

Madeira

Açores

Algarve

Alentejo

lisboa e V.T

médicos enfermeiros

Centro

16000 14000 12000 10000 8000 6000 4000 2000 0

Norte



Resposta ex. nº1- Médicos

33

2%

2% 1%

1% 31%

46%

norte centro lisboa e V.T alentejo algarve açores madeira

17%

Resposta ex. nº1- Enfermeiros

34

3% 3% 4% 4%

31%

36% 19%

norte centro lisboa e V.T alentejo algarve açores madeira

35 Resposta exercício nº1 Norte

15000 10000

Madeira

Centro

médicos enfermeiros

5000 0 Açores

lisboa e V.T

Algarve

36 



Alentejo

Definições

Atributo ou caracter – Característica comum a todos os elementos que constituem o nosso conjunto Modalidade – diferentes situações apresentadas pelo atributo



Exemplos:  

 

Atributo: estado civil Modalidades: casado, solteiro, divorciado, viúvo Atributo: Peso Modalidades: 50 kg , 60 kg ,70 kg ,…

37 

Apresentação de dados Distribuição de frequências

Variável estatística - atributo ou característica que se pretende estudar 

Variáveis qualitativa – exprimem uma qualidade, não podem ser mensuráveis Exemplo: estado civil, cor dos olhos, sexo, etc.



Variáveis quantitativas–características mensuráveis Discretas – assumem um número finito ou infinito numerável de valores (ex.: idade, nº de irmãos, etc.) Continuas – assumem um número infinito não numerável de valores (ex.: tempo gasto para chegar ao local de trabalho)

38 

Dados Qualitativos  



Classificação dos dados segundo a escala em que são expressos

Nominal: dados classificados por categorias não ordenadas Ordinal: dados classificados por categorias ordenadas

Dados Quantitativos (escalas métricas) 



Intervalos – dados expressos numa escala de origem numérica Absoluta – dados expressos numa escala numérica de origem fixa ( o zero tem existência real)

39 Nomenclatura utilizada      

N – população n – amostra fi – Frequência Absoluta fri – Frequência Absoluta relativa Fi – Frequência Acumulada Fri – Frequência Acumulada relativa

40       



Número de classes

O número de classes devera estar compreendido entre 4 e 14; Nenhuma classe deverá ter frequência nula; As classes deverão ter sempre que possível amplitudes iguais; Os pontos médios da classe deverão ser sempre que possível números de cálculo fácil; Classes abertas deverão ser evitadas; Os limites das classes são definidos de modo que cada valor da variável é incluído num e num só intervalo. Seja k o número de classes: n<5 então K=5 n≥5 então √n=K Seja ai a amplitude da classe: R Lmax − Lmin ai =

K

=

K

Representação gráfica de variáveis continuas

41

 Histogramas fi

xi Classes

xi Classes

Também conhecido frequências; 

Frequências acumuladas

x

i Classes

Diagrama Caule e Folhas

42 

Fi

Fri(%)Frequências relativas

Frequências absolutas

como

separador

de

Exemplo: Considere a listagem das idades dos 30 compradores de um automóvel Peugeot, Peugeot, modelo 307 CC

35

28

31

25

32

43

20 21 23 24 24 25 25 27 27 27 28 28 29

38

20

35

33

41

41

31 32 32 33 34 35 35 36 38 38

24

42

27

34

36

38

27

54

28

23

24

29

50

32

21

43

27

25

41

41 42 43 43

50 54

43 Diagrama Caule e Folhas (cont.) Tronco

Folhas

2

0

1

3

4

4

5

5

7

7

7

3

1

2

2

3

4

5

5

6

8

8

4

1

1

2

3

3

5

0

4



8

8

9

Vantagens - esta tabela permite: 

  

44

Melhor percepção do aspecto global dos dados sem perda de informação, como acontece nas classes; Imaginar facilmente o gráfico da distribuição; Ver até que ponto a distribuição é simétrica; Ver se existem concentrações ou lacunas de dados.

Polígono de Frequências

Linha poligonal que une o ponto médio do topo superior de cada rectângulo. 

18

Nº alunos

16 14 12

[200;250[ [250;300[ [300;350[ [350;400[

10 8 6 4 2 0

Peso em gramas

Função Cumulativa

45

Linha poligonal que une os vértices superiores direitos dos rectângulos que formam o histograma de frequências acumuladas 

40 35

Nº alunos

30 [200;250[ [250;300[ [300;350[ [350;400[

25 20 15 10 5 0 Peso em gramas

46 

Medidas de Localização

Medidas de tendência central Moda e classe modal;  Média;  Mediana. 



Medidas de tendência não central 

Quantis  Quartis;  Decis;  Percentis.

47 

Moda e Classe modal

Definição de moda (Mo) – valor que ocorre

mais vezes numa distribuição, i.e., que tem maior frequência. 

Classificação dos conjuntos:  



Bimodal – se ocorrem duas modas Multimodal ou Plurimodal – se existirem mais do que duas modas Amodal – se não existir moda

48 

Moda (variáveis continuas)

Graficamente:

18 16 14 12

[200;250[ [250;300[ [300;350[ [350;400[

10 8 6 4 2



Analiticamente

Mo = l i +

f i +1 × amp f i +1 + f i −1

0

Mo

Peso em gramas

Onde: li – limite inferior da classe modal fi+1 – frequência da classe seguinte à classe modal fi-1 – frequência da classe anterior à classe modal amp – amplitude da classe modal

49 

Média ( x)

Dados não classificados (não agrupados em tabelas de frequências) k

∑x

i

x= 

i =1

N

Dados classificados (agrupados em tabelas de frequências) k

∑x f

i i

x=

50

N

Exemplo

Com base no estudo que já referimos, calcule o número médio de enfermeiros e médicos existentes nas várias regiões. Resposta: Médicos: x = 4446,14 Enfermeiros: x = 5392,43 

i =1

Regiões

Médicos

Enfermeiros

Norte

9622

11618

Centro

5251

7086

Lisboa e V.T

13953

14087

Alentejo

732

1578

Algarve

777

1069

Açores

370

981

Madeira

418

1328

51 

Média (variáveis continuas)

Nota: no caso de dados agrupados por classes, a variável xi , será a marca ou centro da classe de ordem i.

Tempo (xi)

Centro classe

fi

[0;15[

7,5

9

[15;30[

22,5

35

[30;45[

37,5

20

[45;60[

52,5

20

[60;75[

67,5

7

[75;90[

82,5

4

[90;105[

97,5

5

[105;120[

112,5

1

[120;135[

127,5

1

[135;150[

142,5

2

Total

52 

104

Mediana (Me)

Definição - valor que ocupa o lugar central da distribuição, quando os dados estão ordenados por ordem crescente ou decrescente.



Considerações:  

É uma medida de posição, não faz intervir todos os valores É um parâmetro forte, não influenciado por alterações dos extremos

53 

Mediana (dados não agrupados por classes)

n é impar

K= (n+1)/2 

Me=xk

n é par

K= n/2 

Me=(xk+x k+1)/2

Exemplos: Calcule a mediana dos seguintes conjuntos  

10, 10, 12, 7, 7, 8, 5, 4 10, 10, 12, 7, 8, 5, 4

54 Classe Mediana (dados agrupados por classes)

1.

2.

3.

Calcula-se a ordem k, correspondente à classe mediana, levando em consideração o caso do n ser par ou impar; Localiza-se a ordem k na coluna das frequências acumuladas (Fi) Ao intervalo correspondente chamamos classe mediana.

55 



Mediana (dados agrupados por classes)

Graficamente:

Analiticamente

n − Fi (i − 1) 2 × amp Me = li + f (i )

56 





100 90 80 70 60 50 40 30 20 10 0

[200;250[ [250;300[ [300;350[ [350;400[

Me

Peso em gramas Onde: li – limite inferior da classe mediana Fi-1 – frequência acumulada da classe anterior à classe mediana fi – frequência absoluta da classe mediana amp – amplitude da classe mediana

Quantis

Quartis – são os valores da variável que dividem a distribuição de frequências em quatro partes iguais. Representa-se por Qi Decis - são os valores da variável que dividem a distribuição de frequências em dez partes iguais. Representa-se por Di Percentis - são os valores da variável que dividem a distribuição de frequências em cem partes iguais. Representa-se por Pi

Quartis

57

Q2 – 2º quartil, coincide com a mediana 

n é impar 

Posição do Q1

p1 = 



Posição do Q1

p1 = 

3(n + 1) 4

58 

n é par

n +1 4

Posição do Q3 p3 =



n+2 4

Posição do Q3 p3 =

3(n + 2) 4

Quartis

Graficamente: 100 90 80 70 60 50 40 30 20 10 0

[200;250[ [250;300[ [300;350[ [350;400[

Q1 Me=Q2 Q3

Peso em gramas

Quartis

59 

Analiticamente

Qi = li +

EQi − Fi (i − 1) × amp f (i )

Onde: li – limite inferior da classe escolhida Fi-1 – frequência acumulada da classe anterior à classe escolhida fi – frequência absoluta da classe escolhida i×n amp – amplitude da classe escolhida EQi = 4

Decis/Percentis

60 

Decis Di = li +



EDi − Fi (i − 1) × amp f (i )

EDi =

i×n 10

EPi =

i×n 100

Percentis Pi = li +

EPi − Fi (i − 1) × amp f (i )

Exemplo

61 Tempo (xi)

Centro classe

fi

Fi

[0;15[

7,5

9

9

[15;30[

22,5

35

44

[30;45[

37,5

20

64

[45;60[

52,5

20

84

[60;75[

67,5

7

91

[75;90[

82,5

4

95

[90;105[

97,5

5

100

[105;120[

i×n EQ = 112,5

1

101

[120;135[

127,5

1

102

[135;150[

142,5

2

104

i

4

Total

62 

 

EQ1 =

 



26 − 9 ×15 = 22,28 35

Significa que 25% dos tempos de dialise são inferiores a 22,28 meses

104

Medidas de Dispersão

Amplitude total; Intervalo inter-quartis Desvio quartilico Desvio médio Variância; Desvio Padrão

Medidas de dispersão relativas 

1× 104 = 26 4

Q1 = 15 +

Medidas comparativas 



1º Quartil

Medidas de distância 





Coeficiente de variação

63  

 

Amplitude total

Medida de dispersão mais fácil de calcular; Consiste na diferença entre o valor máximo e o valor mínimo da variável; R = Xmax-X min Exemplo: Considere a variável que assume os seguintes valores: X={3, 5, 9, 15, 16, 12, 8, 4} Calcule a amplitude total. R=16-3=13

64 



Amplitude total

Desvantagem: tem apenas em conta os dois valores extremos que a variável assume, logo não é sensível aos valores intermédios. Exemplo: Considere a tabela ao lado. Calcule a amplitude total. R=120-30=90

Tempo (xi)

fi

[30;45[

20

[45;60[

20

[60;75[

7

[75;90[

4

[90;105[

5

[105;120[

1

65 



Intervalo inter-quartis

Consiste na diferença entre o 3º Quartil e o 1ºQuartil; Corresponde a um intervalo que engloba 50 % das observações.

IQ=Q3-Q1



Desvantagem: esta medida não é influenciada por metade dos valores observados, que neste caso são os valores extremos.

66   

Desvio Quartilíco

Medida de dispersão semelhante à anterior; Consiste na semi-diferença entre o 3ºQuartil e o 1ºQuartil; Corresponde a um intervalo que engloba 50 % das observações.

DQ=(Q3-Q1)/2



Desvantagem: esta medida não é influenciada por metade dos valores observados, que neste caso são os valores extremos.

Exemplo de Aplicação

67

Num determinado local foi efectuado um estudo para caracterizar as idades dos residentes a)Calcule o desvio quartilíco b)Calcule o intervalo interinter-quartis 1× 50 EQ1 = = 12,5 4

Q1 = 10 +

68 



fi

Fi

[5;10[

5

5

[10;15[

10

15

[15;20[

20

35

[20;25[

10

45

[25;30[

5

50

Total

50

3×50 EQ3 = = 37,5 4

12,5 − 5 × 5 = 13,75 10

Q3 = 20 +

Idades (xi)

37,5 − 35 × 5 = 21,25 10

DQ =

Q3 − Q1 21,25 − 13,75 = = 3,75 2 2

IQ = Q3 − Q1 = 21,25 − 13,75 = 7,5

Desvio Médio Desvio Absoluto Médio

Soma dos valores absolutos da diferença entre os valores observados e a sua média, divididos pelo número total de observações; k Média aritmética dos valores absolutos dos desvios da distribuição em relação a uma medida de tendência central (média ou mediana)

∑ X −x DM =

i =1

N

k

∑ X −x × f DM =

i =1

N

i

69 

Variância (dados não classificados)

Definição: média aritmética dos quadrados dos n desvios. 2

∑ (x − x ) i

2

σ =

i =1

n

Nota importante: quando se trata de uma amostra de pequena dimensão é mais correcto n utilizar a variância corrigida. 2 

∑ (x − x ) i

2

σ =

70

i =1

n −1

Variância (dados não classificados)

Exemplo: Calcule a variância para o seguinte conjunto de dados: 

M={18; 23; 43,5; 19,2; 20,5}

Calculo da média: x=

18 + 23 + 43,5 + 19,2 + 20,5 5

Calculo da variância: 2 2 2 2 2 ( 18 − 24,84 ) + (23 − 24,84 ) + (43,5 − 24,84) + (19,2 − 24,84) + (20,5 − 24,84) σ = 2

5

71 Variância (dados classificados) 

Formula a utilizar:

n

∑ f ×(x − x )

2

i

σ2 = Exemplo:

Calcule a variância

72    



i

i =1

n

Xi

fi

xi fi

5

2

10

7

1

7

8

5

40

9

2

18

10

4

40

12

3

36

15

3

45

total

20

196

(xi − x )

(xi − x )2

f i × ( xi − x )

2

Desvio Padrão (σ)

Raiz quadrada da variância; Medida que só pode assumir valores não negativos; Medida de dispersão mais utilizada; Quanto maior for o desvio padrão maior é a dispersão dos dados; Se σ=0, então não existe variabilidade.

n

σ=

2 ( ) x − x ∑ i i =1

n

n

∑ f × (x − x )

2

i

σ=

i

i =1

n

73 







Coeficiente de variação (CV)

Até agora estudamos medidas de dispersão absoluta; O coeficiente de variação é uma medida de dispersão relativa; Mede o grau de concentração em torno das distribuições de frequências É a relação percentual entre o desvio padrão e a média.

CV =

74 

σ

x

×100

Coeficiente de variação (CV)

Exemplo: Numa empresa o salário médio dos

homens é 400 € e o desvio padrão é 150 €. Na mesma empresa, para as mulheres o salário médio é 300 € e o desvio padrão é de 120 €. Calcule o coeficiente de variação.  O salário auferido pelas Homens: CV = 150 ×100 = 37,5% mulheres apresenta uma 400 maior dispersão relativa 120 Mulheres: CV = 300 ×100 = 40% do que o salário dos homens

75 

Coeficiente de variação (CV)

Considerações: CV > 50% ⇒ alto grau de dispersão relativa ⇒ pequena representatividade da média como medida estatística CV < 50% ⇒ baixo grau de dispersão relativa ⇒ a média é tão mais representativa quanto menor for o valor de CV

76

Medidas de Assimetria

 1º

Método: comparação das 3 medidas de tendência central:  Distribuição

simétrica

x = Mo = Me  Distribuição

assimétrica positiva

x ≥ Me ≥ Mo  Distribuição

assimétrica negativa

x ≤ Me ≤ Mo

77 

Medidas de Assimetria

Considerações sobre o 1º Método: É vantajoso porque não exige o conhecimento dos valores iniciais da distribuição de frequências em estudo  A assimetria resulta em geral de valores extremamente grandes ou extremamente pequenos;  Quanto mais pronunciada for a assimetria da distribuição maior será a distancia entre a oda e a mediana. 

78 

Medidas de Assimetria

2º Método: grau de assimetria

G=

3 × ( x − Me )

σ G=0



Distribuição simétrica, se



Distribuição assimétrica positiva, se G>0



Distribuição assimétrica negativa, se G<0

Medidas de Assimetria

79 

3º Método: coeficiente de Pearson

G1  

( x − Mo ) = σ

Q3 + Q1 − 2 × Me G2 = Q3 − Q1

Método mais preciso; O 2º coeficiente de Pearson é utilizado quando não se conhece a média nem o desvio padrão.

80

Medidas de Assimetria

Exemplo:

Estude o grau de assimetria da seguinte distribuição de frequências utilizando o coeficiente de assimetria e o coeficiente de Pearson. Resolução  Média=75  Classe

mediana = [70;80]  Mediana=75  Classe modal = [70;80]  Moda=75  Desvio padrão = √160  G=0

Idades (xi)

fi

[50;60[

15

[60;70[

20

[70;80[

30

[80;90[

20

[90;100[

15

Total

100

81 Distribuições bidimensionais 

Objectivo: estudar a relação entre duas ou mais variáveis  



Idade de uma mulher / tensão arterial Taxa de desemprego / Produto Nacional Bruto de um país

Diagrama de dispersão 



Representação das variáveis x e y num referencial cartesiano; Permite visualizar a existência de uma relação entre as variáveis, e identificar qual a condição mais apropriada para descrever esta relação;

82

Correlação

Correlação Negativa

Correlação Positiva

Não há Correlação

Correlação Não linear

83 Coeficiente de Correlação (r) 

   

Também designado por coeficiente correlação de Pearson; Varia entre [-1;1] r=-1, correlação perfeita e negativa r=1, correlação perfeita e positiva r=0, não há relação linear

de

84 Coeficiente de Correlação (r)

r = -1

r = 0,91

r=0

r=0

Centro de Gravidade

85

 Definição:

Ponto de coordenadas (x, y ) correspondentes ás médias aritméticas das variáveis x e y. 

Exemplo: Determine o centro de gravidade da seguinte distribuição: {resposta: (13,1;10,5)} Nº anos trabalho

14

9,5

Nº dias de doença

11,5

10

86 



Algumas

15,5 12,5 18,5 12

10

15

5

15

20

8

0

11

15

10

Distribuição Normal distribuições

podem ser descritas como simétricas em torno da média e com a forma de sino. Uma boa aproximação para muitas dessas distribuições é dada pela distribuição normal

Distribuição do peso de 462 recém nascidos.

87

Distribuição Normal

x = Mo = Me Histograma da variável BIRTHW (peso do recém nascido) com a curva normal

Related Documents

Slides A A
November 2019 6
Writing A Paper Slides
December 2019 5
Giving A Talk Slides
November 2019 17
A A A A A A A
October 2019 96