1
Objecto da Estatística
Recolha de
dados;
Organização
de dados;
Classificação
de dados;
Apresentação
de dados.
Interpretação
de dados.
2
Notas Históricas
Censo mais antigo, 2002 a.C., solicitado pelo imperador chinês Yao; Na Babilónia, Nabucodonosor, mandou registar em placas de argila todos os seus bens; No Egipto, devido as cheias provocadas pelo rio Nilo era necessário efectuar registos de propriedades e bens; Na Grécia antiga efectuavam-se inquéritos com o fim de lançar impostos;
3
O império Romano foi o primeiro Estado a reunir dados organizados sobre a população e os bens do império; A Bíblia testemunha um recenseamento como causa da viagem de Maria e José a Belém; Em Portugal, no reinado de D. Afonso III (1260-1279) realizou-se um dos primeiros inquéritos estatísticos O ultimo levantamento estatístico (XIV Recenseamento Geral da População) o Censos 2001 esteve a cargo do Instituto Nacional de Estatística.
4
Notas Históricas
Estatísticas ≠ Estatística
Estatísticas: factor ou dados numéricos Estatística: Um objecto de estudo; Uma ciência; Conjunto de princípios e métodos de recolha, classificação, síntese e apresentação de dados numéricos.
5
Relevância da sua utilização
Descrever
e compreender as relações
entre as variáveis; Decisões optimizadas e Facilita
mais rápidas;
a tomada de decisões face à
mudança;
6 Estatística Descritiva / Indutiva População
Produção de dados
Características Populacionais Estatística Indutiva
Características amostrais
Amostra Estatística Descritiva
Estudo amostra
7 Estatística Descritiva / Indutiva
Estatística Descritiva: Estudo descritivo dos
Estatística
dados de uma amostra ( ou de uma população) em que se resume a informação contida no conjunto de dados, evidenciando as suas características principais.
Indutiva:
Conhecidas certas propriedades (a partir de uma analise descritiva da amostra), expressas por meio de proposições, imaginam-se proposições mais gerais que exprimam a existência de leis na população.
8 Etapas do Método Estatístico Identificação do Problema
Recolha de dados Critica dos dados
Análise e Interpretação
Apresentação dos dados
9 Identificação do Problema
Identificação do problema Identificação do problema ou situação Objectivo da análise a efectuar; Definição da população correspondente e da amostra (caso necessário);
Recolha de dados Critica dos dados Apresentação dos dados
Análise e Interpretação
10
Esta etapa é a mais uma identificação problema, invalidade subsequentes.
importante, pois incorrecta do todas as etapas
População ou Universo
Definição: Conjunto de elementos (seres, objectos, acontecimentos, etc.) com uma ou mais características em comum, acerca da qual pretendemos efectuar um estudo. População
Finita Infinita
Exemplos: Temperaturas dos recém nascidos registadas durante o dia de hoje na UCERN Conjunto de pressões atmosféricas que se verificam num determinado instante à superfície terrestre.
Amostra
11
Definição: Subconjunto finito da população, em que as características a estudar são, com a maior aproximação possível, iguais às da população de origem. Existem vantagens na utilização de uma amostra? E desvantagens?
12
População com dimensão infinita;
Exemplo: população constituída pelas pressões atmosféricas
Custo excessivo do processo de recolha e tratamento de dados;
Vantagens da amostra
Exemplo: Características geológicas do subsolo no fundo do mar.
Tempo excessivo;
Exemplo: preferência televisiva dos portugueses
13
Inacessibilidade a alguns elementos da população;
Exemplo: por razões de ordem legal não é possível caracterizar o saldo médio da conta à ordem de todos os médicos portugueses.
Recolha de informação através de métodos destrutivos;
Exemplo: Verificação das características mecânicas de um lote de perfis de aço, recorrendo a testes destrutivos
14
Vantagens da amostra (cont.)
Recenseamento/Sondagem
Recenseamento ou censo – estudo estatístico realizado sobre toda a população. Tem-se o propósito de adquirir dados sobre todos os elementos da população e fazer juízos quantitativos acerca das suas características. Sondagem – estudo estatístico realizado a partir de uma amostra.
Recolha de dados
15 Identificação do Problema Recolha de dados
Critica dos dados Apresentação dos dados Análise e Interpretação
Dados recolhidos de forma: Directa – quando os dados são obtidos de forma originária Dados Primários Indirecta – quando os dados provêm de uma recolha directa Dados Secundários
16 Dados primários/secundários
Dados Primários Disponíveis em registos ou ficheiros; Resultantes de inquéritos feitos directamente à população; Disponíveis em estatísticas publicadas pelo INE.
Dados Secundários
Calculados a partir dos dados primários
17
Fontes dos dados
Internas Exemplo: serviços de contabilidade, produção, marketing, etc. de uma organização
Externas Exemplo: informação proveniente de organismos públicos, tais como o Governo, o INE ou revistas da especialidade
18
Periodicidade
Continua - quando realizada permanentemente Exemplo: custos de produção
Periódica - quando realizadas segundo um dado intervalo de tempo Exemplo: Censos
Ocasional - quando realizadas esporadicamente Exemplo: realização de um trabalho académico
19
Processos de recolha
Experimentais – exerce-se um controlo directo sobre os factores que potencialmente afectam a característica ou o conjunto de características em análise. Exemplo: efeito de um poluente sobre a água do rio considerando a fábrica a laborar e parada.
Observacionais – os factores que afectam potencialmente as características em analise não são controlados Exemplo: estudo do tráfego num túnel durante uma semana com medições diárias.
20 Identificação do Problema Recolha de dados
Crítica dos dados Recolha de dados Revisão crítica
Critica dos dados Apresentação dos dados Análise e Interpretação
Suprimir valores estranhos ou eliminar erros capazes de conduzir a conclusões enviesadas.
Apresentação dos dados
21 Identificação do Problema
Principal objectivo da Estatística Descritiva (classificar e apresentar)
Recolha de dados Critica dos dados
Classificação Agrupar em classes
Apresentação dos dados Análise e Interpretação
Análise e Interpretação
22 Identificação do Problema
Apresentação Tabelas, gráficos
Apresentação de dados ajustada
Recolha de dados
Interpretação facilitada
Critica dos dados Apresentação dos dados Análise e Interpretação
Conclusões enviesadas: Propositadas Não propositadas
23
Apresentação dos dados
Quadros; Gráficos; Distribuição de frequências.
Quadros Cabeçalho – informação sobre os dados, em que consistem e a que se referem (local, época, etc.) Corpo – representado por colunas e sub colunas dentro das quais se apresentam os dados Rodapé – deve incluir a fonte dos dados e outra informação pertinente.
24 Apresentação de dados - Gráficos
Objectivo da representação gráfica: transmitir uma ideia imediata e clara sobre os resultados obtidos Gráficos: Linhas; Barras; Sectores; Pictogramas.
Gráfico de Linhas
25
Mais utilizado; Fácil interpretação e execução 100 90 80 70 60 50 40 30 20 10 0
Mulheres Homens
1° Trim. 2° Trim. 3° Trim. 4° Trim.
Gráfico de Linhas
26
Temperatura Operativa Instantânea To 26,1 26,0 26,0 25,9 25,9 25,8 25,8 25,7 25,7 0
20
40
60
80
100
120
140
Tempo [s] Média
Estudo realizado na unidade de diálise do Hospital Amato Lusitano
Gráfico de Barras
27
Mais utilizado; Fácil interpretação e execução 100 90 80 70 60 50 40 30 20 10 0
Mulheres Homens
1° Trim. 2° Trim. 3° Trim. 4° Trim.
Gráfico Circular
28
Representação gráfica dos resultados num circulo, por meio de sectores Facha etária dos funcionários
29%
14% 30_35 anos 35_40 anos 40_45 anos 57%
Estudo realizado na unidade de diálise do Hospital Amato Lusitano
29
Gráfico Polar
Representa os dados estatísticos por meio de um polígono. Utilizado sobretudo para séries temporais Janeiro
1200 1000 800
Julho
Fevereiro
600 400 200
Homens Mulheres
0
Março
Junho
Maio
30
Abril
Pictogramas
Utilizam figuras sugestivas, relacionadas com o problema em estudo; As dimensões da imagem devem ser proporcionais ás frequências observadas (ver gráfico nº 10 das folhas anexas); Em alternativa cada imagem corresponde á unidade que se repete tantas vezes quantas as ocorrências.
Exercício nº1
31
Com base no seguinte estudo, construa um gráfico de barras e dois diagramas circulares (um para os médicos e outro para os enfermeiros) e faça um pequeno comentário relacionandorelacionando-os.
Regiões
Médicos
Enfermeiros
Norte
9622
11618
Centro
5251
7086
Lisboa e V.T
13953
14087
Alentejo
732
1578
Algarve
777
1069
Açores
370
981
Madeira
418
1328
32 Resposta exercício nº1
Madeira
Açores
Algarve
Alentejo
lisboa e V.T
médicos enfermeiros
Centro
16000 14000 12000 10000 8000 6000 4000 2000 0
Norte
Resposta ex. nº1- Médicos
33
2%
2% 1%
1% 31%
46%
norte centro lisboa e V.T alentejo algarve açores madeira
17%
Resposta ex. nº1- Enfermeiros
34
3% 3% 4% 4%
31%
36% 19%
norte centro lisboa e V.T alentejo algarve açores madeira
35 Resposta exercício nº1 Norte
15000 10000
Madeira
Centro
médicos enfermeiros
5000 0 Açores
lisboa e V.T
Algarve
36
Alentejo
Definições
Atributo ou caracter – Característica comum a todos os elementos que constituem o nosso conjunto Modalidade – diferentes situações apresentadas pelo atributo
Exemplos:
Atributo: estado civil Modalidades: casado, solteiro, divorciado, viúvo Atributo: Peso Modalidades: 50 kg , 60 kg ,70 kg ,…
37
Apresentação de dados Distribuição de frequências
Variável estatística - atributo ou característica que se pretende estudar
Variáveis qualitativa – exprimem uma qualidade, não podem ser mensuráveis Exemplo: estado civil, cor dos olhos, sexo, etc.
Variáveis quantitativas–características mensuráveis Discretas – assumem um número finito ou infinito numerável de valores (ex.: idade, nº de irmãos, etc.) Continuas – assumem um número infinito não numerável de valores (ex.: tempo gasto para chegar ao local de trabalho)
38
Dados Qualitativos
Classificação dos dados segundo a escala em que são expressos
Nominal: dados classificados por categorias não ordenadas Ordinal: dados classificados por categorias ordenadas
Dados Quantitativos (escalas métricas)
Intervalos – dados expressos numa escala de origem numérica Absoluta – dados expressos numa escala numérica de origem fixa ( o zero tem existência real)
39 Nomenclatura utilizada
N – população n – amostra fi – Frequência Absoluta fri – Frequência Absoluta relativa Fi – Frequência Acumulada Fri – Frequência Acumulada relativa
40
Número de classes
O número de classes devera estar compreendido entre 4 e 14; Nenhuma classe deverá ter frequência nula; As classes deverão ter sempre que possível amplitudes iguais; Os pontos médios da classe deverão ser sempre que possível números de cálculo fácil; Classes abertas deverão ser evitadas; Os limites das classes são definidos de modo que cada valor da variável é incluído num e num só intervalo. Seja k o número de classes: n<5 então K=5 n≥5 então √n=K Seja ai a amplitude da classe: R Lmax − Lmin ai =
K
=
K
Representação gráfica de variáveis continuas
41
Histogramas fi
xi Classes
xi Classes
Também conhecido frequências;
Frequências acumuladas
x
i Classes
Diagrama Caule e Folhas
42
Fi
Fri(%)Frequências relativas
Frequências absolutas
como
separador
de
Exemplo: Considere a listagem das idades dos 30 compradores de um automóvel Peugeot, Peugeot, modelo 307 CC
35
28
31
25
32
43
20 21 23 24 24 25 25 27 27 27 28 28 29
38
20
35
33
41
41
31 32 32 33 34 35 35 36 38 38
24
42
27
34
36
38
27
54
28
23
24
29
50
32
21
43
27
25
41
41 42 43 43
50 54
43 Diagrama Caule e Folhas (cont.) Tronco
Folhas
2
0
1
3
4
4
5
5
7
7
7
3
1
2
2
3
4
5
5
6
8
8
4
1
1
2
3
3
5
0
4
8
8
9
Vantagens - esta tabela permite:
44
Melhor percepção do aspecto global dos dados sem perda de informação, como acontece nas classes; Imaginar facilmente o gráfico da distribuição; Ver até que ponto a distribuição é simétrica; Ver se existem concentrações ou lacunas de dados.
Polígono de Frequências
Linha poligonal que une o ponto médio do topo superior de cada rectângulo.
18
Nº alunos
16 14 12
[200;250[ [250;300[ [300;350[ [350;400[
10 8 6 4 2 0
Peso em gramas
Função Cumulativa
45
Linha poligonal que une os vértices superiores direitos dos rectângulos que formam o histograma de frequências acumuladas
40 35
Nº alunos
30 [200;250[ [250;300[ [300;350[ [350;400[
25 20 15 10 5 0 Peso em gramas
46
Medidas de Localização
Medidas de tendência central Moda e classe modal; Média; Mediana.
Medidas de tendência não central
Quantis Quartis; Decis; Percentis.
47
Moda e Classe modal
Definição de moda (Mo) – valor que ocorre
mais vezes numa distribuição, i.e., que tem maior frequência.
Classificação dos conjuntos:
Bimodal – se ocorrem duas modas Multimodal ou Plurimodal – se existirem mais do que duas modas Amodal – se não existir moda
48
Moda (variáveis continuas)
Graficamente:
18 16 14 12
[200;250[ [250;300[ [300;350[ [350;400[
10 8 6 4 2
Analiticamente
Mo = l i +
f i +1 × amp f i +1 + f i −1
0
Mo
Peso em gramas
Onde: li – limite inferior da classe modal fi+1 – frequência da classe seguinte à classe modal fi-1 – frequência da classe anterior à classe modal amp – amplitude da classe modal
49
Média ( x)
Dados não classificados (não agrupados em tabelas de frequências) k
∑x
i
x=
i =1
N
Dados classificados (agrupados em tabelas de frequências) k
∑x f
i i
x=
50
N
Exemplo
Com base no estudo que já referimos, calcule o número médio de enfermeiros e médicos existentes nas várias regiões. Resposta: Médicos: x = 4446,14 Enfermeiros: x = 5392,43
i =1
Regiões
Médicos
Enfermeiros
Norte
9622
11618
Centro
5251
7086
Lisboa e V.T
13953
14087
Alentejo
732
1578
Algarve
777
1069
Açores
370
981
Madeira
418
1328
51
Média (variáveis continuas)
Nota: no caso de dados agrupados por classes, a variável xi , será a marca ou centro da classe de ordem i.
Tempo (xi)
Centro classe
fi
[0;15[
7,5
9
[15;30[
22,5
35
[30;45[
37,5
20
[45;60[
52,5
20
[60;75[
67,5
7
[75;90[
82,5
4
[90;105[
97,5
5
[105;120[
112,5
1
[120;135[
127,5
1
[135;150[
142,5
2
Total
52
104
Mediana (Me)
Definição - valor que ocupa o lugar central da distribuição, quando os dados estão ordenados por ordem crescente ou decrescente.
Considerações:
É uma medida de posição, não faz intervir todos os valores É um parâmetro forte, não influenciado por alterações dos extremos
53
Mediana (dados não agrupados por classes)
n é impar
K= (n+1)/2
Me=xk
n é par
K= n/2
Me=(xk+x k+1)/2
Exemplos: Calcule a mediana dos seguintes conjuntos
10, 10, 12, 7, 7, 8, 5, 4 10, 10, 12, 7, 8, 5, 4
54 Classe Mediana (dados agrupados por classes)
1.
2.
3.
Calcula-se a ordem k, correspondente à classe mediana, levando em consideração o caso do n ser par ou impar; Localiza-se a ordem k na coluna das frequências acumuladas (Fi) Ao intervalo correspondente chamamos classe mediana.
55
Mediana (dados agrupados por classes)
Graficamente:
Analiticamente
n − Fi (i − 1) 2 × amp Me = li + f (i )
56
100 90 80 70 60 50 40 30 20 10 0
[200;250[ [250;300[ [300;350[ [350;400[
Me
Peso em gramas Onde: li – limite inferior da classe mediana Fi-1 – frequência acumulada da classe anterior à classe mediana fi – frequência absoluta da classe mediana amp – amplitude da classe mediana
Quantis
Quartis – são os valores da variável que dividem a distribuição de frequências em quatro partes iguais. Representa-se por Qi Decis - são os valores da variável que dividem a distribuição de frequências em dez partes iguais. Representa-se por Di Percentis - são os valores da variável que dividem a distribuição de frequências em cem partes iguais. Representa-se por Pi
Quartis
57
Q2 – 2º quartil, coincide com a mediana
n é impar
Posição do Q1
p1 =
Posição do Q1
p1 =
3(n + 1) 4
58
n é par
n +1 4
Posição do Q3 p3 =
n+2 4
Posição do Q3 p3 =
3(n + 2) 4
Quartis
Graficamente: 100 90 80 70 60 50 40 30 20 10 0
[200;250[ [250;300[ [300;350[ [350;400[
Q1 Me=Q2 Q3
Peso em gramas
Quartis
59
Analiticamente
Qi = li +
EQi − Fi (i − 1) × amp f (i )
Onde: li – limite inferior da classe escolhida Fi-1 – frequência acumulada da classe anterior à classe escolhida fi – frequência absoluta da classe escolhida i×n amp – amplitude da classe escolhida EQi = 4
Decis/Percentis
60
Decis Di = li +
EDi − Fi (i − 1) × amp f (i )
EDi =
i×n 10
EPi =
i×n 100
Percentis Pi = li +
EPi − Fi (i − 1) × amp f (i )
Exemplo
61 Tempo (xi)
Centro classe
fi
Fi
[0;15[
7,5
9
9
[15;30[
22,5
35
44
[30;45[
37,5
20
64
[45;60[
52,5
20
84
[60;75[
67,5
7
91
[75;90[
82,5
4
95
[90;105[
97,5
5
100
[105;120[
i×n EQ = 112,5
1
101
[120;135[
127,5
1
102
[135;150[
142,5
2
104
i
4
Total
62
EQ1 =
26 − 9 ×15 = 22,28 35
Significa que 25% dos tempos de dialise são inferiores a 22,28 meses
104
Medidas de Dispersão
Amplitude total; Intervalo inter-quartis Desvio quartilico Desvio médio Variância; Desvio Padrão
Medidas de dispersão relativas
1× 104 = 26 4
Q1 = 15 +
Medidas comparativas
1º Quartil
Medidas de distância
Coeficiente de variação
63
Amplitude total
Medida de dispersão mais fácil de calcular; Consiste na diferença entre o valor máximo e o valor mínimo da variável; R = Xmax-X min Exemplo: Considere a variável que assume os seguintes valores: X={3, 5, 9, 15, 16, 12, 8, 4} Calcule a amplitude total. R=16-3=13
64
Amplitude total
Desvantagem: tem apenas em conta os dois valores extremos que a variável assume, logo não é sensível aos valores intermédios. Exemplo: Considere a tabela ao lado. Calcule a amplitude total. R=120-30=90
Tempo (xi)
fi
[30;45[
20
[45;60[
20
[60;75[
7
[75;90[
4
[90;105[
5
[105;120[
1
65
Intervalo inter-quartis
Consiste na diferença entre o 3º Quartil e o 1ºQuartil; Corresponde a um intervalo que engloba 50 % das observações.
IQ=Q3-Q1
Desvantagem: esta medida não é influenciada por metade dos valores observados, que neste caso são os valores extremos.
66
Desvio Quartilíco
Medida de dispersão semelhante à anterior; Consiste na semi-diferença entre o 3ºQuartil e o 1ºQuartil; Corresponde a um intervalo que engloba 50 % das observações.
DQ=(Q3-Q1)/2
Desvantagem: esta medida não é influenciada por metade dos valores observados, que neste caso são os valores extremos.
Exemplo de Aplicação
67
Num determinado local foi efectuado um estudo para caracterizar as idades dos residentes a)Calcule o desvio quartilíco b)Calcule o intervalo interinter-quartis 1× 50 EQ1 = = 12,5 4
Q1 = 10 +
68
fi
Fi
[5;10[
5
5
[10;15[
10
15
[15;20[
20
35
[20;25[
10
45
[25;30[
5
50
Total
50
3×50 EQ3 = = 37,5 4
12,5 − 5 × 5 = 13,75 10
Q3 = 20 +
Idades (xi)
37,5 − 35 × 5 = 21,25 10
DQ =
Q3 − Q1 21,25 − 13,75 = = 3,75 2 2
IQ = Q3 − Q1 = 21,25 − 13,75 = 7,5
Desvio Médio Desvio Absoluto Médio
Soma dos valores absolutos da diferença entre os valores observados e a sua média, divididos pelo número total de observações; k Média aritmética dos valores absolutos dos desvios da distribuição em relação a uma medida de tendência central (média ou mediana)
∑ X −x DM =
i =1
N
k
∑ X −x × f DM =
i =1
N
i
69
Variância (dados não classificados)
Definição: média aritmética dos quadrados dos n desvios. 2
∑ (x − x ) i
2
σ =
i =1
n
Nota importante: quando se trata de uma amostra de pequena dimensão é mais correcto n utilizar a variância corrigida. 2
∑ (x − x ) i
2
σ =
70
i =1
n −1
Variância (dados não classificados)
Exemplo: Calcule a variância para o seguinte conjunto de dados:
M={18; 23; 43,5; 19,2; 20,5}
Calculo da média: x=
18 + 23 + 43,5 + 19,2 + 20,5 5
Calculo da variância: 2 2 2 2 2 ( 18 − 24,84 ) + (23 − 24,84 ) + (43,5 − 24,84) + (19,2 − 24,84) + (20,5 − 24,84) σ = 2
5
71 Variância (dados classificados)
Formula a utilizar:
n
∑ f ×(x − x )
2
i
σ2 = Exemplo:
Calcule a variância
72
i
i =1
n
Xi
fi
xi fi
5
2
10
7
1
7
8
5
40
9
2
18
10
4
40
12
3
36
15
3
45
total
20
196
(xi − x )
(xi − x )2
f i × ( xi − x )
2
Desvio Padrão (σ)
Raiz quadrada da variância; Medida que só pode assumir valores não negativos; Medida de dispersão mais utilizada; Quanto maior for o desvio padrão maior é a dispersão dos dados; Se σ=0, então não existe variabilidade.
n
σ=
2 ( ) x − x ∑ i i =1
n
n
∑ f × (x − x )
2
i
σ=
i
i =1
n
73
Coeficiente de variação (CV)
Até agora estudamos medidas de dispersão absoluta; O coeficiente de variação é uma medida de dispersão relativa; Mede o grau de concentração em torno das distribuições de frequências É a relação percentual entre o desvio padrão e a média.
CV =
74
σ
x
×100
Coeficiente de variação (CV)
Exemplo: Numa empresa o salário médio dos
homens é 400 € e o desvio padrão é 150 €. Na mesma empresa, para as mulheres o salário médio é 300 € e o desvio padrão é de 120 €. Calcule o coeficiente de variação. O salário auferido pelas Homens: CV = 150 ×100 = 37,5% mulheres apresenta uma 400 maior dispersão relativa 120 Mulheres: CV = 300 ×100 = 40% do que o salário dos homens
75
Coeficiente de variação (CV)
Considerações: CV > 50% ⇒ alto grau de dispersão relativa ⇒ pequena representatividade da média como medida estatística CV < 50% ⇒ baixo grau de dispersão relativa ⇒ a média é tão mais representativa quanto menor for o valor de CV
76
Medidas de Assimetria
1º
Método: comparação das 3 medidas de tendência central: Distribuição
simétrica
x = Mo = Me Distribuição
assimétrica positiva
x ≥ Me ≥ Mo Distribuição
assimétrica negativa
x ≤ Me ≤ Mo
77
Medidas de Assimetria
Considerações sobre o 1º Método: É vantajoso porque não exige o conhecimento dos valores iniciais da distribuição de frequências em estudo A assimetria resulta em geral de valores extremamente grandes ou extremamente pequenos; Quanto mais pronunciada for a assimetria da distribuição maior será a distancia entre a oda e a mediana.
78
Medidas de Assimetria
2º Método: grau de assimetria
G=
3 × ( x − Me )
σ G=0
Distribuição simétrica, se
Distribuição assimétrica positiva, se G>0
Distribuição assimétrica negativa, se G<0
Medidas de Assimetria
79
3º Método: coeficiente de Pearson
G1
( x − Mo ) = σ
Q3 + Q1 − 2 × Me G2 = Q3 − Q1
Método mais preciso; O 2º coeficiente de Pearson é utilizado quando não se conhece a média nem o desvio padrão.
80
Medidas de Assimetria
Exemplo:
Estude o grau de assimetria da seguinte distribuição de frequências utilizando o coeficiente de assimetria e o coeficiente de Pearson. Resolução Média=75 Classe
mediana = [70;80] Mediana=75 Classe modal = [70;80] Moda=75 Desvio padrão = √160 G=0
Idades (xi)
fi
[50;60[
15
[60;70[
20
[70;80[
30
[80;90[
20
[90;100[
15
Total
100
81 Distribuições bidimensionais
Objectivo: estudar a relação entre duas ou mais variáveis
Idade de uma mulher / tensão arterial Taxa de desemprego / Produto Nacional Bruto de um país
Diagrama de dispersão
Representação das variáveis x e y num referencial cartesiano; Permite visualizar a existência de uma relação entre as variáveis, e identificar qual a condição mais apropriada para descrever esta relação;
82
Correlação
Correlação Negativa
Correlação Positiva
Não há Correlação
Correlação Não linear
83 Coeficiente de Correlação (r)
Também designado por coeficiente correlação de Pearson; Varia entre [-1;1] r=-1, correlação perfeita e negativa r=1, correlação perfeita e positiva r=0, não há relação linear
de
84 Coeficiente de Correlação (r)
r = -1
r = 0,91
r=0
r=0
Centro de Gravidade
85
Definição:
Ponto de coordenadas (x, y ) correspondentes ás médias aritméticas das variáveis x e y.
Exemplo: Determine o centro de gravidade da seguinte distribuição: {resposta: (13,1;10,5)} Nº anos trabalho
14
9,5
Nº dias de doença
11,5
10
86
Algumas
15,5 12,5 18,5 12
10
15
5
15
20
8
0
11
15
10
Distribuição Normal distribuições
podem ser descritas como simétricas em torno da média e com a forma de sino. Uma boa aproximação para muitas dessas distribuições é dada pela distribuição normal
Distribuição do peso de 462 recém nascidos.
87
Distribuição Normal
x = Mo = Me Histograma da variável BIRTHW (peso do recém nascido) com a curva normal