Como comparar intervalo de confiança

Often, the most practical way to decrease the margin of error is to increase the sample size. Usually, the more observations that you have, the narrower the interval around the sample statistic is. Thus, you can often collect more data to obtain a more precise estimate of a population parameter.

Índice Show

Com Variância Desconhecida
O que aprendemos…

You should weigh the benefits of increased precision with the additional time and resources required to collect a larger sample. For example, a confidence interval that is narrow enough to contain only the population parameter requires that you measure every subject in the population. Obviously, such a strategy would usually be highly impractical.

The less that your data varies, the more precisely you can estimate a population parameter.

That's because reducing the variability of your data decreases the standard deviation and, thus, the margin of error for the estimate. Although it can be difficult to reduce variability in your data, you can sometimes do so by adjusting how you collect data. For example, you can use a paired design to compare two groups. You may also be able to reduce variability by improving the process so that the process is more consistent or by measuring more precisely.

A one-sided confidence interval has a smaller margin of error than a two-sided confidence interval. However, a one-sided interval indicates only whether a parameter is either less than or greater than a cut-off value. A one-sided interval does not provide any information about the parameter in the opposite direction. Thus, use a one-sided confidence interval to increase the precision of an estimate only when you are worried about the estimate being either greater or less than a cut-off value, but not both.

For example, a beverage company wants to determine that the amount of dissolved solids in their drinking water. The fewer dissolved solids they have, the better. When they calculate a two-sided confidence interval, the upper side of the interval is 18.4. However, because the company only cares about the upper bound, they can calculate a one-sided confidence interval instead. The one-sided confidence interval shows that the upper bound for the amount of dissolved solids is even lower, 17.8 mg/L.

The advantage of a lower confidence level is that you get a narrower, more precise confidence interval. The disadvantage is that you have less confidence that the confidence interval contains the population parameter you are interested in.

So lower the confidence level only if, in your situation, the advantage of more precision is greater than the disadvantage of less confidence. For example, if it's too expensive to increase the sample size in your study, lowering the confidence level will shorten the length of the interval at the expense of losing some confidence.

Aprender a construir o intervalo de confiança para a diferença entre duas médias com variância conhecida
Aprender a construir o intervalo de confiança para a diferença entre duas médias com variância desconhecida

Consideremos duas amostras aleatórias, x1, x2, …, xn de tamanho nx e y1, y2, …, yn de tamanho ny, com distribuição normal, médias μx e μy e variâncias σx² e σy² conhecidas.

Assim, temos que:

variável z com distribuição normal padronizada.

Sabemos que a probabilidade da variável z tomar valores entre -z(α/2) e +z(α/2) é 1-α (nível de confiança) e podemos obter os valores de -z(α/2) e +z(α/2) na tabela da distribuição normal padrão conforme mostra a figura:

A probabilidade da variável z tomar valores entre -z(α/2) e +z(α/2) pode ser representada da seguinte forma:

Assim sendo, o intervalo de confiança para a diferença entre duas médias é dado por:

Se pudermos repetir muitas vezes o experimento e coletarmos os dados, aproximadamente em 100.(1-α)% das vezes a diferença das médias populacionais estará no intervalo encontrado.

Com Variância Desconhecida

É difícil conhecermos as variâncias populacionais (σ²), então, para encontrar o intervalo de confiança da diferença entre duas médias utilizamos as variâncias amostrais (s²) no lugar da variância populacional (σ²) e em vez de utilizarmos a distribuição normal padrão utilizamos a distribuição t de Student.

Suponha que temos duas amostras aleatórias simples (y1, y2, …, yn e x1, x2, …, xn) com distribuição normal, com variância iguais (σx² = σy² = σ²) e desconhecidas. Assim, temos a variável aleatória t com distribuição t de Student com nx+ny-2 graus de liberdade:

Em que Sp é o desvio padrão conjunto das duas variáveis, calculadas da seguinte forma:

Então, ao fixarmos o nível de significância α, obtemos da tabela da distribuição t de Student com nx+ny-2 graus de liberdade, o valor t(nx+ny-2; α/2):

Com isso, o intervalo de confiança da média com variância desconhecida é dado por:

Podemos afirmar que se pudéssemos construir uma grande quantidade de intervalos IC(μx — μy; 1-α), todos baseados em amostras de tamanho nx e ny, em torno de 100.(1-α)% deles conteriam a verdadeira diferença das médias populacionais.

Exercício

Um pesquisador está avaliando os pesos de adolescentes de duas escolas. Assim sendo, foram pesados 10 alunos de cada uma delas. Os pesos em kg observados foram:

Escola A: 56 ; 56 ; 44 ; 56 ; 52 ; 51 ; 53 ; 50 ; 51 ; 58.

Escola B: 63 ; 58 ; 55 ; 55 ; 57 ; 58 ; 68 ; 58 ; 58 ; 65.

Considerando os dois grupos como amostras aleatórias de duas populações independentes e normalmente distribuídas, determine um intervalo de confiança de 95% para a verdadeira diferença das médias populacionais dos dois grupos.

O que aprendemos…

Aprendemos a construir o intervalo de confiança para a diferença entre duas médias com variância conhecida
Aprendemos a construir o intervalo de confiança para a diferença entre duas médias com variância desconhecida