0% found this document useful (0 votes)
38 views3 pages

Test 2

Density histograms display frequency as the area of rectangles rather than their height. This accounts for the length of intervals and allows estimating the number of values within any interval, not just predefined bins. Similarly, the area under a distribution curve corresponds to the frequency of values within the associated interval. Both density histograms and distribution curves thus provide a more accurate representation of the distribution of a continuous variable than regular histograms.

Uploaded by

Marcos Vinicius
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
38 views3 pages

Test 2

Density histograms display frequency as the area of rectangles rather than their height. This accounts for the length of intervals and allows estimating the number of values within any interval, not just predefined bins. Similarly, the area under a distribution curve corresponds to the frequency of values within the associated interval. Both density histograms and distribution curves thus provide a more accurate representation of the distribution of a continuous variable than regular histograms.

Uploaded by

Marcos Vinicius
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 3

Density Histograms

In the previous lesson, you saw that frequency histograms often do a poor job
displaying a continuous variable's distribution, since the frequency with which values
fall within particular intervals is very sensitive to the intervals' bounds. We need to find
another approach, one that takes the interval length into account. What if we display
frequency not as the height of a column, but as its area?

To find the area of a rectangle, we multiply its length by its height. So the frequency of
the continuous variable defined this way is the interval length multiplied by its column
height. The height of the column is called the frequency density.

A histogram built in this way is called a density histogram. It differs from the
frequency histograms we've been plotting up to this point in that its vertical axis shows
the frequency density, instead of just frequency.

With a density histogram, you can estimate how many values fall into any given
interval, not just the bins selected to build the histogram. Take two values anywhere on
the horizontal axis, even if they're several bins apart and fall in the middle of intervals,
rather than on their boundaries, and then find the area of that part of the density
histogram that lies between them. The result is the number of values within this
interval.

We can also use the area under a curve to find the frequency density. This works the
same way: the area under the curve between two values corresponds to the frequency
of the values located in the interval.

For example, on the graph of the normal distribution, you can see that the majority of
values are found between the dotted lines:

Just as with the density histogram, the values are on the horizontal axis, and the area
under the curve gives the frequency of values in the interval.

We'll come back to the idea that the area under the curve corresponds to the frequency
for the interval later in the course. It will come in handy when you're testing statistical
hypotheses.
Tradução

Histogramas de densidade

Na lição anterior, você viu que os histogramas de frequência costumam fazer um


trabalho ruim ao exibir uma distribuição de variável contínua, pois a frequência com a
qual os valores caem dentro de intervalos específicos é bem sensível aos limites dos
intervalos. É preciso encontrar uma nova abordagem que considere o comprimento do
intervalo. E se representarmos a frequência não como a altura de uma coluna, mas
como sua área?
Para encontrar a área de um retângulo, multiplicamos seu comprimento pela sua
altura. Portanto, a frequência de variável contínua definida dessa forma é o
comprimento do intervalo multiplicado pela altura da sua coluna. A altura da coluna é
chamada de densidade de frequência.
Um histograma construído dessa maneira é conhecido por histograma de densidade.
Ele difere dos histogramas de frequência que temos traçado até agora, pois seu eixo
vertical mostra a densidade de frequência, em vez de mostrar apenas a frequência.
Com um histograma de densidade, você consegue estimar quantos valores caem em
qualquer intervalo dado, e não apenas as caixas selecionadas para criar o histograma.
Pegue dois valores em qualquer lugar no eixo horizontal, mesmo se estiverem bem
distantes e ficarem no meio dos intervalos, em vez de nos seus limites, e encontre a
área daquela parte do histograma de densidade que fica entre eles. O resultado é o
número de valores dentro desse intervalo.
Podemos também utilizar a área abaixo de uma curva para encontrar a densidade de
frequência. Isso funciona da mesma forma: a área abaixo da curva entre dois valores
corresponde à frequência dos valores localizados em um intervalo.
Por exemplo, no gráfico de distribuição normal, você pode ver que a maioria dos
valores são encontrados entre as linhas pontilhadas.

Assim como acontece com o histograma de densidade, os valores se encontram no


eixo horizontal e a área abaixo da curva fornece a frequência dos valores no intervalo.
Mais para frente nesse curso, voltaremos ao conceito de que a área embaixo da curva
corresponde à frequência para o intervalo. Será bem útil quando você for testar
hipóteses estatísticas.

You might also like