Livro Dendrometria e Inventário Florestal
Carlos Pedro Boechat Soares; Francisco de Paula Neto; Agostinho Lopes de Souza
AMOSTRAGEM CASUAL ESTRATIFICADA
1. Conceitos básicos
A distribuição e alocação de unidades de amostra de forma casual sobre uma área que será inventariada somente será eficiente se a área for homogênea quanto à distribuição da variável de interesse.
Se a área não for homogênea, haja vista a presença de povoamentos com diferentes idades, espécies, espaçamentos e topografias, entre outras fontes de variação, a amostragem estrati-ficada será um esquema de amostragem mais eficiente (SHIVER; BORDERS, 1996).
A Amostragem Casual Estratificada consiste na divisão da população em sub-populações mais homogêneas em termos de distribuição da característica de interesse, denominadas estrato, dentro dos quais se realiza a distribuição das unidades de amostra de forma casual (aleatória).
Em termos de inventário florestal, a amostragem estratificada será mais eficiente, se a variabilidade dentro de cada estrato for menor que aquela considerando a população toda.
Para melhor compreender o princípio de estratificação de uma população, considere o seguinte exemplo, em que a população é composta de 10 unidades (árvores), sendo observados os valores da característica (altura, em m), como se segue:
A média da população (m) é igual a 22 m e a variância populacional é = 19,0 (m)2.
Se dada amostra com três árvores fosse selecionada casualmente da população citada acima, o erro-padrão da média estimada da população (sendo a média estimada da população ) seria:
Se a população fosse dividida em três estratos homogêneos – um estrato consistindo das duas primeiras árvores, o segundo consistindo das três árvores seguintes e o último estrato composto das cinco últimas árvores –, a estimativa da média da população, selecionando-se apenas uma unidade casual em cada estrato, seria uma média ponderada, tendo como peso ou fator de ponderamento o número total de unidades em cada estrato (2, 3 e 5, respectivamente), representando o tamanho de cada estrato. Assim, pode-se verificar, facilmente, que a média estimada, nesse caso, será idêntica à da população (m), porém o erro-padrão da média estimada () será zero, porque as unidades dentro dos estratos apresentam valores iguais, e, conseqüentemente, variância igual a zero.
Embora o exemplo apresentado seja um caso extremo, ele serve para fortalecer o que foi relatado antes sobre o princípio da estratificação. Ao dividir uma população em estratos homogêneos, pode-se aumentar a precisão do inventário.
Como vantagens da amostragem estratificada, em relação à amostragem casual simples, pode-se citar:
a) A obtenção de estimativas da produção por estrato e para a população.
b) Para um mesmo tamanho da amostra, a amostragem estratificada propicia estimativas mais precisas (menor erro de amostragem).
c) Para uma mesma precisão requerida, tem-se um menor tamanho da amostra, na amostragem estratificada, resultando em menor custo na coleta dos dados.
Como desvantagens potenciais da amostragem estratificada, tem-se:
a) A unidade de amostra deve pertencer somente a um único estrato. Em situações em que o estrato é bem definido, em plantios, por exemplo, isso é fácil de ser verificado, porém no caso de florestas naturais pode não ser tão fácil.
b) Há a necessidade de conhecer a área do estrato. Em alguns levantamentos já é difícil conhecer a área total da floresta, ainda mais a área do estrato. O desenvolvimento de tecnologias de obtenção de dados especiais tem facilitado a obtenção de áreas florestadas com certa precisão.
2. Critérios de estratificação
A estratificação é determinada pela subdivisão da floresta em estratos com base em alguns critérios, como: características topográficas, tipos florestais, espécies ou clones, espaçamento, volume, altura, idade, classe de sítio etc. Se possível, a estratificação deve ser baseada na mesma característica que será estimada pelo procedimento de amostragem. Assim, se o volume por unidade de área é o parâmetro a ser estimado, é desejável estratificar a floresta com base nas classes de volume. No entanto, conveniências administrativas também devem servir de base para efeito da estratificação. Muitas vezes, dependendo do objetivo do inventário, regiões geográficas compactas são preferidas para constituir o estrato.
Uma forma arbitrária de estratificação, freqüentemente usada em grandes áreas florestais onde existe pouca base para algum tipo de subdivisão natural e, às vezes, empregada em inventários de florestas nativas, principalmente onde não existem mapas ou fotografias aéreas disponíveis ou quando a fotointerpretação revela pouca base para uma estratificação, é a divisão da floresta em blocos quadrados ou retangulares de tamanhos conhecidos e uniformes. Esses blocos resultantes podem não ser homogêneos, porém é evidente que existirá maior homogeneidade dentro dos menores blocos do que nos maiores, ou do que em toda a população florestal.
No caso específico de florestas naturais tropicais, nas quais a população é composta por diferentes espécies, árvores com diferentes idades, distribuídas sobre as mais diversas condições de locais (solo, topografia, exposição ao sol etc.), a estratificação torna-se mais complexa, tendo em vista que, além dessas características, outras, a exemplo da área basal, volume e número de árvores por hectare, devem ser consideradas em conjunto. Nesses casos, há a necessidade de utilizar técnicas de análise multivariada para a estratificação da floresta (SOUZA, 1989).
3. Estimadores populacionais da amostragem casual estratificada
Os estimadores populacionais, considerando-se uma amostra-gem casual estratificada, são assim definidos:
a) Número total de unidades de amostra na população:
em que: M = número total de estratos; e Nj = número total de unidades de amostra em cada j-ésimo estrato, j = 1, 2, ..., M.
b) Número de unidades de amostra lançadas em todos os estratos:
em que: nj = número de unidade de amostra lançada em cada j-ésimo estrato.
c) Média estimada da variável Y em cada j-ésimo estrato:
em que: Yij = quantidade da variável Y na i-ésima unidade de amostra, do j-ésimo estrato.
d) Média estratificada ou média ponderada
tal que:
em que: Pj = proporção do número de unidades de amostra em cada estrato em relação ao número total de unidades de amostra ou proporção da área total de cada estrato em relação à área total.
e) Valor total estimado de Y para a população
f) Valor total estimado de Y para cada j-ésimo estrato
g) Variância estimada de Y em cada j-ésimo estrato:
h) Desvio-padrão de Y em cada j-ésimo estrato:
i) Variância estimada da média estratificada:
j) Erro-padrão da média estimada:
4. Estimação do tamanho da amostra e alocação das unidades de amostra
Para estimar o número de unidades de amostra a serem empregadas em um inventário florestal, cuja população foi estratificada, é necessário ter informações preliminares sobre a variabilidade dos estratos, seja por meio de um inventário-piloto, seja por outras formas de avaliações. É necessário, também, definir a precisão requerida e o nível de probabilidade, de forma semelhante à amostragem casual simples.
O número total de unidades de amostra obtido em toda a população estratificada será, então, distribuído nos diferentes estratos, de forma casual, pela fixação proporcional ou pela fixação ótima (método de Neyman). Na fixação proporcional, a distribuição do número total de unidade de amostra nos diferentes estratos é função da proporção das áreas dos estratos em relação à área total da população. Na fixação ótima, além da proporção de áreas, a distribuição é em função da variabilidade do estrato.
4.1. Tamanho da amostra
Na amostragem estratificada, para estimar o tamanho da amostra deve-se levar em consideração, inclusive, a proporcionalidade de áreas, , de cada j-ésimo estrato em relação à população.
Uma vez definida a área de uma unidade de amostra ou o fator de área basal, quando se tratar de uma amostragem com probabilidade proporcional ao tamanho (amostragem PPS), conhecida a área da população e estabelecidos a precisão requerida e o nível de probabilidade, torna-se necessário conhecer a variabilidade de cada j-ésimo estrato.
Visando à utilização da fixação proporcional, o tamanho da amostra, considerando-se uma população finita, é dado por:
Se a população for considerada infinita, n é calculado por:
Se se pretende utilizar o método da fixação ótima, a estimação do tamanho da amostra, para dada precisão, considerando-se uma população finita, é obtida pela aplicação da seguinte expressão:
Para uma população infinita, será:
Se a precisão requerida for expressa em porcentagem, é necessário calcular o coeficiente de variação (CV) para a população estratificada, que, nesse caso, é dado pela expressão:
De posse do coeficiente de variação, o tamanho da amostra, para uma população finita, é dado por:
Para uma população considerada infinita, é:
Se não quiser calcular o coeficiente de variação, basta transformar a precisão requerida porcentual para absoluta, através da seguinte expressão:
Essa estimativa de E será empregada nas fórmulas apropriadas para o cálculo de n nas fixações proporcional ou ótima, as quais utilizam as estimativas das variâncias dos estratos.
4.2. Alocação das unidades de amostra
Como discutido anteriormente, depois de se calcular o tamanho da amostra a ser empregado num inventário florestal de uma população que foi estratificada, a alocação ou fixação das parcelas por estrato pode ser feita de duas formas: pela fixação proporcional ou pela fixação ótima.
4.2.1. Fixação proporcional
Por esse procedimento, o número de unidades de amostra a ser casualmente lançado em cada j-ésimo estrato é proporcional ao tamanho do estrato. Assim, o tamanho da amostra, n, é multiplicado pela razão entre a área do j-ésimo estrato e a área total da população, dada por Pj = Nj/N, para se obter a quantidade de parcelas a ser fixada em cada estrato (nj), ou seja:
Nesse método, não se consideram o custo da amostragem e as estimativas de variância. Dessa forma, ele possui uma restrição própria: os grandes estratos sempre irão receber um número maior de parcelas que os menores, independentemente da maior ou menor variabilidade do estrato, representada pelos desvios-padrão ou coeficientes de variação entre os volumes por unidade de amostra. No entanto, esse método pode ser utilizado em uma amostragem inicial (inventário-piloto), uma vez que a variabilidade dos estratos é desconhecida.
4.2.2. Fixação ótima (método de Neyman)
Neste método, o número de amostra por estrato (nj) é função do desvio-padrão de cada j-ésimo estrato ponderado pela proporcionalidade entre as áreas do estrato e da população. A fixação ótima pode ser feita independentemente da igualdade, ou não, dos custos das unidades de amostras nos diferentes estratos.
A fixação do número de unidades de amostra, considerando-se custos iguais, em cada j-ésimo estrato é feita pela aplicação da seguinte fórmula:
Pode-se verificar nestas fórmulas que, comparativamente à fixação proporcional, a distribuição pelo método de Neyman leva em consideração a variabilidade dada pelos volumes por unidade de amostra em cada estrato. Assim, esse método pode ser utilizado após o lançamento das unidades de amostra no inventário-piloto, na complementação da amostra definitiva.
5. Análise de uma amostragem estratificada
Para efeito da análise da amostragem estratificada, considere o seguinte exemplo. Assim, seja uma população florestal com 45,0 ha, dividida em três áreas (subáreas), na qual se realizou um inventário-piloto, distribuindo-se sete unidades de amostra de 0,1 ha de área na subárea 1; oito unidades na subárea 2; e sete unidades na subárea 3, de acordo com o Quadro 5.1.
Quadro 5.1 - Estimativas de volume e respectivas estatísticas das três subáreas
Além dos dados apresentados no Quadro 5.1, considere ainda que as subáreas possuem 14,4 ha, 16,4 ha e 14,2 ha, respectivamente. O nível de probabilidade será igual a 95% e a precisão requerida, igual a ± 5%.
Com os dados desse exemplo, serão considerados três casos para exemplificar a eficiência da amostragem estratificada, a saber:
1) A população será tratada como um todo, através da amostragem casual simples.
2) As subáreas serão tratadas de modo independente, através da amostragem casual simples (inventários independentes em cada subárea).
3) Será considerada a amostragem casual estratificada, pela combinação das estimativas e das áreas das subáreas, com a locação das unidades de amostra pelo método de fixação ótima.
1o Caso
a) Média estimada
b) Variância da amostra
c) Desvio-padrão
d) Coeficiente de variação
Tamanho da amostra, considerando t(5%; 21 gl) = 2,08 e N = 450
Recalculando para t(5%; 154 gl) » 1,96
Conclusão: Para garantir um erro de ± 5%, a 95% de probabilidade, seriam necessárias 143 parcelas. Nesse caso, seria preciso lançar e medir mais 121 parcelas para a análise do inventário definitivo.
2o Caso
Utilizando as mesmas estatísticas apresentadas no Caso 1, a mesma precisão requerida e o mesmo nível de probabilidade, têm-se as seguintes estimativas de cada subárea:
* Subárea 1
a) Média estimada da subárea 1
b) Variância da amostra
c) Desvio-padrão
d) Coeficiente de variação
e) Tamanho da amostra, considerando t(5%; 6 gl) = 2,447 e N = 144
Recalculando para t(5%; 78 gl) » 1,994, tem-se:
Conclusão: Para garantir um erro de ± 5%, a 95% de probabilidade, seriam necessárias 64 parcelas. Nesse caso, seria preciso lançar e medir mais 57 parcelas na subárea 1 para a análise do inventário definitivo.
* Subárea 2
a) Média estimada da subárea 2
b) Variância da amostra
c) Desvio-padrão
d) Coeficiente de variação
e) Tamanho da amostra, considerando t(5%; 6 gl) = 2,447 e N = 144
Recalculando para t(5%; 78 gl) » 1,994, tem-se:
Conclusão: Para garantir um erro de ± 5%, a 95% de probabilidade, seriam necessárias 37 parcelas. Nesse caso, seria preciso lançar e medir mais 29 parcelas na subárea 2 para a análise do inventário definitivo.
* Subárea 3
a) Média estimada da subárea 3
b) Variância da amostra
c) Desvio-padrão
d) Coeficiente de variação
e) Tamanho da amostra, considerando t(5%; 7 gl) = 2,365 e N = 164
Recalculando para t(5%; 46 gl) = 2,0147, tem-se:
Conclusão: Para garantir um erro de ± 5%, a 95% de probabilidade, seriam necessárias 45 parcelas. Nesse caso, seria preciso lançar e medir mais 38 parcelas na subárea 3 para a análise do inventário definitivo.
O número total de unidades de amostra, considerando-se as três subáreas, será:
ntotal = 64 + 37 + 45 = 146 parcelas
ou seja, dever-se-ia lançar mais 124 parcelas para o inventário definitivo.
Percebe-se que o inventário independente de cada subárea, através da amostragem casual simples, não resultou em diminuição do tamanho da amostra, em comparação com o Caso 1. Isto poderia ter ocorrido se a variabilidade dentro de cada subárea fosse menor e maior entre as subáreas.
Analisando o coeficiente de variação no Caso 1 (36,89%), com os coeficientes de cada subárea, no Caso 2 verifica-se que estes últimos são menores, indicando que a utilização da amostragem estratificada pode ser mais eficiente, reduzindo o tamanho da amostra, para uma mesma precisão requerida e para um mesmo nível de probabilidade.
3o Caso
Considerando agora cada subárea como um estrato, têm-se as seguintes estatísticas da amostragem casual estratificada:
* Inventário-piloto
a) Média estimada para cada estrato:
b) Média estratificada ()
c) Variância e desvio-padrão por estrato
d) Tamanho da amostra pela fixação ótima, considerando-se t(5%; 21 gl) = 2,08
Para facilitar o cálculo do tamanho da amostra será necessário transformar a precisão requerida porcentual em termos absolutos e preencher um quadro auxiliar.
O erro absoluto em torno da média foi assim obtido:
O quadro auxiliar, com as respectivas estimativas, apresenta o seguinte formato:
De posse dos dados do quadro auxiliar, calculou-se o tamanho da amostra:
Recalculando para t(5%; 60 gl) = 2,00, tem-se:
Nesse caso, para garantir um erro de ± 5%, a 95% de probabilidade, seriam necessárias 57 parcelas.
e) Alocação das parcelas (fixação ótima)
Considerando os três estratos, tem-se:
De acordo com o método de fixação ótima, será necessário lançar e medir mais 7 parcelas no estrato 1, 12 parcelas no estrato 2 e 16 parcelas no estrato 3. Assim sendo, considere os dados a seguir (Quadro 5.2) como sendo do inventário definitivo (57 parcelas).
* Inventário definitivo
Quadro 5.2 - Estimativas de volume e respectivas estatísticas dos três estratos
a) Média estimada de cada estrato
b) Média estratificada ()
c) Variância e desvio-padrão por estrato
d) Variância da média estratificada
Para facilitar o cálculo da variância da média estratificada foi elaborado o seguinte quadro auxiliar:
e) Erro-padrão da média estratificada
f) Estimativa do volume total da população
g) Erro de amostragem
O erro de amostragem absoluto, a 95% de probabilidade, considerando o valor de t(5%, 56 gl) = 2,0, será:
Esse erro, em porcentagem, será:
Posto que a precisão requerida é de ± 5%, o número de unidades de amostra no inventário definitivo foi suficiente para atender a essa precisão, haja vista que o erro de amostragem foi de 4,39%.
h) Intervalo de confiança
* Em termos do volume por unidade de amostra
* Para a produtividade média por hectare
* Para o volume total da população
i) Estimativa do volume por estrato
6. Referências Bibliográficas
SHIVER, B.D.; BORDERS, B.E. Sampling techniques for forest resource inventory. 1. ed. New York. John Wiley & Sons, Inc., 1996. 356 p.
SOUZA, A.L. Análise multivariada para manejo de florestas naturais: alternativas de produção sustentada de madeiras para serraria. Curitiba: UFPr, 1989. 255 f. Tese (Doutorado em Ciência Florestal) – Universidade Federal do Paraná, Curitiba.