Livro Dendrometria e Inventário Florestal
Carlos Pedro Boechat Soares; Francisco de Paula Neto; Agostinho Lopes de Souza
TEORIA DE AMOSTRAGEM
1. Conceitos básicos
De acordo com a teoria de amostragem, alguns conceitos são fundamentais para o perfeito entendimento deste assunto, entre eles:
a) População: é um universo dentro do senso estatístico que contempla duas pressuposições básicas, a saber (LOETSCH; HALLER, 1964):
1) Os indivíduos de uma população são da mesma natureza.
2) Os indivíduos de uma população diferem entre si, de acordo com uma feição, atributo típico ou característica denominada variável.
Em termos florestais, a primeira condição pode ser facilmente exemplificada ao se definir o tipo de floresta a ser inventariada, plantada ou natural. Para a segunda condição, como a floresta é composta por um conjunto de árvores, estas possuem características (feições), as quais serão contempladas pelo inventário propriamente dito, por exemplo: diâmetros à altura do peito (DAP), altura, área basal, volume, incremento, idade etc.
A população, numa consideração teórica, sobre a qual a teoria da amostragem se baseia, pode apresentar tamanho finito ou infinito. Quando finito, o último elemento da população é conhecido.
b) Amostra: trata-se de uma porção de dada população que é examinada, permitindo, a partir daí, que se façam inferências sobre a população em questão (SHIVER; BORDERS, 1996).
c) Unidades de amostra: consistem nas unidades em que serão realizadas as avaliações quantitativas e qualitativas sobre as feições de uma população. Em se tratando de inventários florestais, existem populações que são marcadamente heterogêneas em sua composição e, por isso, o processo de seleção das unidades de amostra se torna atividade de suma importância no processo como um todo (LOETSCH; HALLER, 1964).
d) Quadro de amostra: é uma lista com todas as unidades de amostra que compõem a população.
e) Parâmetro ou característica de uma população: é um valor ou constante que é obtido para dada variável de interesse, se todas as unidades de amostra de uma população forem mensuradas (SHIVER; BORDERS, 1996). Consiste do principal objetivo de qualquer processo amostral a estimativa de um ou mais parâmetros de uma população. O valor estimado de um parâmetro é sempre referido como uma estimativa, cujo valor deve ser o mais próximo do verdadeiro valor de um parâmetro populacional (LOETSCH; HALLER, 1964; HUSCH et al., 2003; SHIVER; BORDERS, 1996).
f) Estimadores: nada mais são do que fórmulas matemáticas usadas no intuito de condensar as informações obtidas através da amostragem, em um único número, a estimativa.
g) Precisão: define o poder de um estimador ou, em outras palavras, o quão próximo o estimador consegue estar do verdadeiro valor de um parâmetro de uma população. A precisão de uma estimativa depende, dentre outros fatores, da variabilidade da população, do tamanho da amostra e do delineamento de amostragem empregado no inventário florestal.
h) Exatidão: refere-se ao grau de aproximação de uma estimativa em relação ao parâmetro da população.
Em um inventário florestal, como em qualquer procedimento de amostragem, primeiramente deve-se buscar a exatidão de uma estimativa. Porém, normalmente as pessoas se preocupam com a obtenção da precisão, simplesmente porque isso é fácil de obter. A exatidão será conseguida quando se realizar um inventário visando ao máximo de precisão requerida e eliminar, ou reduzir a um mínimo, o efeito de tendências “bias”.
i) Erro de amostragem: trata-se do erro que se incorre por se avaliar apenas parte da população.
Segundo Shiver e Borders (1996), três fatores aumentam a probabilidade de ocorrência do erro de amostragem: o tamanho da amostra, a variabilidade das unidades de amostra dentro da população e o método de seleção das unidades de amostra. É notório que amostras maiores, selecionadas sem tendência, propiciam estimativas com menor porcentagem de erro. Se todas as unidades de amostra que compõem uma população fossem amostradas (inventário 100%), o erro de amostragem seria igual a zero.
j) Erros de não-amostragem: são aqueles que não são advindos do processo de amostragem. Segundo Husch et al. (2003), os erros de não-amostragem podem contribuir significativamente para o erro da estimativa de um inventário, podendo ser, inclusive, maior que o erro de amostragem. Precauções devem ser tomadas para minimizar a ocorrência desses tipos de erros, pois, uma vez que ocorram, são difíceis de detectar e eliminar; podem ocorrer tanto para o inventário total ou 100% quanto para inventários por amostragem.
Os erros de não-amostragem podem ocorrer de várias maneiras, mas principalmente devido a equívocos na alocação das unidades de amostra, nas tomadas de dados (medições de árvores) ou no registro dos dados ou das observações, emprego de métodos falhos na compilação e erros no processamento dos dados (cálculos, uso de estimadores tendenciosos, falhas nos softwares utilizados etc.).
Os erros de não-amostragem podem ser classificados em dois tipos gerais, dependendo da forma de como eles surgem (excluindo os erros grosseiros ocasionais devido a descuidos ou desatenção):
1) Erros de medição, de ocorrência casual.
2) Erros consistentes, causando tendência “bias”.
Se os erros de medição ocorrerem casualmente, é esperado que a sua média se aproxime de zero. Se a média dos erros é diferente de zero, a tendência é introduzida, causando erros sistemáticos nas estimativas ou “bias”.
Todos os inventários florestais estão sujeitos a erros de amostragem e de não-amostragem. Juntos, eles perfazem o erro total da estimativa. O erro total é a diferença entre a estimativa de uma amostra e o valor verdadeiro da população. Se não existirem erros de não-amostragem, o erro total é equivalente ao erro de amostragem.
2. A estatística na teoria da amostragem
2.1. Variância, desvio-padrão e coeficiente de variação
Em um povoamento florestal, os diâmetros das árvores usualmente apresentam alguma variação. Igualmente se comportam as alturas, os volumes etc. Alguns diâmetros são maiores que a sua média aritmética, uns são menores e outros têm valores bem próximos da média. Evidentemente, o conhecimento sobre a dispersão dos valores dos diâmetros é importante. Não é difícil de se compreender que serão necessárias mais observações para se obter uma boa estimativa da média dos diâmetros e das outras características de um povoamento em que os diâmetros variam de 5 a 25 cm, por exemplo. A medida de dispersão (variação) mais comumente empregada para expressar essa dispersão dos dados, em relação à média, é a variância. Uma grande variância indica maior dispersão; uma variância pequena significa pouca dispersão. A variância da população é estimada pela variância da amostra. O desvio-padrão, o qual expressa quanto os valores observados individuais se dispersam em torno da sua média, é dado simplesmente pela raiz quadrada da variância. O coeficiente de variação é a expressão porcentual do desvio-padrão, em relação à média.
A variância de uma amostra, composta por n unidades de amostra, considerando uma variável aleatória contínua Y~N (µ,s2), é dada por:
em que: S2 = variância estimada; Yi = valor da característica de interesse na i-ésima unidade de amostra; = média aritmética estimada; e n = número de unidades de amostra.
A fórmula computacional simplificada da variância da amostra é:
O desvio-padrão (S), por sua vez, é dado por:
O coeficiente de variação (CV) é:
2.1.1. Exemplo
Para melhor entendimento dos cálculos das medidas de dispersão: variância, desvio-padrão e coeficiente de variação, considere o exemplo hipotético do Quadro 3.1, em que os dados representam os volumes de cinco parcelas tomadas ao acaso em três florestas.
Quadro 3.1 - Volumes, em m3 por parcela, obtidos em três florestas
Embora as três florestas tenham uma mesma produção volumétrica média, podendo indicar uma igualdade entre elas, é evidente que essas florestas são totalmente diferentes entre si. As diferenças entre os volumes individuais observados evidenciam maior ou menor variação entre eles, conforme as estimativas das medidas de dispersão dos volumes em relação às médias apresentadas no Quadro 3.2.
Quadro 3.2 - Estatísticas obtidas nos três tipos florestais
Na floresta I, os valores das medidas de variação são zero, pois os volumes são iguais em todas as parcelas medidas.
Na floresta II, as medidas de dispersão: variância, desvio-padrão e coeficiente de variação são:
Na floresta III, empregando as mesmas expressões, têm-se:
A variância, como medida de variabilidade entre as unidades de amostra, está relacionada muitas vezes ao tamanho da média dessas unidades. Assim, valores observados superiores tendem a dar maiores variâncias. Por exemplo, a variância das alturas das árvores seria maior que a das alturas de uma população de estudantes. O coeficiente de variação, por sua vez, deixa a expressão de variabilidade em uma base relativa. Assim, a população das alturas das árvores pode ter um desvio-padrão de 1,45 m, enquanto o desvio-padrão da população de estudantes pode ser de 0,18 m. Em unidades absolutas, as alturas das árvores variam mais que as dos estudantes. Porém, se a média das alturas das árvores for 13,2 m e a das alturas dos estudantes 1,65 m, as duas populações terão variabilidade relativamente semelhante, com um coeficiente de variação de 11%.
A variância também depende da unidade de medida empregada. Se as alturas dos estudantes tivessem sido medidas em centímetros, o desvio-padrão seria 100 vezes maior, isto é, 0,18 x 100 = 18 cm. Entretanto, o coeficiente de variação seria o mesmo, independentemente da unidade de medida usada na mensuração da característica altura. Em qualquer caso, o coeficiente de variação seria igual a 11%.
2.2. Erro-padrão e erro de amostragem
Igualmente às unidades de amostra individuais numa população, as estimativas da amostra são sujeitas à variação. É óbvio que o volume médio estimado de uma amostra de 15 unidades não será o mesmo obtido de outra de igual tamanho. As estimativas médias diferem entre si porque são observadas em amostras diferentes, embora de mesmo tamanho. As estimativas médias, portanto, dispersam em torno de uma média geral.
Na seção anterior, discutiram-se a variância, o desvio-padrão e o coeficiente de variação como medidas de dispersão dos dados em torno da média. Essas medidas também podem ser empregadas para expressar a variação entre as estimativas médias, no cálculo da variância da média e do erro-padrão da média. Aliás, o termo erro-padrão da média é normalmente denominado erro-padrão.
O erro-padrão é um desvio-padrão entre as estimativas médias, em vez de ser entre as unidades de amostra individuais. De fato, se várias estimativas médias fossem obtidas de repetidas amostragens de uma população, a variância da média e o erro-padrão dessas estimativas poderiam ser computados pelas equações dadas anteriormente para a variância e o desvio-padrão. Entretanto, a amostragem repetida não é necessária no inventário florestal. A variância da média e o erro-padrão podem ser obtidos de um único conjunto de unidades de amostra. O cálculo dessas medidas de variabilidade de uma estimativa média depende do método de amostragem, do tamanho da amostra e da variabilidade entre as unidades de amostra.
Uma estimativa média quase não possui valor se não houver indicação de sua confiabilidade. Em termos gerais, o erro-padrão é a medida que expressa o grau de confiabilidade de uma estimativa média.
Conhecido o erro-padrão, é possível estabelecer os limites que definem o grau de aproximação esperado para o parâmetro que estiver sendo estimado. Esses são chamados de limites de confiança. Em grandes amostras, pode-se, grosseiramente, estabelecer que os verdadeiros valores dos parâmetros estarão a um erro-padrão do valor estimado, a menos que tenha ocorrido uma chance em três na amostragem (33,33%). Para um valor médio do diâmetro igual a 26,5 cm, com um erro-padrão de 2,5 cm, pode-se dizer que a média verdadeira da população se encontra dentro dos limites de 24,0 a 29,0 cm. Assim, esses valores são chamados de limites de confiança, em uma probabilidade de 67%.
Ampliando os limites para outros níveis de probabilidade, pode-se ter mais confiabilidade na inclusão do parâmetro da população. Na estimativa da média de mais ou menos dois erros-padrão, têm-se os limites de confiança para o parâmetro, a menos que uma chance em 20 ocorra (5%), ou seja, definem-se os limites de confiança para uma probabilidade de 95%. Semelhantemente, os limites de confiança para a probabilidade de 99% são definidos considerando-se mais ou menos 2,6 erros-padrão. Esse intervalo de confiança conterá o verdadeiro valor do parâmetro da população, a menos que uma chance em 100 ocorra.
Deve-se enfatizar que esse método de computar os limites de confiança fornecerá válidas aproximações somente em grandes amostras; em geral, uma amostra grande é composta de pelo menos 30 observações. Entretanto, os limites de confiança podem se tornar mais amplos em dado nível de probabilidade, multiplicando-se o erro-padrão pelo valor de “t”, encontrado na tabela de distribuição de Student.
O erro-padrão da média, ou simplesmente erro-padrão, para uma população infinita é calculado pela seguinte expressão:
Utilizando o exemplo anterior, nas florestas II e III os erros-padrão são, respectivamente:
* Floresta II
* Floresta III
Os erros-padrão expressos em porcentagem das respectivas médias, nas duas florestas são:
* Floresta II
* Floresta III
Tais erros-padrão, portanto, multiplicados pelos valores de “t”, em determinado nível de probabilidade, expressam o erro de amostragem, tanto em unidades absolutas () ou em porcentagem da média estimada, dado por:
Assim, nas florestas II e III, os erros de amostragem, considerando um nível de probabilidade de 95% e valor de t = 2,776, para quatro graus de liberdade, são, respectivamente:
* Floresta II
* Floresta III
2.3. Fator de correção para populações finitas
Seja N o número total de unidades de amostra que compõem uma população e que uma amostra de tamanho n tenha sido selecionada nessa população. Então, a fração de amostragem, ou intensidade de amostragem, é n/N. Assim, o erro de amostragem se deve à parte não incluída no inventário, ou seja, à fração 1-n/N (VAN LAAR; AKÇA, 2007). No caso de um inventário 100%, essa fração será zero, pois n = N.
O valor, ou fração 1-n/N, é denominado “fator de correção para populações finitas”. Esse valor é incluído na expressão do erro-padrão da média () para se obter uma estimativa apropriada do erro-padrão.
O erro-padrão da média para uma população finita é, portanto, calculado pela seguinte expressão:
2.4. Intervalo de confiança (IC) e a estimativa mínima confiável (EMC)
As estimativas dos inventários florestais podem ser expressas num intervalo, com uma probabilidade associada, denominado Intervalo de Confiança (IC). Como se sabe, o intervalo de confiança, que é delimitado pelos limites de confiança, descreve os limites dentro dos quais se espera encontrar o verdadeiro valor do parâmetro da população, a um dado nível de probabilidade. Os limites superior e inferior do intervalo de confiança para a média () são expressos pelo correspondente erro de amostragem. Assim, o intervalo de confiança para determinada estimativa média é dado por:
O valor de “t”, para um nível de probabilidade selecionado, é obtido da tabela de distribuição de Student, usando-se n-1 graus de liberdade, em que n é o tamanho da amostra.
No exemplo anterior, os intervalos de confiança da média estimada nas florestas II e III seriam, respectivamente:
* Floresta II
* Floresta III
Como não existe volume negativo (20 - 24,568 m3), o limite inferior do intervalo de confiança na floresta III é igual a zero.
A estimativa da quantidade de madeira obtida em um inventário, em vez de ser expressa pela média e seu intervalo de confiança, pode o ser também pela Estimativa Mínima Confiável (EMC), que expressa a quantidade mínima de madeira que se esperava encontrar, associada a um nível de probabilidade.
No cálculo da EMC, é necessário conhecer a média e o seu erro-padrão, sendo a expressão da EMC dada por:
Observe que essa expressão se parece com aquela que expressa o limite inferior do intervalo de confiança (IC). Porém, o valor de “t”, para um nível de probabilidade definido, é obtido somente pelo lado negativo da distribuição simétrica dos valores (teste unilateral). Usando uma tabela de “t”, o valor apropriado seria obtido na coluna correspondente a duas vezes o nível de probabilidade requerido. Assim, o valor de “t”, considerando um nível de probabilidade de 95% (α = 5%), será lido sobre a coluna de indicação de 0,10 (10%), reconhecendo-se os graus de liberdade apropriados.
No exemplo anterior, as estimativas mínimas confiáveis, da média estimada nas florestas II e III, considerando-se t = 2,132, para α = 10% e quatro graus de liberdade, seriam, respectivamente:
* Floresta II
* Floresta III
3. Delineamento de amostragem
De acordo com Husch et al. (2003), um delineamento de amostragem, para atingir os objetivos de qualquer inventário florestal, é determinado:
1) Pelo tipo de unidade de amostra.
2) Pelo tamanho, forma e alocação da unidade de amostra escolhida (quando o inventário utiliza unidades de amostra de área fixa).
3) Pelo número de unidades de amostra a ser empregado.
4) Pela forma de seleção e distribuição das parcelas sobre a floresta.
5) Pelos procedimentos adotados de medição das árvores nas unidades selecionadas e análise dos dados resultantes.
Diante disso, o profissional envolvido em um inventário florestal dispõe de ampla gama de possibilidades para conduzir essa atividade, pela variedade de especificações em cada um dos elementos mencionados anteriormente, para se conseguir o grau de precisão desejado, a um custo especificado.
É importante ter a consciência de que não existe um único delineamento de amostragem de aplicação universal. Um delineamento de amostragem é o produto final de uma série de considerações.
Os principais fatores que influenciam o delineamento ou o planejamento de um inventário florestal são:
a) Os objetivos do inventário.
b) Os recursos disponíveis.
c) As condições topográficas e a acessibilidade à área.
d) A tipologia florestal e a sua variabilidade.
e) A precisão requerida em torno da média.
3.1. Tipos, formas, tamanhos e alocação das unidades de amostra
Um dos objetivos centrais da mensuração florestal, segundo Prodan et al. (1997), é a obtenção do valor total de algum atributo relacionado às árvores que compõem a floresta (área basal, volume etc.). Como, as vezes, é impossível realizar o censo ou inventário 100%, os inventários florestais são feitos por amostragem, sendo as árvores selecionadas individualmente ou em grupos, denominados “unidades de amostra,” para a obtenção de estimativas dos atributos da floresta.
As unidades de amostra, unidades básicas onde são executadas as medições de características quantitativas e qualitativas da população, podem possuir área fixa (parcelas ou faixas) ou área variável, no caso da amostragem por pontos; ser constituídas por linhas de amostragem; ou, ainda, ser a própria árvore, no caso dos procedimentos envolvendo árvores-modelo (figuras a seguir).
As parcelas de área fixa podem se assemelhar a diferentes figuras geométricas, entre elas:
Fonte: Loetsch e Haller (1964), Loestch et al. (1973), Prodan (1968), Shiver e Borders (1996) e Malleux (1982).
A respeito da forma dessas unidades de amostra, a literatura descreve aspectos que devem ser observados.
a) Os centros das unidades de amostra circulares podem ser facilmente marcados.
b) Os limites de uma unidade de amostra circular não são facilmente determinados, ao contrário das unidades quadradas ou retangulares.
c) Em terrenos com declividade acentuada, devem-se utilizar preferencialmente parcelas retangulares, de forma que o seu maior eixo fique orientado no sentido da declividade.
d) As parcelas retangulares têm grande porcentagem de bordadura, efeito esse que é mínimo em parcela circular. Isso aumenta a possibilidade de se incorrer em erros de não amostragem, pela inclusão ou omissão incorreta de indivíduos na borda de parcelas quadradas ou retangulares.
e) Parcelas que apresentam mais de 50 m de comprimento são comumente definidas na literatura como transectos ou faixas. Tais unidades de amostra permitem delimitar, com facilidade, a variabilidade do ambiente que será estudado. São freqüentemente utilizados quando há hipótese de haver diferenças ou variações na quantidade de um parâmetro de acordo com um gradiente ambiental, normalmente associado à topografia.
Quanto ao tamanho da unidade de amostra, não há informações acerca de qual seria o melhor tamanho.
De acordo com Schreuder et al. (1993), a unidade de amostra deve ter um tamanho tal que seja suficiente para incluir um número representativo de árvores, porém pequeno o suficiente para que a relação entre o tempo de estabelecimento versus tempo de trabalho na coleta de dados dessa unidade não seja alta em demasia, o que oneraria os custos desse inventário.
Ainda de acordo com Schreuder et al. (1993), quando são utilizadas parcelas muito grandes no inventário florestal, um pequeno número de unidades de amostra é utilizado para obtenção das estimativas. Isso pode acarretar problema de ordem estatística, pois reduz consideravelmente os graus de liberdade para cálculo das estatísticas como variância, desvio-padrão, erro-padrão, entre outras.
Assim, não há um tamanho ótimo de unidade de amostra, haja vista, que este depende do grau de agrupamento das árvores (densidade), do custo do processo de amostragem e da precisão das estimativas. Na verdade, existe um intervalo limitado de tamanhos, no qual a eficiência da amostragem é máxima, tanto em termos de precisão quanto de custo.
Para ilustrar essa observação, na literatura os tamanhos das unidades de amostra mais utilizados em alguns países são: 100 a 500 m2, Alemanha; 800 a 1.000 m2, Canadá; 800 m2, Estados Unidos; 1.000 m2, Finlândia; 400 m2, Inglaterra; e 500 a 2.000 m2, Japão. No Brasil, inúmeros inventários utilizam parcelas circulares ou retangulares entre 300 e 600 m2, em florestas plantadas; e parcelas retangulares entre 1.000 e 2.500 m2, em florestas naturais.
Cabe destacar que em povoamentos que são desbastados, ou seja, que sofreram retiradas de madeira ao longo da sua rotação, as parcelas devem possuir um tamanho que, ao final da rotação, garanta um número razoável de árvores para obtenção de estimativas precisas do estoque de madeira Campos e Leite (2009). Em alguns trabalhos envolvendo desbaste em plantações de eucalipto no Brasil, as parcelas utilizadas estão em torno de 1.000 a 2.000 m2 de área.
Quanto à alocação das unidades de amostra, alguns cuidados devem ser tomados:
1) Em plantios, por exemplo, a alocação das unidades de amostra de área fixa deve obedecer às linhas de plantio, para que as unidades representem a área útil de cada planta. O seguinte exemplo ilustra essa situação.
Considerando um espaçamento de 3 x 3 m entre plantas, a área útil de cada planta será de 9 m2. Se forem utilizadas árvores como limites da unidade de amostra, conforme a figura a seguir, ter-se-iam nove árvores em uma parcela de 36 m2 de área, representando uma área útil por planta de 4 m2. Para representar a área útil de 9 m2, a unidade de amostra deveria ter sido locada entre as linhas de plantio.
2. Em terrenos com declividade maior do que 10o, a área da unidade de amostra deve ser corrigida, de forma que fique no mesmo plano de referência (horizontal) dos mapas utilizados para a definição do desenho da amostragem. A correção da área da unidade de amostra é feita pela seguinte expressão:
em que: Ar = área reduzida ou área projetada no plano horizontal, em m2; a = menor lado da parcela, em m; b = maior lado da unidade de amostra, em m; e = ângulo de inclinação do terreno, em graus.
3.2. Tamanho da amostra
O tamanho de uma amostra é dependente do objetivo do inventário; dos recursos disponíveis; da precisão requerida, dada pelo erro admissível em torno da média, em determinado nível de probabilidade; da variabilidade da característica a ser medida; e do método de seleção e distribuição das unidades de amostra.
Segundo Campos e Leite (2009), há dois critérios para se definir o tamanho de uma amostra em um inventário florestal, sendo eles:
1) Em função de determinada porcentagem da área da população a ser amostrada. Nesse caso, não há como estabelecer a precisão da amostragem com antecipação, e o erro do inventário só será conhecido após a sua conclusão. Por exemplo, algumas empresas do setor florestal definem uma intensidade de 1:5 para um inventário pré-corte. Isso quer dizer que, a cada 5 ha, uma unidade de amostra de tamanho conhecido será lançada e medida no campo. Considerando que uma floresta tenha 100 ha e a unidade de amostra possua 1.000 m2, serão lançadas 20 parcelas, correspondendo a uma área total de amostragem igual a 2,0 ha, ou 2,0% da área da floresta. A experiência adquirida pelo profissional e o conhecimento prévio dessa área são fundamentais para decidir quanto à utilização de um percentual de amostragem da população.
2) Em razão de um erro de amostragem estabelecido antecipa-damente, segundo determinado nível de probabilidade. Esse critério de estabelecimento do tamanho da amostra é definido como método ótimo de amostragem, devido ao fato de que o número de unidades de amostra a ser medido será compatível com um erro máximo preestabelecido.
De acordo com esse critério, a expressão que determina o número de unidades de amostras necessário para atingir determinado nível de precisão, a dado nível de probabilidade, é dada por:
Para populações infinitas:
Populações finitas:
em que: n = tamanho da amostra; E = precisão requerida ou erro admissível em torno da média, em termos absolutos; S2 = variância da característica analisada nas unidades de amostra; t = valor tabelado da estatística “t” de Student, a dado nível de significância (a) e n-1 graus de liberdade; e N = número total de unidades de amostra na população.
No caso de a precisão requerida ser estabelecida em termos porcentuais (E%), as expressões anteriores ficam assim redefinidas:
Para populações infinitas:
Para populações finitas:
Uma vez definidos o tipo de unidade da amostra e o tamanho da unidade a ser empregada na amostragem (no caso de unidades de área fixa); conhecida a área da população e definida a precisão requerida, em valores absolutos ou em porcentagem, torna-se necessária a obtenção de uma estimativa da variabilidade da característica de interesse na população (S ou CV) para determinar o tamanho da amostra. Às vezes, tal estimativa pode ser obtida de levantamentos passados. Porém, quase sempre é obtida em uma amostragem preliminar, através de um inventário-piloto.
A precisão requerida (E) é arbitrariamente escolhida. O valor da estimativa t depende do nível de probabilidade escolhido e dos graus de liberdade. Para uma correta definição do valor de t, os graus de liberdade deveriam ser o número de unidades de amostra que se procura. No entanto, como se conhece apenas o tamanho da amostra preliminar, esse valor é utilizado para definir o valor de t em uma primeira aproximação do tamanho da amostra. Essa primeira aproximação é, então, utilizada para corrigir os graus de liberdade do valor de t e, conseqüentemente, definir finalmente o tamanho da amostra.
3.2.1. Exemplo – Precisão requerida em termos absolutos
Para ilustrar o procedimento de cálculo do tamanho da amostra, suponha que em um inventário-piloto foram utilizadas 10 parcelas de 800 m2 cada, distribuídas casualmente numa população de eucalipto de 250 ha e cujos volumes das parcelas estão apresentados a seguir. Suponha, também, que a precisão requerida (E) seja igual a ± 3 m3 e o nível de probabilidade igual a 95%.
Com base nos dados acima, podem-se calcular as seguintes estatísticas:
a) Média estimada
b) Variância da amostra
c) Desvio-padrão
d) Coeficiente de variação
e) Tamanho da amostra
De posse das informações anteriores e da estimativa da variância populacional (S2), o tamanho da amostra (n) pode ser calculado de acordo com o procedimento que se segue:
Uma vez que a área de cada unidade de amostra é de 0,08 ha, na população cabem 3.125 unidades de amostra (N). Sendo o valor tabelado de t em um nível de probabilidade igual a 95% e 9 graus de liberdade, igual a 2,262, a primeira aproximação do tamanho da amostra será:
n = 29 parcelas
Recalculando para t(5%; 28 gl) igual a 2,048, tem-se que o tamanho da amostra será:
n = 24 parcelas
Conclusão: Para garantir a precisão requerida de ± 3 m3 são necessárias 24 parcelas. Posto que 10 parcelas já foram medidas no inventário-piloto, basta sortear e medir mais 14 parcelas para completar a amostra.
Dividindo 24 por 3.125, encontra-se a intensidade da amostra necessária para o atendimento da precisão requerida, no nível de probabilidade estabelecido. Nesse exemplo, ter-se-ia uma intensidade igual a 0,00768 ou 0,768% de N.
3.2.2. Exemplo – Precisão requerida em porcentagem
Conhecendo-se a precisão requerida em termos absolutos e a média aritmética da variável de interesse, pode-se obter a precisão requerida em termos porcentuais, através da seguinte expressão:
Do exemplo anterior, uma precisão de ± 3 m3, corresponde a:
Considerando uma precisão requerida de ± 13,486%, a 95% de probabilidade, e utilizando os dados do exemplo anterior, a primeira aproximação para o tamanho da amostra será:
n = 29 parcelas
Recalculando para t(5%, 28 gl) = 2,048, tem-se que o tamanho da amostra será:
n = 24 parcelas
Verifica-se com esse resultado que, independentemente da expressão do erro (absoluto ou relativo), 24 unidades de amostra seriam necessárias para satisfazer a precisão requerida, no nível de 95% de probabilidade.
3.2.3. Exemplo – Alterando a precisão requerida
Alterando a precisão requerida de ± 13,486% para ± 20%, ou seja, diminuindo a precisão do inventário e mantendo o nível de probabilidade de 95%, a primeira aproximação para o tamanho da amostra será:
n = 14 parcelas
Recalculando para t(5%, 13 gl) = 2,160, tem-se que o tamanho da amostra será:
n = 12 parcelas
Nesse caso, diminuindo-se a precisão do inventário através do aumento do erro admissível (E%), em vez de 24 parcelas seriam necessárias apenas 12, ou seja, seria preciso lançar e medir apenas mais duas parcelas no campo.
3.2.4. Exemplo – Alterando o nível de probabilidade
Alterando o nível de probabilidade de 95% para 90%, ou seja, diminuindo a precisão do inventário e mantendo a precisão requerida em ±20%, a primeira aproximação para o tamanho da amostra será:
* t(10%; 9 gl) = 1,833
n = 9 parcelas
Recalculando para t(10%; 8 gl) = 1,860, tem-se que o tamanho da amostra será:
n = 9 parcelas
Nesse caso, diminuindo-se o nível de probabilidade e mantendo-se a precisão requerida de ±20%, em vez de 12 parcelas seriam necessárias apenas nove. Assim, as 10 unidades de amostra utilizadas no inventário-piloto seriam suficientes para atender à precisão requerida no nível de probabilidade especificado.
3.2.5. Transformando unidades
Na estimativa do tamanho da amostra (n), deve-se conhecer o efeito da escala de conversão dos valores unitários, na estimativa da variância de população (S2). O mau uso da conversão dos volumes por unidade de área e o desconhecimento da variabilidade dos volumes entre as parcelas de diferentes áreas podem produzir estimativas tendenciosas dos parâmetros da população.
Para ilustrar o emprego das escalas de conversão, seja um inventário utilizando parcelas de 1.000 m2 de área (1/10 do hectare), cuja variância (S2) entre os volumes das parcelas foi igual a 45,33(m3)2. Se a precisão requerida fosse expressa em m3 por hectare, seria necessário converter a especificação da precisão, colocando-a na mesma unidade do desvio-padrão (S), ou converter a variância (S2) de forma que ambas, a variância e a precisão requerida, fiquem na mesma escala de valores ou numa mesma base comparativa. Para converter a precisão requerida, nesse exemplo basta dividi-la por 10 e manter a variância inalterada. O mesmo resultado pode ser obtido deixando a precisão especificada sem alteração e colocando a variância na base comparativa de 1 ha. Lembre-se de que, se Y é uma variável com desvio-padrão, , o desvio-padrão da variável Z = KY será ; logo, a variância
Nesse exemplo, se os volumes por parcela são 10 vezes menores que as estimativas por hectare, eles devem ser multiplicados por 10, para serem convertidos em hectare. Ou, para se colocar a variância estimada na base de 1 ha, basta multiplicá-la por 100. A constante de conversão K é dada pela razão entre a área de 1 ha e a área da unidade de amostra, considerando-se o exemplo anterior
O tamanho da unidade de amostra tem efeito adicional na variabilidade da população. É esperado que a variabilidade entre os volumes medidos em parcelas de menores tamanhos seja maior do que a obtida com o emprego de maiores parcelas, numa mesma escala de medição. A relação entre o tamanho da parcela e a variância da população muda de uma população para outra. Em populações muito homogêneas e uniformes quanto à distribuição da variável de interesse, alterações nas áreas das parcelas têm pouco efeito sobre a variância. Em populações cujas distribuições de freqüência e de ocorrência são heterogêneas ou desuniformes, a relação entre o tamanho da parcela e a variância dependerá da capacidade de representação do tamanho da parcela, principalmente quanto às alterações naturais de aglomeração de árvores e de espécies e quanto à existência de clareiras, mais comuns em populações de baixa densidade. As maiores parcelas tendem a representar uma variância menor. A utilização de grandes parcelas, comparativamente às parcelas de menores áreas, é feita para que nelas sejam captadas todas as alterações naturais da população, de forma que a variabilidade entre as parcelas seja menor.
Essa mudança da variância em relação ao tamanho da parcela pode ser aproximada, considerando-se a seguinte relação: se parcelas de tamanho , apresentam variância , então nas parcelas de tamanho , mantendo a mesma escala de medição, a variância , será mais ou menos igual a:.
Por exemplo, se a variância entre os volumes por unidade de amostra de 800 m2 fosse , a variância entre os volumes por unidade de amostra de 2.000 m2 seria, aproximadamente, igual a: .Assim, o valor corrigido da variância pode ser empregado no cálculo do tamanho da amostra, conforme exemplificado anteriormente.
3.3. Seleção e distribuição das unidades de amostra
O terceiro componente de um delineamento de amostragem consiste basicamente em como as unidades de amostra serão selecionadas e distribuídas em campo, no caso de um inventário florestal. Os métodos de seleção e distribuição de unidades de amostra podem ser classificados em dois grandes grupos; os probabilísticos e os não-probabilísticos.
Na amostragem probabilística, a probabilidade de seleção de qualquer unidade de amostra é conhecida. Ela é maior que zero e pode ser a mesma em todas as unidades, em todos os momentos da seleção da unidade, ou variar com o progresso da amostragem. Freqüentemente, nos trabalhos de inventário florestal as probabilidades não são conhecidas, mas assumidas serem iguais em todas as unidades de amostra.
Na amostragem não-probabilística, as unidades que constituem a amostra não são selecionadas pelas leis da chance, mas pelo julgamento pessoal ou sistematicamente.
Como exemplo de métodos de seleção e distribuição probabilísticos, tem-se:
1. Amostragem com igual probabilidade de seleção das unidades de amostra
1.1. Amostragem casual simples
1.2. Amostragem casual estratificada
1.3. Amostragem multiestágio
1.4. Amostragem multifase
2. Amostragem com probabilidade variável
2.1. Amostragem por listagem
2.2. Amostragem com probabilidade proporcional à predição – 3P
2.3. Amostragem proporcional ao tamanho – PPS
Como exemplo de procedimentos não-probabilísticos, tem-se:
1. Amostragem seletiva
2. Amostragem sistemática
4. Referências Bibliográficas
CAMPOS, J.C.C.; LEITE, H.G. Mensuração florestal: perguntas e respostas. 3a ed. Viçosa, MG: Editora UFV, 2009. 548 p.
HUSCH, B.; MILLER,C.I; KERSHAW, J. Forest mensuration. 4. ed. New Jersey: John Willey e Sons, Inc, 2003. 443 p.
LOETSCH, F.; HALLER, K.E. Forest inventory. BLV-Munchen: Basel, Wien. 1964. v. 1, 436 p.
LOETSCH, F.; HALLER, K.E.; ZOHRER, F. Forest inventory. 2. ed. Munich: BLV Verlagsgesellschaft, 1973. v. 2, 469 p.
MALLEUX, J. Inventarios forestales en bosques tropicales. Peru: Univesidad Nacional Agrária, 1982.
PRODAN, M. Mensura forestal. [s.l.]: IICA BMZ/GTZ. 1997. v. 1, 560 p. (Serie Investigacion y educacion en desarrollo sostenible).
SCHREUDER, H.T.; GREGOIRE, T.G.; WOOD. G.B. Sampling methods for multire-source forest inventory. New York: John Wiley & Sons, Inc., 1993. 446 p.