Relação altura-diâmetro
1. Introdução
É prática comum nos procedimentos de inventário florestal o uso de equações hipsométricas, também conhecidas como equações de relação altura-diâmetro, para estimar as alturas das árvores dentro das unidades de amostragem. Tal procedimento se faz necessário para aumentar o rendimento das equipes de medição no campo, reduzindo o custo do inventário, garantindo precisão das estimativas de altura.
Na literatura existem vários modelos hipsométricos, no entanto neste exemplo iremos mostrar o ajuste de dois modelos amplamente empregados por meio do software R, bem como os procedimentos para a seleção da melhor equação.
2. Exemplo:
Os modelos avaliados neste exemplo, serão:
Os seguinte dados foram utilizados para o desenvolvimento deste exemplo, os quais foram salvos no arquivo exemplo2:
Para conhecer o comportamento das variáveis, elaborou-se o seguinte gráfico de distribuição das alturas das árvores em relação ao seu diâmetros, utilizando-se os seguintes comandos:
De acordo com a figura a seguir, obtida com os comandos anteriores, existe uma tendência não linear assintótica das alturas das árvores em relação aos seus diâmetros.
2.1. Ajuste da equação 1
A equação referente ao modelo 1, foi ajustada pelo Método dos Mínimos Quadrados, por meio dos seguintes comandos:
Os resultados do ajuste foram:
Cabe destacar que o parâmetro β0 da equação 1 foi estatisticamente diferente de zero pelo teste “t” (p-valor = 0,454). Neste caso, para estimar os parâmetros do modelo sem esta constante, basta acrescentar o termo " -1" no comando do ajuste da equação, conforme mostrado no item 4 do post " Regressão linear".
Para ajudar avaliar o ajuste da equação foram elaborados dois gráficos de dispersão: 1) alturas estimadas em relação às alturas observadas e 2) valores dos resíduos em relação às alturas estimadas, utilizando os seguintes comandos:
Os respectivos gráficos de distribuição, foram:
2.2. Ajuste da equação 2
A equação referente ao modelo 2 também foi ajustada pelo Método dos Mínimos Quadrados, por meio dos seguintes comandos, semelhantes aos anteriores, para o modelo 1. Cabe destacar que no software R, log(h) é o logarítmo natural de h, ou seja, ln(h).
Os resultados do ajuste foram:
Para possibilitar a comparação dos gráficos da equação 2 com os da equação 1, eles foram elaborados considerando as estimativas de altura na unidade original, em metros, de acordo com os seguintes comandos:
Desta forma, com os comandos anteriores, obtiveram-se os seguintes gráficos:
3. Seleção da mehor equação
Após os ajustes, as medidas de precisão das equações foram:
De acordo com os resultados, a equação referente ao segundo modelo ajustou-se melhor aos dados observados. No entanto, as medidas de precisão não são diretamente comparáveis, uma vez que as variáveis dependentes estão em escalas diferentes e, portanto, não se pode afirmar que a segunda equação foi a melhor.
Neste caso, as medidas de precisão da equação 2, obtidas considerando a variável dependente transformada pela aplicação de logaritmo, devem ser recalculadas na unidade original da variável. Com isso, torna-se possível possível a comparação entre as medidas de precisão das duas equações, no processo de seleção de equações.
Cabe lembrar que na elaboração dos gráficos do ajuste da equação 2, na unidade original, foi necessário calcular as alturas estimadas das árvores na unidade original (hest) e calcular os resíduos na unidade original (resid), por meio dos seguintes comandos:
Assim sendo e utilizando estas variáveis (hest e resid), juntamente com os seguintes comandos, pode-se calcular as medidas de precisão da equação 2 na unidade original da variável dependente (metros):
As medidas de precisão da equação 2, nas unidades originais, foram:
Comparando-se, então, as medidas de precisão das equações na unidade original da variável dependente, pode-se concluir que a equação 1 foi mais precisa do que a equação 2.
Como complemento, cabe destacar que no processo de seleção de equações referentes a um conjunto de modelos avaliados, além de critérios estatísticos (medidas de precisão e significância dos parâmetros) e comportamento gráfico dos resíduos, deve-se avaliar, também, o realismo biológico e a coerência matemática dos modelos. Como exemplo, muitos trabalhos testam modelos polinômiais de grau elavado, que se ajustam muito bem aos dados observados pelo grande número de parâmetros, mas não tem significado algum com a distribuição dos dados.