Weibull: uma função flexível
1. Preliminares
A distribuição de probabilidades Weibull foi proposta primeiramente por Fisher e Tippet em 1928, tendo sido desenvolvida independentemente por Waloddi Weibull, físico sueco, em 1939 no estudo de resistência de materiais. A partir da Segunda Guerra Mundial o seu trabalho se destacou e a distribuição passou a ser chamada pelo seu nome: “Weibull”. A função de distribuição de Weibull é a terceira função mais empregada na estatística, sendo suplantada apenas pela distribuição normal e pela distribuição gama.
A função de distribuição de Weibull é a função uma das mais empregada na caracterização da estrutura diamétrica de florestas equiâneas, não havendo, contudo, restrições de seu uso em florestas inequiâneas. A princípio parece uma incoerência afirmar a possibilidade do uso da função Weibull para estas florestas, haja vista a diferença entre as estruturas diamétricas, ou seja, as florestas equiâneas apresentam uma distribuição diamétrica tendendo à distribuição normal enquanto que a distribuição diamétrica das florestas inequiâneas apresentam-se como um J-invertido (exponencial negativa). No entanto, a capacidade da função descrever curvas com diferentes formas é a sua principal característica e a principal vantagem sobre as demais funções, tornando a função Weibull uma função flexível.
2. A Função Weibull
e
em que: x = variável aleatória; α ≥ 0; β > 0 e ϒ > 0, os parâmetros da distribuição.
A função densidade acumulada (f.d.a.) é dada por:
em que:
F(x) = probabilidade acumulada.
O parâmetro α (alfa) é chamado de parâmetro de posição, pois controla a posição da curva sobre o eixo das abscissas (Figura abaixo).
O parâmetro β (beta) é denominado de parâmetro de escala. Este parâmetro controla as dimensões que a curva assume, dada uma forma constante. À medida que β aumenta a curva tende a se tornar mais dispersa (Figura a seguir).
O parâmetro Ƴ (gama) é chamado de parâmetro de forma, por controlar as diferentes formas que a distribuição pode assumir. Se ϒ ≤ 1 a função apresenta a forma de “J-invertido” e, igual a distribuição exponencial, se ϒ = 1. Se 1 < ϒ ≤ 3,6 a distribuição apresenta-se assimétrica à direita e, especialmente, igual a distribuição normal, se ϒ = 3,6. Para ϒ > 3,6 a distribuição apresenta-se assimétrica à esquerda. A figura abaixo mostra o comportamento das curvas, variando o parâmetro de forma e mantendo-se os demais constantes.
Quando o parâmetro α é igual a zero (α =0) a função Weibull é denominada de “Weibull 2 parâmetros”. A função densidade acumulada da função Weibull com 2 parâmetros, neste caso, é dada por:
Cabe destacar que se o parâmetro alfa (α) for igual a zero assume-se que a distribuição tem seu começo nas coordenadas x,y (0,0), o que nem sempre é correto quando esta função é utilizada em estudos de distribuição diamétrica de florestas, uma vez que estipula-se um diâmetro mínimo de medição, isto é, a distribuição não sai da origem. Assim, é comum assumir que o parâmetro alfa (α) seja um valor fixo e igual ao limite inferior da menor classe de diâmetro ou é possivel estimá-lo, de acordo com diferentes métodos de estimação.
3. Métodos de Ajuste
Os principais métodos de ajuste da função Weibull, segundo BATISTA (1989), são:
· Métodos de Máxima Verossimilhança;
· Métodos baseados nos momentos da distribuição;
· Métodos de funções lineares;
· Métodos de regressão linear e não linear.
Segundo BAILEY E DELL (1973), de modo geral, as estimadores de máxima verossimilhança são considerados os melhores. No entanto, o estimador de máxima verossimilhança para ¡ é tendencioso, sendo a tendenciosidade dependente do tamanho da amostra. O método de regressão linear, por sua vez, é o método mais fácil de ser utilizado, necessitando apenas da linearização da função densidade acumulada (f.d.a.).
3.1. Regressão Linear
A linearização da função densidade acumulada de Weibul dois parâmetros é dada a seguir. No entanto, deve-se salientar que, no caso da distribuição com três parâmetros, tendo como parâmetro alfa (α) uma constante igual, por exemplo, ao limite inferior da menor classe de diâmetro (α), ter-se-ia a mesma sequência de passos que serão apresentados a seguir, no entanto a variável x seria substituída por (x - α).
Seja a função densidade acumulada (f.d.a):
Rearranjando a expressão anterior, tem-se:
Aplicando o logaritmo (Ln) nos dois lados da igualdade, obtém-se:
Multiplicando os dois lados da igualdade por -1, tem-se:
Aplicando o logaritmo novamente, a expressão fica assim redefinida:
ou
Fazendo:
e
Obtém-se o seguinte modelo de regressão linear:
De posse das estimativas dos coeficientes da expressão anterior (obtidos por Métodos dos Mínimos Quadrados Ordinários), os parâmetros da f.d.a podem ser obtidos por:
3.2. Método de Máxima Verossimilhança
O método de Máxima Verossimilhança, ao invés de mínimizar a soma de quadrados de resíduos, como no Método dos Mínimos Quadrados Ordinários (MQO), máxima a probabilidade de ocorrência dos valores de uma amostra.
No caso da função Weibull dois parâmetros, os estimadores de Máxima Verossimilhança dos parâmetros β e ϒ da função, para dados agrupados em n classes são obtidos por (Gove e Fairweather, 1989):
onde observa-se que o parâmeto gama (ϒ) da função é obtido por meio de um processo iterativo e que o parâmetro beta (β) é estimado em função da estimativa de gama.
No caso da função com três parâmetros, sendo o parâmetro alfa (α) constante e igual ao limite inferior da menor classe de diâmetro (α), o termo xi nas expressões anteriores seria substituído por (xi -α).
3.3. Regressão não linear
A função densidade acumulada da função Weibull com 2 parâmetros, é dada por:
em que: F(x) = probabilidade acumulada; x = variável aleatória, por exemplo, o centro de classe diamétrica.
A expressão anterior pode ser considerada um modelo não linear e seus parâmetros obtidos por processos iterativos, de acordo com algorítimos que minimizam a soma de quadrados dos reísduos (Marquardt, Gauss-Newton, Newton-Raphson, Simplex,...).
Ainda, em algumas situações na mensuração florestal, substitui-se a probabilidade acumulada F(x) na expressão anterior pelo número de árvores por hectare e acrescenta-se um parâmetro (A) a mais na função, caracterizando o seu valor assintótico. Desta forma, a expressão anterior ficaria assim redefinida:
Assim, ao invés de estimar a probabilidade do número de árvores em uma dada classe de diâmetro, estima-se diretamente o número de árvores por classe.
4. Referência bibliográfica
BAILEY, R.L.; DELL, T.R. Quantifying diameter distributions with a Weibull function. Forest Science, Bethesda, v.19, n.2, p.97-104. 1973.
BATISTA, J.L.F. A função weibull como modelo para a distribuição de diâmetros de espécies arbóreas tropicais. Piracicaba: ESALQ/SP 1989. 116p. Escola Superior de Agricultura “Luiz de Queiroz”- Dissertação (Mestrado em Ciências Florestais)
GOVE, J.H.; FAIRWEATHER, S.E. Maximum-likelihood estimation of Weibull function parameters using a general interactive optimizer and grouped data. Forest Ecology and management, v.28, p.61-69. 1989.