Search in book...
Toggle Font Controls
Create new playlist

Name your new playlist

Playlist description (optional)
Sign In

Email address

Password

Forgot Password?

or

Continue with Facebook

Continue with Google
Sign Up

Full Name

Email address

Confirm Email Address

Password

or

Continue with Facebook

Continue with Google

Appendix C

Quasi-likelihood functions and properties

The term quasi-likelihood function was initially introduced by Wedderburn (1974). While providing a way of allowing for overdispersion in statistical analysis, quasi-likelihood estimating equations are mostly applied for grouped binary or count data. In theories underlying this model, the quasi-likelihood function is shown to have similar properties to the log-likelihood function. Briefly, in this perspective, only relationship between the mean and the variance is specified in the form of a variance function.

Suppose we have independent observations Y_i (i = 1, …, N) with expectation μ_i and variances V(μ_i), where V(·) is some known function. Let each observation μ_i be some known function of parameters $β = (β_{1}, ..., β_{M})'$ $β = (β_{1}, ..., β_{M})'$ . Then for each observation the quasi-likelihood function, denoted by $Q (Y_{i}, μ_{i})$ $Q (Y_{i}, μ_{i})$ , is defined by the relation

$\frac{\partial Q (Y_{i}, μ_{i})}{\partial μ_{i}} = \frac{Y_{i} - μ_{i}}{V (μ_{i})},$ $\frac{\partial Q (Y_{i}, μ_{i})}{\partial μ_{i}} = \frac{Y_{i} - μ_{i}}{V (μ_{i})},$

(C.1)

or equivalently

$\frac{\partial}{\partial μ_{i}} Q (Y_{i}, μ_{i}) = . \int_{}^{μ_{i}} \frac{Y_{i} - μ_{i}^{'}}{V (μ_{i}^{'})} d μ_{i}^{'} + function of Y_{i} .$ $\frac{\partial}{\partial μ_{i}} Q (Y_{i}, μ_{i}) = . \int_{}^{μ_{i}} \frac{Y_{i} - μ_{i}^{'}}{V (μ_{i}^{'})} d μ_{i}^{'} + function of Y_{i} .$

For analytic convenience, the subscript i will be dropped in the succeeding texts, so that Y and μ will refer to an observation and its expectation, respectively.

Following immediately from the definition of $Q$ $Q$ , then $Q$ $Q$ has the following first characteristic:

$E (\frac{\partial Q}{\partial μ}) = 0 .$ $E (\frac{\partial Q}{\partial μ}) = 0 .$

(C.2)

By applying the chain rule, we have

$\frac{\partial Q}{\partial β_{m}} = (\frac{\partial Q}{\partial μ}) (\frac{\partial μ}{\partial β_{m}}),$ $\frac{\partial Q}{\partial β_{m}} = (\frac{\partial Q}{\partial μ}) (\frac{\partial μ}{\partial β_{m}}),$

where m = 1, …, M. Thus, we obtain another quasi-likelihood equation:

$E (\frac{\partial Q}{\partial β_{m}}) = 0 .$ $E (\frac{\partial Q}{\partial β_{m}}) = 0 .$

(C.3)

Given V(μ) = var(Y), we have

$\begin{array}{l} E (\frac{\partial Q \partial Q}{\partial β_{m} \partial β_{m^{'}}}) & = E {(\frac{\partial Q}{\partial μ})}^{2} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \\ = E \{\frac{{(Y - μ)}^{2}}{{[V (μ)]}^{2}}\} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \\ = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \end{array} .$ $\begin{array}{l} E (\frac{\partial Q \partial Q}{\partial β_{m} \partial β_{m^{'}}}) & = E {(\frac{\partial Q}{\partial μ})}^{2} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \\ = E \{\frac{{(Y - μ)}^{2}}{{[V (μ)]}^{2}}\} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \\ = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} \end{array} .$

(C.4)

Also, the second partial derivative of the quasi-likelihood function with respect to β can be written by

$\begin{array}{l} - E (\frac{\partial^{2} Q}{\partial β_{m} \partial β_{m^{'}}}) & = - E \{\frac{\partial}{\partial β_{m^{'}}} [\frac{Y - μ}{V (μ)} \frac{\partial μ}{\partial β_{m}}]\} \\ = - E \{(Y - μ) \frac{\partial}{\partial β_{m^{'}}} [\frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}}] - \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}}\} \\ = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} . \end{array}$ $\begin{array}{l} - E (\frac{\partial^{2} Q}{\partial β_{m} \partial β_{m^{'}}}) & = - E \{\frac{\partial}{\partial β_{m^{'}}} [\frac{Y - μ}{V (μ)} \frac{\partial μ}{\partial β_{m}}]\} \\ = - E \{(Y - μ) \frac{\partial}{\partial β_{m^{'}}} [\frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}}] - \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}}\} \\ = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}} . \end{array}$

(C.5)

Let l denote the log-likelihood and the distribution of Y be specified in terms of μ. Then, from the Cramér–Rao inequality (Stuart and Ord, 1994), we have

$var (Y) \geq - \frac{1}{E (\frac{\partial^{2} l}{\partial μ^{2}})} .$ $var (Y) \geq - \frac{1}{E (\frac{\partial^{2} l}{\partial μ^{2}})} .$

(C.6)

Summarizing the above inferences, the quasi-likelihood $Q$ $Q$ has the following properties:

$\begin{array}{l} Property (i) : & E (\frac{\partial Q}{\partial μ}) = 0, \\ Property (ii) : & E (\frac{\partial Q}{\partial β_{m}}) = 0, \\ Property (iii) : & E {(\frac{\partial Q}{\partial μ})}^{2} = - E (\frac{\partial^{2} Q}{\partial μ^{2}}) = \frac{1}{V (μ)}, \\ Property (iv) : & E (\frac{\partial Q \partial Q}{\partial β_{m} \partial β_{m^{'}}}) = - E (\frac{\partial^{2} Q}{\partial β_{m} \partial β_{m^{'}}}) = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}}, \\ Property (v) : & - E (\frac{\partial^{2} Q}{\partial μ^{2}}) \leq - E (\frac{\partial^{2} l}{\partial μ^{2}}), \end{array}$ $\begin{array}{l} Property (i) : & E (\frac{\partial Q}{\partial μ}) = 0, \\ Property (ii) : & E (\frac{\partial Q}{\partial β_{m}}) = 0, \\ Property (iii) : & E {(\frac{\partial Q}{\partial μ})}^{2} = - E (\frac{\partial^{2} Q}{\partial μ^{2}}) = \frac{1}{V (μ)}, \\ Property (iv) : & E (\frac{\partial Q \partial Q}{\partial β_{m} \partial β_{m^{'}}}) = - E (\frac{\partial^{2} Q}{\partial β_{m} \partial β_{m^{'}}}) = \frac{1}{V (μ)} \frac{\partial μ}{\partial β_{m}} \frac{\partial μ}{\partial β_{m^{'}}}, \\ Property (v) : & - E (\frac{\partial^{2} Q}{\partial μ^{2}}) \leq - E (\frac{\partial^{2} l}{\partial μ^{2}}), \end{array}$

where Property (iii) is a special case of (iv), and for a one-parameter exponential family, the inequality in Property (v) becomes equality. Wedderburn (1974) mathematically proves that the precision of maximum quasi-likelihood estimates can be estimated from the expected second derivatives of

Q

$Q$

in the same fashion as the precision of maximum likelihood estimates is estimated from the expected second derivatives of the log likelihood. In practice, using the Newton–Raphson method with the expected second derivatives of

Q

$Q$

to calculate

\hat{β}

$\hat{β}$

is equivalent to iteratively calculating a weighted linear regression of the residuals on the quantities of the scores by linear least squares, with the residuals and the score being calculated from the current estimate of

\hat{β}

$\hat{β}$

..................Content has been hidden....................

You can't read the all page of ebook, please click here login for view all page.

Table of Contents for Appendix C: Quasi-likelihood functions and properties

Create new playlist

Sign In

Sign Up

Quasi-likelihood functions and properties

Table of Contents for
Appendix C: Quasi-likelihood functions and properties