IntrotoMathematicalStatisticsH.M.C 思维导图模板

<h2>   Chapter 7          Sufficiency              <br></h2>

<h3>7.1 Measures of quality of Estimators</h3>

Def：MVUE(Minimum Variance Unbiased Estimator)<br>

Y=y(X1,X2...Xn),如果 Y unbiased即E(Y)=θ，同时Y的方差不大于任何其他无偏估计量的方差，则Y为θ的MYUE<br>

<h3>Risk function</h3>

Decision function/Rule<br>

Def

δ（y）是统计量Y的函数，通过δ(y)实现对θ的点估计<br>

因为δ()决定了θ的值，所以称为decision rule;一个y对应一个decision<br>

Loss function<br>

Def

某个非负函数g()，衡量θ真实值和δ(y)之间的差异性

example<br>

squared-error loss function<br>

<br>

absolute-error loss function<br>

goal post loss function<br>

理解：如果落入中心的a单位之内，则没有损失；规定之外，则损失b<br>

Risk function（R.F.）<br>

Def

Loss funciton 的期望(对y)<br>

annotation

对于所有的θ，希望选择的δ(）使得R(θ，δ)尽可能小，但通常行不通

Minimax decision function

Def<br>

δ0即为所取选取得decision rule，称为minimax decision function<br>

理解

对每一个Decision Rule 先取它对每一个θ估计的最大值，再选取所有最大值中最小的Decision Rule<br>

δ(y)给出的决策函数是对所有的θ∈Ω

<h3>Annotation</h3>

1.若不加限制，很难找到某R.F.使得其R.F. 一致的小于任何其他决策的R.F.

2.选取DR的一个原则为 minimax decision function<br>

δ0即为所取选取得decision rule，称为minimax decision function<br>

3.

用其它条件代替E(δ(Y))=θ

并且损失函数形如此

minimax decition function 会得到<br>

<h2>minimum mean-squared-error estimator 最小均方误差估计量</h2>

习题7.1.6、7、8<br>

<h3>7.2 A Sufficient Statistic for a Parameter</h3>

<h3>Sufficient statistic</h3>

Def

X1,X2...Xn iid pmf/pdf,Y1 = u1(X1,X2...Xn)是一个统计量，其pdf/pmf 为fY1(y1,θ),<br>

当H(x1,x2...xn)与θ无关时，Y1为θ的sufficient estimator

Annotation

1. 注意，充分统计量在更一般的情形下，不要求X1，X2...Xn同分布or独立

也就是说用联合分布代替成立即可说Y1为充分统计量

2. 直观上来看，一旦Y1=y1所确定的集合固定，即在Y1=y1下，对样本空间进行分割，留下Y1=y1的空间。任一统计量Y2不依赖于θ，即可以说Y1将θ信息充分用尽。也就是任何Xi也提取不出来θ的信息

3. 一般来说，求解任意得一个Y的pdf是十分困难<br>

<h3>Factorization theorem（因子分解定理）</h3>

X1,X2...Xn iid pmf/pdf。Y1 = u1(X1,X2...Xn)是一个统计量。

Y1为θ得sufficient estimator 当且仅当可以找出两个非负函数k1,k2。其中k2不依赖于 θ<br>

意义

判别一个统计量是否是充分统计量

无需求解Y1的pdf，计算方便许多，即在求解Y1分布困难的时候用因子分解定理

<h2>7.3 Properties of a Sufficient Statistic</h2>

充分统计量的传递性

Y1是SS，Y2 = g(Y1)是一个统计量，其中g()是一个一对一函数，则Y2也是SS<br>

<b>SS 与 MVUE的联系<br></b>

前提<br>

<ul><li>θ=E(Y2)=E[E(Y2|Y1)]=E(φ(y1)) (重期望公式)</li></ul>

Suffiency 能产生最佳点估计<br>

充分统计量Y1的函数φ(y1)=E(Y2|y1)仍是无偏估计量，而且其方差比Y2的方差小<br>

Rao-Blackwell

X1,X2...Xn iid pmf/pdf，Y1 = u1(X1,X2...Xn)是SS，Y2=u2(X1,X2...Xn)是θ无偏估计量，E(Y2|y1)=φ(y1)，则φ(Y1)是θ的SS :Y1的函数,且其方差小于Y2的方差

应用<br>

寻找某参数的MVUE时，若参数的SS Y1存在，那么找到无偏估计量Y2，构造φ(Y1)=E(Y2|y1),那么φ(Y1)既为无偏估计量，方差又更小

<b>SS 与 MLE的联系<br></b>

Theorem 7.3.2<br>

θ的SS Y1=u1(X1,X2...Xn)存在，同时θ的mle θhat唯一存在，则θhat一定为Y1的函数<br>

应用

先求解其SS是否存在以及其MLE，再求MLE的期望，并通过乘以系数的方式使得MLE称为某无偏估计量，那么这个无偏估计量即为MVUE、

例7.3.1<br>

<h3>7.4 Completeness and Uniqueness</h3>

Complete Family<br>

Def

<br>

完备族的证明

例7.4.2

Uniqueness<br>

<h3>Lehmann & Scheffe</h3>

<h3>Y1=u1（X1,X2,X3...Xn）,{fY1(y1;θ)}是θ的完备族，如果有关于Y1的函数使得其为θ的无偏估计量，那么这个Y1的方程即为θ的唯一MVUE</h3>

理解

给寻找MVUE的方法找到了理论依据

<h3>Complete sufficient statistics</h3>

定义

概率密度函数族充分，且本身是θ的SS<br>

<h3>7.5 The Exponential Class of Distributions</h3>

意义

正则指数分布族具有完备且充分统计量<br>

Exponential Class<br>

S表示 X的support<br>

正则指数族

Regular Conditions<br>

1. X的support S 不依赖于θ<br>

2. p(θ)是θ∈Ω上的非平凡连续函数<br>

3.

连续

K'(x)恒不为零，且H(x)在S上连续

离散

K(x)在S上非平凡

Def

满足 Regular Conditions 的Exponential Class 称为正则指数函数族<br>

正则指数族下的Y=ΣK(Xi)的性质

分布

结论<br>

对于某个函数R(y1), Y1的pdf:f(y1;θ)=R(y1)*exp[p(θ)y1+nq(θ)]<br>

<br>

theorem 7.5.1<br>

完备性和充分性

结论

Y=ΣK(Xi)是θ的充分统计量

Y的概率密度函数族是完备的

<h3>所以使得E(φ(Y))=θ的φ(Y)是一个MVUE</h3>

theorem 7.5.2<br>

<h2>Chapter 8 Optimal Tests of Hypotheses</h2>

<h3>8.1 Most Powerful Tests</h3>

basic conception

hypothesis

null hypothesis<br>

alternative hypothesis<br>

critical region<br>

Error<br>

Type 1 error<br>

Type 2 error<br>

signifiance level<br>

power fonction<br>

Best Critical Region<br>

Def

C是样本空间的一个子空间 H0 : θ = θ0；H1：θ=θ1<br>

b) 对于样本空间的任何有着水平α子集A，其功效函数比C小<br>

a）C的significant level of α<br>

Neyman-Pearson Theorem<br>

假设Ω={θ'，θ''}只有两个元素，C是样本空间的子集<br>

如果 a,b,c 成立，那么C即为 H0: θ=θ'，H1：θ=θ''的检验水平α下的最优临界域。<br>

这是使区域C成为检验水平α下的最优临界域的充要条件

判断 Best Critical Region<br>

Unbiased Test<br>

例 8.1.2<br>

Unbiased Test 无偏检验<br>

Def<br>

Pθ( X∈C )>=α，对于所有的 θ ∈ H1<br>

理解

检验功效应该永远不低于其显著性水平，否则错误拒绝H0的概率α 会大于正确拒绝H0（功效函数）的概率<br>

Corollary 8.1.1<br>

<b>Best Critical Region is  an Unbiased Test ,</b> that is γ(θ'')>=α for all θ''∈Ω<br>

<h3>8.2 Uniformly Most Powerful Tests</h3>

Background

Simple Hypothesis H0 vs Alternative composite hypothesis H1<br>

Uniformly most powerful (UMP) critical region<br>

如果 C是检验H0 vs H1中的每一个简单检验的最优临界域，则C称为H0 vs H1下的水平α的最大一致功效区域<br>

Uniformly most powerful(UMP) Test<br>

由最大一致功效区域定义的检验

Monotone likelihood ratio(mlr)<br>

def

对于θ1<θ2<br>

比值是关于y=u(x)的单调函数，则称L(θ,x)具有关于统计量y=u（x）的单调似然比

（这一节记得不太详细）

<h2>Chapter 9 Inferences About Normal Models<br></h2>

<h3>9.1 Quadratic Forms</h3>

Quadratic Forms<br>

Def

n个变量的二次多项式称为其二次型，即在一个多项式中，未知数的个数为任意多个，但每一项的次数都为2的多项式

Example<br>

(n-1)S^2是一个二次型<br>

统计量为 Quadratic Forms 的函数进行检验极为快捷<br>

<h3>正态分布的二次型定理</h3>

Q = Q1 + Q2+ ... Qk-1+Qk, 他们是服从正态分布的n个独立随机变量的二次型。若Q/σ方，Q1/σ方...Qk-1/σ方分别服从自由度为r,r1...rk-1的卡方分布，Qk非负

结论

1. Q1,Q2...Qk 是独立的<br>

2. Qk/σ方服从自由度为 r-(r1+r2+...rk-1)=rk的卡方分布<br>

<h2>常见的二次型转换</h2>

按行均值、总体均值变换<br>

Q = (ab-1) * S^2<br>

Q/σ^2：服从卡方(ab-1)<br>

Q1

Q1/σ^2服从卡方a(b-1)<br>

理解

每行多了一个均值约束，总共a行，自由度从ab->a(b-1)

Q2

由定理一，则  Q2/σ^2 服从卡方(a-1)

理解

a行a个变量，但行均值的期望=总体均值，a->a-1<br>

按列均值、总体均值变换

Q = Q3 + Q4<br>

Q = (ab-1) * S^2<br>

Q/方差：服从卡方(ab-1)<br>

Q3

Q3/σ^2 服从卡方b(a-1)<br>

理解

每列多了一个均值约束，总共b列，自由度从ab->(a-1)b

Q4

有定理一，Q4与Q3独立且 Q4/σ^2 服从卡方(b-1)<br>

按行均值、列均值、总体均值变换

Q = Q2 + Q4 + Q5<br>

Q = (ab-1) * S^2<br>

Q/方差：服从卡方(ab-1)<br>

Q2

Q2/σ^2 服从卡方(a-1)

Q4

Q4/σ^2 服从卡方(b-1)<br>

Q5<br>

由定理一，Q5/σ^2 服从卡方(a-1)(b-1)<br>

<h3>9.5 The Analysis of Variance</h3>

ANOVA <br>

Analysis of Variance<br>

因为一般构成的中枢变量都是形如类型的，所以称为ANOVA(其实应该理解为用方差进行分析)

<h3>9.2 One-Way ANOVA<br></h3>

One Way<br>

单向模型(单因素)

Model

Xij=μj+eij .i= 1,···,n, j = 1,· ··,m, where eij∼N(0,σ2)

i 代表样本量<br>

Hypothesis

H0 : μ1=μ2=···=μb=μ

H1 :  At least one of those means μj are different to others

Statistic

<br>

CR

 F(m-1, m*(n-1) ) 截图有误<br>

理解

因为是要比较各组之间的差异，所以组间方差分析作为分子，组内方差作为分母<br>

<h2>推导过程很重要P363</h2>

<h3>Two-Way ANOVA)</h3>

One Observation per Cell(每格单位观测值的双向分类)<br>

Additive Model

<br>

理解<br>

μij 为cell（i,j）的均值<br>

即将（i,j）格的均值归因于平均值上的因素A 的 i 水平与因素B 的 j 水平的可加影响<br>

所以称为Two - Way ANOVA<br>

Hypothesis

Row Effect<br>

H0A : α1=···=αn= 0 <br>

Main Effect 假设<br>

对特定列来说，每个行的格均值都一样，行水平因素为0

H1A: αi != 0,for some i

Column Effect<br>

H0B : β1=···=βm= 0 <br>

Main Effect 假设<br>

H1B : βj  !=  0 ,for some j

Decomposition

 Q = Q2 (行间平方和)+ Q4(列间平方和) +Q5(剩余平方和)<br>

C.R.

HA（行均值检验）

 F  ~ (a-1, (a-1)(b-1) )<br>

<br>

理解<br>

基于行均值相同的假设，即用行间平方和/剩余平方和

HB（列均值检验）

<br>

理解

基于列均值相同的假设，即用列间平方和/剩余平方和

More than one indepent Observations per Cell<br>

Interaction Model

γij 称为个性化因子<br>

γij = μij - { μ +(μi. - μ)+(μ.j  -μ)}= μij - (μ+αi+βj)<br>

每个格子取大于1个独立的观测值

理解<br>

μij 为cell（i,j）的均值<br>

γij称为个性化因子，代表指标族A，B之外没考虑到的因素<br>

称为 Interactive Two-Way ANOVA<br>

Hypothesis

H0AB : γij= 0 for all  i,j

H1AB : γij  != 0 for some i,j

理解

即考察指标A,B分类清晰之后，是否还存在剩余的个性化因素<br>

Decomposition

<br>

总平方和 = 各行之间差异平方和 + 各列之间差异平方和 + 交互效应平方和 + 格内平方和<br>

C.R.

<br>

理解

检验个性化因子是否均为零，即用交互效应平方和 / 格内平方和<br>

<h3>Summary</h3>

如果接受 H0AB 的假设时，然后就可以继续对指标A，B进行检验<br>

实验流程

Interaction Tests —— Two-Way ANOVA —— One-Way<br>

<h2>Chapter 10 Nonparametric and Robust Statistics</h2>

<h3>10.1 Location Model</h3>

Background

test procedures associated with the methods are distribution-free<br>

Basic Concept<br>

Functional<br>

Def

Functions of functions<br>

Induced estimator<br>

Def

Location functional<br>

Def

X is a continuous R.V with cdf FX and pdf fX, T(FX) is a location functional if it satisfies

If Y = X + a , T(Fy) = T(Fx)+ a，对于所有的a∈R<br>

If Y =aX , T(Fy) = aT(Fx) ,对于所有的a≠0<br>

Example

Mean functional<br>

Median functional<br>

例10.1.1

Median 是唯一作为位置泛函的百分位数<br>

Location Model<br>

Def

<br>

By the definition of location functional, we have X1, X2,···,Xn are iid with pdf fx() =f(x−T(Fx)).

Symmetry(对称性定理)<br>

Let X with cdf F(x) pdf f(x) and distribution of X is symmetric about a.  T(Fx)是位置泛函，则T(Fx)=a<br>

<h3>10.2 Sample Median and Sign Test</h3>

<h3>Basic</h3>

Model Setting<br>

X1,X2...Xn are R.S. which follows Location Model Xi = θ + εi, εi~pdf f(x), F(x) 以及 median 0<br>

Sign Test<br>

Hypothesis

H0a : θ = θ0  vs   H1a：θ> θ0<br>

H0b : θ = θ0 vs    H1b：θ≠ θ0

Statistic

符号统计量<br>

S(θ0) = #{Xi > θ0} =  (i=1~n)∑ I ( Xi>θ0 )<br>

H0a为真时，我们期望一半左右的观测值大于θ0

H1a为真时，期望超过半数以上的观测值大于θ0

H0a为真时，我们期望一半左右的观测值大于θ0

H1b为真时，期望小于等于c1或者大于等于(n-c1)的数落在拒绝域中

分布

小样本下<br>

在H0下，因为θ0为中位数点，所以一半的Xi小于θ0。因此S(θ0)服从bin(n,0.5)的二项分布

大样本下

H0为真且样本量足够大时，标准化统计量使之渐进服从正态分布 N(0,1)

[S(theta0)-（n/2)]/sqrt(n)/2

<h4>Distribution Free Test（非参数检验）</h4>

并不依赖于Xi本身的分布的检验<br>

Power function<br>

性质

符号统计量的平移性质Translation property<br>

For every k， Pθ[S(0)>k] = P0[S(-θ)>k]<br>

理解<br>

即总体中位数为θ时，样本大于零的个数之和大于k的概率与总体中位数为0时，样本大于-θ的个数之和大于k的概率相同<br>

Nondecresasing

γ(θ)是单边假设检验水平α的符号检验功效函数，则γ(θ)为θ的非递减函数<br>

理解

γ（θ）=Pθ[S(0)>cα]，θ增大中位数增大，γ不减

Hypothesis推广

H0' :θ<=θ0

<h4>10.2.2 Estimating Equations Based on the Sign Test</h4>

Estimate Equation<br>

L1 distance<br>

中位数θ的估计转换成使L1距离最小的点<br>

EE<br>

<br>

其解即为样本中位数Q2

变式

2S(θ)-n = 0<br>

样本中位数也是S(θ) = n/2 的解<br>

<h4>10.2.1 Asymptotic Relative Efficiency </h4>

子主题

<h3>10.3 Signed-Rank Wilcoxon</h3>

Background（缺点）<br>

Sign Test推断非常简单，而且所需的基础分布很少<br>

符号检验的有效性只是t检验的0.64倍<br>

Lamma

H0 成立且pdf关于0对称的条件下，|x1|,|x2|,...,|xn|和sgn(X1),sgn(X2)...sgn(Xn)是独立的<br>

即Xi的rank 和Xi 的符号是独立的<br>

Signed-Rank Wilcoxon<br>

假设<br>

Xi = θ + εi的pdf f(x)是对称的即f(x) = f(-x),<br>

所以 Xi服从关于θ 对称的分布<br>

Statistics<br>

r(|Xi|) refers to the rank of |Xi| among |X1| ,···, |Xn|

理解

视为符号检验的一种加权后的结果

当两个距离原点距离相同时，权重应当一致

当一个的到原点距离小时，其权重应该小

Anti-Ranks<br>

Denote the variable with the rank equal to j as Xij .

<br>

Decision Rule<br>

T >= c,拒绝H0, 接受H1<br>

<h2>Chapter 6    Maximum Likelihood Methods</h2>

<h2>     极大似然估计  MLE        </h2>

定义

似然函数<br>

<br>

一般取对数进行运算

估计方程

对数偏导为0

本书有几种估计方程EE,这只是其中的一种

极大似然估计量 MLE<br>

一般求解估计方程即可<br>

MLE能使得其似然函数函数值达到最大

特殊情况下，例如含有<b>示性函数</b>的问题，直接看L(θ，X)的图像即可<br>

正则条件（R0-R2）

pdf unique，即不同的θ，pdf不同<br>

对于不同的θ，X有着相同的support

θo为Ω的内点（即不为边界点）

性质<br>

似然函数与 θo之间的关系<br>

在R0,R1下

表明：似然函数在θ0处渐近达到最大值

MLE在函数作用不变性<br>

<b>θhat 是θ的mle，则在函数g()的作用下,g(θhat)是g(θ)的mle<br></b>

 MLE 与 θ的关系<br>

θhat 依概率收敛于 θ<br>

应用

求pdf参数的mle

不满足正则条件

均匀分布U(0,θ)

满足正则条件

求P(X>x)的mle

相当于把这个概率视作在θ某函数作用下的，求g(θhat)

习题6.1.5、6.1.6

求pmf的mle

二项分布mle

习题6.1.6 <br>

<h2>Rao-Cramer 下界及有效性</h2>

正则条件(R3-R4)

pdf 二次可微<br>

pdf在积分符号下二次可微

pdf三次可微，且得分函数的二阶导能被M（X）控制

得分函数 Score function<br>

定义

<br>

性质

得分函数的期望为0

<b>得分函数对所有变量求和为估计方程</b>

<h3>Fisher infromation: I(θ)</h3>

定义

得分函数平方的期望<br>

等价形式

得分函数再对θ求偏导的期望的相反数<br>

易于计算

费舍信息即得分函数的方差

易于理解

<h3><u>Rao-Cramer 下界      </u></h3>

定义

条件：R0~R4成立，随机变量Xi iid, Y=u(X1,X2...Xn)为k(θ)统计量，且E(Y)=k(θ) 即Y为k(θ)的无偏估计量<br>

限制了Y的方差的最小值

推论

条件:在上述假设下，且Y为θ的<b>无偏估计</b>，即<b>E(Y)=θ</b>

Y的方差大于等于n倍的费舍信息的倒数

<h3><font color="#c41230">有效估计量Efficient Estimator</font></h3>

定义

有效估计量（efficient estimator）：当Y为θ的无偏估计量且 Y的方差达到RC下界时，称Y为θ的有效估计量

有效性（efficiency）：RC下界与Y方差的比称为Y的有效性

性质

有效估计量衡量了大样本下Y对θ的接近程度

定理<br>

条件：在R0~R5成立，费舍信息有限且θhat为θo的mle（即为似然估计方程的解）<br>

结论

应用<br>

求sqrt(n)*（θhat-θo)的渐进分布 <br>

习题6.2.7、8

推论

在上述条件下<br>

<br>

Δ-方法<br>

Rn 依概率趋向于0<br>

步骤

1.首先看Y是否为无偏估计量

2.计算Y的方差V(Y)

3.得分函数二阶偏导数的期望的相反数计算I(θ)，及Rao-Cramer下界<br>

4.判断是否达到Rao-Cramer下界<br>

渐进有效性asymptotically efficiency<br>

条件

θ1nhat是θ0的估计量（不一定为mle、不一定无偏估计）<br>

<br>

定义

渐进有效性

e的值称为θ1nhat的渐进有效性<br>

渐进有效估计量

如果e= 1 ，则称θ0hat为渐进有效估计量<br>

应用：

由定理知mle是渐进有效

渐进相对有效性ARE<br>

定义：θ1nhat、θ2nhat均为θ0的估计量<br>

1相对于2 的渐进相对有效性<br>

e >1，θ1nhat更好<br>

e < 1 , θ2nhat更好<br>

应用：比较两个估计量的好坏，直观上来看拥有较小渐进方差的估计量较好

<h2>极大似然检验</h2>

似然比检验(LRT，Likelihood Ratio Test)

<h3>正态分布LRT（精确分布）</h3>

常规统计量       <br>

θo为θ的真值，一般在H0中定义，θhat为θ的mle

λ小于从c，则拒绝H0<br>

θo若为真值，比值应该接近于1；H1成立则比值较小<br>

变式统计量

理论依据

似然函数可以化为<br>

之后可以采用此检验量

在R0~R5成立，费舍信息有限。检验统计量服从卡方1分布

Decision rule<br>

其中卡方L为上述定义的统计量<br>

<b>其他分布LRT</b>(Asymptotical Distribution渐进分布)

变式统计量

理论依据

在R0~R5成立，费舍信息有限。统计量依分布收敛于卡方1分布<br>

Decision rule<br>

其中卡方L为上述定义的统计量<br>

沃尔德型检验(Wald-type Test)<br>

统计量

由于I(θhat)依概率收敛于I(θ0)，此统计量的极限分布为卡方1<br>

理解<br>

平方内的部分渐进收敛于N(0,1)

Decision rule<br>

<br>

得分型检验(Score-type Test)<br>

统计量<br>

<br>

理解<br>

由于涉及到Score function: l'(θ0)，所以称之为得分型统计量<br>

Decision rule<br>

<br>

<h2>多参数估计</h2>

极大似然估计量 mle<br>

等价的求解向量方程

性质

上述定理6.1.1依旧成立

上述定理6.1.2依旧成立

上述定理6.1.3依旧成立

费舍信息阵Fisher Infromatation Matrix<br>

定义<br>

密度函数对参数向量各分量梯度协方差矩阵

对于信息阵中的每个元素Ijk来说

计算方法<br>

一般元素I(j,k)的等价形式

由于上式成立，并且得分函数的期望为0

计算化简可以得到每个信息阵每个元素的等价形式

优点此形式便于计算

对角线元素

信息阵对角线元素的形式大致和纯量的一样

随机样本下的费舍信息阵

由于样本量n且iid，所以具有一样的费舍尔信息阵

随机样本下的费舍信息阵为单独信息阵的n倍

费舍信息阵下的RC下界

令估计量Yj=uj(X1,X2...Xn)是θj的无偏估计量

估计量Yj的方差不小于费舍信息阵逆的对角线第j个元素除以n

多参数下的渐近性

定理

θnhat是θ的渐进有效估计量

根号n倍的θnhat与θ的差依分布收敛于p元均值为0方差为费舍尔信息阵的逆的正态分布

应用

纯量形式

对某一个参数<br>

函数映射<br>

设p元向量θ在函数g()的映射下

于是，g（θ）的偏导矩阵为

变换 η 为g(σ)的估计量

满足定理

于是η信息阵可以表示为<br>

理解

<ol><li>举个例子来说，一般求得的费舍信息阵例如I(μ，σ)，虽然能从I(1,1)得出来I(μ)，但是从信息阵中无法直接看出来出来I(σ方)</li></ol>

  2.所以需要采取变换η=g(μ，σ)=σ方，进行转换，然后代入公式

   3.此时如果要求I(η)，便可以通过此时的信息矩阵的逆求出<br>

例题6.4.6<br>

<h2>多参数检验</h2>

似然比检验LRT

统计量

其中Ωhat表示全空间下的mle<br>

Decision rule<br>

α的确定<br>

子主题