自考考试概率统计课程指定教材中随机变量函数概率密度表述

2019-06-03
来源:

  近两年我应邀为我院与南京财经大学合办的专接本班讲授概率统计课,在教学过程中我发现,全国高等教育自学考试指定教材《概率论与数理统计(经管类)》(全国高等教育自学考试指导委员会组编,武汉大学出版社出版)第52页关于求连续型随机变量函数概率密度的定理的表述不够完美,学生运用该定理求连续型随机变量函数的概率密度时容易出错.发现问题后,我又翻阅全国高等教育自学考试指定教材《概率论与数理统计(二)》(全国高等教育自学考试指导委员会组编,辽宁大学出版社出版)等其他作者主编的几本教材,发现也存在类似的问题.求连续型随机变量函数的概率密度,是全国高等教育自学考试大纲规定的自学重点,也是学生自学的难点.我深感必须把这个问题指出来,并应予以完善,以免让欠完美的说法误导读者,特别是误导没有老师指导的参加自学考试的读者.

  2.问题所在

  教材《概率论与数理统计(经管类)》中关于求连续型随机变量函数概率密度的定理:

  设X为连续型随机变量,其概率密度为f(x).设g(x)是一严格单调的可导函数,其值域为[α,β],且g′(x)≠0.记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度

  f(y)=f[h(y)]|h′(y)|,α<y<β0,其他(1)

  特别的,当α=-∞,β=+∞时,

  f(y)=f[h(y)]|h′(y)|,-∞<y<+∞ (2)

  该定理容易让学生出错的地方是“[α,β]是g(x)的值域”.

  3.欠完美的原因

  为什么说定理中的“[α,β]是g(x)的值域”容易让学生出错呢?因为比较(1)式与(2)式,从形式上来讲,容易让人误认为在(2)的情况下,概率密度函数是一个初等函数,而不是分段函数,事实上从本质上来说,此时也可能是一个分段函数.我们看一个例子.

  例如:设随机变量X具有概率密度

  f(x)=,0<x<40,其它

  求随机变量Y=2X+8的概率密度.

  本题学生用现有教材中定理解答常见错误如下:

  解:由y=2x+8得,h(y)=从而|h′(y)|=

  显然y=2x+8的值域为(-∞,+∞),

  故α=-∞,β=+∞.

  按照教材中定理学生容易错误地把结果写成:

  f(y)=f[h(y)]h′(y)

  =,-∞<y<+∞

  事实上本题的结果应为f(y)=,8<y<160,其它

  4.定理的改进

  那么,怎样表述学生运用时才不容易出错呢?我认为应作如下调整.

  定理:设X为连续型随机变量,其概率密度为f(x).设g(x)是一严格单调的可导函数,且g′(x)≠0.记x=h(y)为y=g(x)的反函数,则

  (1)当f(x)为一初等函数时,Y=g(X)的概率密度为

  f(y)=f[h(y)]|h′(y)|,-∞<y<+∞;

  (2)当f(x)为一分段函数,且f(x)在有限区间[a,b]以外等于零时,Y=g(X)的概率密度为

  f(y)=f[h(y)]|h′(y)|,α<y<β0,其它(1)

  其中[α,β]是g(x)在[a,b]上的值域.

  如果这样叙述,学生应用时就不容易出错了.根据这样的叙述,上例就可以很容易地得到正确结果:

  解:由y=2x+8得,h(y)=,从而|h′(y)|=

  显然y=2x+8在[0,4]的值域为[8,16],

  故α=8,β=16

  又f(x)=,0<x<40,其它

  本题属于定理中(2)的情形

  所以所求概率密度函数为:

  f(y)=f[h(y)]|h′(y)|,8<y<160,其它

  =,8<y<160,其它

  5.结语

  改进后的定理表述与现有教材中定理表述相比,更具可操作性.两年多的实践表明,学生使用改进后的定理求连续型随机变量函数概率密度的错误率显著下降.