跳转至

一、随机变量与分布

🏺 寓言故事 —— 《老周的秤》

青石镇上有两个生意人,老周卖米,老陈卖布。两人做了二十年邻居,性格却天差地别。

老周是个精细人。他的米铺里摆着六口缸,分别标着"一升""二升""三升""四升""五升""六升"。每天早上,他让伙计阿福从缸里舀米卖给客人。阿福手不稳,舀出来的米有时多有时少,但奇怪的是,不管他怎么舀,舀出来的量永远只落在这六个数上——绝不会舀出二升半,也不会舀出七升。老周为此得意了半辈子,他在柜台后头挂了一块木板,上面刻了六道横线,每道线代表一升。半年下来,木板上的刻痕密密麻麻,老周发现一件怪事:六道横线的高度竟然差不多。他摸着胡子想,原来阿福的手虽然不稳,但歪来歪去,歪到每一升的次数大致是一样的。

老陈的布庄就在隔壁。他也让伙计量布,但他的布是论尺卖的。伙计量出来的布,一尺二寸五、一尺二寸六、一尺二寸七……小数点后的数字仿佛永远量不完。老陈不像老周那样在木板上刻横线——那得刻到猴年马月?他在柜台底下藏了一张纸,纸上画着一条弯弯的曲线,中间高,两头低,像一座小山包。每天打烊后,他就把当天量过的布长一一标在纸上。日子久了,那条曲线越来越清晰:大部分的布长都挤在山包的中间,越往两边,点越稀疏。老陈看着这条曲线,心里踏实了——他知道明天大概会量出多长的布,也知道出现一丈长的布几乎是不可能的。

有一年大旱,米价飞涨。镇上来了一个外乡人,想一次性买走老周所有的米。老周犯了难:阿福的手明天会舀出几升?他看着木板上的六道横线,心里有了底——每口缸里的米剩多少,他大致有数,因为每一升出现的机会都差不多。他咬咬牙,按平均数估了个价,把米卖了。

老陈那边也遇到了麻烦。一个裁缝铺要订一大批布,问他一个月能供多少。老陈看着纸上那座小山包,手指沿着曲线滑动。他发现,绝大部分的布长都挤在中间那一小截里,两边的尾巴虽然存在,但细得像头发丝。他指着山包中间最鼓的那一块,对裁缝说:"按这个数,错不了。"后来果然,实际供的布和他说的大差不差。

那天晚上,两个老邻居坐在布庄门口喝酒。老周说:"我这辈子就守着那六口缸,米不是一升就是二升,跳来跳去,中间没有别的路。"老陈笑了笑,展开那张画满曲线的纸:"我这布可不一样,一尺和二尺之间,还藏着千千万万个数,量不完,数不清。但你看这条线——"他指着山包,"虽然数不清,但哪里多、哪里少,我心里有谱。"

老周沉默了一会儿,忽然说:"咱俩卖的东西不一样,用的法子也不一样。可说到底,都是在对付一件同样的事——明天会发生什么,谁也说不准。"老陈举起酒杯:"说不准归说不准,但说不准里头,也有个谱。你那六道横线,我这座小山包,都是谱。"

月光照在青石板上,两个老人的影子拉得很长。老周的六口缸还在米铺里摆着,老陈的曲线纸还在柜台底下藏着。镇上的人来来往往,有人买米,有人买布,没人知道这两个老人在深夜的门槛上,已经摸到了同一件东西的两种面孔。

"说不准里头,也有个谱。"


📖 原文定义

随机变量是一个能取得多个可能值的数值变量,是统计学中的核心概念,用于描述不确定性。例如,对某公司发行的债券,可以定义一个违约变量:违约变量Default是一个随机变量,Default=1表示债券违约,Default=0表示债券不违约。同样,某公司发行的普通股股价在未来某一天的收盘价也可以是一个随机变量。

离散型随机变量:如果随机变量X只能取有限个或可数无限多个不同的值,则X为离散型随机变量。其特点为取值是跳跃的,中间可能存在间隔。例如,抛硬币的结果(正面或反面)、骰子的点数(1到6的整数)、家庭的子女数量,以及债券的违约状态(0表示未违约,1表示违约)都属于离散型随机变量。

连续型随机变量:如果随机变量X可以取某个区间内的任意实数,则称为连续型随机变量。其特征是取值是连续的,任意两个不同的取值之间总存在其他取值。人的身高或体重、某地区的年降雨量、制造过程中产品的重量误差,以及股票在交易时间内的价格都是连续型随机变量的典型例子。

随机变量的分布描述了它取不同值的概率。如果X是离散型随机变量,其最多可能取n个值,并且记p_i是X取x_i的概率,所有概率的总和Σp_i = 1。如果X是一个连续型随机变量,由于无法列出X取每个特定值的概率,我们使用概率密度函数来刻画X的分布。概率密度函数衡量随机变量X在特定范围内取值的可能性,其图像称为概率密度函数曲线。

💡 对应点

故事元素 概念对应
阿福舀出的米量(只落在1-6升) 离散型随机变量:取值跳跃、有限个、中间有间隔
量布的长度(任意实数,量不完) 连续型随机变量:取值连续、区间内任意实数
木板上六道横线的刻痕高度 离散型随机变量的概率分布:每个取值对应一个概率
老陈纸上"中间高、两边低"的山包曲线 连续型随机变量的概率密度函数曲线
六道横线高度"差不多" 离散型分布中各取值概率的总和为1
山包中间最鼓、两边像头发丝 概率密度函数:中间取值可能性大,极端值可能性小
"说不准里头,也有个谱" 随机变量的分布描述了它取不同值的概率规律

📝 来源:科目二 · 第三章第四节 · 一、随机变量与分布