跳转至

二、期望、方差与标准差

🏺 寓言故事 —— 《老周的两条河》

山那边有座城,城里有个叫老周的人,靠给人运货为生。他手里有两条河可以走:一条叫青河,一条叫红河。

青河水流平缓,一年到头差不多都是那个深浅。老周跑一趟,好的时候能挣十袋米,差的时候也能挣八袋,大多时候就在九袋上下晃悠。红河不一样,水势大起大落,赶上顺风顺水,一趟能挣十五袋;赶上风浪大作,不但颗粒无收,还可能翻船赔本。

老周年轻时只走青河,图个踏实。可日子久了,他发现邻居老赵专走红河,虽然偶尔倒霉,但几年下来,院子里的米居然比他多出一倍。老周心里不服气,决定也去红河试试。

第一年,老周运气不错,挣了十四袋,比青河最好的年景还多。他得意极了,觉得以前真是白活了。第二年,红河发了大水,老周不但没挣到,还倒赔了三袋。第三年,水势稍缓,他挣了十二袋。第四年,又遇上枯水期,只得了五袋。

四年下来,老周坐在院子里一盘算:红河四年总共挣了二十八袋,平均每年七袋。青河那边,老赵帮他记着账,同样的四年,青河总共挣了三十六袋,平均每年九袋。

老周愣住了。红河明明有挣十五袋的时候,怎么平均下来反而不如青河?他盯着账本看了半晌,忽然明白过来——红河那些大风大浪的年份,把整体拉低了。平均数就像一根线,把所有年份串在一起,告诉你"大概是什么水平",但它不告诉你这条线晃得有多厉害。

老周不死心,又细细翻看账本。他发现红河每年的收成离那条"平均线"七袋,差得可真远:十四袋差了七袋,负三袋差了十袋,十二袋差五袋,五袋差两袋。把这些差距合起来看,红河的年份像是坐在一条剧烈颠簸的船上,而青河的年份则像走平路,每年的收成离平均线只差那么一点点。

那一刻,老周忽然懂了:一条河值不值得走,不能只看它"平均能挣多少"。还要看它的水势"稳不稳"。平均值告诉你这条河大概能给你什么,而那种上下起伏的剧烈程度,才告诉你走这条河要担多大的惊吓。

后来老周把船卖了,在河边开了间茶馆。来往的船夫问他该走哪条河,老周总是说同一句话:"先问自己想挣多少,再问自己能睡多安稳。"他顿了顿,又补一句,"最害人的不是挣得少,是你以为能挣十五袋,结果只挣了五袋,那种落差能把人吞了。"

茶馆生意平平,但老周每晚都睡得很踏实。


📖 原文定义

随机变量X的期望,或称"均值",记作 $E(X)$ ,衡量了X取值的平均水平。期望值是对X所有可能取值按照其概率加权后得到的平均值。

很多情况下,我们不仅需要了解数据的期望值和平均水平,还要了解这组数据分布的离散程度。分布越分散,波动性和不可预测性也就越强。投资者不仅关心投资的期望收益率,也关心实际收益率相对预期的收益率可能有多大的偏差,即该投资回报的风险水平。

对于投资收益率r,我们用方差 $\left(\sigma^{2}\right)$ 或者标准差 $\left(\sigma\right)$ 来衡量它偏离期望值的程度。方差和标准差越大,表明收益率r偏离期望收益率E(r)的程度越大;反之,方差和标准差越小,说明数据分布更集中,波动性也越小。

💡 对应点

故事元素 概念对应
红河四年平均每年七袋米 期望值(均值):衡量取值的平均水平
青河四年平均每年九袋米 期望值(均值):不同选择的平均水平对比
红河各年收成与平均线的差距 方差/标准差:衡量偏离期望值的程度
红河"大风大浪"、青河"水流平缓" 方差/标准差越大,波动性越强;越小越集中
"以为能挣十五袋,结果只挣了五袋,那种落差能把人吞了" 风险的本质:实际结果与期望之间的偏差
"先问自己想挣多少,再问自己能睡多安稳" 投资决策需同时考虑期望收益与风险(波动)

📝 来源:科目二 · 第三章第四节 · 二、期望、方差与标准差