跳转至

五、协方差与相关系数

🏺 寓言故事 —— 《茶楼的三个艺人》

江南有一座小城,城西的茶楼最热闹。茶楼里常年有三位卖艺人:拉二胡的老沈、吹笛子的小柳,以及后来才来的说书人老周。

老沈和小柳搭伙多年。他们发现一件怪事:只要天好,来茶楼听曲的人多,两人的赏钱都多;天一下雨,客人稀稀落落,两人的赏钱又都少。日子久了,老沈在账本里画了两条线,一条记自己的收入,一条记小柳的收入。他惊讶地发现,这两条线像两条并肩而行的河,涨一起涨,落一起落。

"咱们的命,像是拴在一根绳上。"老沈对小柳说。

小柳点头:"绳子那头,连着老天爷的脸色。"

他们给这种"一起涨跌"的劲儿起了个名字,叫"同涨同跌之力"。旱涝保收的年份,这力小;遇到大旱连着大涝,收入一起垮,这力又大得吓人。可老沈很快发现,这个力没法直接比较——小柳年轻,笛声清亮,底子本就比他厚,基数不同,同涨同跌的绝对数字也差了一大截。

有一年,茶楼来了位教书先生,姓林。林先生爱听曲,更爱琢磨数字。他看了老沈的账本,笑道:"你算的是'一起变了多少',可两个人起点不同、本事不同,单看这个数字,比不出真正的亲疏远近。"

老沈不服:"那怎么比?"

林先生蘸了茶水,在桌上画了一个圈:"先各算各的'起伏'。你老沈的收入忽高忽低,有个平均的摆动幅度;小柳也有她自己的摆动幅度。把你们'一起涨跌的劲儿',除以两个人各自摆动幅度的乘积,得到的数,就叫'相关'。这个数把你们各自的底子都除掉了,只剩'到底有多像'。"

"最大是多少?"小柳问。

"一。"林先生竖起一根手指,"你涨一分,我也涨一分;你跌一分,我也跌一分,像照镜子。"

"最小呢?"

"负一。你涨我跌,你跌我涨,像跷跷板。"

"零呢?"

"那就是各走各的道,互不相干。"林先生顿了顿,"不过世间的事,零很少见。大多是在一和负一之间晃荡。"

老沈和小柳照这法子一算,他们的相关差不多是零点八——很亲近,但不是一个人。这意味着,如果把全部希望都押在二胡和笛子上,晴日一起赚,雨天一起赔,没有退路。

就在这时,说书人老周来了。老周不讲天气,讲古。晴天有人听他讲三国,雨天也有人围炉听他讲聊斋。老沈暗中比较,发现老周的收入和自己的收入相关很低,大约只有零点二。有时候雨天二胡赏钱少,老周那边反而因为人躲雨闲坐,赏钱更多。

老沈一拍大腿,去找茶楼掌柜商量:以后不再只让二胡和笛子压轴,而是让老周也固定登台,三人轮流,组合成一台戏。

掌柜将信将疑,试了一个月。结果出乎意料:晴天自然满堂彩;雨天虽然二胡、笛子收入降了,老周那块却稳住了。整台戏的总收入不再像过去那样大起大落。

老沈在账本上画下三条线。他明白了:知道两个人有多"像",不是为了让他们更像,而是为了找到那些"不像"的人。只有把"不像"的放在一起,才不会被同一场雨浇透。

后来林先生给他写了一张纸条,压在账本底下:

同涨同跌的劲儿叫协方差,除了各自的底子、标准化之后叫相关系数。相关系数只在负一到正一之间。找到相关性低的人搭伙,便是分散风险。

老沈看不懂公式,但他把纸条收得好好的。每当有年轻的艺人来投奔,他就指着台上的老周说:"去,跟他搭伙。咱们茶楼最怕的,不是没生意,是所有人生意一起没。"


📖 原文定义

在统计学中,人们用协方差(Covariance)衡量两个随机变量共同变化的程度。假设 $r_i$ 和 $r_j$ 分别表示证券 i 和证券 j 的收益率,它们的协方差可以记作 $\mathrm{Cov}(r_i, r_j)$ 或 $\sigma_{ij}$ 。当 $i = j$ 时,协方差退化为单个随机变量的方差,即 $\mathrm{Cov}(r_i, r_i) = \mathrm{Var}(r_i)$ 。协方差反映了两个变量的共同变化趋势:协方差为正,表示两个变量同向变化;协方差为负,表示两个变量反向变化。然而,协方差的数值大小依赖于变量的单位和尺度,因此不易直接用来比较不同资产之间的相关性。

为了消除协方差的单位影响,统计学家引入了相关系数的概念,用于衡量两个变量相关性的强度和方向。证券 i 和证券 j 的收益率相关系数 $\rho_{ij}$ 定义为协方差与各自标准差的比值:$\rho_{ij} = \mathrm{Cov}(r_i, r_j) / (\sigma_i \times \sigma_j)$ 。相关系数的取值范围为 $-1 \leqslant \rho_{ij} \leqslant 1$:当 $\rho_{ij} = 1$ 时,表示完全正相关;当 $\rho_{ij} = -1$ 时,表示完全负相关;当 $\rho_{ij} = 0$ 时,表示零相关。相关系数反映了两个变量线性相关性的强弱,且不受原始数据单位的影响。

在实际市场中,完全正相关或完全负相关的情况极为少见。大多数情况下,相关系数在 $(-1, 1)$ 之间。通过合理配置相关性较低的资产,投资者可以在不显著增加风险的情况下提高组合的预期收益。这种策略被称为分散化投资,是降低投资组合非系统性风险的有效方法。

💡 对应点

故事元素 概念对应
老沈与小柳的收入同涨同跌 两个随机变量的共同变化趋势
晴天雨天收入波动大小不同 协方差数值受变量自身波动幅度影响
两人起点、本事不同,绝对数字不好比 协方差依赖变量单位和尺度,不易直接比较
林先生用各自起伏标准化"同涨同跌之力" 相关系数 = 协方差 ÷(各自标准差的乘积)
相关最大为 1,最小为 -1,零为互不相干 相关系数取值范围 [-1, 1]
老沈与小柳相关约 0.8 高度正相关
老沈与老周相关约 0.2 低相关性
三人组合登台,雨天收入稳住 分散化投资降低非系统性风险
"找到'不像'的人搭伙,才不会被同一场雨浇透" 理解相关性的真正价值在于构建分散化组合

📝 来源:科目二 · 第三章第四节 · 五、协方差与相关系数