股票收益率曲线怎么做?
先贴图,说明一下,这是基于对历史数据回归分析做的一种简单尝试,没有使用任何统计测试或模型。所以,这只是一个简单的演示,并非严格意义上的“曲线”,更不是一个“最优”的曲线——当然,其实也没有所谓的“最优”可言。 图中是按年计算的年化收益情况,绿线是市值加权平均的收益,黄线是等权重平均的收益(因为对单只股票的投资比例不会改变,因而等权重平均的收益最终取决于组合中个股的收益)。显然,对于这两种方法得到的收益来说,年份数越多,差别就越小,到第30年简直可以忽略不计了。这也是我选择用1995年至2014年的数据做例子而不是更长的时间段的原因——虽然理论上说,越长的时间段越能反映“趋势”。然而,在如此短的时期内进行这样的比较其实并没有多大意义! 对于这种简单的样本,我们或许还可以有另一种思考方式。把每个一年都看作是一个独立的事件,然后计算每个事件发生时候的概率分布,这样我们就可以得到每条曲线的概率密度函数,从而进一步得到期望和方差等信息。但问题是,如何给定一个“独立事件”的定义呢?假如我们把每一年都当作是独立的事件来看待的话……那么,问题就回到原点了——这些“独立事件”本质上还是由同一堆样本点组成的。
以上都是基于“大数定理”和“中心极限定理”进行的讨论和分析,这两个定理告诉我们,当样本足够大的时候,各种统计量的估计值就会收敛于它们的真值,而且,那些估计值的分布也会趋于标准正态分布。如果我们对“收益率曲线”的要求仅限于“收敛于一条曲线”,并且这条曲线满足正态分布,那么上述例子中的两种做法其实都是可行的。但是,如果我们还要这个“曲线”能够尽可能逼近真实的市场情况,那结果就没那么乐观了。事实上,基于如此之少的样本,哪怕是对其中较大的几个时间段做回归分析,得到的结果也是可疑的——用统计学的话来说,就是存在严重的“过度拟合”问题。