p值 (p-value) p值是一个统计学指标,它像一个“运气探测器”,用来帮助我们判断一个事件的发生,究竟是出于某种真实有效的原因,还是仅仅是随机的巧合。在投资领域,当我们测试一个新的选股策略或者交易信号时,总想知道它是不是真的比市场平均水平更“神”,还只是碰巧在测试期间运气爆棚。p值衡量的,正是在“假设这个策略完全无效”的前提下,我们观测到的这种(甚至更好的)优异表现有多大的概率会纯粹因为运气而发生。如果这个概率(p值)非常小,我们就有理由相信,这个策略可能真的有两把刷子。
想理解p值,我们先忘掉复杂的公式,来看一个硬币的例子。 假设你的朋友小明拿出一枚硬币,宣称这是他的“幸运币”,抛掷时出现正面的概率特别高。 这是一个需要验证的“声明”。在统计学上,我们通常会建立两个对立的假设:
现在我们开始实验:抛掷10次,结果出现了8次正面。 这时候,p值就登场了。p值要回答的问题是:如果这枚硬币真的是一枚普通硬币(即原假设为真),那么抛10次出现8次或更多次正面的概率有多大? 经过计算,这个概率大约是5.5%(即p值 = 0.055)。这意味着,即使是普通硬币,每抛100轮(每轮10次),也大概有5到6轮会碰巧出现8次以上正面的情况。这个概率不算特别小,所以我们似乎没有足够强的证据来推翻“这是一枚普通硬币”的说法,只能遗憾地告诉小明,他的“幸运币”可能只是他的心理作用。 但如果实验结果是10次正面呢?此时p值会变得非常小(约0.001),说明普通硬币几乎不可能做到这一点。这时我们就有充分的信心拒绝原假设,承认小明的硬币可能真的有“魔力”。
这个“幸运币”的逻辑,完美地适用于检验投资策略。作为投资者,我们脑中总会冒出各种“如果这样…就会赚钱”的想法。p值就是检验这些想法的试金石。
假设一位价值投资者提出了一个策略:“每年年初,买入市净率(PB)最低的10%的股票,年底卖出,其年化收益率会显著高于市场指数。”
为了验证,我们通常会进行回测(Backtesting),即用过去几十年的历史数据来模拟这个策略的表现。回测结束后,我们会得到一个超额收益率。p值此时会告诉我们:如果低PB策略真的无效(H0为真),我们有多大的可能性,仅凭运气就获得我们回测出的这个(或更好的)超额收益?
在学术界和金融界,通常会预设一个显著性水平(Significance Level,用希腊字母α表示),最常见的就是5%(或0.05)。它就像一个判断标准。
p值是一个强大的工具,但绝不能盲目迷信。对于一个理性的价值投资者来说,理解它的局限性至关重要,否则很容易掉入“数据陷阱”。