b.f.斯金纳

B.F.斯金纳

B.F.斯金纳 (Burrhus Frederic Skinner),美国心理学家,行为主义心理学流派的集大成者。你可能会好奇,《投资大辞典》里为何会收录一位心理学家的名字?答案很简单:因为投资在很大程度上是一场心理游戏,而斯金纳的理论,就像一把解剖刀,精准地剖析了驱动我们(以及市场中其他所有人)在买卖按钮前做出非理性决策的深层心理机制。他提出的操作性条件反射 (Operant Conditioning) 理论深刻地揭示了行为是如何被其结果所“塑造”的。对于投资者而言,理解斯金纳,就是理解自己为何会追涨杀跌、为何会对交易上瘾,以及如何跳出市场这个巨大的“斯金纳箱”,从而真正走向理性的价值投资之路。

B.F.斯金纳(1904-1990)是20世纪最具影响力的心理学家之一。与关注内心世界、潜意识的弗洛伊德不同,斯金纳和他的行为主义学派主张,心理学应该研究可以被观察和测量的外在行为。他认为,人的行为(以及动物的行为)不是由什么神秘的内在思想或情感驱动的,而主要是由环境以及行为的后果来决定的。 他最著名的实验就是“斯金纳箱”。想象一个箱子,里面有一只饥饿的小白鼠。箱子里有一个杠杆,小白鼠偶尔会无意中按压到它。如果每次按压杠杆,都会掉落一颗食物丸,小白鼠很快就会学会“按压杠杆”这个行为,因为它得到了积极的奖励。反之,如果按压杠杆会遭到电击,它就会迅速回避这个行为。 这个看似简单的实验揭示了一个颠覆性的原理:行为的后果决定了该行为在未来重复出现的概率。 这就是操作性条件反射的核心。得到奖励(专业术语叫“强化物”)的行为会得到强化,从而更频繁地发生;受到惩罚或没有任何结果的行为则会减弱。斯金纳认为,人类复杂的行为,从语言学习到社会规范,都可以用这套“强化”和“惩罚”的机制来解释。而当我们把目光投向金融市场时,会惊恐地发现,整个市场就是一座为我们精心设计的、无比巨大的“斯金纳箱”。

现代投资环境,尤其是那些拥有实时报价、闪电成交和推送通知的交易软件,简直是斯金纳箱理论的完美应用场景。我们每个投资者,都像是箱子里的那只小白鼠,而交易软件的设计者,则在无形中扮演着实验员的角色,用各种“强化物”来塑造我们的交易行为。

正强化 (Positive Reinforcement) 指的是通过提供一个愉快的结果来增加某个行为发生的频率。在投资中,最直接、最强有力的正强化物莫过于盈利。 想象一下这个场景:你听了个小道消息,买入一只股票,第二天它就上涨了5%。你的账户里浮现出诱人的绿色数字。这个“盈利”就是一颗美味的“食物丸”,它瞬间强化了你“听消息买股票”这个行为。你的大脑会迅速建立连接:“听消息 = 赚钱 = 快乐”。下一次,当你再次听到类似的消息时,你会更倾向于重复这个行为,哪怕你对这家公司的基本面一无所知。 追涨行为也是同样的道理。当你看到一只股票连续大涨,你忍不住冲了进去,结果第二天又涨了。这种即时的盈利,就是对“追涨”行为的强力正强化。它让你忽视了背后巨大的风险,只记住了那个瞬间的快感。交易APP上跳动的K线、上涨时的绿色(在中国股市是红色)以及不断增加的资产数字,都是在不断地给你投喂“食物丸”,强化你进行短线交易的冲动。

斯金纳在实验中发现了一个更有趣的现象。如果不是每次按压杠杆都给食物,而是随机、不规律地给予奖励(比如平均按压10次给一次,但具体是第3次还是第17次给不确定),小白鼠按压杠杆的行为会变得异常执着和高频,甚至在奖励完全停止后,这种行为还会持续很长时间。这就是间歇性强化 (Intermittent Reinforcement),也是老虎机和赌博让人上瘾的心理学原理。 股市完美地符合这个模型。你不可能每次交易都赚钱。有时候赚,有时候亏。正是这种不确定性,这种“下一次也许就能赚大钱”的期待,让你欲罢不能。一次成功的短线投机带来的巨大快感,足以覆盖掉数次失败交易带来的痛苦,并激励你不断地“按压杠杆”——也就是频繁交易。 日内交易者(Day Trader)就是间歇性强化的典型受害者。他们每天在市场的随机波动中寻找机会,偶尔的几次成功“押注”会带来巨大的刺激,让他们相信自己掌握了市场的密码,从而忽略了从长期来看,这种行为的数学期望几乎为负。他们不是在投资,而是在玩一台设计精良的“金融老虎机”。

斯金纳的理论还包括另外两个概念:

  • 惩罚 (Punishment): 通过一个令人不快的结果来减少某个行为的频率。在投资中,最直接的惩罚就是亏损。当你买入的股票下跌,账户变成刺眼的红色,这就是惩罚。它让你痛苦,理论上会减少你未来“买入这只股票”的行为。
  • 负强化 (Negative Reinforcement): 通过移除一个令人不快的事物来增加某个行为的频率。这有点绕,但非常重要。举个例子,你持有的股票不断下跌,让你焦虑不安。这种焦虑就是那个“令人不快的事物”。当你最终忍不住“割肉”卖出后,虽然亏了钱(这是惩罚),但你不用再时时刻刻盯着它、为它揪心了,那种焦虑感瞬间消失了。这种“焦虑的移除”就是负强化,它强化了你“一跌就卖”的行为。未来再遇到类似情况,你可能会更快地选择割肉,以逃避持有的焦虑。

“踏空”的痛苦同样是一种负强化机制。你一直想买某只股票,但觉得贵,结果它一路高飞猛涨。看着它涨,你每天都备受煎熬,这种“踏空的焦虑”令人痛苦。终于有一天,你受不了了,不计成本地追了进去。买入的瞬间,踏空的焦虑消失了。这个过程强化了你的“追高”行为,让你未来更容易因为害怕错过而做出非理性的高位接盘决策。

理解了我们是如何在市场的“斯金纳箱”中被训练的,价值投资者又能从中获得什么启示呢?答案是,我们可以反其道而行之,构建自己的防御体系,甚至利用他人的非理性行为。

斯金纳箱的核心在于即时反馈(立即得到奖励或惩罚)。而价值投资的精髓在于延迟满足本杰明·格雷厄姆教导我们,要把股票看作是企业的所有权,而不是闪烁的代码。这意味着我们的决策依据应该是企业的长期内在价值,而不是市场的短期价格波动。

  • 行动指南:
    • 减少查看账户的频率。 不要每天、每小时甚至每分钟都去看股价。这会让你陷入短期的反馈循环中。设定一个周期,比如每周或每月审视一次你的投资组合。
    • 关闭消息推送和价格提醒。 交易APP的各种推送通知,就是实验员在按按钮,试图引起你的注意。关掉它们,把注意力集中在对企业基本面的研究上。
    • 建立物理隔离。 如果自制力差,可以考虑将主要用于投资的资金放在一个不那么容易操作的账户里,增加交易的“摩擦成本”,让自己在“按压杠杆”前有更多的时间思考。

既然行为可以被强化,那我们为什么不主动强化那些正确的投资行为,而不是被动地被市场结果所强化呢?查理·芒格反复强调流程和清单的重要性,这本质上就是在构建一个理性的、内在的强化系统。

  • 行动指南:
    • 奖励你的研究过程,而非投资结果。 当你完成了一份深入的公司研究报告,或者严格按照自己的投资清单筛选出一家公司时,给自己一点小小的奖励(比如看场电影、吃顿大餐)。这会强化你的研究行为,而不是赌博行为
    • 为你的耐心和纪律喝彩。 当市场狂热,你忍住了追高的冲动;当市场恐慌,你坚守了自己的持仓原则。这些时刻,都值得在你的投资日记里记上一笔,对自己说一声:“干得漂亮!”。这会强化你的纪律性
    • 从错误中学习,而不是惩罚自己。 投资亏损是难免的。关键在于,不要让亏损这个“惩罚”仅仅带来痛苦,而要把它转化为学习的机会。复盘亏损的原因:是分析错了,还是时机不对,或是纯粹运气不好?通过复盘,将“惩罚”转化为对未来正确决策的“正强化”。

格雷厄姆创造的“市场先生 (Mr. Market)”寓言,就是一个情绪化的、被斯金纳效应完全支配的交易对手。他时而兴高采烈,愿意出高价买你的股票(对应被正强化后的贪婪);时而悲观沮丧,愿意以极低的价格把股票卖给你(对应被惩罚后的恐惧)。 理解了斯金纳的理论,你就能更好地理解“市场先生”为何如此反复无常。当市场上大多数人都陷入了被间歇性强化驱动的投机狂热时,他们会把价格推到远超内在价值的高度,这时便是价值投资者卖出的良机。当市场经历连续的下跌(惩罚),大多数人被训练得一看到下跌就想割肉(负强化)时,恐慌蔓延,价格跌到远低于内在价值,这正是价值投资者买入的黄金时刻。 正如沃伦·巴菲特所说:“在别人贪婪时我恐惧,在别人恐惧时我贪婪。” 这句话的背后,是对大众行为模式的深刻洞察。斯金纳的理论,为我们理解这种集体性的贪婪与恐惧提供了坚实的心理学框架。我们利用的,正是那个巨大的“斯金纳箱”对其他投资者进行“训练”后产生的可预测的非理性行为。

在斯金纳的另一个著名实验中,他将鸽子置于箱内,每隔15秒固定投喂一次食物。有趣的是,鸽子们似乎认为食物的出现与它们在投喂瞬间的行为有关,于是它们开始发展出各种“迷信行为”:有的不断转圈,有的反复点头,以为是这些行为“导致”了食物的到来。 金融市场中的许多投资者,就像这些迷信的鸽子。他们迷信各种技术指标、痴迷于寻找股价波动的“规律”,本质上也是在为随机的市场波动赋予虚假的因果关系。 B.F.斯金纳的理论本身并无好坏之分,它只是揭示了行为与环境互动的规律。作为一个投资者,我们的选择是:是做一只被市场即时反馈所控制、在“斯金纳箱”里不由自主按动杠杆的小白鼠,还是做一只“迷信”的鸽子?亦或是,成为那个站在箱子外、理解了所有规则、保持着清醒与独立思考、并利用这些规则为自己长期目标服务的聪明投资者?答案,不言自明。