home

如何计算两个东西之间的距离

Created
May 10, 2020
Tags
想法
用尺子量?不是。
这里的「东西」不是实物,而是抽象的概念,比如说「生」与「死」。这些东西之间的距离就没法用尺子量了。
那要怎么算呢?
Amazon 在 2001 年提出了一种计算不同商品之间距离的方法,并申请了专利(点击「阅读原文」查看专利全文)。他们当时是为了给购买了 A 商品的用户推荐与 A 距离最近的那些商品,提高转化。
notion image
简单说来,他们是这么计算的(不要被公式吓住,中学数学知识就够,本文的主要目的是开脑洞)。
在一个时段内,假设购买商品 A 的人数 nA 是 100 人,购买商品 B 的人数 nB 是 200 人,同时购买了 A 和 B 的人数 nA,B 是 30 人,那么用下面这个公式算出商品 A 与商品 B 的关联性:
notion image
sA,B = 30 / √(100 x  200) = 0.21
这个数越接近于 1,两个商品之间的距离越小。当所有购买了商品 A 的用户都同时购买了商品 B 时,sA,B = 1,此时两个商品之间的距离为 0。
这个方法借用了计算向量之间距离的方法:
notion image
真是太巧妙了!
利用工作之便,我用用户听书的数据,计算了「樊登读书」平台上不同书籍之间的距离。这里隐去具体数据和计算过程,我们来看结果:
  • 与《高效能人士的七个习惯》距离最近的是《深度工作》
  • 与《逆商》最近的是《坚毅》
  • 与《创业维艰》最近的是《从 0 到 1》
  • 与《中国哲学简史(上)》最近的是《中国哲学简史(下)》
结果证明这个方法是很靠谱的。
这样一来,发散一下,打开脑洞,只要数据足够,理论上可以计算出任何「东西」之间的距离:
  • 王菲与孙燕姿之间的距离
  • 《无所谓》与《惊雷》之间的距离
  • 音乐与啤酒之间的距离
  • 足球与高尔夫之间的距离
  • 爱情与婚姻之间的距离
  • 爱马仕与拼多多之间的距离
  • 陌陌与脉脉之间的距离
  • 早起学习与通宵游戏之间的距离
  • 等等等等
有了这些数据,我们就可以建立一个坐标系,任意一个「东西」在这个坐标系里都有唯一的坐标。
然后根据一个人的性格和喜好,可以在这个坐标系中作出代表他 / 她的曲线。
这样每个人都可以由一条不同的线来代表,稍加计算,我们就可以算出任意两个人之间的距离。人也是「东西」。
因为所有生物都会死,根据公式,「生」与「死」之间的距离是 0。所以代表人的这条曲线由一个点开始,回到同一个点结束。
善变的人曲线导数更大。
感觉这东西有点用,但没想好有啥用。
欢迎留言讨论,回头咱一起去申请专利。