2373
需用时 04:44
【菠萝科学奖】一个公式,解决婚礼份子钱这一千古难题

2016菠萝数学奖颁给台湾学者赖以威,以表彰他在婚礼份子钱这一大难题上做出的贡献。

对很多人来说,去参加别人的婚礼应该随多少份子是一件让人抓狂的事。人们总是免不了和其他人讨论“你包多少”、“五星级饭店哎,2600够吗”等诸如此类的话题(编者注:文章提到的金额均为新台币,目前人民币与新台币的汇率约为1:5)。前阵子,一张由婚宴从业者整理的“订婚/结婚礼金行情表”在Facebook上广泛传阅(下图)。从业者根据经验,依照台湾的5个地区、5种餐厅等级、3种参与人数(不出席、1人、2人)以及4种交情关系,设计出了这个表格,表格共计有5×5×3×4=300个栏位。不过,这个非常实用的表格也有一个缺点——过于复杂。要是每次包红包都要对照这个表,那估计省下来的红包钱配眼镜都不够。

订婚/结婚礼金行情表,图为不熟朋友和普通亲友的礼金行情。图片来源:twhf999.com.tw

订婚/结婚礼金行情表,图为世交、公司主管或兄弟姐妹等熟人的礼金行情。图片来源:twhf999.com.tw

不过,既然表格是根据各种状况所统计出来的数据,那么这300种红包金额就并非各自独立,而是彼此间有所关联。比方说,交情越好就该包越多,这是常识,表格反映出来的价码也是如此。于是我决定牺牲周末晚上快乐时光,用数学将表格化繁为简。

线性回归建立“红包公式”

能做到这件事的数学工具有很多种,我选了统计学常用的“回归分析”:通过建立数学模型来了解两个或多个变量间的相关程度。

先考虑稍微简单的状况:独自参加台北的婚礼。固定“地区”跟“参与人数”后,要考虑的变数剩“交情”、“餐厅等级”,共有4×5=20种状况。将交情由点头之交到挚友用数字1-4表示,餐厅等级从自家办酒席到五星级饭店用数字1-5表示,再把这20组两个输入、一个输出的数据放进去跑回归分析(严格来说应该称之为多重回归分析),得到的回归方程式为:

红包金额= 975+372×交情+215×餐厅等级

四舍五入进位到百位得到:

红包金额= 1000+400×交情+200×餐厅等级

和此前总结出的表格进行一下对比:

结果还不错,20个数据里有一半完全吻合,剩余的一半也只有200元的差距。唯一的困扰是跑出了几个2400、3400这样不吉利的数字——这是绝对不会(除非参加旧情人)包的红包数目。

接下来,我要回过头来分析更复杂的状况:将“区域”和“参与人数”一并考虑。

这次在挑战回归分析整个表格时,我遇到了两个问题:

  1. 上述例子(独自在台北出席婚礼)只有2个变数和20种组合,回归分析能提供一道精准简洁的公式;当变成4个变数和300种组合,就很难用一道数学公式来捕捉礼金的变化。
  2. 上述例子的礼金落在1800到3800之间,每次增加200或400,相对规律;300种组合时,礼金数额变化从800到10000,中间跳过了4000、5000以及7000-9999,非常不规律。(作者注:跳过400050007000~9000是台湾包红包的习俗。因为4不吉利,而6又特别吉利,因此从3800之后就直接跳到6200。6800后因为在增加一点点也没意思了,索性直接加码到10000.

这两个问题增加了回归分析的误差。

为此,我做了两件事:

  1. 重新检查表格,剔除“不出席”的状况。因为不出席时,礼金只根据交情等级调整,其他变数都不会影响。这样的特例会降低回归分析对于其他出席状况的计算,使结果更不准;也因此,接下来的分析仅针对“出席1人”与“出席2人”的状况。
  2. 将输出从“礼金金额”改成“礼金等级”,分级制度如下:


换句话说,回归分析不再分析各种状况与“礼金金额”的关系,而是分析各种状况与“礼金等级”的关系。如此一来就可解决不同礼金等级,金额变化不一的问题。

经过这两个处理后,得到的回归分析公式为:

红包等级=-5.375+0.465×地区+2.66×人数+1.08×交情+0.6575×餐厅等级

再将式子改成分数表示,整理可得到考虑更全面的红包(等级)公式:

其中[ ]是高斯符号,意思是将括号里面的值四舍五入取到整数位。此公式算出来的结果与表格比对,只有2%的状况出现红包等级相差2,其他都相差1级以下,还算不错。比如说,如果你要和对象一起(人数2),在台北(地区5)的一个四星级酒店(餐厅等级4)参加闺蜜的婚礼(这个交情等级算4不过分吧?),那么带入公式后计算的结果为9,在对应到礼金等级表格中,查到红包金额应该为6200,与表格中的结果只相差1级。

这个红包公式不只宾客可以使用,新人也可以参考,评估自己会来的宾客大概属于那些类型,该请怎样的饭店,才能最大化收益(是把婚礼当成创业吗),或至少不亏本。

一些公式之外的想法

接下来是我的一些观察。首先是“简洁”与“全面”的取舍:从两道婚礼公式可以看到,考虑的状况越全面,公式便越复杂,直观性和实用性就会降低。以我自己来说,恐怕也不会真的去用有高斯符号的红包等级公式。

但尽管是那么复杂的公式,比起表格还是简单许多。这是一个充分展现数学化繁为简、以简御繁的例子:可以将庞大的表格表示成一道式子跟几个较小的表格。之后,只要用一道式子,就可以算出不同状况的红包礼金。

第二点也是最重要的,就是透过回归分析,可以看到不同因素在决定礼金数目的比重。以礼金等级式子来说,地区、餐厅等级最不重要,光交情跳一级,就是地区跟餐厅同时加一级的分量。此外,携伴参加对礼金的影响是最大的。

“这些不用算啊,还蛮直观的,是稍微想一下就可以下的结论。”

这么说也没错,但地区、餐厅、交情以及人数的比重是3:4:7:17——这就不是稍微想一下才能得到的,甚至,很认真地想也想不到,是唯有透过数学分析才能得到的。

那内地呢?

有兴趣的朋友可以试着建立内地的红包公式。让我们先脑力激荡,想想看会遇到什么问题:

首先我想得注意“地区”这项变数。

台湾“地域”的权重比“饭店”、“人数”、“交情”低,而内地则幅员辽阔,不同区域的影响理当大很多。精确地说,台湾的地区实际上是反应“经济发展状况”,这项指标对应到内地应该是“几线城市”。

果壳网做了一些前期调查发现的确如此。有趣的是,某些四线城市相当注重人情互动,礼金甚至可能跟一线城市相当。此外,他们以“家”为单位,人数这项变数在此毫无作用。“人数”不影响礼金数目,这在某些三线城市也有类似状况。

另外不管在几线城市,饭店等级似乎都不会影响到礼金金额。照这样看来,台湾比较偏向贴心考虑“不要让新人亏到”,内地则比较多豪爽认为“我来是冲着我俩的交情,吃哪才不重要咧”,我觉得能从数据中看见这些以区域为单位的不同习俗习惯,是很有趣的。

延续不同区域的习俗,我想如果要精准一点,内地应该还要有一个新的“地区”参数——表示的不是经济发展,而是不同地区对婚丧喜庆的重视程度。这点对一线城市来说或许没什么影响,但南方或北方的三、四线城市,可能对礼金的习俗就大不相同。

以上的考量点不仅仅是数学公式分析要注意,而是要早在统计资料汇整时就要分项收集,这样才能作为有效的分析。

照这样看来,想要一套以不变应万变的内地红包公式,恐怕是有些难度的。但缩小在某个区域,或聚焦到各位居住的城市,根据当地居民的统计资料来做分析,还是有机会得到一套加权加总公式的。

如果各位觉得还有什么参数要考量,也很欢迎我们一起讨论噢!

(编辑:球藻怪)

文章题图:shutterstock友情提供

The End

发布于2015-06-15, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

我的评论

賴以威

电子工程博士

pic