年度归档:2021年

数学之美:数学学得好,赚钱也简单!

彩票怎样才能中奖?

理论上,只能靠运气。但是,如果规则设计得不好,就可以钻漏洞。

2005年2月,美国的一个彩票品种,就出现了漏洞,被麻省理工学院的学生发现了。随后的七年,这个学生反复购买这个品种,一共赚到了300万美元。

我们分析一下他是怎么做到的,以及其中的数学原理。

我依据的材料,主要来自数学教授 Jordan Ellenberg 在斯坦福大学的一次演讲(Youtube)。

#

01

期望值

彩票最重要的数学概念,叫做”期望值”(expected value),即同一种行为多次重复以后,所能得到的平均收益。

举例来说,如果每次抽奖需要2元,假设200次抽奖可以中奖一次,奖金为300元。那么,你花了2000元,一共抽奖1000次,中奖了5次,奖金为1500元。

也就是说,1000次抽奖的总收益是1500元,每次的平均收益是1.5元,这就是期望值。

它的计算公式如下:

期望值 = 300 * (1 / 200) + 0 * (199 / 200) = 1.5

期望值是1.5元,但是每次抽奖成本2元,于是净亏损0.5元。

一看就知道,这个事情是不划算的,做得越多,越不划算。

偶尔买一次彩票,倒也算了,如果你一天到晚不断买彩票,就肯定会亏很多钱(上例是每200次亏100元)。

总之,期望值是衡量彩票收益的一个关键指标。

继续阅读

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用

TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文本频率指数)

TF-IDF,是一种统计方法。

TF-IDF,是一种常用于信息检索于数据挖掘的加权技术。

TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

TF-IDF计算公式:

TF-IDF=TF*IDF

TF-IDF值越大,则这个词成为一个关键词的概率就越大。

相关的,还有TF和IDF的计算公式:

TF计算公式:

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用插图

逆向文件频率指数 (inverse document frequency, IDF) IDF的主要思想是:

如果包含词条w的文档越少, IDF越大,则说明词条具有很好的类别区分能力。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。

IDF计算公式:

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用插图2

某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF。

TF-IDF倾向于过滤掉常见的词语,保留重要的词语。

继续阅读

不负青春:从选专业到职业规划,找到命中注定的职业!

我们经常在求职网站上看到,有非常多的岗位把对应聘者的经验要求粗暴的分为「应届生」、「1-3 年」、「3-5 年」、「5-10 年」等,从求职的角度来说,入行 3 年可以说相当于是我们的第一个职业节点,从表面上看,这似乎只是一个工作时间的制约,没有达到的话会失去很多工作的准入机会,但其实背后还包含着「不需要调教、能独当一面」、「基础扎实」等默认的工作素质。

回顾自己毕业以来这些年的职场经历,一方面幸运自己坚守了选择专业时的初心,做着相关的工作,也从实习起就选定了自己将来的职业方向,可以说在这条路上走得还算「顺利」,另一方面,作为一个日渐成熟的「打工人」,对于工作和职业规划,我有了很多新的认知,再回过头来审视自己的职业选择,只能说是做出了当时认知范围内的「最好选择」。

这篇文章的存在,既是为了厘清自己在下一个阶段的职业规划,同时也希望我的经历和思路能对正在选择专业的朋友们有一些帮助。

毕竟于普通人而言,选择专业大概率意味着选择未来要入行的职业领域,即使是以后也有一些修正的机会,比如说大学转专业、考研跨专业、工作转行……但这毕竟需要一定的成本,能尽力提供一个视角给选专业的小朋友,也算是这篇文章额外的价值。

继续阅读

当我说起音质的时候,我想说什么?

说起 Hi-Fi,我们脑子里难免会出现这样一个画面:

神情严峻的狂热发烧友正襟危坐在音响前,时不时从嘴里蹦出几个莫名其妙的、类似「高音甜」「中音准」「低音劲」这样的形容词;和他们聊起音乐时,动辄就是那几张「发烧天碟」中的「试音金曲」。

虽然乍看之下有些可笑,但「音乐发烧」也算是唱片工业扩张大潮下对音乐欣赏本真的一种坚持,只是和任何亚文化一样,有时候当坚持演变成了「古怪」的仪式,外人看了觉得奇诡也情有可原。

但音乐爱好者对高保真的追求并不是凭空而来的,它与音乐产品的制作方式演变密不可分。

曾经有一段被称为「响度战争」的小历史:

为了更容易引起听众的注意,很多音乐制作人都不顾创作者的原本意图,争相把音乐做得足够大声,以达到瞬间把歌迷耳朵牢牢抓住的效果。

#

在以前,比如古典乐,就是一种更细腻、更复杂的纯音乐表达方式,除了各种乐器的配合,还会使用响度变化来表达不同的情感;但流行乐就比较少看到这种创作方式,所以那时很多流行音乐制作人干脆就把各种乐器的音量调到几乎一样。

这种做法其实现在也还有,如果你有兴趣,可以将一些口水歌或者短视频平台的背景音乐下载下来,拖到能显示声音频谱的软件里。你会发现它们的波形图并非错落有致的「山峦」造型,而是都像砖墙般充斥着整个界面。

同时,随着时代的变化听众的喜好也发生了巨大的变化,别说音乐细节,能完整听完一首歌的人都越来越少了。

没有买卖就没有热爱,音乐制作人自然也就不再用心,批量生产爆款才是王道。

#

那一定要去听懂那些古典的、大编制的作品才能欣赏好音乐了吗?

所幸不管在什么时代,不管是实体唱片还是数字音乐,有追求的音乐人一定都会在自己的作品中留下各种想法和痕迹。

如果不使用所谓的发烧词汇来聊「音质」,我们究竟聊的是什么?

继续阅读

我想这样,我才是我喜欢的样子!

(一)

因为贵,所以好吗?

有人说:“这件衣服不太衬你哦。”

你说:“不会吧,这个可是名牌,花了我2000多呢!”

因为2000块,所以应该好看吗?因为贵,所以好?!

(二)

很优秀,所以你会喜欢!

有人问:“上次介绍的那个人怎么样?”

你说:“我不喜欢。”

继续说:“唉呀,这个男/女孩子很优秀的!才24岁,就有房有车了!很多人追求,你怎么会不喜欢呢?”

24岁,有车有房说明他/她很有能力,但是等于我一定要喜欢他/她吗?!

#

因为贵,所以合适我?

因为他优秀,所以我会喜欢?

继续阅读

判断用户的价值:网站用户忠诚度计算公式

客户忠诚营销理论(Customer Loyal,CL)是在流行于20世纪70年代的企业形象设计理论(Corporate Identity,CI)和80年代的客户满意理论(Customer Satisfaction,CS)的基础上发展而来的。

企业应以满足客户的需求和期望为目标,有效地消除和预防客户的抱怨和投诉、不断提高客户满意度,促使客户的忠诚,在企业与客户之间建立起一种相互信任、相互依赖的“质量价值链”。

#

客户忠诚度,又可称为客户粘度,是指客户对某一特定产品或服务产生了好感,形成了“依附性”偏好,进而重复购买的一种趋向。

客户忠诚是指客户对企业的产品或服务的依恋或爱慕的感情,它主要通过客户的情感忠诚、行为忠诚和意识忠诚表现出来。

其中情感忠诚表现为客户对企业的理念、行为和视觉形象的高度认同和满意;行为忠诚表现为客户再次消费时对企业的产品和服务的重复购买行为;意识忠诚则表现为客户做出的对企业的产品和服务的未来消费意向。

由情感、行为和意识三个方面组成的客户忠诚营销理论,着重于对客户行为趋向的评价,通过这种评价活动的开展,反映企业在未来经营活动中的竞争优势。

继续阅读

相念,不如相见!

相见不如怀念。

是出自宋朝司马光(砸缸少年)的《西江月》中的词句:

相见争如不见,有情何似无情。

一直以来,被认为是写情的佳句。

一种见之与不见,有情与无情之间的意境,只可意会,难以言传。

口语化后演变为,相见不如怀念,多用以描绘无法相见时,无奈的心境。

也用于相见后,梦想和现实之间的差距,以至于,相见不如不见。

#

我是比较现实主义的,把一切都埋藏在心里,我基本上做不到,也不会这样去做。

也一直秉承是你的就是你的,不是你的你抢也没用式的缘分之说。

所以,我个人是比较奉行:

相念,不如相见。

继续阅读

特别策划:《舌尖上的阳山》缩略图

特别策划:《舌尖上的阳山》

阳山县位于广东省清远市中部,南岭山脉南麓,连江中游。

战国时期境内有阳禺国,秦朝末年设阳山关,西汉高祖时置阳山县,迄今已有2200多年的历史。

每个阳山人舌尖上的味道,构成了阳山这座城市的饮食文化,见证了这座城市的成长,一种舌尖上的味蕾代表着一座城市的味道。

2012年,央视美食类纪录片《舌尖上的中国》,引爆了无数舌尖上的文化。

但令人遗憾的是,对于阳山美食的描述,拍了第3季了,还是0秒出镜。

于是,舌尖上的阳山,就此诞生!

继续阅读

你有权,保持无聊!

《无聊的意义》,原本是这篇文章的标题。

但是你看,意义,就算是加了一个无聊的前缀,仍然充满了习惯了追寻意义的路径依赖。

2021 年快要过去了。

疫情的反复无常,对生活的影响,也逐渐进入了常态化,人们不再盲目惊慌。

国内的校外培训巨头们遭遇了政策监管落地后的市值爆击,兴趣教育却陷入了内卷。

围绕“躺平”的争论,正随着互联网大公司们纷纷作出拒绝加班、取消大小周的姿态,顺利的进入中场休息间,算是风平浪静了。

这是个难得的喘息窗口,令人对大到社会、小到个体自身的生活或生存状态与目的,做一番打量。

#

01

无聊有罪

绩效导向的社会里,没有真正的禁区,也可以说处处是禁区。

这是变革中最大的不同。

因为没有了敌我矛盾(可以做/不可以做)的粗暴两分法,反而模糊了规则和界线,因此自我审查和自我鞭策成为了新的枷锁,在一个越来越好、越来越不好中也必然带着“好”的正向思维成为主流价值观的激励下,(似乎已经被解放了的自由的)自己就是自己最好的奴隶主和奴隶。

数据成为新宗教的时代,产出的衡量标准是数字,或进而简化为流量。

当我真切地听到身边人骄傲/自嘲/无奈地说出“我不要脸,我只要流量!”的时候,空气里隐隐约约有资本主义初级阶段粗暴跑马圈地的血腥味,只是这次被圈的对象是我们的同胞 —— 在所有人都这样做的时候,也就是我们自己了。

继续阅读