打开网易新闻 查看精彩图片

· 这是第3465篇原创首发文章 字数 4k+ ·

· 涂子沛 | 文 关注秦朔朋友圈 ID:qspyq2015·

有一个来自山东老乡的一个经典段子:一个人在卖葱,有人问葱多少钱一斤,卖葱的说1块钱1斤。那人再问,葱白跟葱叶分开来怎么卖?卖葱的人说,葱白8毛,葱叶3毛,因为他要把葱白和葱叶分开,所以要贵1毛。

你认为第二种卖法相比于第一种怎么样?卖葱的人是亏了还是赚了?

我最近提出了一个新的概念,叫作数商。这道题考的就是人的数商。

就像智商可以测试一样,数商是一个人对于数据的记录、组织、保持、搜索、分析、控制的能力的衡量体系。我在《数商》一书中也出了一套数商的测试题。大部分题目只要具备小学数学能力就可以完成的,很多题目看起来要计算,实际上可以用知识去判断。

比如这道题:你认识一个新朋友,你和他同一天生日的概率是1/365,今天你开了个party,请了49个朋友来参加,你认为你们中间出现有人同一天生日的概率大约是多少?

大部分人都觉得概率肯定很低,事实上非常高,有95%以上的可能性。这背后需要懂一些概率的基础知识。

“数商”的第一个维度是新时代的知识结构」,第二个维度是「数感」,某种程度上是以数字为中心的,对数字的感觉、感受。你对数字熟不熟悉,你和数字有没有共同语言,你会不会娴熟地运用数字,能不能从大千世界中去发现一些数字层面的规律。

面向过去,你会不会从数字层面去发现一些规律;面向未来,你会不会用数字去预测、规划明天。我们对很多事情都是凭感觉,如果有了数感,就能让数据成为新的感觉器官,将数据神经、数据肌肉锻炼得更加敏锐,更加适应数字化社会的发展。

“数商”的第三个维度是「日常生活的习惯」,你会不会记录,会不会分类,会不会把你的生活、学习、社交分门别类地记录。记录是什么?记录就是通过手、笔、电脑把它们变成数据,然后去分析它,然后就知道,原来我有多少朋友,我的朋友可以分成多少类,每一类朋友我分别用什么样的方式去对待他们。

甚至恋爱、结婚也要依靠高数商。假如在一座1000万人口的城市里,你要找到一个合适对象是非常难的,大概是1000万里找25个人,概率非常低,你怎么办呢?大数据可以帮忙。

2012年,加州大学洛杉矶分校有一个博士生,叫麦金利(Chris McKinlay),他是一个数据高手,35岁,他在婚恋平台网站上运用了大数据和算法,在上万名女性用户中寻找到了适合自己的另一半。

打开网易新闻 查看精彩图片

信息技术的进步,赋予了中国后发优势。好像和别人赛跑,我们曾经落后500米,突然裁判一吹哨子,说:“停!你们换一条赛道,重新起跑。”

在这条全新赛道上,上演的将是以数据为基础的全面竞争。

在小数据时代,在对数据的信仰、洞察和分析使用方面,和西方比我们输了,但在新时代的新赛道上,我们和全世界最好的运动员相比可能只落后5米,甚至不落后。

发达国家具备的大数据分析工具,我们也有,没有哪个国家有我们这么便利的移动支付,也没有哪个国家能将电商的触角伸到角角落落。这一次,面对大数据的无垠瀚海,我们正在与世界同步,甚至还能领先。

在未来社会,最重要的能力不是体力,也不仅仅是智力和情商,而是新增了基于数据的能力。

现在的年轻人都是互联网的原住民、数字空间的原住民,生活的一切都在向数字空间迁移,从线下点单到手机扫码,这些应用不仅仅方便了你的生活,还积累了你的数据。你点了一杯奶茶,它就知道你喜欢奶茶,下次就推荐你这个,给你打折券。它了解你,有时更甚于我们对自己的了解,有时我们自己都会忘记自己的特点和要求,数据能记得,它会帮助你了解自己。

有人问我,感情可以被数据量化吗?这样的量化有价值吗?

我觉得可以,并且有价值,它提供了新的维度测试你的爱情。爱情的量化有很多个维度,我们总以为感情是说不清楚的,但是事实上任何感情的程度变化都有很多征兆,未来的生活完全数据化以后,算法会记录你什么时候给伴侣买过花,如果你很久没买花了,算法可能就会提醒你,所有的重要日期都给你记录了,从结婚纪念日到所有家庭成员的每一个纪念日,它都会来指导你。

未来,我们要和算法一起共同生活。

我认为,人类最大的问题不是不知道,是不知道自己不知道,不是忘记,是不知道自己已经忘记。如果我们清楚地记得自己忘记了什么,也许我们还能把它捡回来,但是不知道自己忘记那就完蛋了,彻底找不回来了。我们经常会忘记结婚纪念日、重要朋友的生日,因为人在生活的轨道上不停地奔跑,我们会顾此失彼,我们会忘记很多东西,但是算法不会,它会积累得越来越多。有算法的生活会更美好。

打开网易新闻 查看精彩图片

有观点认为,从数据中直接得出结论,这有悖于传统的科学研究方法,即提出假设、证实或证伪。

我不赞同这个观点,我认为有因果的相关性才是科学的,才是有价值的。今天的数据量太大了,每一秒都有新的数据产生,比如我点了一杯冰柠檬茶,有个数据显示,冰柠檬茶的销量和犯罪率有相关性,如果你就此下结论:冰柠檬茶销量越高的地方,犯罪率最高,如果要降低犯罪率,我们就要控制冰柠檬茶的销售,这是不对的。

但事实上,冰柠檬卖得越多,可能犯罪率确实会越高,为什么呢?因为到了夏天,夏天的犯罪率会比冬天高,气温高,很多人家里门窗打开着,女孩子穿着更短的裙子等等很多因素。从数字层面来说,很多事物都有相关性,但是我们要去考察那种有因果关系的相关性,它需要专业人员去分析,数据和算法把这些相关性都找出来,交给人来做判断,最后做判断的还是人,假如把数据交给一个糊涂蛋去分析,那也没用。

另外,在数商时代,我们该怎样培养下一代?

今天的孩子在牙牙学语时就开始接触互联网,在网上能找到一切他们喜欢的东西,他们也知道几乎所有大人知道的东西,因为我们获取信息的渠道是一样的,纸质书和kindle等电子阅读器几乎是同时进入他们的生活。像我女儿看书用kindle,但我的客厅里没有电视,有一整面书墙,还有个书房,书房里也有半墙的书,我会告诉她这是两种手段,你都要会用。

我们要把他们从电子世界当中拉回来一点点,拉回来做什么呢?要告诉他们用手写、用手记,不能一切都依靠电子设备。我们经历过、享受过手写记录的时期,手是体外的大脑,你必须要锻炼你的手,手脑要协同。

今天有很多人不愿意写,就用电脑copy、paste一下,这是很容易出问题的。我讲一个真实案例,杭州某医院一个男病人的病历上写着“子宫”,原来是医生直接复制粘贴,把女病人的病历粘贴到了他的界面。事实上,用手记录的过程是一个思考和分析的过程,而数字化把过程简化了,数据给我们带来巨大的好处,但也出现了新的问题。所以我鼓励孩子们要用手来做笔记,我自己本身也是一个笔记的践行者,每天都用手写记录。

当然,我并不反对使用电子化的记录工具,我的主张是,重要信息坚持用“手”记,并辅以强大的电子工具,比如微软的OneNote、印象笔记等可以用来管理自己的信息收集体系。

打开网易新闻 查看精彩图片

任何一种技术都会带来新的问题,技术解决了一些问题,让人的生活变得更方便,同时也会带来新的问题。比如滴滴帮你叫一辆车,原来你只能在街边偶遇,现在靠电脑分配,有一辆车就在前面拐弯的路口,只是你看不到它,这辆车要是没有接到滴滴的订单,他很有可能就往反方向开走了,你就与它失之交臂,现在有了打车软件,他一拐弯就过来接你了,整个成本降到了最低。

但是我们少了什么呢?我们少了邂逅,少了偶遇,一切都是算法在提供,你吃什么,看什么电影,读什么书,你一打开它就会根据你以前的行为给你推荐,你以前关注过大数据,买过一本涂子沛的书,现在涂子沛出了一本新书,平台推荐给你,猜你可能喜欢,它猜得准不准呢?很可能准。

但是话说回来,这个投喂是基于你的行为,算法是死的,人是活的,人的主动性在哪里?你自己应该主动去关注新的东西,因为你关注新的东西,你就为算法输入了新的东西,算法就会变得多元;如果你永远不关注新的东西,算法就永远给你投喂同样的配方,所以你和算法之间是一个互动的关系,人在算法的世界、数据的空间里,还是要有能动性,问题是你怎么去发挥你的能动性。

有人提出疑问,现在机器人能写诗、画画、写小说,比如计算机作诗系统“九歌”,它作出来的诗给评委看,评委也分不出哪个是人写的,哪个是机器写的,它根据算法可以不断优化,可以做得更好。那么,在大数据和人工智能时代,人文艺术工作者应该采取的策略是什么?

人工智能在快速进入人文艺术领域,确实形成了挑战。机器在某些方面超越人是铁定的,要接受这个现实。机器人下棋已经赢了,机器人还能弹钢琴、作诗、画画、写小说……未来是机器人和人协同来写小说,这种产品已经有了。

任何一个重大的科技进步,最后挑战的都是伦理问题。

我们今天看到很多对人工智能的畅想,你会发现它们都是在挑战人的主体性。你会担心机器人把你取代了,以后你不用上班了。机器人会不会造反?你想断它的电,它还不让你断电,最后机器人统治了你,让你为它工作,让你为它干活……会不会有这样的一天?我们对智能时代最深的忧虑都在这里,就是人的主体性正在被消解。

我想,50年内机器人没有办法挑战人的主体性,但会形成一些局部挑战,大部分重复性的工作都会被取代。从木牛流马到流水线生产,人的珍贵性和不可替代性在越来越多方面受到挑战,它会激发人类去思考,我要做什么事情才不可替代?假如你写10篇稿,8篇都被机器人写掉的,你可能只有拿到20%的工钱,这就逼着你去把剩下的2篇稿写得更有创造性,而且要去开拓更多的领域。

我期待数据在未来可以引领一种大众文化,不仅是从事科学技术的人,我希望诗人、小说家、医生、记者、清洁工都来关注数据,形成真正的“数据文化”。从这个角度来讲,数据革命正在创造一个新的文明。

我的一个最大论断就是,我们在进入一个“数文明”的时代,原来的文明是以文字为中心的,未来的文明是以数据为中心的,我们需要新的思维技能和工具,需要新的价值观、新的生活方式。

胡适先生曾说,某些中国人长期具有“凡事差不多,凡事只讲大致如此”的习惯和作风,《差不多先生》活灵活现地白描了某些中国人取道中庸、不肯认真、甘于糊涂、拒绝精准的圆通形象。

如今,我们不能再把大数据仅仅当作一个科技符号,而要把它变成一个文化符号,让“尊数、爱数、用数”的基因融入中国人的思维方式和文化血液。

  • 作者为大数据领域的先锋思想家,著有《大数据》等作品,近作《数商》由中信出版集团出版