数据之巅

作者:涂子沛文章来源:图书馆点击数:678更新时间:2018-11-30

内容简介:

从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景。

“尊重事实,用数据说话”,“推崇知识和理性,用数据创新”,作者不仅意在传承黄仁宇“数目字”管理的薪火,还试图把数据这个科技符号在中国转变为文化符号,形成一种文化话语体系。大数据正在撬动中国的制度创新、科技创新。阅读此书,体会历史与现实相互融合,知识与激情相互交织,思想与观念相互碰撞,未来与前景必定豁然开朗。

  

书评:  

涂子沛先生开启了一道大门,我相信,后面会有更多的发展,让大家进入这一个重要的现代文化园地。

  ——许倬云(著名历史学家、美国匹兹堡大学历史系荣誉讲座教授)

在《数据之巅》这本书中,涂先生跳到了哲学思考的层面,以统计学的社会应用为切入点,解构数据文化在美国政治、经济乃至军事发展上起到的关键作用,一环扣一环,构思精巧,故事生动,逻辑清晰,读起来实在“解渴”。感谢涂先生的智慧,为时代贡献了一部杰作!

——郭为(神州数码控股有限公司董事局主席)

涂子沛先生的《数据之巅》通过追溯梳理美国的数据历史、展望人类的数据未来,给中国社会提出了一个数据时代的新命题——如何构建数据文化?本书引人入胜、发人深思,是不可不读的好书。    

——马蔚华(招商银行前行长)

数据本无大小,但运用数据的立场却分出大小,是谓大数据。数据表示的是过去,但表达的是未来,所以观察数据需要有历史观。涂子沛先生的这本新作《数据之巅》以大历史、大数据、大社会、大进步的格局,通过数据将遥远拉近,将悠久缩短,将巨大归聚,将过程简直。无论你从事何业或研究何题,都值得认真阅读这部巅峰之作。        

 ——朱小黄(中信银行行长、中信集团监事长)

大数据是互联网金融的基础支柱。互联网金融是云计算、大数据、社交网络这个移动互联大时代里的小时代。时代潮流,浩浩荡荡!涂子沛先生的大数据系列著作,带您观时代大潮!    ——肖风(通联数据董事长、万向信托董事长)

涂子沛先生《数据之巅》一书的历史高度和现实意义,超出了他的《大数据》。如果说他上部书开启了中国人对大数据的认识,此书则从历史的角度来说明,对数据的理解和掌握是人类文明进步的标志。中国人在“初数时代”是被动的、落后的,黄仁宇在他的名著《万历十五年》中也将中国明朝未能走向资本主义归结为中国人不能在“数目字上管理国家”。在新世纪的大数据时代,我们能否成为参与者甚至领导者?子沛这本书中有诸多可贵的思考和启示,我向读者推荐。

——田溯宁(中国宽带资本董事长)

涂先生深思熟虑,用语殷殷,穿行在中美两国的历史中,努力发掘各个大数据改变观念,改造社会,改革制度的故事,无论人与事件,都是栩栩如生,发人深省……这本书让我们有目标有信心,也给我们创新的无限空间。

——王巍(中国金融博物馆理事长)

大数据的江湖有两派,国家治理派和产业升级派。涂子沛先生无疑是国家治理派的宗师,这本书在美国200多年的政界商海、刀光剑影中勾勒出雄浑的数据思维、文化、价值观和方法论。临到尾处,我的期待愈来愈强。他的第一本书《大数据》在通篇的历史视角、西方视角后,煞费苦心附上一篇“挑战中国”的尾声,把人拉回当下、令人掩卷忧思;这次果不其然,子沛以整整一章的浓墨重彩,挑战了“智慧城市”这一兼具进行时和未来时的话题,而当涉及中国元素时,子沛的行文中出现了暖色调,那种欣赏和希冀让人宽慰之极、意犹未尽!期待《数据之巅》之后,山不穷,峰更高

——吴甘沙(英特尔中国研究院院长)

涂子沛先生已经成为中国大数据和数据分析领域最前沿的思想者和专家,如果您想了解大数据的历史、现实和未来,这本书将是您的必读书目。

——托马斯·H·达文波特(巴布森学院教授,麻省数字商务中心研究员)

涂子沛先生不仅在写书,还在用书来传递他的炽热激情:大数据时代是上帝恩赐给中国人的,国人切切不可错过这个经济发展和社会进步的时代机遇。如其书中所言,在这个新的时代,我们不仅要用数据来说话,还要用数据来创新。

——刘鹰(清华大学社会科学学院教授)

在全球化、信息化和市场化的今天,国际竞争本质上是软实力的竞争,即制度和文化的竞争。涂子沛先生倡导的客观、精确、理性和逻辑的“数据文化”理念,不仅是挖掘中国传统优秀文化、吸纳西方文明,重塑中华文化的新范式,也是推进国家治理体系和治理能力现代化的利器。

——周超(中山大学公共政策研究中心主任、教授)

《数据之巅》以数据为轴线洞察人类社会的发展规律,描绘未来的趋势和走向,力透纸背的还有作者严谨的治学风格及其赤子情怀。涂子沛老师的这本新书就是一座桥梁,实现了中西方之间、历史与现实之间、政治与商业之间的贯通融合,深入研读,可以帮助我们进入通达无碍的智慧境界!

——付伟(中国银联支付学院院长)

身处国内喧嚣浮华的互联网金融蜃景,此书恰似拨云见日,涂子沛先生跨洋而来的目光深邃地看清了中华文明与西方文明在虚与实上的认知鸿沟。民主的细节在于数据,金融的血液中流淌的也是数据,《数据之巅》,众心向往!

——郭宇航(点融网创始人、首席执行官)

作为《大数据》最早的一批读者,我曾于2012年10月专程前往美国拜会涂子沛先生。涂先生的格局和视野、勤奋和雅静以及时代的责任感令我印象深刻。这本新书立意高远、数往知来,把数据从科技符号演进到文化符号,在今天这样一个尤其需要高瞻远瞩的大变革时代,相信《数据之巅》会再次成为热点话题,推动中国数据文化的普及。

——陈登坤(金蝶集团执行董事、高级副总裁、金蝶医疗软件公司总经理)

涂子沛先生的新作《数据之巅》揭示了在人类近、现代文明进程中,在民主和共和体制的创立演化中那无形的数据之手。国内鲜有类似的作品。把数据与人类社会的进步、民主体制的演化联系起来,这是真正的人文关怀。当下的中国,从不缺“民主自由”的口号,但口号建不起先进的人类文明,数据才能。

——赵嘉敏(译言网联合创始人、首席执行官)

通过《数据之巅》,涂子沛先生再次深入美国历史中的细节,以真正治学之人的责任与良心,发掘“数据”所凝聚的可以再生的思想文化资源。数据文化是一个全新的视角,非常值得教育工作者探索和思考。在智能型社会、人机共生的时代敲响鼓点、加速到来的时刻,本书的阅读,也是一场自我启蒙之旅,将为我们推开那扇未来世界之门。    

   ——潘江雪(上海真爱梦想基金会理事长)

数据自古存在。本书截取历史长卷中的数据剖面,或古今中外,或政经产学,案例生动,立意高远,令人心生钦敬。

——赵国栋(中关村大数据产业联盟秘书长)

  

摘录:

多数人暴政:一个社会,有钱人永远是少数,没钱人总是多数,如果绝对按照“少数服从多数”的规则行事,那少数有钱人的钱最终会被没钱的人经投票的民主程序而分光。也就是说,民主程序极有可能成为多数穷人欺负少数富人的工具,如果是这样,有钱人刚冒出来,就会被打压,经济发展就会停滞。

民主:从严格的意义上理解,是指少数服从多数的票决制,其目的是通过投票这种手段,维护绝大多数人的利益。然而一投票,社会就会分裂为“多数”和“少数”两个阵营,从这个角度来说,民主导致了分裂。

共和:强调如何杜绝“多数人暴政”,保障因民主而分裂的“多数人”和“少数人”能够和谐共处。一个社会要和谐发展,在贯彻多数人意见的同时,还必须保护少数人的利益,否则“少数人”就会成为“多数人”的羔羊,被“多数人”宰割,根本谈不上“和”。

以人口普查为基础,美国的建国者构建了用数据分权的方法,这不仅调和了民主与共和的矛盾,就人口普查本身而言,也是一项创新。因为国家权力—议席要按人口数量来分配,各州需要向中央政府缴纳的税收也要按人口来分摊,权利和义务得以互相制约:想通过夸大人口基数获得更多议席的州,也要相应承担更多的纳税义务;同时,想要通过隐瞒人口增长来避税的州,将在国家权力的分配中失去应该得到的席位,这种互相约束的关系保障了人口普查的公正性和准确性。

人口普查的数据,最后成了美国国家权力、资金、资本最根本、最公平的分配标准和依据。

对一个国家来说,统计什么、不统计什么,其实是个政治问题。……要统计一件东西,必须要有清晰的边界。……首先要清楚地定义什么是“1”。

这就是政治,没有绝对的公平,政治的天平只会在不同的博弈者之间轮流倾斜,而且这种倾斜是不断发言和抗争的结果。

公元前3世纪,古希腊哲学家亚里士多德就说过:在只可能获得一个大概的情况下,满足于事物固有的精确度、停止追求完全准确,这是头脑受过训练的标志。

政治的基础应该是“真正的事实以及由此衍生出来的知识”。

在所有的事实当中,用数据描述的事实是最准确、最锐利、最有说服力的。因此,描述一件事实,增强客观性、减少主观性的最好方法,就是尽可能地使用数据。

“……专制的暴君把会计系统尽可能搞复杂、把人搞糊涂,以操纵税收和财务工作,但一个共和国的货币体系应该简单,简单到最普通的人也能方便地使用。”换句话说,共和国的目标就是让一切计算变得简单,让每个人在商业活动中都能成为自己的计算器,而不依赖他人。计算能力不仅仅是自由经济的需要,也是自由社会、自由人的需要。

十进制在亚里士多德时代就被发明了,但美国是全世界第一个在货币体系中普及十进制的国家。

在这个时代,数据好比涟漪,在历史的长河上静静的绽开波纹,把千千万万个普通人卷进它的晕圈,冲刷、洗涤、浸泡,使其成为具有数据意识的公民个体。

所有的科学,在抽象的意义上,都是数学;所有的判断,在理性的基础上,都是统计学。

在前一个世纪所有伟大发明的背后,绝不仅仅是技术本身的长期进步,同时还有思维方式的改变。

未来的美国历史不应该是这样,它还应该是普通人的历史。而普查,把我们的观察放大到民房、家庭、工厂、煤矿、田野、监狱、医院等集中展示人性之强大及脆弱的所有地方,这使新的历史记录成为可能。

站在1890年这个时间节点上,我们前瞻后顾,可以清楚地看到美国社会迈进信息时代的全景。无论是霍尔瑞斯的发明、IBM的崛起,还是第一台商用计算机的出现,都离不开美国人口普查产生的庞大数据。正是因为处理这种大数据的需求,一系列的发明和创新才成为可能。

检视人类的创新史,有一点可以肯定,市场的需求才是真正的创新动力,当需求成为越来越迫切的现实,重大的技术突破就一定会产生。

中国在数据可视化方面的先驱人物,是地理学家陈正祥。陈正祥在国际地理学界享有崇高的声誉,但因为种种原因,墙里花开外香,他的作品和贡献,尤其是在数据可视化方面的贡献,并不为中国大众所知。

陈正祥一生致力于绘图,他主张用地图说话,用地图反映历史,利用地图对政治、经济、文化、生态、环境等现象进行描绘和阐述。……直到今天他的不少作品还被世界各国专家视为精品,被称为数据可视化的经典之作。

面对错综复杂的利益冲突和政治压力,话不用多说,就让数据来一决高下!

总统身边的幕僚、亲信、内阁部长当然都从中看出了端倪,他们都意识到,要想获得项目和拨款,就必须用数据说话。这在美国政府掀起了一股数据浪潮,各个政府部门都开始招聘、雇用一大批统计学家和经济学家,以确保自己在“数据竞争”中不落于人后。

在国会的听证会上,每一个数据如果稍有含糊,每一个逻辑推理的链条如果断裂,都有可能被虎视眈眈的竞争对手揪出来,受到质疑和挑战。这种严谨的、针锋相对的辩论,最终推动了成本收益评估方法的规范和改进。

一提到要对生命的价值进行量化,而且要转变为一个货币单位,可能大部分

人的第一反应都是反对!理由很简单:生命无价!

民主的“多数”恰恰可能就是平庸的多数。民主的质量依赖于大众的理性思考水平。

用道德的名义反对生命价值的量化,其实是无知的表现,也是真正漠视人类根本利益的表现。如何完成这种量化,才是理性人类真正的挑战。

人类的一切的理性活动,其实都是在进行量化和计算,成本收益分析方法是人类理性的终极选择,就连法庭也不例外。

如果民族复兴有明确的定义和目标,那中国的学术界不仅需要对这个进程进行量化,而且还需要百家争鸣,出现多种量化模型。

所谓的模型,是对现实世界的一种简化和抽象,人类的任何模型,都不可能穷尽现实世界中的所有关系。严格的说,没有完美的模型,任何模型都是错的,但并不是说我们不需要设计模型。

中国社会非常需要普及数据文化和量化的知识。这种普及是一种启蒙,这种启蒙是实现民族复兴的必要前提,也是当前中国知识分子的重要使命。

正如盖洛普所预测的,《乱世佳人》最终成为美国有史以来票房最高、最赚钱的电影,如果剔除通胀因素,直到今天,还保持着历史第一的票房纪录。

对于大众在想什么,候选人已经不用去猜,他可以从每天的民意跟踪调查中找到答案。我们现在的政治领袖,已经不再是“领导”,相反,他们必须“追随”民意。

今天回头看,日本的秘密其实没有其他,就是承认自己的不足,诚意地向西方国家学习,不断引进、不断消化、不断建设,最终在器物、制度、文化三个方面都和西方文明接轨,成为了先进文明的一部分。

用数据来改善、控制产品质量,毕竟只是一种方法和手段,中国人最需要学习的,应该是日本人对待先进文明的胸怀和态度。

一个国家的开放,应该首先指向它的内部……和对外开放相比,内开放更加重要,它决定了一个国家长期的发展和命运。……内开放不仅关系到公民的自由、权利,还是政府管理社会、调控市场、服务经济发展的有效手段。更重要的是,随着大数据时代的到来,数据将像传统的“人、财、物”一样,成为重要的生产资料和创新资源,内开放的程度,将决定一个国家发展的动力、一个社会创新的活力。

政府用好数据、开放数据,可以服务于经济发展,推动社会创新。

政府的大数据战略除了要广泛地收集数据,其核心就是对已有数据的整合和利用。

数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。

如果仅仅把大数据的标准限定在互联网企业,认为只有互联网企业才拥有大数据,那就严重窄化了大数据的意义。毕竟容量只是表象,价值才是本质,而且大容量并不一定代表大价值,大数据的真正意义还在于大价值,价值主要是通过数据的整合、分析和开放而获得。大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来“大知识”、“大科技”、“大利润”和“大智能”的发展机遇。

到2020年,只需花上一杯咖啡的钱,就可以把一个图书馆的全部信息拷进一个小小的硬盘。

众包是通过互联网,在全球范围内利用、整合分散的、闲置的、廉价的劳动力、技能和兴趣等资源,为软件业和服务业提供一种新的劳动力组织方式。

在前智能时代,是人努力向机器靠拢,通过掌握使用机器的技能,让机器为自己服务;在智能时代,是机器开始向人靠拢,主动理解人、为人服务。

数据是知识生产和创新的资源,通过互联网开放数据,就是将原来由部分社会精英垄断的知识和创新资源,开放给大众,进一步调动大众智慧,推动大众创新,也就是“众创”。

数据就是静态的历史,历史就是动态的数据。历史的碎片,就是游离的数据;历史的迷雾,就是模糊的数据;历史的盲点,就是缺失的数据。用数据构建的历史,因为精确的细节而永远鲜活,数据越丰富,后世的历史学家也就越能经由数据更好地再现当时的社会。

国与国之间的竞争,表面上是科技竞争、经济竞争,但归根结底,还是国民素质和文化的竞争。没有一个健康、理性、与时俱进的文化,一个国家就难以变得强大,本书的努力,就是试图在中国,把数据这个科技符号变成一个文化符号,将大数据这个高端精英的话题变成一个大众话题,使数据文化进入中国人的视野、融入中国人的意识和血液。

(摘编人:彭雪勤)

  

  

返回原图
/