华乐网
当前位置: 首页 >头条 >科技 >正文

神州数码主席郭为:大数据就是大智慧,终极是生命科学

2020-10-18 05:51    

文/邱月烨

城市与大数据的结合真正变得越来越紧密,我们居住的物理世界与虚拟世界正在加速融合。

1月11日,神州数码控股有限公司与广州市城市建设投资集团有限公司联合举办“数字中国·未来城市”首届广州塔未来城市论坛,神州控股董事局主席郭为在论坛上表示,智慧城市从无到有,经过多年的发展之后到了一个新的阶段。

早在2010年,神州控股就提出了智慧城市发展理念,搭建基于互联网的应用服务平台。2016年神州控股提出了“云计算+大数据”战略,2017年从传统IT服务提供商转型为创新型大数据服务商。

目前,据神州控股给出的数据,其智慧城市业务已覆盖全中国120多个城市,基于数据整合的城市服务平台签约已达40多个城市/地区,并且已经在30多个城市开展运营, 覆盖常住人口超过一亿人。

作为智慧城市成果的一部分,神州控股发还布了“大数据精准医疗临床决策平台”。神州医疗CEO史文钊介绍了关于精准医疗和大数据、基因测序的精准医疗罕见病产品、基因测序的精准医学肿瘤产品和基因测序的药物基因组学产品以及精准医疗产品的推广和部署。据介绍,成立于2016年底的神州医疗孵化近十年、筹备近三年。

神州控股从联想科技分离出来,在20年间经历了中国最大的整合IT服务商、智慧城市专家、大数据云服务提供商等几次重大转型。根据神州控股发布截至2017年6月30日的半年财报,营业额约港币57.33亿元,同比上升5.60%(公司业务收入主要来源于中国大陆,以人民币计价,收入增长率为10.53%)。

其中,神州控股的新业务收入达到4.14亿港币,较去年同期的2.73亿港币大幅增长51.21%(人民币同比增长58.41%),新业务毛利达2.09亿港币,同比增长50.75%;同时,随着利润较高的新业务在营业额中的占比增加,集团毛利率也由17.98%提升至20.12%。

在论坛上,神州数码控股有限公司董事局主席郭为就“大数据”这一主题,从科学、技术、社会、哲学等层面进行了深度演讲,以下为演讲内容(有删节):

“大数据”一词已被广泛使用,但很多厂商、专家和专著却只能给出感性的概念,以讲故事居多。

我们到底应该如何理解大数据?大数据到底有什么价值?我们该如何使用大数据?中国在大数据领域的机会在哪里?我把自己的思考总结成以下七个点。

第一,从科学的角度来定义,大数据的核心是数据,属于数学范畴。数学作为一门基础学科,和其他学科有紧密的结合,推动了这些学科的发展。

当代有一门学科发展非常迅速,这就是数据科学,它既不是纯粹的理论数学,也不是纯粹的数学应用,而是专门研究数据本身的科学体系。而“大数据”是对数据科学一种文艺化的称呼,我们要避免把“大数据”这个概念神秘化。

随着互联网和物联网技术大规模应用以后,数据收集和处理能力不断提高,人类掌握的数据样本容量将接近无限大,于是统计的可信性会趋近百分之百,这时大数据得出的规律就将愈加接近真实。

因此,数据科学旨在用最简单、直观的方法,去解决复杂的系统问题。

这就引出了第二点,在现实生活中,人们所遇到的很多现象和系统是活的、进化的、随机的,这些都是复杂问题,比如蝴蝶效应,就完全无法用简单的理论来解释。

大数据的作用在这里就突显出来了,我们可以在计算机里构建各种各样的模型叠加起来,导入各种相关的变量,去模仿复杂系统,用仿真的方式来推演、预测。地震预测和气象预测就是非常典型的应用。

人类社会是个典型的复杂系统,所以社会科学领域的问题非常复杂。例如回答一个看似简单的问题“我国是不是要开放政策允许生育二胎?”就要构建一个复杂的国家人口模型,含有几千个变量,其中一两个政策参数或变量的改变,会引起环境、经济、教育、医疗等等一系列的社会波动。

举个最简单的例子,学龄儿童数目的波动可能会带来教育资源分布不均衡问题,需要提前若干年就匹配设计相应的调整方案。设想某年小学入学人数翻倍,但师资储备不足,可能会引发多少混乱?又或者某年大学考生数目出现断崖式下跌,但院校招生计划规模不变,又会使得人才培养出现什么问题?所以针对计划生育这样一个政策的制订,需要引入几千个数据,构建几千个变量的复杂系统。

这就是针对复杂系统大数据该如何去发挥、如何去应用的一个典型案例。从系统角度来看,大数据是简单系统演化为复杂或者超复杂系统之后,一种可用的规律描述方法。这个意义上来讲,大数据需要在系统科学的指导下来应用。而系统科学的诞生实际上就是为了解决复杂系统的问题。

这就进入到了第三个层次,也是一个更宏大的层次,我们所认知的世界究竟是什么?

人类对世界的认知可分为三个阶段:对物理世界的认知,对数据世界的认知,最后是对生命世界的认知。所有人类问题的终结很可能在于生命科学,我们必须解决生命延伸与存活环境之间的矛盾,破除生命延续的限制。

然而这三者之间是有互相关系的:没有物质世界的科学突破,没有量子力学的突破,就不可能有计算机用数字进行计算的发展;而没有大数据技术的发展,就不可能有生命科学的进步。

人类基因测序的数据量是PB级的:1 PB = 1024 TB = 1048576 GB,所以今天的计算机在面对基因测序的工作量时都还存在能力不足的问题,但我们只需短暂等待,因为强大的量子计算机即将开始投入实用。

数据科学的发展会推动生命科学的发展。人类生命延续的一个重点在于攻克癌症肿瘤难关。肿瘤的病发有很多相关因素,病发后要看治疗过程中的各种方法。

而未来攻克癌症的药物一定是靶向药,辅助以精准的、副作用最低的放射线治疗,其结果就是重症医疗的个性化,癌症死亡率和致命性将极大降低。这就是数据科学和生命科学最有效的一个结合,而这需要的运算量也一定是难以想象的大。

所以产业和学界目前集中精力在研究的,就是如何提高计算能力,如何使用算法来优化疾病和诊治之间的函数关系、大数据关系。这就是由大数据构造的另一类虚拟映像。

以上是对大数据含义的阐述,再进一步需要回答,它到底能给我们带来什么价值?可以说,大数据就是大智慧。

今天,人工智能(AI)这个技术非常火热。很多人在讲AI的时候把它讲得很神秘。但实际上,AI也始终都是在做模拟验证。人类在模拟很多东西的时候,是沿着两个方向去做。一种是机理上的模仿,另一种是功能性的模仿。人工智能是对人的一种功能性的模仿。是什么功能呢?计算功能。它能解决的问题在本质上都是可以计算的,都是数学问题。

当然,要实现这样的功能模仿,有三个前提条件,就是前述三条内容——数据科学的发展、对复杂系统的认知以及大量数据的积累(成为虚拟映像)。如此,计算机可以再现环境的特征,通过一系列的算法和函数,通过不断的参数调节迭代,使得这个系统的输入输出结果逐渐逼近人的思维结果。

这样,大数据和AI就可以帮助我们完成很多需要重复性脑力劳动的工作,成为了人类思维和智慧的延伸。过去的发明创造主要从体力上解放人类,未来的科学技术要在智力维度上帮助人类完成更复杂的工作。这就是从大数据到大智慧的过程。

可以设想,未来,AI会在诸多领域发挥它的价值,比如医疗领域。依据肿瘤的电子影像来诊断,是需要医生有多年经验的,这个经验,就是它对于影像这一现象和肿瘤这一结论之间的关系判断。

看过一千个片子的年轻医生肯定不如一个看过上万的片子的老医生判断准确。但是,AI可以用大数据的方式去模仿人类学习看片子,判断就可能比这个老医生更准确。

肿瘤的放射性治疗也是同理。有经验的医生对于放射性治疗针对的位置、方向都能设计得更准确。未来可能AI也可以帮助人类做这样的方案,减轻医生的压力。

对于认识世界来说,大数据就是大智慧;而对于认识人来说,管理学也会因为大数据带来革命性的变化,这是第五点。

经验和心理成熟度可能与管理水平有直接关系——人的认知不同,决定了管理方式不同,处理手段不同。对大数据的管理也需要高超的认知水平。我们管理大数据,除了要对物理世界产生积极可控的影响之外,也将更多地优化自身的虚拟映像,这也是大数据管理的一个新特征。

定义一个人在过去是靠各种假想假设和验证。而现在不需要假设,只要统计在社交网络的数据,看人在所有关系圈里的表现即可。一个人做父亲做得怎么样,做儿子做得是否孝顺,对孩子是不是很爱护呵护,作为一个债务人是不是很讲信用按时还贷,作为一个公务员是不是很爱岗敬业等等,在大数据面板之前一目了然。

可以这样比喻:物理世界和虚拟世界之间有一扇旋转门,推门进去就是虚拟世界,走出来就是物理世界。我们如何运用好这个旋转门,用虚拟世界的这些新的规律、新方法、新技术来解决我们现实生活当中所面对的问题,是智慧城市最根本的一个方向。

建设社会信用体系,每个人就会很在意自己的行为,违信、违法的成本会变得越来越高——这就是用大数据来进行社会管理的最有效、最典型的一个实例。

第六点,从商业的角度来看,大数据产业里有什么机会?

首先要明确的是,大数据产业链,或者说是计算技术的产业链,可以分为数据采集、数据计算、数据存储、数据分析、应用场景和数据传输六个环节。

在世界范围内,数据存储、数据传输还是在靠大型IT公司支撑;数据分析行业目前是国外领先,但是由于它的多样性,还没能被某一家企业所垄断,这是我国计算机产业非常好的机会;应用场景的多样性,也决定了数据分析产业很难被一两家公司垄断。所以,中国计算机产业在数据采集、数据分析和数据应用上有很多突破机会。

在数据传输和存储方面,我国依然有很强的后发优势。我国现在有国际一流的光量子技术团队,量子计算方面已经取得了全球领先的成果。量子通讯领域,凭借墨子号量子卫星和京沪通讯,我国也建立了领先优势;下一步就是要解决长距离传输和带宽这两个问题,攻克之后就可以大面积改造所有通讯基础设施,将掀起下一代通讯技术革命。

最后澄清一个概念,就是“云”和“大数据”的关系。

除了“大数据”以外,我们也经常听到“云”这个概念,某种意义上大数据是它的内义,云是它的主体,即所有的大数据都要放在云架构上。云的形态就是“数据中心+网络+终端”。云与固态物体不同,没人能够准确感知它的形状是什么,但它却承载着来自所有人的所有数据。无论人是什么角色,不管人在做什么,其实都在构建一个无比庞大的“云”。而建此“云”的目的,就是使大数据的应用价值得到最大体现。这就是云和大数据的一种关系。

云和大数据也有显著的区别。例如云强调延展性,而大数据更看重质量;云是如何将服务送到你的手上,大数据讲如何提升数据的价值。云与大数据很难分开,因为它们彼此支持,互为中枢与脉络,为真正的大智慧提供源源不断的土壤与空间。

品牌、内容合作请点这里: 寻求合作 ››

榜单

今日推荐