今天的生态一是计算资源社会化,二是5G,三是大数据。最大的挑战就是怎么把数据从资源转化为资产、资本。从数据资产到资本的转化有两个瓶颈,一是数据的资产化,二是无限数据产生价值需要工具,一个是区块链,第二个是人工智能。我们今天做的所有人工智能都是数据驱动的,要以前沿的思想来探讨人工智能对社会的意义。
人工智能是大数据时代最重要的核心技术。人工智能的发展是非常有趣的现象,叫做“莫拉维克悖论”:人类做一个事情很困难时,机器做起来反而容易,比如下围棋、推理、证明数学命题;人类做起来比较简单的事情,比如人脸识别或者认识一个人,但机器做起来很困难。因为人的自然能力经过几百万年的进化,而那些人做起来困难的事情是后期功能,所以机器模仿起来容易一点。人工智能是个工具,它能把社会化的数据形成各种各样服务产品。
人工智能最大的挑战就是怎么把数据从资源转化为资产、资本,这是很重要的前提。以前我们在谈数据产品时,认为把数据用来服务时可以成为资源。现在谈的是数据资产,对数据所有权的界定使数据成为资产。而未来我们要谈的是数据交换,使数据成为资本。这条路比较难走,因为数据是特殊资产,不是一般的资产,这个资产在经济学上很难研究,它跟我们熟悉的很多资产、资源都不一样。
数据边际效用递减是很重要的概念,任何一个物质产品或者资源都是边际效用递减的,也就是生产越多,效用就会下降,因为消费者都是喜新厌旧的。但数据不是这样,数据无论怎么生产,边际效应都不递减,因为数据有集聚效应、非同质性,导致价格弹性不适用。比如定价很困难,数据市场的收益很低,原因就是它的价值是动态的,这个数据对你有用,可能对我一点用都没有,数据的非同质性和动态性造成很大问题。
还有,数据是非排他性,我们拥有一份数据,并不妨碍别人同时也拥有它,因为拷贝成本几乎为零,所有数据都是可以拷贝的,而区块链正是要解决这个问题。比如健康数据,健康数据是人生产的,并不存在报酬问题。数据的资产和资本,在很大程度上是经济学、法律以及我们需要构造的体制和法规。欧盟有一个《通用数据保护法》,重要的一点就是解决数据确权问题,包括生命数据、生活数据,确权之后,才能成为数据可以交易的最最重要的前提条件,这就是数据的资本化。
从数据资产到资本的转化有两个瓶颈,一是数据的资产化,我们怎么样把物理世界跟数据对接起来?怎么样把数据的可交易性解决掉?要不然怎么能形成市场?二是无限数据产生价值需要工具,一个是区块链,解决数据对接问题和交易问题,第二个是人工智能。
很多场合我们都在讲区块链非常重要,但它最终要解决的问题是什么?我们说它构造可信的网络体系,不篡改,当你花了钱之后,这个数据资源别人就不能再用,这解决了排他性问题。还有一个问题是去中心化,这是数据交易的本身,因为数据是个性化的,怎么把交易本身变成点对点?没有中心控制,这就要有可信的架构。
比特币是数据交易物的原型,实际上区块链要做的更多的事情是智能合约。智能合约完成占有一个物理资源,把它虚拟化,变成数据资源。比如一辆车的买卖,首先把它的拥有权变成一个token通证,再根据通证做交易,交易过程中通过智能锁来实现车拥有权的转移。在网上系统保证两个事情,一、拥有这个车;二、买车人拥有这个钱。如果完成之后,就可以获得这辆车,这个过程中没有第三方参与,是一个拥有者和一个购买者之间点对点的交易。
我们认为数据社会有三方,第一方是数据拥有者;第二方是数据管理者,包括云计算、数据中心;第三方是数据使用者(消费者)。这三方在实践过程中不断改变,引出新问题。首先我们把数据放到云的时候,我们要保证数据的安全性,数据本身要被安全保管,所以云计算、数据中心走的是这条边。然后我们要保证确定数据的拥有权,特别是我们每天在互联网上产生的数据,怎么保证这些数据的拥有权利?有了资产之后还有消费的问题,消费很可能不需要管理者,消费者和拥有者之间最重要的问题是交易。
人工智能靠的是数据,它一定是大众数据的汇合,这时怎样形成一个生态就是很重要的对人工智能的支持。大家都知道人工智能算力算法算料大数据,但千万不要忘了还有资产技术、区块链。我们今天做的所有人工智能都是数据驱动的,数据驱动来自于两大特点,一是有很大的数据,二是有很高的算力。
什么叫学习?学习就是在观察基础上的归纳,建一个模型。学习的过程就是效用函数的最优化,学习的结果是使得效用函数最优的模型。我们现在做数据、做机器学习时,很重要的一点是人的知识给机器只有一个办法,就是标注,比如人脸识别时要标注所有人。人有常识,如果没有常识,很多学习是不牢靠的。目标函数效应有一个很大的特点,我们对世界的理解是不断进化的,很多事情仅仅用数学模型告知机器是不可能的,没有常识就无法感知。
交通、路权问题并不是技术问题,你要判断机器决定这件事情时的效用。如何设计算法时考虑行为,把行为的形式化教给机器是非常困难的问题,如果做得不好,飞机就会掉下来。这些问题都是人工智能研究的前沿,人工智能研究的可解释性和人工智能研究的可验证性。
对人工智能的研究方兴未艾,刚刚开始,我们要以前沿的思想来探讨人工智能对社会的意义,把这个事情踏踏实实做好。