数字经济大变革
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 人工智能时代:日新月异,数字经济的成熟期

随着大量传感器、智能设备、App连接到互联网中,数据产生的速度越来越快,预计到2025年,全球数据总量将超过160 ZB。随着万物互联的智能社会的到来,未来全球的数据量还将继续保持爆发式增长的态势。

数字经济时代,除了土地、资本、技术、劳动力等传统生产要素,数据已成为最重要的生产要素,数据竞争力将成为企业最核心的竞争力之一。

随着数据量的急剧增长,对数据的采集、传输、存储、处理和应用的要求也越来越高,传感器、5G、云计算、深度学习、大数据等新技术应运而生,标志着数字经济发展正式进入人工智能时代。

数据、算力和算法是推动人工智能技术发展的三个核心要素,数据是人工智能的原材料,算力是人工智能的燃料,算法好比一位优秀的厨师,它们之间相互依存,缺一不可,是人工智能创造效益和产生价值的必备条件。

数据的采集主要来自两个方面:一方面是由传感器采集的大量的来自物联网的数据;另一方面是由App采集的大量的来自移动互联网的数据。数据可以分成数值、文本、图片、音频、视频等多种类型,也可以按照结构分成结构化数据、半结构化数据和非结构数据。数据种类越来越丰富、数据来源也越来越多样化,多源多模态数据融合技术将成为人工智能的核心技术之一。

人工智能算力一般由专用AI芯片和公有云计算服务来提供。其中GPU作为通用AI芯片领先其他芯片,在人工智能领域中使用最为广泛,GPU具有更高的并行度、更高的单机计算峰值、更高的计算效率。一般来说,GPU浮点计算的能力是CPU的约10倍。另外,深度学习加速框架在GPU之上进行优化,再次提升了GPU的计算性能,有利于加速神经网络的计算。

云计算是一种全新的分布式计算模式,通过云计算平台将海量的存储资源、网络资源和计算资源有机地组织成一个巨大的资源池,为用户按需提供云计算服务。云计算具有按需分配、弹性可扩展、性价比高等特点,可以为用户提供IaaS、PaaS和SaaS三种不同层次的服务,其中IaaS服务相当于为用户提供了一台虚拟的计算机,PaaS一般以API的方式对外提供服务,SaaS则为用户提供开户即用的软件服务。云计算本质上是一种集约化的计算模式,一方面增加了数据处理的吞吐量,另一方面,对于云计算的客户来讲,相比传统自购服务器的模式,采购云计算服务成本更加低廉,安全性和稳定性也更高一些。可以说,云计算为人工智能提供了源源不断的算力支持。

算法是人工智能的核心要素,近年来人工智能技术的发展,很大程度上得益于机器学习算法的发展。机器学习算法可以分为有监督学习、无监督学习、强化学习三种基本类型。

通过训练样本学习,由监督学习可以得到一个模型,之后运用这个模型进行推理。例如,识别各种水果的图像,我们需要采用人工标注(即标好了每张图像所属的类别,如苹果、梨、香蕉)的样本进行训练,在这之后得到一个模型,然后用这个模型对未知类型的图像进行判断,这称为预测。如果只是预测一个类别值,则称为分类问题;如果要预测出一个实数,则称为回归问题,例如,根据一个人的学历、工作年限、所在城市、行业等特征来预测这个人的收入就是一个典型的回归问题。有监督学习算法发展历程如下。

有监督学习算法发展历程

无监督学习则与之刚好相反,它首先通过机器学习算法分析某些给定的数据样本,然后得到某些内容。无监督学习发展历程如下。

无监督学习发展历程

强化学习是一类特殊的机器学习算法,算法要根据当前的环境状态确定一个动作来执行,然后进入下一个状态,如此反复,目标是让得到的收益最大化。如围棋游戏就是典型的强化学习问题,在每个时刻,要根据当前的棋局决定在什么地方落棋,然后进行下一个状态,反复放置棋子,直到赢得或者输掉比赛。这里的目标是尽可能地赢得比赛,以获得最大化的奖励。

虽然真正意义上的人工神经网络诞生于19世纪80年代,反向传播算法、卷积神经网络、长短期记忆网络等早就被提出,但遗憾的是神经网络在过去很长一段时间内并没有得到大规模的成功应用,在与SVM等机器学习算法的较量中处于下风。原因主要有:算法本身的问题,如梯度消失问题,导致深层网络难以训练;训练样本数的限制;计算能力的限制。直到2006年云计算出现后,这种情况才慢慢有所改观。