第三节 AI成为国际竞争的重要砝码
随着人工智能的再次崛起,全球主要国家都意识到,它将为世界经济注入巨大能量,于是纷纷将人工智能视作经济增长的新引擎,给予大力扶持。
2019年年初,美国白宫的科技政策办公室发布了由总统特朗普(Donald Trump)签署的《美国人工智能倡议》(American AI Initiative,以下简称“倡议”)。
我在接受《中国电子报》记者李佳师女士采访时谈到,这份倡议释放了很多信号。其一,数据是人工智能战略中的灵魂性命题。高品质、强相关性数据的短缺,是整个人工智能界公认的难题。数据的完整性、准确性、可追溯性和安全性等,已经成为真正影响人工智能实现商业落地和变现的核心关键;其二,在法律、法规政策制定上有了重要变化,人工智能的视角已经从“技术”向“社会”扩展;其三,在人才需求上,人工智能的发展需要重新构建人才竞争力。不仅要强调人工智能技术专才的培养,同时强调对具有人工智能产业化能力的运营人才的培养。
人工智能作为推动国家经济发展的新的增长驱动力,正逐渐被政府层面所重视。许多国家都在不遗余力地发展人工智能,人工智能的发展已经上升为国家级战略。
那么,应该如何保障人工智能国家战略的落地与发展呢?作为在全球数据分析和人工智能领域从业几十年的亲历者,我有以下几点观察:
数据——AI落地产业的“灵魂”和“永动机”
首先,从全球范围内的人工智能企业来看,目前大家在技术实力上差别不大。美国在基础研究和核心技术积累、算法及芯片等基础层面具有核心优势,而中国在产业应用层面因为数据的开放、政府的支持等原因发展较快。中美两国作为两个科技大国,各有特色。
未来的3~5年,谁能抓住人工智能的“数据力”和“落地力”,谁就将有可能在这场全球人工智能竞赛中拔得头筹。
所谓“数据力”,就是我们常说的数据资源和数据价值的挖掘;对应的另一个关键是数据价值落地行业应用的能力,即所谓的“落地力”。这两点是近几年推动产业发展的关键。
现在大家都意识到了数据的重要性,我想说明的是,数据扮演着更为重要的角色,数据是人工智能落地产业发展的“灵魂”,数据将成为推动人工智能应用发展的“永动机”。
高品质、强相关性数据的短缺,是困扰整个人工智能界的公认难题,如果不建立开放、共享的数据解决方案,人工智能的落地就无从谈起。数据的完整性、准确性、可追溯性和安全性等,已经成为真正影响人工智能实现商业落地和变现的核心关键。
我们看到,美国在数据这个命题上已经开始发力。2020年2月28日,美国白宫发布了《美国人工智能倡议首年年度报告》(American Artificial Intelligence Initiative:Year One Annual Report),宣布美国的人工智能已经发展到了具有里程碑意义的关键阶段。在释放人工智能资源上,报告强调:“美国必须加强对高质量联邦数据、模型和计算资源的访问,以提升它们对于人工智能研发的价值,同时维护和扩展安全性、隐私性和机密保护。《美国人工智能倡议》呼吁政府寻找新的机会,增加对联邦数据和模型的访问和使用。”
当我们谈及人工智能落地、商业化、产生价值,以及运营一个可持续发展的人工智能时,需要将四个环节有逻辑地串联起来。
第一个环节是业务场景的梳理,即找到能够运用人工智能的行业痛点场景。人工智能不是空中楼阁,需要与某一行业场景结合。第二个环节是数据资产的获取,并不是所有的数据都有价值。目前在全世界获取的数据中,有价值的可能尚不到10%,与业务场景强相关的数据才是有价值的数据。第三个环节是处理和分析数据,需要运用大数据能力和人工智能的能力,构建数据模型和算法,为业务场景运营的改良提供技术支撑。第四个环节是将数据分析、人工智能分析所产生的洞察力应用到相关的商业中,转化为业务的价值,反哺用户。
从技术向社会扩展
我们看到,各国政府都在思考和推动人工智能的相关规章制度建设。人工智能已经开始从一个技术的命题上升为政府关注的社会话题,相关法律法规的制定已经成为热点。这个态势是非常好的,法规制度的配套建设有利于人工智能安全、平稳且快速地发展。
另外,如何建立可信任的人工智能,对人工智能所做出的决策能够追溯得到因果关系,增强信任,并且能保护数据的安全隐私,也是业界讨论的一大命题。如果不能保证数据的使用安全和隐私保护,政府、企业和机构都不会同意分享数据。没有数据的开放共享,人工智能的产业落地发展也就无从谈起。如何制定一个合理合法的数据安全保护制度,各个行业都在积极讨论,为监管部门献计献策。
另外,在数据收集和整理过程中,也涉及大量的道德和伦理问题。比如收集哪些数据,如何为这些数据分类、打标签。当我们把这些数据“喂”给机器学习的时候,我们提供的这些知识本身会不会有偏颇,以至于机器学习后给出的结果违背人类的道德伦理?除人工智能技术之外,我们更需要把人性的方面考虑进去。这也需要大量的产业、科技及社会伦理专家共同参与讨论,给出正确的指导原则。
在数据的归属问题上,在全球范围内也有大量讨论。大量数据虽然源自个人,但是它们到底应归属个人还是企业、组织或者政府?或是多方归属?在使用数据时,谁才是授权方?大量数据来源于个人,那么企业在通过这些数据做商业应用的时候,是否需要回馈个人或社会?这些都需要政府来规范和指导。
复合型人才需求
人才是人工智能发展的重要组成部分,目前市场上既懂技术又能进行产业化应用的人才少之又少。人工智能不同于以往的软件开发,它不仅需要技术的专业人才,还需要具有落地产业化应用能力的行业人才。实际上,人工智能落地是一个业务加技术的命题,需要的是复合型人才。
我对美国市场比较了解。目前,美国已经着手从正规的教育体系中培养既拥有行业能力、行业知识又具有技术能力的人才。美国的得克萨斯大学和哥伦比亚大学已经开始专门为生物医药产业配套的生物统计学进行人才培训,招募健康医疗从业人员进入大学学习人工智能相关专业知识,继而将他们培养成这个领域的复合型人才。在中国,诸如浙江大学、天津大学等高校也开始设置医药或健康医疗与人工智能相结合的专业,进行复合型人才的培养。
人工智能发展若成功,一定是高度业务价值驱动与行业深度融合的结果。目前来看,美国在基础研究领域和应用方面优势明显,龙头企业的数量和实力也比较领先,产业人才的数量众多。中国也开始意识到基础的重要性,开始参与人工智能开源和基础理论的探讨。随着人工智能技术多以云计算的方式研发并开放出来,技术门槛不断降低,中国在技术上的弱势会被削减,相对应的是数据的权重会逐渐增大。中国的企业由于在数据资源、政府支持和广泛应用环境上都具有先天优势,只要紧紧抓好数据,一定能在人工智能发展的领域跑到前列。