同实验室小伙伴一起去苏州参加了2019年中国计算机大会。
这次大会的主题是"智能+引领社会发展"。无论是在传统产业智能化转型升级过程中,还是新兴产业飞速发展的进程中,智能化技术部担当着重任,并将作为技术基础引领社会发展。未来的社会将是智能化的社会,将是互联网、云计算、大数据、物联网与人工智能共舞的社会,将是智能+引领各行各业全面转型提升变革的机会。
本届大会吸引了众多巨佬参加,干货满满,只恨分身乏术。由于有的内容实在晦涩难懂,鄙人边听边录音,等后面抽空再整理。
整个报告计划分为两部分,上和下。在上部分先列出几个报告,这几个报告是在高铁上整理的。在下部分会列出所有报告,并将大会的资料全部共享出来。
日程
10月16日:
注册签到
10月17-19日:
上午特邀报告,下午技术论坛
10月20日:
闭幕式
地点
苏州国际会议中心(金鸡湖旁)
演讲
1. 题目:Making Big Data Small
演讲者:樊文飞(英国爱丁堡大学主任教授,英国皇家学会院士,欧洲科学院院士)
之前咱们在做数据库查询时, 数据一般大小是10的9次方B,而到了现在的大数据时代,大小来到了10的15次方甚至18次方B,不可否认,大数据给传统的计算机查询理论带来了难处。
针对大数据带来的查询困难,樊提供了两个方案:
1 Bounded query evaluation
2 Data-driven approximation scheme
分别为有界计算理论和数据驱动理论。
有界计算理论的基本思想是,给定一个函数 F(x),参数 x 代表大数据集。多数计算不需要访问全部的 x,只需要取 x 的一小部分就能得到 F(x)的精确解。有界计算理论研究的就是如何根据不同的函数 F,根据语义找到所需的 x 的那一小部分。
数据驱动的近似计算理论是根据用户的查询,在数据的层次表述中动态找到所需的数据,并在有限资源下计算查询的近似解。通俗来讲,无论数据集本身有多大,可以通过先确定用户想要问的问题相关的一小部分数据,然后访问这一小部分数据,这样就可以替代原来要访问所有数据。
2. 题目:智能机器人研究:思考和问题
演讲者:徐扬生(香港中文大学首任校长)
徐讲述了之前做过的机器人,有爬树机器人,有照顾动物机器人。爬树机器人很有意思,它的原理是来自毛毛虫爬树,这个爬树机器人什么树都能爬。徐做这些机器人时没有什么目的,就是纯粹好奇。同时,徐提出了一个很好的问题:“我们到底是要做机器人,还是做可穿戴机器智能设备?”而他是倾向于做穿戴设备的。
我想了一下,也是倾向做后者。毕竟已经有人了,为何还要做人型机器人呢?再想一下,做一个会飞的机器人,我觉得不如自己会飞呢,摆脱地心引力可是一件很酷的事情。
3. 题目:人工智能发展简史
演讲者:洪小文(微软全球资深副总裁)
1950年人们就开始表达对AI的恐慌,美国哲学家约翰·希尔勒(John Searle)在1980年设计的一个思维试验以推翻强人工智能(机能主义)提出的过强主张。这个实验就叫做中文房间实验:
一个机器人手中拿着一本象形文字对照手册,身处图灵实验中所提及的房子中。而另一人则在房间外向此房间发送象形文字问题。房间内的人只需按照对照手册,返回手册上的象形文字答案,房间外的人就会以为房间内的机器人是个会思维的象形文字专家。然而实际上房子内的人可能对象形文字一窍不通,更谈不上什么智能思维。
Searle认为通过这个过程,房间里的人可以让任何房间外的人以为他会说流利的中文。但是对于一些更复杂的问题,机器人的手册中是找不到的。
在与alphago对决的围棋比赛中,柯洁和李世石的算法要更强,但计算能力和阿尔法相比,那要差得远。虽然人在存储和计算是完全比不过机器,但是在认知这一方面上是超过机器人的。
同时,洪小文还提出了一个观点:
“ 弱人工智能很强,强人工智能很弱 ”
弱人工智能(Weak AI):指的是只能做一件事的机器,并在该领域比人类更强。
强人工智能(Strong AI):指的是我们人类,每个领域都懂一点,并且有自己的意识和智慧。
我们知道,只有少部分哺乳动物才具有意识,但建立有意识的机器人是毫无意义的。比如说,在平常的生活中,你让你老婆帮你倒一杯咖啡。你老婆说:“诶?你还敢吩咐我?!”你可能马上回答:“ 我错了我错了,我自己倒,美丽可爱的老婆, 你要不要也来一杯? ”
但是如果有个机器人反驳你,你立马就会将这个机器人丢进垃圾桶。因为我们建立机器人,就是想让它们无条件服从我们。如果你想建立有意识的机器人,为何不生个孩子呢?从这个方面去思考,弱人工智能较于强人工智能,它要更适合于未来的人类社会。
4. 题目:大规模智能体博弈中的学习算法和支持平台
演讲者:张伟楠(上海交通大学约翰霍普克罗夫特研究中心助理教授)
人工智能是预测,而多智能体的强化学习则需要决策。做决策的人工智能必须为未来考虑,也就是long-term planning,而在这个过程中必须是保证稳态的环境。我们可以将博弈论引入到强化学习中,决策模型一般大致分为三种:
NDP决策:只有一个decision maker
重复决策博弈:有多个decision maker,环境一个state,只做出一次行动。
随机博弈:马尔可夫Game,多个decision maker,环境多个state。
其实,前两种是第三种的特殊情况。
大规模海量智能体博弈,要解决的问题就是在智能体相互之间做决策,这其中需要用学习算法。学习算法可以模仿鱼群或者鸟群迁徙,这些动物在迁徙时,是如何保证整体一起前行的呢?
其实很简单,一只鸟把周围的鸟看成一个整体,根据整体的趋势做决策,这归纳起来,就是平均场理论。
再介绍一下老虎和羊之间的博弈:
在一片草原中,老虎和羊处在一个环境中,老虎带有扇形视野,有一个血槽,随着时间的流逝,老虎的生命值会不断降低,而吃了羊以后,就会恢复生命。羊没有血槽,因为身处草原中,只要不被老虎吃了,就可以一直生存下去。
如果老虎想要最大程度地活下去,它的智能应该是:一旦找到一头羊,就追踪它,等自己的血槽快空了的时候,就干掉这只羊。通过这样,能获取到最大的reward。
在模拟海量智能体博弈时,制造环境数据我们需要用CPU,而使用里面的深度学习方法时则需要使用GPU。所以说,多智能体的环境是需要大量的CPU和GPU。
再说说另一个场景,如果我们用计算机去模拟城市的交通情况,效果不是很好,为什么呢?因为离散世界的模拟器很难模拟真实世界,主要真实世界的有一个连续性事件——堵。
堵是怎么产生呢?如果所有的车都是匀速运动,那就不会堵,但是只要有一辆车速度变化了,那么就会产生堵这种情况。
张还介绍一个开源项目-CityFlow。在苏州,每天有25万辆车,那么建立该环境需要很多的智能体。首先,该如何用计算机构造这种模拟环境呢??
?
张使用的是大一就学会的链表,在每条街道和每条lane,建立一个链表,变道的时候,可以通过链表的插入等操作。检测前面是否有车,可以用遍历链表的方式。
而如何判断是否会撞车呢?通过高中物理的加速度公式,判断最小刹车距离,安全速度等等。其中,交通灯也是通过强化学习来生成的。需要多个交通灯来联合学习,也就是多智能体强化学习的合作。?
目前来说,交通灯之间的控制有三种算法
1 设置交通灯,平均需要300秒通过一个路口,比较慢。
2 计算上游和下游灯之间的压力,可以平均到145秒通过一个路口。
3 强化学习算法,根据车流实时动态变化,145秒可以降低到130秒。
如果将这个算法应用到杭州,将会减少14.5吨的排放量,总体排放减少到24%,当然,这需要非常高效的学习算法,非常高的模拟环境,
5. 题目:企业级知识图谱构建、推理与应用
演讲人:贾岩套(华为公司中央软件院知识图谱首席技术专家)
大家了解到的知识图谱,一般是知识和问答。而华为想从通信的角度来构建知识图谱,以及构建5G知识图谱。我们知道,知识图谱依赖于大量的算法,而之前的知识主要是通过人工收集。
图谱目前存在的问题:
1.过程类的知识没有很好地被建模,什么是手机容易解答,如何做一部手机不容易解答。
2.主观类的知识不能很好地建模,因为用户对知识的理解是不一样的。
之前华为领导开会,他们认为华为成立30周年的最大浪费是经验的浪费,因为很多知识都分散在大家的脑子里。华为现在想的是,在5G网络部署的时候,要把专家知识给固定下来。我们知道,爬虫能爬取到很多知识,但是专家知识不能很好地结构化。并且在经验这一发面,显得比较乱,也没有很好的校验机制。
总体来说,知识的散落和不规则分布和不规范表达是构建知识图谱的拦路虎。
除此之外,还谈了一下华为公司的AI战略: 全栈,全场景,全连接。这个“全”就包括底层的芯片,已经构建海思芯片,华为还要搭建类似TensorFlow的框架,大家都知道Google mobile service,华为打造 Huawei mobile Service,也就是要做一个生态,比如说鸿蒙系统。
同时,华为提出“网络层自动驾驶”,这是一个很宏伟的目标,目的是能将网络设备更好关联在一起,做到故障的自我修复。顺带也提到了“云测”这一概念,最后,华为希望将服务原子化,不同的APP的不同服务,对于终端系统的厂商来说,不同服务将原子化。也就是说,终端系统的厂商提供一种服务,能适应于不同的APP。
6. 题目:云时代数据库系统的产品形态和技术演进
演讲人:周烜(华东师范教授)
在国内,DBA还是很辛苦的。我的本科同学是做DBA,之前在小米工作,发了一个朋友圈,在小米年会上还在维护数据库。周介绍了如何将DBA的任务交给平台,减轻DBA人员的压力,该如何自动化DBA的工作呢,主要分为两步:
1 过度保障(Over Provisioning)
2 智能化(AI)
周教授主要讲述了第一点,方法很粗暴,就是将安全级别提高到最大,这样一些安全隐患就会彻底排除。同时,目前的架构是让计算和存储分离,这样能有效减轻压力。
7. 量子计算:从理论到实践
量子计算主要利用量子力学的两大特性-量子叠加和量子纠缠来获得比经典计算在性能上潜在的提升,并已经在一些问题上展示出了超越经典计算的能力。但量子计算模型中的特殊性质也为设计量子算法带来了巨大的挑战。近年来谷歌、IBM、阿里、腾讯、百度、华为等公司相继建立了专门的量子计算实验室或研究所来发展量子计算技术。
师兄师姐是量子方面的,我没有去听。他们听了一下午,听得是津津有味。几位大牛介绍了超导量子计算发展现状和展望、专用量子计算机的应用算法、量子架构和量脉系统、量子计算的发展发展之路;介绍了绝热量子计算AQC,超导量子计算,测量量子计算,连续变量量子计算,量子随机行走。
产品上是介绍了“量子即服务”(Qaas,Quantum infrastructure as a Service)的综合服务平台,“量脉”(Quanlse),(https://quanlse.baidu.com),该平台能够将量子逻辑门的描述高效地转换成控制量子硬件的脉冲序列。经实际测试,量脉的算法运行性能较同类型的工具包有数量级的提升。
在下一篇中,将会涉及如下内容:
1 系统软件发展的若干思考
2 AIOT
3 滴滴自动驾驶业务现状与未来
4 大数据环境下的智能存储技术
5 网络空间安全
6 若干其他内容...