关注即可获取arXiv每日论文自动推送;
如果您有任何问题或建议,请公众号留言。
[如果您觉得本公众号对你有帮助,就是我们最大的荣幸]
今日 cs.AI方向共计14篇文章。Artificial Intelligence(12篇)[1]:Knowledge Map: Toward a New Approach Supporting the Knowledge Management in Distributed Data Mining
标题:知识地图:一种支持分布式数据挖掘中知识管理的新方法
作者:Nhien-An Le-Khac, Lamine M. Aouad, M-Tahar Kechadi
备注:Third International Conference on Autonomic and Autonomous Systems (ICAS'07)
链接:https://arxiv.org/abs/1910.10547
摘要:分布式数据挖掘(DDM)处理的是在分布式数据和计算环境中发现模式或模型(称为知识)的问题。今天,大量的数据被挖掘出来,这些数据通常分布在不同的地理位置,由不同的组织拥有。因此,大量的知识正在产生。这不仅造成了数据挖掘中的知识管理问题,而且也带来了可视化问题。此外,DDM的主要目的是充分利用分布式数据分析的优点,同时尽量减少通信量。现有的DDM技术对局部站点的局部数据进行局部分析,然后通过聚集这些局部结果来生成全局模型。这两个步骤并不是独立的,因为对本地分析的简单方法可能会产生不正确和不明确的全局数据模型。这两个步骤的集成与协同需要一个有效的知识管理,具体地说是一个有效的知识地图,以便利用挖掘出的知识来指导数据的挖掘。在本文中,我们提出了“知识地图”,一种关于所挖掘知识的知识表示。该方法旨在对网格等大型分布式平台中的知识进行有效的管理。该知识地图不仅便于挖掘结果的可视化、评价,而且有助于局部挖掘过程与已有知识的协调,提高最终模型的精度。
[2]:RTOP: A Conceptual and Computational Framework for General Intelligence
标题:RTOP:通用智能的概念和计算框架
作者:Shilpesh Garg
备注:17 pages
链接:https://arxiv.org/abs/1910.10393
摘要:提出了一种具有三种学习方式的通用智能模型。前景感知轨迹和命令轨迹的统一序列转化为直接和时间跳的观测路径,构成原始学习的基础。原始学习包括图像联想的形成,它导致感知对象和对象部分之间的时间和空间关系;以及图像音频联想的形成,它们是语言的基石。离线识别观察路径中的相似片段,然后通过合并记忆节点将其还原为公共片段,从而实现广义学习。泛化包括形成用于鲁棒和一般匹配的内插感觉节点,形成用于特定匹配和重叠的感觉属性节点,以及形成用于更简单逻辑路径的组节点。多个预测中记忆节点的在线叠加,主要是图像在内部投影画布上的叠加,产生了创新性的学习和思考。动作的学习与原始学习的方式相同,而动作的确定则是通过建立在原始学习中的实用新型来实现的,其实用功能是物理感官的愉悦和痛苦。
[3]:Learning Humanoid Robot Running Skills through Proximal Policy Optimization
标题:基于最近策略优化的仿人机器人跑步技能学习
作者:Luckeciano C. Melo, Marcos R. O. A. Maximo
链接:https://arxiv.org/abs/1910.10620
摘要:在当今足球三维发展水平中,运动控制是决定球队成绩的关键因素。最近的工作利用基于机器学习的无模型方法来开发机器人动力学,以获得更快的运动技能,实现运行策略,从而为足球三维环境开辟了一个新的研究方向。
在这项工作中,我们提出了一种基于深度强化学习的方法,该方法使用一个输入与机器人动力学相关的神经网络,在没有任何先验知识的情况下学习运行技能。我们的结果比之前在足球3D文献中报道的最先进的冲刺速度有显著的优势。它还展示了样本效率的提高,能够在短短几个小时内学会如何运行。
我们报告了我们的结果,分析了训练过程,并从速度、可靠性和人的相似性方面评估了策略。最后,我们提出了一些关键因素,这些因素使我们改进了以前的结果,并就今后的工作提出了一些看法。
[4]:Sample Complexity of Reinforcement Learning using Linearly Combined Model Ensembles
标题:基于线性组合模型集成的强化学习样本复杂性
作者:Aditya Modi, Nan Jiang, Ambuj Tewari, Satinder Singh
链接:https://arxiv.org/abs/1910.10597
摘要:强化学习(RL)方法已经被证明能够在丰富的领域学习智能行为。然而,这在很大程度上是在模拟领域完成的,没有充分关注模拟器的构建过程。在这篇文章中,我们考虑一个设置,在这个设置中,我们可以访问一组预先训练过的、可能不准确的模拟器(模型)。我们使用集合的状态相关线性组合来近似真实环境,其中系数由给定的状态特征和一些未知参数确定。我们的算法可以证明一个近似最优策略,在未知参数的数目上具有样本复杂性多项式,并且不依赖于状态(或动作)空间的大小。作为扩展,我们还考虑了更具挑战性的模型选择问题,其中状态特征是未知的,可以从一个大的候选集中选择。我们提供指数下界来说明这个问题的基本困难,并在附加的自然假设下发展一个可证明有效的算法。
[5]:Neural Execution of Graph Algorithms
标题:图算法的神经执行
作者:Petar Veli?kovi?, Rex Ying, Matilde Padovano, Raia Hadsell, Charles Blundell
备注:Under review as a conference paper at ICLR 2020. 13 pages, 4 figures
链接:https://arxiv.org/abs/1910.10593
摘要:图神经网络(GNNs)是解决图结构输入问题的一种强有力的表示工具。然而,到目前为止,在几乎所有情况下,它们都被应用于直接从原始输入中恢复最终解决方案,而没有明确指导如何构建它们的问题解决方案。在这里,我们专注于算法空间的学习:我们训练了几种最先进的GNN体系结构来模拟经典图算法的各个步骤,并行(广度优先搜索,Bellman-Ford)和顺序(Prim算法)。由于图算法通常依赖于在邻域内进行离散决策,所以我们假设基于最大化的消息传递神经网络最适合于这样的目标,并且凭经验来验证这种说法。我们还演示了算法空间中的学习如何为任务间的正迁移提供新的机会——演示了在同时学习可达性算法时如何显著改进最短路径算法的学习。
[6]:Robust Domain Randomization for Reinforcement Learning
标题:强化学习的鲁棒域随机化方法
作者:Reda Bahi Slaoui, William R. Clements, Jakob N. Foerster, Sébastien Toth
链接:https://arxiv.org/abs/1910.10537
摘要:在强化学习中,产生可推广到广泛环境的代理是一个重大的挑战。克服这一问题的一种方法是领域随机化,即在每一次训练开始时,环境的一些参数是随机化的,从而使代理暴露在许多可能的变化中。然而,域随机化效率很低,并且可能导致跨域的高方差策略。在这项工作中,我们将领域随机化问题形式化,并证明最小化政策的Lipschitz常数相对于随机化参数导致低方差的学习政策。我们提出了一种只需训练一个环境变量的方法,并在训练过程中对其学习状态表示进行正则化以最小化该常数。我们进行的实验表明,与标准域随机化相比,我们的方法在获得相同的泛化分数的同时,可以获得更高效、更健壮的学习。
[7]:The Task Analysis Cell Assembly Perspective
标题:任务分析单元组装透视图
作者:Dan Diaper, Chris Huyck
备注:39 Pages
链接:https://arxiv.org/abs/1910.10481
摘要:一种全新的综合方法将任务分析方法的应用认知心理学与神经细胞组装的观点结合起来,在任务执行过程中对大脑和大脑功能进行建模;类似的细胞组装可以作为人工智能神经网络来实现。介绍了一种简化的单元组装模型,并由此产生了几种新的表示格式,这些格式结合起来被证明适合于分析任务。使用神经模型的优点已经暴露出来,并与以前使用符号人工智能生产系统的研究进行了比较,这些系统没有尝试对神经生理学进行建模。对于认知科学家来说,这一方法提供了一个简单实用的介绍,从细胞组装的角度来思考大脑、大脑和人工智能。在未来,随后的发展有可能导致一个新的,心理学和神经生理学的一般理论,支持基于细胞组装的人工智能。
[8]:Decentralized Runtime Synthesis of Shields for Multi-Agent Systems
标题:多智能体系统屏蔽的分散运行时综合
作者:Dhananjay Raju, Suda Bharadwaj, Ufuk Topcu
链接:https://arxiv.org/abs/1910.10380
摘要:在系统上安装一个屏蔽,通过在运行时纠正系统的行为来保证安全。现有的方法,采用设计时间合成盾牌不缩放到多代理系统。此外,此类屏蔽通常以集中方式实现,要求系统中所有代理的状态的全局信息。我们通过一种新的方法来解决这些限制,这种方法在运行时合成屏蔽,不需要全局信息。每个代理上都有一个屏蔽,它只能修改相应代理的行为。在这种基本上是分散的方法中,每个代理上的屏蔽有两个组件:一个是修正代理行为的探路者,另一个是动态修改代理优先级的排序机制。当前优先级决定屏蔽是否使用探路器修改代理的行为。我们推导出任何代理的最大偏差从其原始行为的上界。我们证明最坏情况下的合成时间是在运行时的代理数量为二次,而不是针对现有方法的设计时间的指数。在一个碰撞避免问题上,我们测试了分散的、运行时屏蔽综合方法的性能。对于50x50网格中的50个代理,每当检测到潜在冲突时,运行时合成每个代理都需要几秒钟。相比之下,在5x5网格中,屏蔽体的集中设计时合成在4个代理之外是困难的。
[9]:Knowledge of Uncertain Worlds: Programming with Logical Constraints
标题:不确定世界的知识:带逻辑约束的规划
作者:Yanhong A. Liu, Scott D. Stoller
链接:https://arxiv.org/abs/1910.10346
摘要:复杂应用程序的逻辑编程必须处理递归和否定,这给逻辑带来了重大挑战,导致许多不同的、相互冲突的规则语义。本文描述了一种设计和分析逻辑的统一语言DA-logic,它基于建立的语义和约束语义的统一,支持不同语义的编程能力和易用性。其关键思想是提供元约束,支持以未定义值或可能的值组合形式使用不确定信息,并促进使用可由任何新谓词(包括带有附加参数的谓词)实例化的知识单元。
[10]:Robot-Friendly Cities
标题:机器人友好城市
作者:Seng W. Loke
备注:7 pages
链接:https://arxiv.org/abs/1910.10258
摘要:机器人越来越多地在公共空间进行测试,未来城市环境不仅适合人类,也适合自主系统。虽然机器人是有前途的,为了方便和效率,有挑战与建设城市拥挤的机器。本文概述了存在的问题及解决办法,并呼吁大家对此给予更多的关注。
[11]:An Empirical Study on Learning Fairness Metrics for COMPAS Data with Human Supervision
标题:人监控下COMPAS数据学习公平性度量的实证研究
作者:Hanchen Wang, Nina Grgic-Hlaca, Preethi Lahoti, Krishna P. Gummadi, Adrian Weller
备注:Accepted at NeurIPS 2019 HCML Workshop
链接:https://arxiv.org/abs/1910.10255
摘要:个人公平的概念要求相似的人得到相似的待遇。然而,这在实践中很难实现,因为很难指定适当的相似性度量。在这项工作中,我们试图从人类注释数据中学习这种相似性度量。我们收集了一个关于犯罪累犯预测(COMPAS)任务的人类判断的新数据集。通过假设人的监督服从个体公平原则,我们利用度量学习的先验工作,评估了几种度量学习方法在我们的数据集上的性能,并表明在不同的标准下,所学习的度量优于欧几里德度量和精确度量。我们不提供直接学习满足个体公平性的相似性度量的方法,而是提供如何从人类监督者那里获得相似性度量的实证研究,以便将来的工作可以将其作为理解人类监督的工具。
[12]:Bottom-Up Meta-Policy Search
标题:自下而上的元策略搜索
作者:Luckeciano C. Melo, Marcos R. O. A. Maximo, Adilson Marques da Cunha
链接:https://arxiv.org/abs/1910.10232
摘要:尽管最近在通过交互学习的代理方面取得了进展,但是在样本效率和训练过程中不可见行为的泛化方面仍然存在一些挑战。为了解决这些问题,我们提出并应用了一阶元学习算法自底向上的元策略搜索(BUMPS),该算法采用两阶段优化过程:首先,在元训练阶段,提取少量专家策略,生成一个元策略,能够在训练过程中将知识泛化为未知任务;其次,采用策略过滤的快速适应策略,对元策略分布中的少量策略进行评价,选择最能解决问题的策略。我们在RoboCup 3D足球模拟领域进行了所有的实验,在踢动学习的背景下。我们表明,在我们的实验设置下,BUMPS在简单的多任务强化学习不起作用的情况下工作。最后,我们进行了实验来评估算法的各个组成部分。
NLP方向重复(2篇)[1]:AnnaParser: Semantic Parsing for Tabular Data Analysis
标题:AnnaParser:用于表格数据分析的语义分析
作者:Yan Gao, Jian-Guang Lou, Dongmei Zhang
备注:10 pages, 5 figures
链接:https://arxiv.org/abs/1910.10363
摘要:本文提出了一种将自然语言问题转换为给定表的SQL查询的新方法,满足了跨域、多语言和快速启动的实际数据分析应用的三个要求。我们提出的方法包括:(1)在解析器之前一个新的数据抽象步骤,使解析表不可知;(2)一组语义规则,用于将抽象的数据分析问题解析为中间逻辑形式,作为树派生,以减少搜索空间;(3)基于神经网络的模型作为基于跨度的语义分析器的局部评分函数,用于结构优化和有效推理。实验表明,我们的方法在大型开放基准数据集WikiSQL上的性能优于最新算法。我们在一个小数据集上也取得了很好的结果,可以处理更复杂的英文和中文查询,这证明了我们的语言扩展和快速启动能力。
[2]:Does Gender Matter? Towards Fairness in Dialogue Systems
标题:性别重要吗?论对话制度的公平性
作者:Haochen Liu, Jamell Dacon, Wenqi Fan, Hui Liu, Zitao Liu, Jiliang Tang
备注:12 pages
链接:https://arxiv.org/abs/1910.10486
摘要:近年来,人们越来越关注人工智能(ai)在计算机视觉和推荐等实际应用中的公平性。例如,计算机视觉中的识别算法对黑人是不公平的,比如对他们的脸检测不好,不恰当地将他们识别为“大猩猩”。对话系统作为人工智能的重要应用之一,在我国社会中得到了广泛的应用。它们通常是用真实的人类会话数据构建的,因此它们可以继承现实世界中的一些公平问题。然而,对话制度的公平性尚未得到调查。本文对对话系统中的公平问题进行了初步的研究。特别是,我们构建了第一个数据集,并提出了量化的方法来理解对话模型中的公平性。我们的研究表明,流行的对话模式显示出对不同性别和种族的严重偏见。我们将在稍后发布数据集和测量代码,以促进对话系统中的公平性研究。中文来自机器翻译,仅供参考。
扫描二维码
获取更多精彩
arXiv Daily

欢迎关注、转发、点击在看