机器人学前班助力机器人简单快速学习,给予强化学习的自动驾驶策略 | 一周AI学术
大数据文摘专栏作品
作者:Christopher Dossman
编译:fuma、Jiaxu、云舟
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
AI Scholar Weekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
周一更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:自动驾驶、智能机器人、GANs
本周热门学术研究
机器人学前班
机器人需要以直观和实用的方式学习操作,以便在现实环境中更成功地部署。为此,研究人员训练了ResNet的一个变体,将手眼相机图像映射到末端效应器速度。
在他们的方法中,人类教师通过操纵杆向机器人演示简单的服务型任务,并在一个小时内进行数据收集,训练和部署。
本文的贡献是一种数据有效的实用方法,可以在很短的时间内教授机器人新行为。这些都表明机器人可以通过实际演示快速学习简单的任务。此外,该技术可用于学习数据低效强化学习的快速策略。
原文:
https://arxiv.org/abs/1905.09025
基于强化学习的高速公路自动驾驶汽车行驶策略
研究人员首次在基于强化学习的实时自动驾驶策略中为在高速公路上行驶的车辆做出了贡献。这一策略通过部署Double Deep Q-Network实现,并且能够引导在高速公路上行驶的自动驾驶汽车。
此外,该策略还能够通过巧妙设计的目标函数来考虑乘客的舒适度。最终,该策略使得汽车产生了一条无碰撞轨迹,自动驾驶汽车将以所需速度向前移动,同时最小化其纵向和横向加速度。
自动驾驶工程师在考虑交通密度和安全等多个角度的情况下制定除了可行的路径规划策略,这是一个很大的成功。
这项工作是学者们尝试针对无限制高速公路制定强化学习策略的第一次尝试。并为轨迹路径规划问题提供了很多见解。该工作还使用了已建立的SUMO微观交通模拟器研究新强化学习策略的泛化能力和稳定性。
再计算成本上,动作的产生需要的计算成本显著降低,并能够推广到以前看不见的驾驶情况。遗憾的是,目前该策略还不能保证产生无碰撞的轨迹。
https://arxiv.org/abs/1905.09046
在自动驾驶汽车中实现安全感知软件
到目前为止,还没有关于安全感知AV(Autonomous Vehicles)计算系统和架构设计的明确指南。这促使了研究人员进行实地研究,包括各个地区的自动驾驶车队,道路状况和交通模式。根据研究,传统的计算系统性能指标不能完全满足AV计算系统设计的安全要求。 相反,他们建议使用"安全评分"作为衡量AV计算系统设计安全水平的主要指标。他们还提出了感知延迟模型,以帮助架构师估计给定架构和系统设计的安全分数,而无需在AV中对其进行物理测试。
本文的贡献是提出了安全感知AV计算系统设计的安全评分和感知延迟模型。它详细阐述了AV计算系统的详细设计和工作负载,并讨论了安全感知的AV系统设计含义。由于自动驾驶汽车在通过道路自由行驶之前还有很长的路要走,因此本文的工作只是安全感知视听系统设计研究的起点。这是一个呼吁人工智能研究人员和工程师随着领域的进步继续改进它的优秀工作。
https://arxiv.org/abs/1905.08453
利用领域自适应弥补合成和实际点云数据的差异
研究人员提出了一种基于深度学习的生成对抗网络(GANs)领域自适应方法,通过3D 光学雷达传感器获取实际点云数据以协助车辆检测。该框架基于循环一致的生成对抗网络(CycleGAN)架构。
在真实鸟瞰图(BEV)点云图像中的车辆检测任务上,该框架取得了有竞争力的结果。 在真实鸟瞰点云图像上进行测试时,该框架比其他基线方法提高了超过七个百分点 。
经过训练的模型获得了64.29%的准确率,从而显示了这一领域自适应方法在真实鸟瞰点云图像中的车辆检测任务上的有效性。 该框架的实施可以发展目标检测的最新技术。
https://arxiv.org/abs/1905.08955
通过实际照片创造个性化的头部对话模型
研究人员提出了一种用于对抗生成模型元学习的框架,该框架能够以深度生成器网络的形式训练高度逼真的虚拟对话头像。 该框架仅通过少量照片即可创建一个新的模型。
在32幅图像上训练的模型达到了完美的真实感和个性化评分。 新算法能够基于个人修改生成器和判别器的参数,从而仅使用少量图像快速完成训练。
本文提出的框架能够学习高度逼真和个性化的对话头像。通过在大规模视频数据集上执行长时间的元学习,该方法能够将陌生人脸对话头像模型的小样本学习作为高容量生成器和判别器的对抗训练问题。
该方法可用于增强和实现人机交互、自然语言处理和自动对话系统,能够在视频序列中合成合理的对话。
它还具有在网真(telepresence)领域的实际应用,包括视频会议和多人游戏以及特效行业。
原文:
https://arxiv.org/pdf/1905.08233.pdf
其他爆款论文
通过视觉,激光雷达和GPS / IMU定位的全新物体检测和跟踪系统 。
https://arxiv.org/abs/1905.08758
使用Range-Image U-Net实现3D激光雷达点云的简单准确语义分割。
https://arxiv.org/abs/1905.08748
通过研究性学习和竞赛帮助学生逐步实施机器人项目。
https://arxiv.org/ftp/arxiv/papers/1905/1905.07644.pdf
一种用于将重叠的脑组织数据数字化分层的成像模型 。
https://arxiv.org/abs/1905.09231
一种自动生成突出显示的大脑结构图像的软件。
https://arxiv.org/abs/1905.08627
AI新闻
比GPU更快的新型可编程芯片可以解决最棘手的优化问题。
https://spectrum.ieee.org/tech-talk/semiconductors/processors/georgia-tech-optimization-chip-solves-huge-class-of-hard-problems
数据科学家的需求水涨船高。
https://www.forbes.com/sites/intelai/2019/05/22/ai-strategy-6-trends-changing-the-role-of-data-scientists/#2b5594565d5e
公司希望利用人工智能,但缺乏技能以协助执行人工智能策略。
https://www.artificialintelligence-news.com/2019/05/21/93-of-firms-committed-to-ai-but-skills-shortage-posing-problems/