导航：首页 > 互联网科技 >

机器人学前班助力机器人简单快速学习，给予强化学习的自动驾驶策略 | 一周AI学术

发表于：2025-02-13 作者：千家信息网编辑

千家信息网最后更新 2025年02月13日，大数据文摘专栏作品作者：Christopher Dossman编译：fuma、Jiaxu、云舟呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！AI Scholar

千家信息网最后更新 2025年02月13日机器人学前班助力机器人简单快速学习，给予强化学习的自动驾驶策略 | 一周AI学术

大数据文摘专栏作品

作者：Christopher Dossman

编译：fuma、Jiaxu、云舟

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！

AI Scholar Weekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。

周一更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：自动驾驶、智能机器人、GANs

本周热门学术研究

机器人学前班

机器人需要以直观和实用的方式学习操作，以便在现实环境中更成功地部署。为此，研究人员训练了ResNet的一个变体，将手眼相机图像映射到末端效应器速度。

在他们的方法中，人类教师通过操纵杆向机器人演示简单的服务型任务，并在一个小时内进行数据收集，训练和部署。

本文的贡献是一种数据有效的实用方法，可以在很短的时间内教授机器人新行为。这些都表明机器人可以通过实际演示快速学习简单的任务。此外，该技术可用于学习数据低效强化学习的快速策略。

原文：

https://arxiv.org/abs/1905.09025

基于强化学习的高速公路自动驾驶汽车行驶策略

研究人员首次在基于强化学习的实时自动驾驶策略中为在高速公路上行驶的车辆做出了贡献。这一策略通过部署Double Deep Q-Network实现，并且能够引导在高速公路上行驶的自动驾驶汽车。

此外，该策略还能够通过巧妙设计的目标函数来考虑乘客的舒适度。最终，该策略使得汽车产生了一条无碰撞轨迹，自动驾驶汽车将以所需速度向前移动，同时最小化其纵向和横向加速度。

自动驾驶工程师在考虑交通密度和安全等多个角度的情况下制定除了可行的路径规划策略，这是一个很大的成功。

这项工作是学者们尝试针对无限制高速公路制定强化学习策略的第一次尝试。并为轨迹路径规划问题提供了很多见解。该工作还使用了已建立的SUMO微观交通模拟器研究新强化学习策略的泛化能力和稳定性。

再计算成本上，动作的产生需要的计算成本显著降低，并能够推广到以前看不见的驾驶情况。遗憾的是，目前该策略还不能保证产生无碰撞的轨迹。

https://arxiv.org/abs/1905.09046

在自动驾驶汽车中实现安全感知软件

到目前为止，还没有关于安全感知AV（Autonomous Vehicles）计算系统和架构设计的明确指南。这促使了研究人员进行实地研究，包括各个地区的自动驾驶车队，道路状况和交通模式。根据研究，传统的计算系统性能指标不能完全满足AV计算系统设计的安全要求。相反，他们建议使用"安全评分"作为衡量AV计算系统设计安全水平的主要指标。他们还提出了感知延迟模型，以帮助架构师估计给定架构和系统设计的安全分数，而无需在AV中对其进行物理测试。

本文的贡献是提出了安全感知AV计算系统设计的安全评分和感知延迟模型。它详细阐述了AV计算系统的详细设计和工作负载，并讨论了安全感知的AV系统设计含义。由于自动驾驶汽车在通过道路自由行驶之前还有很长的路要走，因此本文的工作只是安全感知视听系统设计研究的起点。这是一个呼吁人工智能研究人员和工程师随着领域的进步继续改进它的优秀工作。

https://arxiv.org/abs/1905.08453