连续数周,气球由人工智能控制,实现自主导航
科技日报北京12月3日电(记者张梦恕)根据英国《自然》杂志3日发表的计算机科学最新突破,加拿大科学家团队报告称,气球完全由人工智能控制,成功实现了自主导航,并在平流层停留了数周。这一成果标志着深度强化学习在实际应用中迈出了重要而难得的一步,也提高了环境监测自动化的可能性。
人工智能在气象领域的应用正呈爆炸式增长,呈现出从传统机器学习向深度学习的趋势。在气象实验中经常采用气球充氦等高水平大气监测。但是,如果它们被风吹离航道,它们必须回到原来的停滞点。深度强化学习可以训练人工智能系统做出决策。对于超压气球,这些积极的决定包括采取什么行动来保持它们的位置不变。
这一次,加拿大谷歌研究所的科学家马克·贝尔梅尔(mark belmaier)和他的同事训练了一名人工智能控制器,根据风的历史记录、预报、当地风力观测和其他因素(如氦损失和电池疲劳)来决定是否移动气球。
该团队使用了数据增强算法来解释数据中的差距。他们将这项名为“探空者”的新技术应用于世界各地的“气球”,包括在太平洋上空进行为期39天的受控实验。”“气球气球”最初是一个互联网项目。研究小组将高空超压气球送入平流层,在空中形成无线网络。贝尔梅尔的实验表明,“站导引头”控制的气球能够成功实现自主导航,一旦气球吹出航道,它们能比传统控制器控制的气球更快地回到原来的停滞点。
深度强化学习的应用已经在计算机游戏等受控环境中得到了验证,但在受控环境中,有完整的数据集和明确定义的参数。在现实世界中,可预测性变得越来越差,例如,环境中风的数据是不完整的,因此很难做出最佳调整来保持气球的位置。
英国牛津大学(Oxford University)科学家斯科特·奥斯佩尔(Scott Ospel)同时在《新闻与观点》上发表文章说,正因为如此,最新的研究结果可以说代表了强化学习在现实世界中应用的一大进步。