新闻 news
您现在的位置:首页 > 新闻 > OpenAI的Procgen Benchmark防止AI模型过拟合

新闻

视频聊天聚会带来欢乐时光,生活在庇护的门后 视频聊天聚会带来欢乐时光,生活在庇护的门后

  人类确实是一群惊人的韧性。 尽管在佛罗里达海滩上举行聚会的偷偷摸摸的人肆意冒着将冠状病毒传...

  • “煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...

      Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...

  • 首席执行官表示,随着美国关闭,StockX的业务蓬勃发展

      StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...

  • Zyl重现旧照片以创建协作故事

      法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...

财经

杭州商务局总经济师武长虹:未来5年培育10家独角兽企业 杭州商务局总经济师武长虹:未来5年培育10家独角兽...

【亿邦原创】4月27日消息,在2023中国(杭州)新电商大会开幕式上,杭州市商务局总经济师武长虹发表了题...

  • 伊丽莎白·沃伦(Elizabeth Warren)担任总统,为其20...

      民主党参议员伊丽莎白·沃伦(Elizabeth Warren)可能已经结束了她的2020年总统大选,但用于推动她竞选的技术将继续存在。 她的员工成员宣布,他们将公开公开展示沃伦为成为民主党总统候选人而开发的顶...

  • 看来布兰登·米道(Brandon Middaugh)正领导着$ 1B的...

      今年早些时候,微软提出了一项最雄心勃勃,范围广泛的战略来减少公司运营的碳排放量,从而在企业界引起了轰动。 该计划的一部分是一个10亿美元的基金,该基金将投资于减缓气候变化的技术,特别是针...

  • 英国科技产业组建Code4COVID.org以抗击冠状病毒危机

      由英国基层技术倡议组织组成的联盟已经聚集在一起,以协调支持英国应对冠状病毒的关键技术人员群体。 COVID19技术响应(CTR)旨在协调可用技术人才的供应;处理需要解决的问题以及两者的匹配。到目前为...

商业

视频聊天聚会带来欢乐时光,生活在庇护的门后 视频聊天聚会带来欢乐时光,生活在庇护的门后

  人类确实是一群惊人的韧性。 尽管在佛罗里达海滩上举行聚会的偷偷摸摸的人肆意冒着将冠状病毒传...

  • “煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...

      Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...

  • 首席执行官表示,随着美国关闭,StockX的业务蓬勃发展

      StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...

  • Zyl重现旧照片以创建协作故事

      法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...

OpenAI的Procgen Benchmark防止AI模型过拟合

发布时间:2019/12/05 新闻 浏览:738

 
在机器学习模型的训练方面,总是存在过度拟合(或过于接近)特定数据集的风险。实际上,流行的机器学习基准(例如Arcade Learning Environment)鼓励过拟合并不是不可行的,因为它们对泛化的重视程度较低。
这就是为什么OpenAI(由CTO Greg Brockman,首席科学家Ilya Sutskever和其他人共同创立的旧金山研究公司)今天发布了Procgen Benchmark,Procgen Benchmark是一组16种程序生成的环境(CoinRun,StarPilot,CaveFlyer,Dodgeball,FruitBot,Chaser ,矿工,跳线,Leaper,迷宫,BigFish,Heist,Climber,Plunder,Ninja和BossFight)来衡量模型学习通用技能的速度。它建立在初创公司的CoinRun工具集之上,该工具集使用过程生成来构建训练和测试水平集。
OpenAI在博客中写道:“我们希望两全其美:一个包含许多不同环境的基准,每个环境从根本上都需要泛化。” “为了满足这一需求,我们创建了Procgen Benchmark…[致力于]以下所有方面:实验便利性,环境内的高度多样性以及环境之间的高度多样性…CoinRun现在作为Procgen Benchmark的首创环境,为其多样性做出了贡献整体而言。”
 
根据OpenAI,Procgen环境的设计具有很大的自由度(受基本设计约束),从而为AI驱动的代理带来了“有意义的”通用化挑战。还对它们进行了校准,以确保基准代理在训练了2亿个时间步之后可以取得显着进步,并且每秒仅用一个处理器内核就可以执行数千步。
此外,Procgen环境支持两个“经过良好校准”的难度设置:简单和困难。 (前者的目标用户是计算能力有限的用户,因为这需要大约八分之一的资源进行训练。)并且他们模仿了许多Atari和Gym Retro游戏的风格,与先例保持一致。
 
根据OpenAI,随着训练集的增长,AI模型的性能通常会提高。博客作者解释说:“我们认为,培训绩效的提高来自不同级别的隐性课程。” “如果座席学会在训练集中的各个级别进行概括,那么更大的训练集可以提高训练效果。”
OpenAI让未来的工作更加复杂,它相信这将为更强大,更高效的AI模型提供参考。 “ [培训和测试表现之间的巨大差距值得一提。它揭示了在按照固定级别的顺序进行环境的培训中一个关键的隐藏缺陷。” OpenAI写道。
 
OpenAI先前发布了Neural MMO,这是一个“大规模多代理人”虚拟培训场,可以在类似于RPG的世界中欺骗特工;而Gym是增强学习算法的试验场(涉及训练机根据试验和训练来做事)错误)。最近,它提供了SafetyGym,这是用于开发AI的工具套件,该AI在训练时尊重安全约束,并用于比较算法的“安全性”以及这些算法在学习过程中避免错误的程度。