新闻
-
“煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...
Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...
-
首席执行官表示,随着美国关闭,StockX的业务蓬勃发展
StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...
-
Zyl重现旧照片以创建协作故事
法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...
财经
-
伊丽莎白·沃伦(Elizabeth Warren)担任总统,为其20...
民主党参议员伊丽莎白·沃伦(Elizabeth Warren)可能已经结束了她的2020年总统大选,但用于推动她竞选的技术将继续存在。 她的员工成员宣布,他们将公开公开展示沃伦为成为民主党总统候选人而开发的顶...
-
看来布兰登·米道(Brandon Middaugh)正领导着$ 1B的...
今年早些时候,微软提出了一项最雄心勃勃,范围广泛的战略来减少公司运营的碳排放量,从而在企业界引起了轰动。 该计划的一部分是一个10亿美元的基金,该基金将投资于减缓气候变化的技术,特别是针...
-
英国科技产业组建Code4COVID.org以抗击冠状病毒危机
由英国基层技术倡议组织组成的联盟已经聚集在一起,以协调支持英国应对冠状病毒的关键技术人员群体。 COVID19技术响应(CTR)旨在协调可用技术人才的供应;处理需要解决的问题以及两者的匹配。到目前为...
商业
-
“煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...
Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...
-
首席执行官表示,随着美国关闭,StockX的业务蓬勃发展
StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...
-
Zyl重现旧照片以创建协作故事
法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...
Uber开源Manifold,用于调试AI模型的可视工具
发布时间:2020/01/09 新闻 浏览:790
调试机器学习(ML)模型绝非易事。只需询问Uber的数据科学家和工程师,其中一些人就难以挖掘算法来诊断其性能问题的原因。
为了减轻工作量,Uber内部开发了Manifold,这是一种与模型无关的可视化工具,可显示特征分布的差异(即所观察到的现象的可测量特性)。它是乘车公司的米开朗基罗ML平台的一部分,可帮助各种产品团队分析无数的AI模型。从今天起,它可以在GitHub上以开源形式使用。
Uber机器学习软件工程师Lezhi Li在博客中写道:“自从今年早些时候突出[Manifold]以来,我们已经收到了很多关于其在通用ML模型调试场景中的潜力的反馈。” “在开源独立版本的Manifold时,我们相信该工具将通过为ML工作流提供可解释性和可调试性,同样使ML社区受益。”
优步歧管
Manifold利用所谓的聚类算法(k-Means)将预测数据根据其性能相似性细分为多个细分。该算法通过其KL散度对特征进行排名,KL散度是两个对比分布之间差异的度量。一般而言,在歧管中,较高的发散度表示给定的特征与区分两个片段组的因子相关。
流形包括对多种算法类型的支持,包括常规的二进制分类和回归模型。在可视化方面,它可以提取数字和分类以及地理空间要素类型。它与Jupyter Notebook集成在一起,Jupyter Notebook是为数据科学家和ML工程师使用最广泛的数据科学平台之一,并且具有交互式数据切片和基于每个实例的预测损失和其他特征值的性能比较。
Manifold方便的“性能比较视图”可比较各个模型和数据子集的预测性能。功能归因视图通过用户定义的细分汇总了具有各种性能级别的数据子集的功能分布。两者都提供了模型性能的概述和地理空间特征的地图视图,有助于识别表现不佳的数据子集以进行进一步检查。
歧管包装为独立安装或打包安装。安装完成后,有两种方法可以将数据输入其中:通过逗号分隔的文件或以编程方式进行的转换。
Uber一直处于开源状态。 Manifold的发布是在Plato揭幕之后发布的,Plato是一个用于构建,培训和部署对话式AI和机器学习的平台。去年年初,它推出了Ludwig,这是一个基于Google TensorFlow框架构建的开源工具箱,该工具箱使用户无需编写代码即可训练和测试AI模型。并且在2019年2月,它推出了自主可视化系统(AVS),这是一种基于Web的独立技术,用于了解和共享自主系统数据。