新闻
-
“煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...
Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...
-
首席执行官表示,随着美国关闭,StockX的业务蓬勃发展
StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...
-
Zyl重现旧照片以创建协作故事
法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...
财经
-
伊丽莎白·沃伦(Elizabeth Warren)担任总统,为其20...
民主党参议员伊丽莎白·沃伦(Elizabeth Warren)可能已经结束了她的2020年总统大选,但用于推动她竞选的技术将继续存在。 她的员工成员宣布,他们将公开公开展示沃伦为成为民主党总统候选人而开发的顶...
-
看来布兰登·米道(Brandon Middaugh)正领导着$ 1B的...
今年早些时候,微软提出了一项最雄心勃勃,范围广泛的战略来减少公司运营的碳排放量,从而在企业界引起了轰动。 该计划的一部分是一个10亿美元的基金,该基金将投资于减缓气候变化的技术,特别是针...
-
英国科技产业组建Code4COVID.org以抗击冠状病毒危机
由英国基层技术倡议组织组成的联盟已经聚集在一起,以协调支持英国应对冠状病毒的关键技术人员群体。 COVID19技术响应(CTR)旨在协调可用技术人才的供应;处理需要解决的问题以及两者的匹配。到目前为...
商业
-
“煤矿里的金丝雀”:西雅图营销技术初创公司Amplero...
Amplero的前途一片光明。这家西雅图营销技术初创公司以积极的势头进入2020年,并计划将其收入增加近三倍。 但是随后发生了COVID-19疫情,经济陷入停滞。 Amplero的客户渠道突然枯竭。现在,该公司正...
-
首席执行官表示,随着美国关闭,StockX的业务蓬勃发展
StockX是一个高速发展的转售市场,连接着运动鞋,街头服装,手袋和其他可收藏物品的买卖双方,其财富随着价值60亿美元的全球运动鞋转售市场一起增长,而后者是更广泛的1000亿美元运动鞋类别的一部分。...
-
Zyl重现旧照片以创建协作故事
法国初创公司Zyl发布了适用于iOS和Android的移动应用程序的重大更新。该应用程序旨在查找照片库中重要生活事件的被遗忘的回忆。 Zyl会扫描您的照片库,并神奇地找到重要的照片。每天,应用程序都会...
Databricks融资4亿美元,估值62亿美元
发布时间:2019/10/24 新闻 浏览:1224
有远见的企业家曾预测数据将成为新的石油,例如阿里·戈西(Ali Ghodsi),安迪·康温斯基(Andy Konwinski),离子斯托伊卡(Ion Stoica),马太·扎哈里亚(Matei Zaharia),帕特里克·温德尔(Patrick Wendell),雷诺·辛(Reynold Xin)和斯科特·申克(Scott Shenker)。他们是Databricks的共同创始人,这是一家总部位于旧金山的公司,提供一套以企业为中心的可扩展数据科学和数据工程工具。自2013年Databricks开业以来,吸引客户就毫不费力。但是,本周该公司开始不间断地向市场支配前进。
Databricks今天早上宣布,它已经完成了由Andreessen Horowitz牵头的4亿美元F轮融资,微软,Alkeon Capital Management,BlackRock,Coatue Management,Dragoneer Investment Group,Geodesic,Green Bay Ventures,New Enterprise Associates和T. Rowe Price参与了此次融资和Tiger Global Management。该公司对这家初创公司的估值为62亿美元,较2月份的27.5亿美元的融资后估值(经过2.5亿美元的一轮融资后)有所提高,而这是在Databricks的收入营业额达到2亿美元(2019年第三季度)之后不久以及年度经常性收入同比增长2.5倍。
它还宣布聘请Dave Conte为首席财务官,他曾担任Splunk的首席财务官长达八年之久。他将领导公司的所有财务和运营职能,直接向CEO Ghodsi报告。
现在,Databricks的客户品牌包括Hotels.com,Viacom,HP,壳牌能源,Showtime,Riot Games,Sanford Health,Expedia,CondéNast,McGraw Hill,Zeiss,Cisco,NBCUniversal,Overstock,Nielsen,HP,Dollar Shave Club ,以及广告,技术,能源,政府,金融服务,医疗保健,游戏,生命科学,媒体和零售等领域的更多内容。 Ghodsi表示,目前总共有超过5,000个组织的数据团队正在使用其平台,这相当于2019年Databricks报告的组织(2,000个)的组织数量的两倍以上。
“ [我们是有记录的增长最快的企业软件云公司。我们在海量数据处理,机器学习,开放源代码和向云的迁移上的赌注都在市场上发挥作用,并导致巨大且快速增长的全球客户需求。” Ghodsi补充说,他说Databricks将拨出€ F系列中有1亿欧元(1.1亿美元)的股份将在未来三年内扩展其位于阿姆斯特丹的欧洲开发中心。 (他声称该中心在过去两年中已经增长了三倍。)其他近期计划包括加强该公司在欧洲,中东和非洲,亚太地区和拉丁美洲的业务以及900名员工分布在阿姆斯特丹,新加坡和伦敦的主要办事处。
Databricks由Apache Spark的原始创建者创建,Apache Spark是在加州大学伯克利分校AMPLab的Scala上开发的一种开源分布式通用集群计算框架,主要开发基于网络的工具来协调深度学习,机器学习,和图形处理工作量。该公司的套件可与Spark的100多家运营商进行接口,以进行数据转换和处理,并且它们提供了自动集群管理和虚拟笔记本环境,用于实时协作编程。
Databricks的数据科学工作区提供了用于运行分析过程和管理机器学习模型的环境,并辅以支持多种语言(包括R,Python,Scala,Java和SQL)以及库和框架(如Conda,XGBoost,Google的TensorFlow,Keras)的交互式笔记本为补充,Horovod,Facebook的PyTorch和scikit-learn。交互式的点击式可视化(以及可编写脚本的选项,例如matplotlib,ggplot和D3)是现成的标准配置,编排工具也使用户能够从集中式存储库开发模型,部署和监视模型,以及从Altyerx进行容器服务, Azure,Amazon,DataRobot和Dataiku。
说到这些笔记本,除了实时警报和用于故障排除的审核日志外,还支持共同创作,注释和自动版本控制。他们能够自动启动机器学习管道,或者将数据传递到Tableau,Looker,PowerBI,RStudio,SnowFlake和其他平台,并且它们的结果可以以HTML和IPYNB之类的流行格式导出到笔记本(笔记本文档)。
至于Databricks的数据分析和统一数据服务产品,它们建立在Linux基金会Delta Lake的Spark兼容层上,该层位于现有数据湖之上,并使用Apache Parquet(面向列的数据存储格式)来实现。在捕获快照和跟踪提交的同时存储数据。 (Databricks表示,它可以处理具有数十亿个分区和文件的PB级表。)Analytics(分析)工作区在成千上万的用户和数据集中保持私有状态,可以由管理员进行审核和分析,管理员还可以管理基础结构并施加限制和限制。组织范围内的预算。
Databricks还开发了MLflow(一个用于机器学习实验,验证和部署的端到端开源平台),以及Koalas(一个扩展PySpark的DataFrame API以使其与Pandas兼容的项目)。 MLflow的一个组件-MLflow跟踪-记录和查询实验,而其他组件-MLflow项目和MLflow模型-提供与平台无关的打包格式以实现可重复运行,并提供将模型发送到部署工具的通用格式。
Databricks产品组合中最重要的宝石也许是Databricks Runtime,它是基于Apache Spark的优化版本构建的处理引擎,可在自动缩放基础结构上运行。使用它,用户可以根据需要重新启动,创建或终止Spark集群,以及重新配置或重用资源。此外,运行时提供了使用哪个版本的Spark来运行作业以及作业计划程序和生产作业开始,失败和完成通知的自由。
Databricks运行时的一个子组件是机器学习运行时,它通常可在Databricks的产品中使用,并提供可扩展的集群,其中包括流行的框架,内置的AutoML和性能优化。功能从预先构建的容器,库和框架(例如XGboost,numpy,MLeap,Pandas和GraphFrames)的库中运行,并使用MLflow到简单的API(HorovodRunner)进行模型搜索以进行分布式培训。 Databricks声称与Apache Spark 2.4.0相比,机器学习运行时的速度提高了40%。
“没有其他公司像Databricks一样成功地将开源软件商业化,” Andreessen Horowitz联合创始人兼普通合伙人Ben Horowitz说。 “我们都见证了Apache Spark作为大数据处理标准的强大发展。毫不奇怪,我们将继续看到该团队与Delta Lake,MLflow和Koalas一起进行开源创新。”
Market Research Future的一份报告指出,到2023年,大数据分析的市场价值将达到2750亿美元,而Gartner最近预测,到2022年,人工智能衍生的业务收入将达到3.9万亿美元。它们的重量达到数亿美元。分析服务提供商Fractal Analytics在一月份筹集了2亿美元,比端到端数据运营平台提供商Unravel的3500万美元C轮融资提前了几个月。值得一提的是,业务分析初创公司Sisense去年9月筹集了8000万美元,以扩大产品范围。