Databricks的首席执行官Ali Ghodsi和他的联合创始人最开始对创业并不感兴趣,对利用科技赚钱更不感兴趣。8年后,这家公司的联合创始人里至少有3人成为了亿万富豪。
Databricks的7名联合创始人(其中六人拥有计算机科学博士学位)一开始在加州大学伯克利分校人工智能研究实验室开展合作。站立左起:Arsalan Tavakoli,37岁,领导现场工程;Ion Stoica,56岁,执行董事长兼原首席执行官;Andy Konwinski,37岁,产品管理副总裁;Reynold Xin,35岁,首席软件架构师;Patrick Wendell,32岁,工程副总裁。坐着左起:Ali Ghodsi,42岁,首席执行官;Matei Zaharia,36岁,首席技术员。“我们一直认为自己是伯克利的‘黑手党’,”Ghodsi说。
图片来源:TIMOTHY ARCHIBALD FOR FORBES
在旧金山市中心一间位于13层的会议室里,气氛紧张。那是在2015年11月,由7名伯克利研究人员创立的软件公司Databricks已经成立两年了,但是仍处于风头很劲但营收不足的阶段。
董事们尴尬地谈论着那些已经被反复提及的话题。五个月来,这家初创公司一直在试图筹集资金,但因为其销售额微薄,风投资本家们谨慎地与它保持着距离。在看到没有其他选择以后,恩颐投资(NEA)合伙人、现有投资人Pete Sonsini举起了手,提出以3,000万美元的紧急注资来拯救该公司。
下一步的工作:找到一个新老板。该公司的创始人兼首席执行官Ion Stoica已经同意退居二线,回到他在加州大学伯克利分校的教授职位。这一举措明显是为了引进一位经验丰富的硅谷高管,而这也正是Databricks的主要竞争对手Snowflake在2020年9月创下软件业记录的330亿美元IPO过程中两度采用的方法。然而,在Stoica和其他联合创始人的敦促下,Databricks选择了当时担任工程部副总裁的联合创始人Ali Ghodsi来担此重任。
“董事会的其他一些成员自然会说,‘这没有任何意义:用一个教授创始人换另一个?’”Ben Horowitz回忆说。Horowitz是该公司的第一个风投支持者,并且他本人一开始也对将公司委托给一个没有经营企业经验的职业学者持怀疑态度。但最后,双方达成了妥协:给Ghodsi一年的试用期。
现在,据Horowitz自己承认,42岁、光头、胡子刮得干干净净的Ghodsi已成为他投资的数百家公司中表现最棒的CEO,Databricks也成为了他投资的最成功的软件公司,这要归功于其最近280亿美元的估值,比Ghodsi接手时高出110倍。Databricks目前号称拥有5,000多名客户,且据《福布斯》估计,该公司2021年的营收有望超过5亿美元,高于去年约2.75亿美元。此外,该公司还登上了《福布斯》最新版的人工智能50强榜单,在去年的云计算100强榜单中排名第五,可能很快将进行IPO,并跻身软件行业历史上最赚钱的IPO之列。Ghodsi近乎奇迹般的表现已经为该公司造就了至少三位亿万富豪创始人——他自己、56岁的Stoica和36岁的首席技术专家Matei Zaharia——据《福布斯》估计,他们持有的股份在5%到6%之间,价值14亿美元以上。
这是一个惊人的成就,尤其是当你想到这些创始人当中有很多人——特别是Ghodsi——太过专注于自己的学术工作,以至于一开始根本不愿意成立公司,也不愿意为他们的技术——一款名为Spark的未来预测软件收费的时候,它就显得更神奇了。但是,当研究人员一开始将其作为公开源码的工具提供给公司时,他们却被告知它还“不适合企业使用”。换句话说,Databricks需要进行商业化。
“我们是一群伯克利的嬉皮士,我们只是想改变世界,”Ghodsi说。“我们会告诉他们,‘免费使用这款软件就行了’,但他们却说,‘不行,我们必须给你100万美元。’”
Databricks的尖端软件使用人工智能将昂贵的数据仓库(用于分析的结构化数据)与数据湖(廉价的原始数据存储库)相融合,创造出它独有的“数据湖屋"(这个词是Databricks自己创造的,并且按照最好的极客传统,两个原英文单词之间没有空格)。在这个软件里,用户只需提供他们的原始数据,人工智能就能替他们对未来进行预测。例如,约翰迪尔公司(John Deere)在其农业设备中安装了传感器,以测量发动机温度和使用时间等。Databricks就可以使用这些原始数据来预测拖拉机何时可能发生故障。电子商务公司也可以使用该软件对其网站提出修改建议,以促进销售。此外,它还被用来检测一些平台上的恶意行为——例如证券交易所或社交网络。
Ali Ghodsi是Databricks的首席执行官兼联合创始人。2013年,当Ghodsi勉强同意帮忙创办Databricks时,他只是以一名兼职工程师的身份加入的:“三个月后,我意识到自己每周已经在这里工作100个小时。想要继续做研究是不可能了。”之后不到一年,他就掌管了整个工程部门;不到三年,他就开始管理这个地方。 图片来源:TIMOTHY ARCHIBALD FOR FORBES
Ghodsi说,Databricks已经为近期上市做好了准备。Sonsini指出,该公司明年的营收有望接近10亿美元,而Ghodsi说,从长远来看,1,000亿美元也不是不可能的,甚至这可能都是一个保守的数字。要得出这个结论只需做一道简单的数学题:企业人工智能已经是一个万亿美元的市场,而且它肯定还会继续增长。Ghodsi说,即便这个领域的领导者企业只占据10%的市场份额,那也意味着“数千亿的收入”。
两伊战争爆发四年后,伊朗的政治领袖阿亚图拉·霍梅尼(Ayatollah Khomeini)为了稳定其统治而镇压其政治对手,而原本属于伊朗上层阶级的Ghodsi一家成为了革命的目标,被迫抛下他们的积蓄,逃往瑞典,因为这里是第一个给他们签证的国家。那是1984年,对于时年5岁的Ali Ghodsi来说,他对家乡的记忆只停留在爆炸和警报的嘈杂声中,而这一年也是他持续几十年的辗转生涯的开始。
一开始,他们一家在廉价的学生宿舍里搬来搬去,因为每隔几个月当房东发现住在这间一居室里的不是学生,而是一整个家庭以后,他们就会被赶出去。有时,他们还会忍受一些侮辱性的言论,诸如“svartskalle”——这是一个针对深色皮肤移民的贬义词,字面意思是“黑脑袋”。
因为全家人经常从一个破旧的斯德哥尔摩社区搬到另外一个,于是Ghodsi和他的妹妹不得不经常转学,结交新朋友。他把他今天的社交技巧也归功于他那时所遇到的形形色色的人物。
他的工程天才也很早就显现出来了。Ghodsi的父母买不起新的礼物给他们的孩子,但是他们为他找到了一台二手的Commodore 64,这是一种家用电脑,带有可以加载视频游戏的卡式播放器。这一台之所以如此便宜,正是因为卡带盒的机壳坏了,无法修复。出于好奇,这个四年级的学生开始阅读使用手册,并很快弄清了如何编写自己的游戏。“我就是那种超级痴迷于科技的奇葩,”Ghodsi笑着说。
这种痴迷一直延续到他在瑞典中部大学(Mid Sweden University)就读的时候。该校位于安静的工业城市桑兹瓦尔(Sundsvall),Ghodsi为了拿到计算机工程和工商管理硕士学位在那里多待了一年。之后,他进入瑞典皇家理工学院(KTH Royal Institute of Technology,相当于瑞典的麻省理工学院或加州理工学院)学习,并于2006年获得计算机科学博士学位。
2009年,30岁的Ghodsi作为加州大学伯克利分校的访问学者来到美国;在那里,他第一次看到了硅谷。尽管9年前互联网泡沫破灭,金融危机仍在持续,但创新正处于高峰期。Facebook当时刚创办五年,还没有上市,Airbnb和Uber也正处于成立的第一年。一些新兴公司刚刚开始宣传他们的技术能够在精确的任务中击败人类。
“事实证明,如果你把70年代的类神经网络算法掸掸灰再拿出来使用,但使用比以前多很多的数据和现代硬件,结果就开始变得‘超人’了,”Ghodsi说。
凭借一系列“特殊技能人才”签证,Ghodsi得以留在了美国。一到伯克利,他就与当时24岁的博士生Matei Zaharia联手开展了一个项目,建立一个用于数据处理的软件引擎,并把这个项目命名为Spark。他们想复制大型科技公司在神经网络方面所做的工作,只不过没有复杂的界面。
Zaharia说:“我们的小组是最早研究如何让那些生活中主要兴趣不是软件工程的人能够轻松处理非常大的数据集的团队之一。”
后来,事实证明Spark是好用的,非常好用。它在2014年创造了数据排序速度的世界纪录,并为Zaharia赢得了当年的最佳计算机科学论文奖。他们急于让公司使用他们的工具,于是免费发布了代码,但却很快意识到它并没有获得任何真正的吸引力。
2012年,7名学者组成的核心团队跑到一家廉价的印度餐厅开了一次又一次的会议,最终决定成立Databricks。出生于罗马尼亚的Zaharia的论文导师Scott Shenker和罗马尼亚人Ion Stoica是这些学者当中最有创业经验的。Stoica曾是估值3亿美元的流媒体初创公司Conviva的高管,而Shenker曾是Nicira的首位CEO。Nicira是一家网络公司,2012年标价13亿美元卖给了VMware。根据会议讨论的结果,Stoica将担任Databricks的首席执行官,Zaharia担任首席技术员,Shenker不是公司的全职员工,而是选择加入了董事会。他安排了Nicira早期投资者Ben Horowitz与这几名学者的首次会面,但是学者们对这次会面并没有多大的兴趣。
“我们对自己说,‘我们不想拿他的钱,因为他不是研究人员,’”Ghodsi说。“我们希望获得一些种子基金,也许能筹集到几十万美元,然后用一年的时间编写代码,看看我们能琢磨出什么。”
夏季的一天,在距加州大学校园一个街区的新办公室里,几个创始人悠闲地坐在会议室里,思考着多少钱才算多到无法拒绝。预定的会议时间过了一小时后,Horowitz才来。他说,“交通太拥挤了,”然后开门见山地表示:“我不会和你们这些家伙谈判:我只想给你一个条件,你要么接受,要么放弃。’他愿意出资1,400万美元,给出接近5,000万美元的估值。这笔钱太多了令创始人难以拒绝。
“这类想法带有时间限制,”Horowitz解释说。“对大多数人来说,从种子基金开始是正确的做法,但对这些人来说不是。”
Stoica很快拉拢NEA的合伙人Sonsini成为公司的第二名风险投资人,Sonsini本人也是加州大学的校友,这要归功于Stoica在Conviva时的人脉关系。Sonsini的公司是Conviva的最大股东。2014年,Sonsini买入Databrick股份之时,公司的收入几乎为零。3,300万美元的投资使这家初创公司的估值达到了2.5亿美元,此时距离该公司成立仅13个月。
Ghodsi表示:“2015年,Spark成为最火爆的产品。”Databricks预计未来增长加速,于是把总部从伯克利那毫不起眼的办公室搬到了旧金山金融区一座摩天大楼的13层。他们不在乎不吉利的楼层号码。“Ghodsi说,“也许正是因为这个原因,我们才拿到了便宜的租金,然后我们想,‘这太棒了’。”然而,几个月之内,坏运气似乎就出现了。
Horowitz说:“我们花了太长时间来考虑如何市场化。像Amazon Web Services和Cloudera这样的大公司绕过了Databricks,将Spark集成到他们自己的产品中。“我们所有的竞争对手都开始谈论他们有多喜欢Spark,”Ghodsi说。“但我们几乎没有赚到收入。”
Ghodsi在2016年1月上任后立即出台了三项措施。一,扩充销售队伍,招募懂得如何向企业首席信息官推销的人。二,在Databricks的高管层中纳入“有经验的人”。三,打造Spark的专有功能,这样那些出色的销售人员就有东西可以卖了。当时,这是项开源技术。Ghodsi说:“我们没有什么特别的东西,因为其他公司都可以免费使用Spark。
一年内,管理团队大换血。曾帮助AppDynamics和Alteryx等公司上市的科技行业老将加入团队。Ghodsi向离职的高管提供了留任的机会,只要他们愿意向接替他们的人报告。他说,“如果人们足够聪明,他们就会把自负放在一边。”7个人中只有2个人辞职。
事实证明,新的Databricks平台之所以受欢迎,是因为它比模仿者更好地利用了Spark的核心引擎。Ghodsi说,“其他人几乎不理解Spark”。由于这些创始人是Spark的创造者,他们在Databricks发布之前就已经在构建和整合新功能了。“我们总是比其他公司领先一两年。”
销售额迅速增长,2016年达到1,200万美元。Horowitz说:“第一年非常成功,显然Ghodsi应该在那之后就担任CEO”。投资者信心恢复后,这位知名投资者给微软首席执行官Satya Nadella写了一封推荐信,宣称Databricks是人工智能和大数据革命的先锋。Nadella立即回复。多年来一直想与Nadella建立联系的Ghodsi说:“他抄送了一群微软高层的员工,突然间,他们都非常渴望与我们建立密切的合作关系”。这两家公司合作将Databricks直接集成到微软的云服务Azure中。Azure是微软价值595亿美元(2020年预计销售额)的云服务。现在,微软的销售团队在向潜在客户推销时都在兜售“Azure Databricks”。2019年,微软投资了Ghodsi的公司。
Ghodsi表示,Databricks的工作原理并没有什么神秘之处:只需将大量数据输入算法,训练人工智能模型如何利用数据进行分析和预测。“这不是一种没人知道的深层秘方。”
但起步较慢的竞争对手,往往被迫在数据处理或人工智能工具方面迎头赶上。“作为学者,我们只是从大处着眼,并且思考:‘未来会走向何方?’这几乎就像科幻小说。”Ghodsi表示。
一直以来,Databricks都在忙着超越Spark。2018年,它发布了MLflow来管理机器学习项目,一年后又发布了Delta Lake,将现有的数据湖(Data Lake)变成数据湖屋(Lakehouse),让企业不必从头开始。两者都被证明是成功的。Ghodsi说,Spark只占客户使用Databricks原因的5%。
“其他所有开源公司仍然是他们开始时的开源(产品)。Databricks远远超过了Spark。”Horowitz说。他对该公司的早期投资帮助他在《福布斯》2021年的顶级科技投资者Midas榜单上排名第38位。假设Andreessen Horowitz持有全部股份,其最初1,400万美元的投资现在价值89亿美元。
今年2月,Databricks融资10亿美元,巩固了其作为全球最有价值初创公司之一的地位。这些新资金为该公司赢得全球最大公司的合同提供了巨额资金。没有哪家竞争对手比Snowflake更强大了。Snowflake是一家新上市的、一流的数据仓库提供商,就在三年前,它还与Databricks保持着商业伙伴关系。Piper Sandler的技术分析师Brent Bracelin表示,即使在今天,70%的Databricks用户也是Snowflake的客户。但这两家公司已经开始制造麻烦了。
Horowitz说:“显然,Snowflake是一家处于伟大地位的令人难以置信的公司,但他们的首席执行官很专业。”“他还要在那儿待多久?”可能不会太久了。”由于创始团队仍在全力投入,“企业软件领域没有人能在创新方面超过Databricks。”
Snowflake产品高级副总裁Christian Kleinerman反驳道:“过去三、四年里,我认为Databricks做的每一件事都是很好的架构选择,而Snowflake在八年前就做了。”他对Databricks新的仓储功能表示蔑视。不过,他承认Snowflake的下一步行动将是建立一个用户可以将自己的数据输入人工智能工具的中心,该中心的使用方式将与Databricks“非常相似”。
在Ghodsi看来,无论如何,只是四个主要竞争对手之一。其他三家是云计算的三巨头:亚马逊、微软和谷歌。这使得情况变得棘手,因为这三家公司都是Databricks的投资者。但它们长期以来都在构建自己的数据分析套件。
Ghodsi意识到了来自老牌科技巨头和新的搅局者的威胁。“我想大多数认识我的人都会告诉你,我是他们见过的最偏执狂的首席执行官,”他说,这是对英特尔首席执行官Andy Grove长期以来的准则的一种致敬。
“这对我来说很自然,因为我在战争中长大。如果你小时候看到人们死在街头,你就知道任何事情随时都可能改变。”Ghodsi每年都会让他的员工做一次“天要塌下来了”的训练——制定详细的行动计划,以防市场干涸或经济放缓。
在新冠肺炎疫情爆发时,这些应急计划帮助Databricks应对了疫情将数年的数字转型压缩为短短几个月的极端动荡。从澳大利亚、印度到日本和瑞典,它正在全球各地开设办事处,建立一支由技术人员和销售人员组成的队伍。
回到旧金山湾区,Ghodsi正忙于一件更直接的事情:他儿子的肾癌。Ghodsi深夜去了急诊室,反思了现在的情况。技术和数据已经发展到了可以帮助Ghodsi和他的妻子在他们的儿子出现肿瘤之前发现这种疾病的遗传易感体质的程度。像Databricks这样的公司正在帮助制药和医疗保健公司的下一步:使用人工智能来加快发现新疗法。
“如果这发生在10年或15年前,他可能已经死了。除非他呕吐,癌症扩散到各处,否则你是不会发现的,”Ghodsi说。“这种技术可以有所帮助。”
作者:Kenrick Cai 编译:Vivian、Young、Stephen、李永强
出处:头条号 @福布斯