刚过去的几个月见证了VC对AI编程赛道的狂热,其中最具代表性的就是拿到了巨额融资的两家:
3月12日,AI编程领域初创企业Cognition宣布获得A轮融资,投后估值3.5亿美元,并发布了其“首位AI工程师”Devin。仅1个月之后,公司又获得Founders Fund领投的新一轮融资,据悉公司在两轮融资筹集资金1.96亿美元,最新投后估值20亿美元,而此时距离公司成立仅仅6个月。
4月24日,AI编程助手开发商Augment宣布完成2.27亿美元的B轮融资,投后估值9.77亿美元,由谷歌前CEO埃里克·施密特(Eric Schmidt)以及Index Ventures等多家知名风险投资机构参投,而此时距离其完成A轮融资也仅仅过去了3个月。
资本的大量涌入意味着巨大的市场潜力和对赛道的看好。据不完全统计,过去一年AI编程领域拿到投资的初创企业多达数十家,而头部玩家如微软、亚马逊、谷歌也都推出了自己的AI编程助手。在AI能够结合并改造的所有“细分品类”中,AI编程无疑是资本和巨头倾注资源最多的那一个。为什么这个赛道如此受到关注?
在我们看来,如果AI能够自主编程,比其他工作的“自动化”可能有着更重要的意义——因为程序员是数字世界的主要构建者,一旦AI能够完全自主胜任编程工作,意味着数字化世界一个根本性的颠覆——这对于各行各业都是有巨大影响的。
关于这一点,微软CEO纳德拉有一段非常精彩的表述:“当你向一个组织引进Github Copilot,工作流程将发生改变。当销售人员开始写代码,这个组织就变了,它会以代码的速度前进。Copilot和代码速度将从根本上改变数字经济。包括汽车、金融、制药...未来,每家公司都是数字公司,也是软件公司。”
对于AI将要自动化的所有领域而言,编程是颇为特殊的一个。但目前这些AI编程工具,包括火遍全网的Devin,真的会让程序员失业吗?它们宣称要做的事情和实际上能实现的功能,真的一样吗?
下面这篇文章译自Google机器学习工程师Logan Thorneloe的博客,对这些问题给出了精彩的回答。
Cognition Labs 最近发布了第一位AI软件工程师,让开发人员担心他们的工作安全。我甚至在推特上看到过关于高中生因为Devin而改换大学专业的帖子。我理解这种担忧,它基于对AI夺走工作岗位的普遍恐惧,加上几周前英伟达CEO黄仁勋声称人们不应该只学编程。实际上这些说法都是炒作而已。作为一个从事机器学习和软件工程的人,我可以告诉你,软件工程师的工作在短期内还是安全的。
Devin是继Copilot之后,AI在编程辅助方面合乎逻辑的下一步。开发者们对Devin将取代他们的工作如此担忧,真让人感到惊讶,尤其是当大家都非常喜欢Copilot做同样的事情时。难道我们不应该期望Copilot和类似的工具变得更好吗?
号称最懂技术的社会群体,现在却成了对AI进步最感恐惧的群体。有些任务AI很擅长,它会首先替代工作中的这些任务。但这不仅限于软件工程。所有职业的某些部分都很快会被自动化,而许多其他方面则需要更长的时间让AI来完成。到软件工程师被完全替代的时候,许多其他工作早已被取代。我不理解为什么软件工程师是最担心被AI夺走工作的群体。
Devin的发布揭示了大多数软件工程师两个非常有趣的方面,比自动化工程师更吸引我:
Devin已被证明可以在没有干预的情况下端到端地完成约14%的问题,远远高于同类编程工具。
Cognition Labs针对编程任务对Devin进行了微调,并允许其访问常用的开发者工具来完成这些任务。Devin列出的功能包括:
阅读博客并从中学习。LLM已经表明,它能理解提供给它的文本和图片。这和使用开发者工具进行同样的操作是一回事。这里的创新之处在于与开发者工具的集成。
端到端构建和部署应用程序。我很好奇这在实践中意味着什么,但鉴于上述情况,这不应让人感到惊讶。如果Devin能够阅读指令并实施它们,只要有了相应的指令,Devin就能构建一个应用。
自主找到并修复错误。Copilot已经证明了LLM能在代码库中发现错误并提出可能的修复方案。这里的创新之处在于实际上实施修复。这真的很酷,但我很好奇这在现实中如何发挥作用,以及它的局限性在哪里。
训练和微调自己的AI模型。再次,网上有很多关于如何做到这一点的指导。我很怀疑Devin是否在做数据预处理和其他创建高质量AI模型的困难决策。如果真是这。