**加密货币挖矿的变革**
2013年,专为比特币挖矿设计的ASIC芯片横空出世,与之前的CPU和GPU相比,ASIC在挖矿效率上取得了质的飞跃,彻底改变了比特币挖矿的格局。
**硅谷初创公司Etched的崛起**
如今,一家名为Etched的硅谷初创公司以其用于AI的ASIC芯片引起了轰动。该芯片从底层架构着手,为主流AI大模型公司采用的Transformer计算提供了更具性价比的选择,在AI硬件领域激起波澜。
**Etched及其专为Transformer设计的芯片**
Etched由哈佛辍学生Gavin Uberti和Chris Zhu于2022年创立。他们开发了一种名为Sohu的ASIC芯片,专门设计用于Transformer模型。
**Sohu芯片的卓越性能**
Etched宣称,Sohu芯片在进行Llama-3 70B推理方面的速度比英伟达的H100快20倍,同时功耗大幅降低。
**巨额投资的涌入**
Etched最近获得了1.2亿美元的新融资,由Primary Venture Partners和Positive Sum Ventures领投。知名投资者彼得·蒂尔、GitHub首席执行官托马斯·多姆克和前Coinbase首席技术官巴拉吉·斯里尼瓦桑等也参与了本轮融资。
**Sohu芯片对AI格局的影响**
随着Transformer模型不断推动生成式AI的突破,Sohu芯片被认为有望打破英伟达GPU在AI推理领域的垄断,重塑AI计算的格局。
**Etched的差异化优势**
专用于Transformer的GPU包含多种运算单元,如FP64、FP32、INT、TensorCore等结构。处理任意CUDA代码需要复杂的编译器,芯片开发商往往需要在软件开发上投入数十亿美元的成本,但成效有限。
而Etched则采取了更为聚焦的策略。通过专门用于运行Transformers,Etched可以简化软件开发,并重点关注TensorCore,有针对性地提升AI运算能力。
由于大多数AI公司使用特定的Transformer推理库,如TensorRT-LLM、vLLM或HuggingFace的TGI,这些框架足以满足大多数需求。而且,文本、图像或视频等不同应用中的Transformer模型基本相似,使得客户可以在不修改核心模型代码的情况下调整模型超参数。
顶尖AI公司通常需要定制解决方案,聘请工程师对GPU内核进行精心优化。而Etched通过开放从驱动程序到内核的整个软件栈,消除了逆向工程的需要。这种开放性允许工程师根据需要实施定制Transformer层,从而提高了灵活性。
Sohu芯片减少了用于存储器的空间,而将更多空间用于计算用途的晶体管。并且,通过只有一个大内核的设计,减少了用来协调不同内核的低效计算。
**潜在风险**
如果迅速出现替代Transformer的新算法,则Sohu芯片将失去价值。
加文·乌贝蒂在一次采访中表示:“我们正在进行人工智能领域最大胆的押注。”
“如果Transformer技术消失了,我们就完蛋了。但如果这项技术持续发展,我们将成为有史以来最伟大的公司。”
事实上,大型云计算公司也开始自主研发或委托设计专用集成电路 (ASIC),加入了这场人工智能军备竞赛。目前,海外ASIC设计巨头的财务报告已经出现了一些积极的变化。
博通公司2024财年第一季度财报显示,该季度网络业务收入为33亿美元,同比增长46%,这主要得益于两家超大规模客户对定制人工智能加速器的强劲需求。
博通预计,人工智能业务将占2024财年半导体收入的25%,目前已将这一预期上调至35%,超过100亿美元,其中70%来自人工智能加速器。
近日有消息称,字节跳动正与博通合作开发一款5纳米制程、用于人工智能的ASIC芯片,并由台积电代工生产,但字节跳动否认了这一消息。
国盛证券在3月20日发布的研报中指出,从整体来看,ASIC的量产和相应的算力成本下降,是大模型走向更大产业的必经之路。人工智能的算力需求十分巨大,与比特币的“一轮替代”不同,我们认为人工智能芯片的发展将经历多轮螺旋式上升,最终实现全社会的通用人工智能 (AGI)。新的模型和算法将通过通用GPU被发现和初步开发,然后通过专用ASIC满足市场需求,繁荣的生态系统将吸引更多用户和参与者,最终培育出更新、更强大的算法,循环往复,螺旋上升,最终实现AGI的宏伟目标。
国盛证券建议关注领先的晶圆厂、ASIC设计龙头企业、散热厂商、ASIC芯片公司和服务器厂商。其中,在ASIC芯片公司方面,推荐关注寒武纪、芯原股份和嘉楠科技。
相关文章推荐阅读: