圆桌论坛结束时,人群迅速围拢上来,以月之暗面公司 CEO 杨植麟为中心,将会场前排的空位挤得水泄不通。人们举着手机,希望能碰巧扫到杨植麟的微信。在工作人员的协助下,杨植麟至少被现场与会者簇拥围堵了三次,才得以离开会场。
2024 年 6 月 14 日至 15 日,备受瞩目的 AI 领域盛会“2024 北京智源大会”在中关村展示中心隆重举行。每日经济新闻记者现场观察到,这场被誉为“AI 界春晚”的大会,在大模型浪潮的推动下,呈现出愈加浓厚的氛围,国产大模型明星公司也成为参会者的关注焦点。
与上届大会主要围绕技术探索,以国外技术人员和从业者为主不同,今年,百度、月之暗面、智谱 AI、零一万物、面壁智能等国产大模型公司成为论坛的主角。与此随着大模型从技术竞速逐步转向落地应用,一些新的变化正在发生。
国产大模型站上舞台中央
在今年的“AI 界春晚”上,国产大模型企业成为绝对主角。
“进入 2023 年,大模型从研究机构的科研成果开始向产业界逐步发展,我们也看到,百花齐放,有越来越多的大模型在过去的一年发布。”智源研究院院长王仲远在发言中提到。
王仲远认为,以 2023 年为界,人工智能基本上可以分为两个大的阶段:2023 年之前都属于弱人工智能时代,即人工智能的模型是针对特定的场景和任务,需要收集特定的数据,训练特定的模型。比如,战胜人类世界围棋冠军的 AlphaGO 在围棋上表现非常出色,但无法直接用来解决医疗问题,虽然方法可以借鉴,但针对不同的场景任务需要重新收集数据和训练模型。进入 2023 年,随着大模型的发展,人工智能逐步进入通用人工智能时代,而通用人工智能最大的特点就是其规模庞大,模型具备涌现性,能够跨领域通用。
2023 年和 2024 年的北京智源大会,如同两个鲜明对比的画面,尤其是在大模型技术的发展和应用上,两届大会的嘉宾构成和议题变化,成为大模型时代飞速发展的注脚。
2024 年的智源大会,嘉宾阵容发生了显著的变化。更引人瞩目的是国内大模型公司,如百度、月之暗面、零一万物、智谱 AI、面壁智能等大模型明星公司的 CEO 与 CTO(首席技术官),以及来自国内顶尖院校和研究机构的代表。此次会议更加聚焦于人工智能关键技术路径和应用场景,从理论探讨向实际应用迈进了一大步。
在 2023 年的大会上,ChatGPT 刚推出半年,国内大模型开始跟进,“百模大战”刚刚拉开序幕。彼时,大会的主角是来自全球的顶尖学者和科技巨擘,国内则更多以学界为主。在彼时的主论坛环节,两组对谈嘉宾分别是:Meta 首席 AI 科学家、纽约大学教授杨立昆与清华大学计算机系教授朱军;未来生命研究所创始人 Max Tegmark 与清华大学智能产业研究院(AIR)院长张亚勤,对谈内容围绕 AI 技术层面的探索展开。
如今,变化已经非常明显。
国内大模型市场方兴未艾,折射出国内大模型市场的快速崛起和自主创新能力的显著提升。随着大模型由科研走向产业,人们对 AGI(人工通用智能)有了更多想象。
王仲远也提到,当多模态大模型能够理解和感知、决策这个世界的时候,它就有可能进入到物理世界。如果进入到宏观世界跟硬件结合,这就是具身大模型的发展方向。如果它进入到了微观世界,去理解和生成生命分子,那么这就是 AI For Science。
无论是具身模型、AI For Science,还是多模型模态,都会促进整个世界模型的发展,最终推动人工智能技术向 AGI 方向发展。
一个共识:落地!落地!落地!
尽管面临挑战,但技术的普及与落地已经显著加速,预示着人工智能正迈向一个全新的发展阶段。一个重要的共识是,在将 AGI 的理想带入现实世界的路上,落地应用是重要的必答题。
“零一万物坚决做 to C(面向个人),不做‘赔钱的 to B(面向企业)’,找到能赚钱的 to B,我们就做,不赚钱就不做。”李开复表示。
对于大模型的落地应用,李开复认为,在中国 to C 短期更有机会,国外两者都有机会。在 to C 端,大模型就如同互联网时代或 PC 时代的新技术、新平台,将会带来新应用,这是巨大的机会。他判断,AI 时代,第一个阶段突围的应该是生产力工具;第二个阶段可能会是娱乐、音乐、游戏;第三个阶段可能会是搜索;再下一个阶段可能会是电商;然后可能会有社交、短视频、O2O(线上到线下),这是不变的定律。
张亚勤则认为,再分层来看,目前真正赚钱的是 to B,是在硬件、在芯片、在基础设施层,这个是目前已经发生的,但是从应用来讲,是先 to C 再 to B。对于当前的 AI 分层,张亚勤将其划分为信息智能、物理智能(也称为具身智能)以及生物智能。在具身智能阶段,面向企业的应用可能会发展得更为迅速。而到生物智能阶段,情况可能恰好相反,面向个人的应用会超过面向企业的应用。各个领域的情况可能不尽相同,但总体来看,面向企业和面向个人的应用,包括开源模型、商业闭源模型、基础大模型、垂直行业大模型以及边缘模型,都会存在。
而对于 B 端的落地应用,李开复认为,to B 是大模型带来的更大的价值,而且应该更快实现,但是可惜的是在 to B 这个领域面临几个巨大的挑战。
一方面部分大公司、传统公司看不懂大模型技术,不敢进行颠覆式应用。与此对企业来说这一年(大模型)带来的最大的价值是降本,而不是创造价值。而降本说实在的就是取代人类的工作,大公司会有很多高管或者中层管理人员不愿意做这个事情,因为做了这个,可能团队就要被砍掉了,他在公司的资本就没有了,他的权力就变小了,甚至他自己的工作都没有了。所以大公司有时 CEO 是很想做,但是下面会有阻力,这些理由造成 to B 理论上应该马上可以落地的,但实际上没有那么快。
相关文章推荐阅读: