4月国内AI大模型遍地开花，科技巨头纷纷“走火入模” 全球今头条

来源：读创/深圳商报时间：2023-04-20 15:05:29

读创/深圳商报记者涂竞玉

(相关资料图)

2023年无疑是生成式人工智能的关键一年，就在今年4月，国内AI大模型已经遍地开花。继百度打响国内AI大模型第一枪后，目前阿里、京东等互联网大厂，商汤、昆仑万维等科技公司纷纷推出AI大模型，包括内容平台知乎也在4月13日推出了中文大模型“知海图AI”。

有关AI大模型的讨论在业界激起层层浪花。科创企业争相入局的AI大模型究竟有何魅力？该领域的飞速发展将对企业产生哪些影响？近日，记者带着这些疑问采访了多位业界专家。

“百模大战”正式打响

从时间上来看，被称为中国版ChatGPT的百度“文心一言”于3月16日发布。发布会后一小时内，排队申请文心一言企业版API调用服务测试的企业用户已达3万多家，申请产品测试网页多次被挤爆。

4月7日，在阿里云峰会上，阿里云大语言模型“通义千问”正式推出，现阶段该模型主要定向邀请企业用户进行体验测试。另外，阿里巴巴决定未来将所有产品接入通义千问，进行全面改造。

4月10日，商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型体系。同日，昆仑万维宣布，其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型“天工”3.5发布在即，于4月17日启动邀请测试。搜狗创始人王小川也在当天正式宣布入局中国大模型创业，和前搜狗COO茹立云联合创立人工智能公司。

4月11日，毫末智行正式官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型，中文名“雪湖·海若”。同日，科大讯飞在互动平台表示，关于讯飞预训练大模型的详细信息，将于5月6日产品发布会上进行发布。

4月13日，知乎创始人、董事长兼CEO周源在“2023知乎发现大会”上宣布，知乎联合面壁智能发布中文大模型“知海图AI”，邀请AI加入知乎“讨论场”。

“抢占AI大模型市场对于科创企业来说非常关键，同时，AI大模型一旦无法快捷发布，将对企业现有的生态造成很大冲击。”北京大学深圳研究院5G&6G课题组组长胡国庆表示：“因此，企业近期密集发布自家AI大模型，以便在未来市场抢占先机。”

究竟谁的AI大模型能够“跑赢”，胡国庆说：“首先看算力，也可以说是一个门槛；同时需要海量的数据和参数来供大模型进行学习。其次是应用生态，跑赢整个领域很难，企业可以考虑在一两个细分市场中抢占一席之地。”

AI大模型发展按下加速键

在中国规模庞大的互联网用户的支撑下，国内企业在算法和算力上有望不断实现突破并取得领先。从算力到应用，已经按下了AI大模型发展的加速键。

AI大模型是“人工智能预训练大模型”的简称，包含了“训练”和“大模型”两层含义，二者结合产生了一种新的人工智能模式，即模型在大规模数据集上完成了预训练后无需微调，或仅需要少量数据的微调，就能直接支撑各类应用。

相关专家表示，AI大模型的竞争很可能像九十年代PC操作系统的竞争一样，具有“垄断性”的倾向和趋势。其本质还是和操作系统一样，都是一个技术新时代的“基础设施”。如同需要搭乘操作系统的软件一样，所有的人工智能产品，尤其是生成式人工智能，乃至未来可能的通用型人工智能，都需要依靠背后的人工智能大模型才能完成训练、输出等一系列动作。一旦某一个AI大模型或操作系统占领了市场，它将获得相对于其他后来者无可比拟的优势。

知名数字经济学者、DCCI互联网研究院院长刘兴亮说：“未来AI大模型的发展方向之一，一定是降低模型的规模和复杂度，提高运行效率，使其能够在更多设备上运行。其次，提高大模型在不同领域和任务上的适应性和泛化能力，使其能够更好的解决实际问题。此外，将大模型应用于多种数据类型，实现多模态信息融合和跨领域学习，同时提高大模型的可解释性，使其更容易被人理解和信任。”

AI大模型将引发产业变革

“炙手可热的人工智能把背后的大模型推到了前台，似乎有全面取代人类思维之势。”刘兴亮说。它们的检索能力更强，计算速度更快，可以通过分析亿万级别的参数来形成判断，比较各种变量之间的相互关系，达到过去的计算机无法形成的智能程度。人能做的许多事，它们能更快地完成。

“随着AI技术应用到不同行业、不同领域，对AI模型的需求也日益多样化，这促使科创企业针对不同场景、不同需求开发定制化的AI大模型，以满足市场的多样化需求。”刘兴亮表示，大型AI模型的普及将推动AI技术在各个产业的应用，在医疗、教育、金融等领域，AI技术将有望带来更高效、更准确的服务，提高整体产业的效率。

除了最先拥抱AIGC（生成式AI）的游戏、营销等内容生产行业，AI大模型还将在智慧交通、智能制造等智慧城市的众多场景中促进效率提升。

在商汤科技智慧城市与商业事业群CTO赵瑞看来，AI大模型还将从算力、算法和平台范式等方面引发城市智能化、数字化进程的变革。“从算力的角度来看，由于AI大模型对算力的需求大幅增加，城市中算力中心的量级将从P（PetaFlops，每秒一千万亿次浮点运算）向E（ExaFlops，每秒一百亿亿次浮点运算）跃变。国产化大算力比例将提升，算力中心将从目前多中心的分布变得更加聚焦。从算法层面看，基于AI大模型能实现多个功能模型自动串联，快速完成复杂视觉任务，而传统算法则要经过人工设计，且仅能完成单一、简单的任务。这种变革将在智慧城市的长尾业务如交通违章判定、工业智能制造等场景中带来效率提升。”

AI大模型生态体系需要共建共享共生

ChatGPT用户量已经过亿，科技巨头展开新一轮“军备竞赛”的另一面，是开发和接入大模型成本高昂。据浙商证券研报，参照ChatGPT的初始投入与电量消耗，国内开发与之同等性能的大模型资金投入约为56亿元，每年电费投入约1.7亿元。与此同时，接入ChatGPT API（应用程序编程接口）的成本也相对较高。

普通企业如何以较低成本应用AI大模型，腾讯云行业生态总经理曹言表示，更好的方式是企业从大模型中蒸馏出相对较小的模型，应用到细分场景中，如企业客服、企业知识沉淀等。具体应用场景不可能由一家公司独立完成，需要繁荣的生态体系共建共享共生。他还表示，AI大模型作为一种语言助手，在多种语言翻译、文本缩放、识别编程语言等方面表现出了出色的能力，但具体到企业应用，大模型还需要其他能力的加持，如数据能力、制图能力等。

刘兴亮表示，AI大模型将给普通企业带来非常大的影响。首先是提高生产效率，大模型可以帮助企业实现自动化，从而提高生产效率和降低成本；第二是改善决策过程，大模型能够在海量数据中发现隐藏的模式，帮助企业进行更精准的数据分析，提高决策的质量和效率；第三是创新产品和服务，基于大模型智能技术，可以帮助企业开发新的产品和服务，满足客户和市场的需求。

关键词：