大模型热要多点冷思考
行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。
用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示,国内公开发布的大模型已达80多个。我们是否需要这么多大模型?这场热潮会持续多久?会不会带来泡沫?对此我们还需多一些冷思考。
国内企业纷纷入局大模型,是因为看好大模型背后的商业价值。虽然被众人调侃为“一本正经地胡说八道”,但在ChatGPT展现了其在聊天对话、创作编程等方面模拟人类思维的智能之后,业界对于人工智能的认知和想象又打开了新空间。一些企业将大模型视为人工智能的核心,认为这很可能是引领第四次工业革命的颠覆性创新技术,将推动各个行业的变革。能抓住这样的超级风口既是企业实力的象征,也更容易获得资本的青睐。正因为如此,短短几个月,国内人工智能大模型数量呈现爆发式增长。
大模型并非多多益善。以ChatGPT为代表的通用大模型,技术门槛高,开发、训练、运营等成本耗资巨大,动辄一次训练成本就高达数百万美元,被称为“少数人的豪华游戏”。只有大型龙头企业或领军企业才具备相应的研发和投资实力,其他企业盲目跟风、一哄而上不仅很难成功,还会带来投资浪费,增加能源、算力等消耗,产生低质量产品。简而言之,推出多个通用大模型既不现实,也没有那么多市场需求,还会带来同质化竞争。
产业界现在越发关注行业大模型,其门槛大大低于通用大模型,所需投入成本相对更低。但也要看到,写诗作画绝非大模型的全部,行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。当前,已有一些行业大模型在金融、制造、医药研发、煤矿、铁路等诸多领域发挥了作用。
当前,大模型发展还处于初期,仍面临技术短板、隐私安全等问题。在一些大模型的实际使用过程中,已被发现生成内容存在质量不佳、冗余回答等问题,甚至有输出危害内容的风险。为此,国家互联网信息办公室等7部门日前联合公布《生成式人工智能服务管理暂行办法》,对生成式人工智能产品及服务提供者作出了一定要求和规范,但目前尚缺乏对使用者的有力约束。
此外,大模型生成内容的知识产权、数据来源的合法性等问题都亟待解决。还需统筹资源,加快基础研究和技术创新,强化场景牵引作用,建立健全大模型监管机制,加强国际合作与交流。
一项新兴产业的发展初期,难免会有一定的泡沫和过剩。但要避免过度,因为泡沫定会挤掉,市场总会洗牌。当热潮退去,大浪淘沙之后,能留下的注定是脚踏实地的赢家。