推动生成式人工智能健康发展
生成式人工智能技术快速发展,涵盖了创意产业、医疗保健、虚拟现实、艺术和文化创作等多个领域,为各行各业带来更多创新、效率和价值。第十四届夏季达沃斯论坛发布《2023十大新兴技术报告》,其中就包括生成式人工智能。2023年7月13日,国家网信办等七部门发布《生成式人工智能服务管理暂行办法》,推动生成式人工智能向着健康发展和规范应用迈进。本期特邀专家围绕相关问题进行研讨。
深度嵌入生产生活全过程
生成式人工智能走进现实,将给经济社会发展带来怎样的变革?
余江(中国科学院科技战略咨询研究院研究员):当前,以ChatGPT为代表的人工智能的前沿性突破给世界带来极大震撼,也给人们的生产生活带来深刻变化。生成式人工智能,是指基于算法、模型、规则来生成文本、图片、声音、视频、代码等内容的新一代人工智能技术,其与传统人工智能或简单神经网络学习最大的差异是具备自生成模式,可以实现闭环式学习体系的构建,通过从海量数据信息中自己学习要素,进而生成全新的、原创的专业知识内容或产品,并能持续提高自身能力,真正打破了我们熟悉的“专业知识壁垒”。生成式人工智能等突破性创新涌现,标志着世界进入新一轮创新活跃期和产业变革期。
值得注意的是,依托无处不在的数据与智能,当前除了在语言大模型方面有重大突破,人工智能领军企业还在研究构建针对不同类型业务数据进行高效训练的模型,包括代码、时间序列数据、表格数据、地理空间数据和IT事件数据等各类异质性极大的数据集。生成式人工智能不仅具备传统人工智能的分析、判断、决策功能,还能实现其所不及的创造性属性,加速了人工智能行业从决策式分析式向生成式跃进演化,强调学习归纳后进行演绎创造,生成新的知识内容,其本质是对生产力的大幅度提升和创造,这引起了世界各国科技界和产业界的高度重视。
具有创造性是生成式人工智能的核心特征。强大的对话能力和生成能力,能够处理超长文本,允许用长形式的内容创建、扩展会话、文档搜索,回答新问题、承认可能的错误、拒绝不适当的请求等,意味着当前人工智能颠覆了传统搜索模式,具有创造性将信息转化为知识的优势,不仅对我们熟悉的咨询、教学、考试等方面产生深远影响,在智能客服、游戏、虚拟人等领域也得到广泛应用。
人工智能持续取得突破,正不断催生新产业、新业态和新商业模式,培育经济发展新动能。生成式人工智能在商业端的应用开始跨越企业组织边界,深度集成到现有组织工作流程和系统中,对客户服务、供应链和网络安全等领域的关键业务流程进行重构,形成有影响力的新模式、新业务。生成式人工智能商业潜力的发挥,推动了利用与开发海量数据价值的进程,在信息生成、编辑和迭代方面,可以高效收集、整合各类数据,自动生成文本内容、图像。据国际咨询公司Gartner预测,到2025年,大型企业机构对外营销信息中的合成信息比例将上升到30%;到2030年,主要影视作品中AI生成内容的比例将上升到90%。在新的人工智能基础设施赋能下,生物制药、制造、材料科学等领域也开始变革业务流程。
生成式人工智能从营销、设计、建筑、内容领域向生命科学、制药、汽车、航空航天产业广泛渗透,正成为越来越多行业的新生产力核心元素,为更多客户创造全新价值。同时也要认识到,当前算法、模型、数据和算力的进步一日千里,亟需引导人工智能良性健康发展。人工智能系统能力及其固有的局限性是把双刃剑,在加强技术研发和创新的同时,需努力提高其安全性和可控性,有效识别潜在风险和漏洞并形成应对策略。需推进生成式人工智能发展所需的算力基础设施、优质数据集等建设。此外,还要营造可信的运行环境,通过提升算法透明度、水印技术等方式确保使用者知晓内容是否为人工智能生成。释放海量数据价值和生成式人工智能的商业潜力,需要提供法规保障,让更多用户受益,《生成式人工智能服务管理暂行办法》出台,展现了国家坚持发展和安全并重、促进创新和依法治理相结合的包容审慎原则。
产业界高度重视生成式人工智能的突破意义,近期各类大模型发布如火如荼。拥抱更美好的智能时代,关键在于推动人工智能深度嵌入经济社会生产生活全过程,依托数据与模型相互增强的双动力,以数智化赋能、激活和推动更多新业务新场景落地,坚持共生共赢的合作开放理念,营造充满活力的智能化创新生态圈,让生成式人工智能成为创新发展重要驱动力。
赋能千行百业潜力巨大
作为一项新技术,生成式人工智能在我国发展和应用情况怎样?如何充分释放其发展潜力?
武虹(中国科协创新战略研究院研究员):大模型引发的生成式人工智能热潮,其关键变革性特征是通过学习现有数据并以自然语言而非编程语言实现创建文本、图像、视频、音频和代码等形式的新内容。生成式人工智能泛指借助AI手段由机器自动产出的多模态内容,其技术本身离不开算力、算法、数据三大要素的支撑,而作为AI技术产出的成果,可以与相关行业融合,赋能千行百业。《生成式人工智能服务管理暂行办法》规范了生成内容的服务管理,对生成式人工智能技术从算力(平台)、算法以及数据等维度进行了激励与约束,提升了在应用过程中的规范化程度,以激发多方协作,推动扩大行业未来增长空间。
伴随ChatGPT的火爆,人工智能行业格局发生巨大变化,由于市场拥挤、产品差异化不够,国外一些基于开源工具开发的大语言模型初创企业发展受阻,已进入裁员阶段,缺乏技术护城河和产品易复刻成为初创型企业可持续发展面临的关键问题。回观国内,近半年来国产生成式人工智能大模型亦备受业界关注。今年3月16日,百度推出搭载文心大模型的文心一言,对标ChatGPT。其后,更多巨头企业跟进发布大模型。4月8日,华为更新盘古大模型;4月10日,商汤科技推出商量SenseChat;4月11日,阿里巴巴推出通义千问,字节跳动、科大讯飞、京东、腾讯等互联网巨头也相继在该领域布局。科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,当前国内10亿参数规模以上的大模型已发布79个。数据显示,我国人工智能核心产业规模达到5000亿元,企业数量超过4300家,生成式人工智能大模型成为近期热度最高的领域。从目前状况来看,国内生成式人工智能底层算法及实现与发达国家还存在一定差距,算力存在限制,加之国外基础模型自身也在不断演进与发展,作为上层应用的人工智能产业或在不短的时间内处于紧密跟随的动荡期。
大模型作为生成式人工智能最基础、最核心的工具,可作为底层技术,在此基础上垂直应用于各个产业和复杂场景。国内大型科技企业研发的人工智能大模型已布局办公、娱乐、生活、金融、医疗、教育、工业、自动驾驶、智慧城市等多个领域。例如,百度文心大模型已率先应用于百度搜索、信息流、智能驾驶、百度地图、小度智能屏等内部重要产品,并在能源、金融、传媒、社科等领域与国家电网、浦发银行、泰康保险集团、上海辞书出版社等开展外部应用实践。华为盘古大模型专注于企业市场服务,已在能源、零售、金融、工业、医疗、环境、物流等领域完成场景验证。公开信息显示,在医药领域,利用药物分子大模型可将先导药研发周期缩短至1个月,研发成本降低约70%;在气象领域,可提供秒级全球气象预报,预测速度提高了万倍以上;在工业领域,可提升样本筛选效率约30倍,筛选质量提高约5倍,同时降低开发成本90%,但目前尚无关于盘古大模型的外部评估信息。
基于对当前技术、应用的分析,充分释放生成式人工智能发展潜力,需注重以下几方面。
一是加快生态培育和应用拓展。发挥我国生成式人工智能专业化、细分化、多元化应用场景优势,构建多源异构的应用大数据生态圈。合法合规推动开源开放,打破“数据孤岛”,以高质量、多模态、场景化的数据为人工智能产业稳定高速发展提供原动力。
二是顺应新一代人工智能研发范式的变革,淡化研发与应用边界。借鉴ChatGPT在研发组织方面的经验,通过为用户提供测试服务,收集交互数据加速迭代优化模型。以新技术的多场景应用为导向,以供需联动为路径,促进研发和应用形成闭环。
三是加强人工智能领域高水平开放合作。充分发挥我国超大市场规模优势、制造业集成化优势,搭建多层次国际交流平台,积极融入国际人工智能创新生态。倡导共建共享理念,参与人工智能全球研发应用与产业分工,维护产业链供应链稳定、完善与发展。
四是合理引导,避免盲目跟风的同质化研发,一哄而上的概念炒作等现象。充分利用我国在数据规模、应用以及产业上的优势,准确研判生成式人工智能的发展走势并前瞻布局,为实施国家大数据战略增添新动力。
全球范围迎来新一轮快速成长期
从世界范围看,生成式人工智能发展现状和趋势怎样?
肖仰华(复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任):自2022年11月ChatGPT推出以来,其强大的多轮对话能力、意图理解能力、上下文学习能力、指令理解能力引起社会广泛关注,引领了生成式人工智能的研究与应用热潮。
随着前沿技术的不断进步,全球范围内生成式人工智能迎来新一轮快速发展。生成式人工智能在解决复杂任务、提升专业水平、理解多模态数据、具身化操纵物理机械等方面有了显著进展,其产业生态初具规模,已形成从基础模型、行业模型、应用插件到数据服务的完整产业形态,带动了GPU(图形处理器)计算显卡、高通量网络互联设备、云计算平台等算力企业进一步发展,并在图像、语音、代码、游戏、医疗等领域的应用场景中取得了显著效果。国际知名AI工具导航网站theresanaiforthat已收录面向1966个任务的7142个AI应用,其中绝大多数是近半年内新生企业,主要围绕基础模型,结合各细分领域与场景的具体需求,打造具有竞争力的AI产品或服务。可以说,围绕生成式人工智能基础模型的产业生态正蓬勃发展。
新一轮人工智能的快速发展由少数巨头企业直接推动形成,微软、亚马逊、谷歌、脸书等企业竞相入局,并投入巨大资源布局生成式人工智能大模型与相应产品研发。同时,一系列以实现通用人工智能为目标的人工智能实验室或创新企业汇聚了包括图灵奖得主在内的顶尖科学家,取得一系列重大突破,加速推动通用人工智能应用落地。
生成式人工智能的发展催生了大量的产业应用,涉及教育、娱乐、商业等众多领域。在教育领域,可以实现教学各个环节提质增效。以可汗学院的AI机器人Khanmigo为例,可为学生提供多个领域的个性化辅导和反馈,让其自主掌握知识和技能。在娱乐领域,可以创作出小说、剧本、配音、歌曲、动画等多种形式和风格的内容。Fable Studio公司的动画生成模型SHOW-1使用ChatGPT生成脚本;位于纽约的人工智能初创公司Runway发布的视频编辑器Gen-2,可根据用户指令进行影视作品创作。在商业领域,可以帮助企业进行市场分析,为客户提供智能咨询、推荐等服务。例如,客户关系管理软件服务提供商Salesforce推出的AI销售助手SalesGPT,可快速生成定制的销售邮件,而Marketing GPT模型则将AI用于营销工作,帮助用户提高效率。上述应用只是不完整列表,生成式人工智能是有着深远且广泛影响的技术革命,其代表性技术大规模基础模型将会成为人工智能基础设施,赋能千行百业。
全球人工智能产业进入高速发展阶段,但在实际应用中仍有不少问题亟需解决。首先,大模型存在安全底线问题,很多训练语料在未经用户授权情况下混入个人信息,提供对外服务时存在泄露风险,需进一步加强隐私防护、版权保护、可控编辑,确保可解释性与透明度。其次,大模型经常产生所谓的幻觉现象(如编造不存在的人物经历),未来要在更多场景应用落地,需解决其幻觉问题,降低训练与应用成本、实现增量学习、提升规范理解能力,增强大模型的可用性。再次,持续提升大模型的认知能力,包括角色扮演、性格塑造、记忆与遗忘、长短期记忆转换等,从而提高其在代码生成、数学推理、评论改写等场景的应用效果。
值得注意的是,人工智能新技术在为经济社会发展带来新机遇的同时,也产生了传播虚假信息、侵害个人信息权益等问题。兼顾发展与安全成为全球共识,各国政府积极应对生成式人工智能带来的新挑战。美国加利福尼亚州、伊利诺伊州等地出台了生成式人工智能相关法案,欧盟、日本、韩国等国家和地区正酝酿相关法案,预期在2023年底出台正式法案。中国发布《生成式人工智能服务管理暂行办法》,已于今年8月15日正式施行。与此同时,社会各界也在积极呼吁加强对生成式人工智能的监管与治理。
人工智能是新一轮科技革命和产业变革的重要驱动力量,从全球发展趋势来看,算力仍是人工智能发展的制约性因素,特别是高端GPU芯片、高速网络互联设备,生成式人工智能与其他人工智能的技术集成将成为取得应用效果的关键。与此同时,大模型能力瓶颈日益受到关注,大模型与传统AI技术的深度融合,特别是与传统知识库等技术的融合,是释放其在严肃复杂决策场景应用价值的重要方式。大模型将逐步从文本、图像、语音等数据的基础模型,演变为自治智能体大脑;将驱动智能体在虚拟环境中成长、与物理环境交互,成为能够自主适应复杂环境的智能体;将逐步从互联网开放聊天,演变为推动实体经济智能化发展的先进生产力。大模型有望成为推动数据价值变现的重要技术设施,助力数据资产化改革。