大模型:从炒作走向应用

新知榜官方账号

2023-07-06 11:13:01

引言

随着人工智能的快速发展,大模型逐渐成为了人们关注的焦点。本文将从大模型的发展现状和趋势、大模型在多个领域中的应用、大模型所需的投入和挑战以及如何让大模型更有价值等方面进行探讨。

大模型的发展现状和趋势

大模型是指参数量非常庞大的模型,通常需要大量的算力和数据来进行训练。随着人工智能技术的不断发展,大模型也在不断演化。

目前,视觉大模型和语言大模型是人工智能领域中最为热门的两个方向。视觉大模型主要用于图像和视频的处理,而语言大模型则主要用于自然语言的处理。

在整个大模型的发展历程中,我们可以看到一个趋势,那就是大模型逐渐向多模态方向发展。未来的大模型将不仅仅能够处理语言数据,还能够同时处理图像和视频等多种数据类型。

大模型在多个领域中的应用

大模型在多个领域中都有着广泛的应用。下面我们将分别从自动驾驶、蛋白质结构预测和自动化数据标注三个方面进行介绍。

自动驾驶

自动驾驶一直是人工智能领域中的一个热门方向。但是,传统的自动驾驶技术很难向更高级别跨越,而且很难像人一样,可以灵活应对各种路况。多模态大模型或许能够解决这种困境。利用大模型生成大量困难样本,再用环视感知数据和多模态数据作为输入,实现感知和决策一体化,通过环境解码器重建3D场景,实现路径规划,并用自然语言解释自动驾驶动机,就能使自动驾驶系统更安全可靠,且具有可解释性。

蛋白质结构预测

解析蛋白质结构是一项非常重要的基础工作。蛋白质功能通常由其结构所决定,要预测其结构,算力资源是基础。利用大模型可以实现自动标注,大大降低了成本。商汤AI大装置为蛋白质结构大模型提供AI推理算力,并为蛋白质相互作用模型,提供研发平台及训练算力,在与百英科技合作中,蛋白质结构预测大模型推理时间可由数小时减少到数分钟,使得蛋白质结构预测性能达到工业应用的标准,抗体筛选效率提升60%。

自动化数据标注

传统的数据标注需要大量的人力和时间,成本较高。而利用大模型可以实现自动标注,大大降低了成本。商汤明眸自动化数据标注平台则提供自动数据标注服务,它拥有12个行业级大模型,涵盖超过1000个目标类别,且能标注2D和3D。当用户上传图片数据,就可以对目标进行检测和属性识别,并自动显示标注。

大模型所需的投入和挑战

大模型的训练需要大量的算力和数据,因此需要巨额的投入。而且,大模型的训练还需要解决诸如算法、数据和算力等方面的挑战。

算法挑战

过去10年,最好的AI算法对于算力需求增长超过了100万倍,也就是每两年提高一个数量级。随着多模态的引入,数据量将继续指数级增长,当计算量有限情况下,需要分配更多计算资源给数据,而不是完全给参数,用公式来说,就是“大模型参数量×处理的数据量=计算量”,计算量越大,通用能力越强。

数据挑战

大模型需要大量的数据进行训练,而高质量的数据往往难以获取。未来的大模型,不仅需要算力惊人,更会通晓文字、图像或视频。高质量语料正逐渐消耗殆尽,更多信息需要从视觉上获取,也就是向多模态发展。

算力挑战

大模型是算力巨兽,依赖高端GPU芯片,一个大模型需数万块GPU,以此推算,是至少几十亿元人民币的投入。

如何让大模型更有价值

对于正探索多模态大模型的公司,要让大模型更有价值,需要考虑以下几个方面:

  • 优化好模型本身,提高多模态数据处理能力,让文字、图片、视频无缝衔接;
  • 提供更多高质量数据,给模型更多“好口粮”;
  • 与生态伙伴探索商业应用,让大模型释放更多生产力,如智能助手、自动驾驶、医疗诊断;
  • 让大模型时刻安全可靠。

结语

大模型作为前期投入极大的技术,需要的并不是概念,而是在提高投入的前提下,找到更多看得见摸得着的商业化应用。当大模型被每个人触及之时,行业便会被更多人所重视。

本页网址:https://www.xinzhibang.net/article_detail-6341.html

寻求报道,请 点击这里 微信扫码咨询

关键词

大模型 多模态 视觉大模型

分享至微信: 微信扫码阅读

相关工具

相关文章