媒体报道 | 范特科技CEO吴圣阳:大模型将给人类社会带来新一轮的范式革命


掌握了人工智能就掌握了新时代的生产力密码。

在ChatGPT爆火的当下,大模型火遍全球,中国产业也激发了对人工智能应用的新热情。

因此,这个时间点,36氪数字时氪团队正式启动《年度AI对话》专栏,希望与国内在大模型领域有着深度研究的专业人士进行热点话题的探讨,通过一系列报道,还原AI新的技术能力与应用潜力。

本期我们邀请到了范特科技CEO吴圣阳。

大模型的出现对中国的数字化进程有什么影响?对于企业数字化预算有什么影响?另外,大模型是否会改变中国公司的商业模式?这些都是值得关注的问题。

范特科技作为企业数字化转型和元宇宙的基础设施提供商,在企业数字化转型和人工智能领域多有研究。范特科技CEO吴圣阳认为:数字中国其实和元宇宙是息息相关的,在模型即生产力的新时代大背景下,每个城市都会有一个底层的城市级别的大模型;未来企业会像现在的订阅式付费模式一样,向大模型服务提供商按需定制大模型能力;大模型出现后,跟新技术深度融合的公司将会取代墨守陈规的集成商,重新定义和瓜分商业场景。

以下内容为采访原文,经数字时氪编辑整理:

图片

大模型与企业的数字化转型

大模型带来的能力将被应用到企业的实际生产经营中,尤其在数字化层面,大模型会加速数字化方案的落地。范特科技认为在B端和G端,企业和政府部门都可以借助大模型端到端的能力定制自己所在细分领域的大模型,让各种解决方案快速落地。

数字时氪:大模型出现后对中国的数字化转型进程有什么影响?

范特科技:数字化转型首先解决基础设施建设问题,其次就是大规模的能力建设,以往能力建设需要大量的人力、物力和时间成本,因为算法的研发和应用的开发周期都比较长。组一个团队、培养一批人、干成一件事投入大、周期长、见效慢。大模型有望改变这种局面。大模型的出现从底层颠覆了传统的算法研发和应用开发模式,大量的人工设计算法被大模型直接替代,应用开发被大幅度简化甚至自动化。拥有了大模型的企业相当于多雇用了一个算法团队和应用开发团队,不仅降低了成本还大大提高了效率。有人会说大模型的门槛很高,普通企业不一定能掌握,这其实也不是个问题,像范特科技这样深耕垂直领域多年的公司,正好可以帮助客户打造和落地大模型。范特科技的新一代人工智能MaaS平台,集大模型即服务能力、算法自训练能力、应用自定义能力和部署自动化能力为一身,就是为了能够端到端的解决大模型的落地问题、助力数字化转型。

我们曾经做过一个对比图,数字中国其实和元宇宙是息息相关的。在浙江和重庆等城市,我们已经见证了数字中国的蓬勃发展。这两地的数字中国架构,政府层面都有一个底层的大平台,可以简单理解为通用能力,在这个通用能力基础上赋能各个业务单元开发小能力。这其实和大模型是有天然结合的。在模型即生产力的新时代大背景下,相信在不远的将来,每个城市都会有一个底层的城市级别的大模型,在此基础上,大家都可以定制各种垂直领域或者行业应用的模型。在C端,居民的衣食住行在深度数字化的基础上将变得更加便捷。在B端和G端,企业和政府部门都可以借助大模型端到端的能力定制自己所在细分领域的大模型,让各种解决方案快速落地。这些都将助力数字中国宏伟蓝图的早日实现。

数字时氪:大模型出现后,企业的数字化预算有什么变化?

范特科技:从短期而言,大模型尤其是私有化的大模型价格和硬件投入较高,这是可以预见的。且大模型的应用还是需要打通内部的流程、标准等,以及与原有业务进行整合,这都是相当大的一笔支出。所以短期来说企业数字化的预算可能会增高。

从长期来看,在企业完全消化了大模型的固定成本和自身业务整合的对接成本后,企业运营和创新的整体成本可能会因为人员精简和效率提升而降低,但是尝到了大模型甜头的企业一定会在大模型和基于大模型的创新上投入更多的精力,以保持自身的优势和竞争力,所以我们相信MaaS模式将会兴起。

未来企业会像现在的订阅式付费模式一样,像范特科技这样的大模型服务提供商按需定制大模型能力,按需支付相应的服务费。对于企业来讲预算压力将大幅减轻,支出和收入的比例将得到更好的控制和匹配。

数字时氪:大模型在数字化的落地难点是什么?

范特科技:首先直接的难点是算力和提示词工程问题。算力本质上是基建问题,不仅是大模型,对任何数字化工程来说,基建都是大问题,而大模型由于对显卡的显存和数量都有比较大的要求,目前这块是需要一定的投入的。

提示词工程是大模型特有的问题,大模型训练完了,怎么用这个大模型很有讲究,不好的输入得到不好的结果,因此在落地的应用中做好提示词工程尤为重要,目前提示词工程这块的工程师比较缺,学术界和工业界也都在不断探索中,也就是说大模型出来了,但是对大模型的认识还在一步一步加强。

前面讲了直接的难点,需要补充的是,数字化是个系统工程,大模型是底层基础设施,大模型解决了算法创新难题,但是从算法到应用之间还有很多的事要做,比如大模型虽然效果好,但是很难直接跑在边缘设备上,很多时候需要用大模型监督训练更轻量更高效的垂直领域小模型跑在边缘计算设备上。另一方面,算法只是应用的核心模块,应用除了算法本身外还有大量的业务逻辑需要实现。

最后,有了算法和应用,还得方便部署到大量的设备上、最好是自动化的部署和运维才好。为了真正端到端的解决大模型的落地问题,就需要一套集大模型即服务能力、算法自训练能力、应用自定义能力和部署自动化能力为一身的新一代人工智能服务平台,也就是所谓的MaaS平台。范特科技已经打造了这样一套MaaS平台、底层是大模型的底座、中间是AI、AR以及算法、应用的定制化能力和自动化部署能力,上层是面向垂直行业的具体应用。我们认为只有这样才能真正解决大模型在数字化的落地难题。

图片

大模型带给中国企业更多“破圈”的机会

大模型的出现给中国产业和中国企业带来了更大的机会。范特科技表示在ToB、ToG领域,原来的商业地盘基本都由各大集成商瓜分,技术厂商或者算法厂商大多都是被集成的身份。大模型出现后,跟新技术深度融合的公司将会取代墨守陈规的集成商,重新定义和瓜分场景。

数字时氪:大模型的出现对中国产业将产生什么影响?

范特科技:大模型的训练,数据、算法和算力缺一不可,目前现状是国内高质量训练数据缺乏、大量原始数据未经梳理质量不高;算法层面不算落后但用以训练算法的显卡资源被限制非常匮乏。目前头部AI公司基本上都入局了大模型赛道,也有很多创业公司参与其中,总体来看目前处于追赶阶段,相信随着时间的推移,我们一定可以解决数据和算力问题,真正拥有原创的懂中文的媲美GPT4的大模型。

大模型的出现将加速中国产业的升级。一方面目前的现状让我们意识到了我们在科技创新领域仍然有很多的薄弱环节,非常容易被卡脖子,那么接下来产业界对于数据、对于AI芯片肯定会有更多的投入。另一方面大模型本身就是生产力的升级,底层生产力的升级一定带来上层建筑的升级。大模型的出现将为中国的科技创新提供更多机会和动力。

通过大模型的能力,中国企业可以在各个领域进行更深入的研究和创新,推动科技的发展,并在人工智能、机器学习等领域取得突破。中国的制造业可以利用大模型来进行预测和优化生产计划、改进供应链管理,并实现更高水平的自动化和智能化生产,提高竞争力。中国的酒店、旅游、金融、医疗等服务行业可以利用大模型来改进客户服务和体验,提供更智能、个性化的服务,增强竞争力。随着创新的速度不断加快,大量的简单重复劳动被AI替代,全新的掌握AI技能的工程师出现,将进一步推动创新和科技发展。一句话总结的话,大模型会带来生产力层面的巨大升级,并大幅推动各行业的数字化进程,在这波科技革命浪潮中,如果我国能抓住机遇,将有可能进一步缩小与科技强国的差距,全面提升国际竞争力。

数字时氪:大模型的出现对中国公司的商业模式会有什么影响?

范特科技:在ToB、ToG领域,原来的商业地盘基本都由各大集成商瓜分,技术厂商或者算法厂商大多都是被集成的身份。大模型出现后,跟新技术深度融合的公司将会取代墨守陈规的集成商,重新定义和瓜分场景。在这样的趋势下,所有的公司都拥有了破圈的机会,跟不上时代的公司将被淘汰,十多年前互联网公司百花齐放,颠覆传统行业的历史将再次上演。现在比拼的就是对新技术新事物的认知,以及在新时代下快速适应和迭代的能力。

在ToC领域,同样,大模型可能带来的是流量入口级别的改变,BATJ这样过去几乎实现了流量垄断的巨头,甚至于Google这样的世界级霸主,都有可能在新时代中被颠覆,没有公司能够说自己现在拥有了护城河。对于敢于创新的创业者来讲,这可能是十年甚至百年不遇的机遇,八仙过海各显神通,MidJourney这样十一个员工实现过亿年利润的公司,绝不会是仅此一家。

数字时氪:大模型的出现对具体行业会有什么影响?

范特科技:大模型是底层生产力的变革,带来的影响是全行业的。就拿我们深耕的金融行业来说,在ChatGPT问世的当天我们就收到了来自银行客户的咨询,说明行业对大模型带来的创新特别敏锐。大模型在银行的客户服务、理财建议、智能投顾、欺诈检测以及数智人等具体业务中是强需求,但由于政策原因ChatGPT以及基于互联网的语言类大模型是不能直接用的,涉及用户隐私等问题。目前在基础大模型这块国内头部企业相继推出了自己的语言类大模型,但与ChatGPT相比都还有较大差距,短期内难以实现规模化产品落地。

基础大模型的研发投入巨大、对创业公司来说不够友好;当然目前随着技术的发展各种开源大模型已呈现百花齐放的状态,几乎每天都有新的大模型出现,很多模型的效果也已经达到GPT-4的90%以上的水平,这些模型的出现,让创业公司拥有自己的大模型成为可能,尤其是面向垂直领域的大模型,目前这个方向上我们也在跟进,以为客户提供定制优化服务为主。我们更多的将精力集中在行业的垂直领域大模型。因为范特科技团队在金融、治理、应急和文旅等垂直领域深耕多年,有一帮孜孜不倦的持续创新者,我们既知道垂直领域需要什么样的大模型,又知道如何将大模型落地。一句话来说,我们会用大模型能力或者说MaaS能力,来帮助我们的行业客户拥有打造最适合自己所在领域的垂直类AI模型的能力。

图片

垂直大模型是人工智能创业公司的机会

范特科技作为AI领域的创业公司,在大模型出现后,把角色调整为MaaS服务提供者,本身更专注在技术层面而不是从业务到底层都需要专注。范特科技也表示,在中国,因为成本和人才的原因,能做基础大模型的其实也不会超过三家,以范特科技目前的体量是不会进入到这个领域的争夺的。而垂直大模型,是像范特科技这样的人工智能创业公司可能在新时代下脱颖而出的真正机会。

数字时氪:怎么看待创业公司在垂直领域大模型的机会?

范特科技:正如陆奇所说,世界上能做基础大模型的只有中美两国,而在中国,因为成本和人才的原因,能做基础大模型的其实也不会超过三家,以范特科技目前的体量是不会进入到这个领域的争夺的。而垂直大模型,是像范特这样的人工智能创业公司可能在新时代下脱颖而出的真正机会。垂直领域的大模型通常在百亿级别(基础大模型一般在千亿级别),目标是解决垂直领域内的问题。垂直领域大模型基于成熟稳定的基础大模型底座、针对垂直领域具体问题进行能力的组合和调优,能低成本、快速高效地解决实际问题。

什么样的公司能够做好垂直大模型?在我们看来,要同时具备技术积累和行业理解的两种能力,还是那句话“得场景者为王”,这句话在垂直大模型领域同样适用。做好垂直领域大模型,创业公司首先对行业要有足够的认知,不仅要充分掌握大模型的能力,还要知道行业痛点在哪里,因此大模型要在自己熟悉的垂直领域里做。其次,打铁还需自身硬,大模型落地讲求的是端到端地解决用户问题,这就要求创业公司具备很强的工程落地能力。这个工程落地能力体现在算法、应用、部署、运维等多个层面,是个系统性工程,不是一朝一夕的。范特科技自创立第一天起就一直在解决上面这些问题,我们从最小的推理单元做起,不断迭代,逐步形成了自己的一套开发运维体系,只有这样才能高效率、高质量的将大模型应用交付到客户手里。

数字时氪:这次的大模型浪潮对范特科技有什么影响?

范特科技:大模型对于所有公司包括范特科技这样的AI厂商来说,首先带来的是紧张,大模型的恐怖能力是对我们之前的认知和AI能力的降维打击,每个公司都需要重新定位和发展自己。但是很快我们更多的情绪就变成了惊喜,眼下所有的AI创业公司几乎都被拉到同一起跑线,而这次我们可能跑赢所有人。

从2020年的GPT3开始,我们内部就一直密切关注大模型的发展,今年二月份ChatGPT爆火更是让我们见到了大模型赛道的机遇,我们内部也组织了针对AIGC和大模型的讨论会,大家一致看好大模型的发展,也一致认为以垂直领域作为突破口切入大模型赛道是当前最佳的选择,并且迅速开启了研发工作。我们调整了研发组织架构,成立了以首席科学家为首的大模型研究小组,调整了研发方向,重点加强了垂直领域大模型的研发能力以及各产品条线对大模型能力的整合。可以说,大模型改变了AI企业自身的运作方式,改变了算法和应用的生产和设计思路,也拓宽了AI落地的能力边界。

在我们服务客户的过程中,我们的定位也有很大的变化。在大模型问世之前,我们需要根据用户需求去现场收集数据,训练算法,做工程化落地并对接用户的系统,需要提供一整套完整的解决方案,从厂商的角度来讲,如果该解决方案不能够大规模进行复制的话,投入产出比是不高的。有了大模型,我们的角色变成了MaaS服务提供者,在底层算法上选择好最合适的大模型后,提供给了用户自己定制算法的能力,这样范特科技就可以更专注在技术层面,而不是从业务到底层都需要专注。而客户则可以充分发挥自己对业务熟悉的优势,利用大模型不断进行业务模式的创新。举个通俗的例子,如果再来一次共享单车之争,我们并不关心到底是ofo还是摩拜会赢,我们只负责把自行车做好并且卖出去。

数字时氪:范特科技当下有什么规划?正在做什么?

范特科技:陆奇前段时间演讲提到过,人类目前所处的时代是第二代系统的开端,即刚开始完成从信息到模型转换的阶段,范特科技的MaaS平台致力于这一阶段的高效赋能。在未来的第三代系统中,人类社会不仅是信息-模型,而是要转变为信息-模型-行动,空间计算、虚实结合、Web3都是未来的必然趋势,而这部分正好与范特科技对未来的布局完美匹配,即在MaaS平台的基础上利用AR的能力实现模型-行动能力的打通。

从近期目标来看,范特科技更专注两件事,一是MaaS能力的构建,二是利用我们原本便拥有的AR能力来完成场景端最后一公里的落地问题。在MaaS能力上,范特科技已经完成了语言类大模型、视觉大模型以及多模态大模型的技术预研,掌握了训练、调优、推理全流程定制化能力。并且已经将大模型技术应用在产品研发的过程中,完成了AI快速开发平台等产品的大模型能力整合升级工作,将于近期推出相关产品。在技术预研的过程中我们也发现了通用大模型在垂直细分领域的不足和缺陷,接下来我们将针对这些问题对大模型进行优化和迭代,让大模型在垂直领域更加的通用和易用,在金融、治理、应急和文旅方面陆续会有更多的基于大模型的应用落地。

同时我们也有个预判,正如前文所说,大模型到来后,一切场景都会在新的生产力革命下实现重塑,也就是过去所有的规则都会被打破,那么如何利用技术快速占领场景的制高点会成为商业化推进的关键所在。AR是我们看好并坚持的方向,首先各类产品从2D向3D的进化符合人性的需求。当信息化、数字化、RPA等技术手段解放了人的双手之后,大模型会逐步解放人的大脑,那么接下来人类便很有可能会寻求进入到元宇宙去体验更多平行世界,享受不一样的人生。