范特科技CTO郭长柱:深度结合业务场景,以最快速度实现垂直大模型的应用落地


近日,科技媒体猎云网记者对范特科技CTO郭长柱就行业垂直大模型进行了一次全面深入的专题访问。

 

在这次专访中,郭长柱分享了关于行业垂直大模型的重要性、发展前景,以及范特科技在相关领域的研发成果及机会优势等内容。郭长柱认为,垂直大模型发展空间巨大,不仅将颠覆传统行业运营模式,而且有可能孕育出新的科技巨头企业。
 
以下是根据此次专访整理的完整版文字内容,通过阅读此文您将对垂直大模型形成更加全面、更深层次的理解。

垂直领域大模型发展空间广阔

猎云网:像李彦宏以及市场一些讨论的声音认为应用层的创业机会最大,您怎么看?

范特科技:首先解释一下什么是大模型,大模型是一类模型的统称,通常参数量在千亿以上,在TB级的语料库或数据集上训练过,这个数据量简单类比可以理解成模型了解互联网的全量知识,因此模型具备一定的“涌现”能力也就不足为奇。普通人听的比较多的是ChatGPT之类的语言类大模型,其实除了语言类大模型,还有视觉大模型、多模态大模型等。

大模型这个赛道的玩法有很多,大家熟悉的OpenAI、谷歌、微软、百度等都是做基础大模型的公司。基础大模型因投入巨大,对创业公司不够友好。随着技术的发展,各种开源大模型已呈现百花齐放的状态,几乎每天都有新的大模型出现,很多模型的效果已经达到GPT-4 90%以上的水平。这些模型的出现,让创业公司拥有自己的大模型成为可能,目前我们也在密切跟进大模型发展趋势。

横向的基础大模型仍处于快速演变过程中,创新速度非常快,创业公司投身其中极有可能面临模型还未问世就已经落伍的尴尬境地,同时软硬件投入巨大,风险不可控。而垂直领域大模型基于成熟稳定的基础大模型底座,针对垂直领域具体问题进行能力的组合和调优,快速高效地解决实际问题。

猎云网:范特科技为什么选择做垂直领域的大模型?

范特科技:从范特科技的角度看,应用层的创业机会一直都存在,且相对容易,但是作为一家注重技术研发应用的创业公司,只做应用层的创新明显是不够的,我们应该立足当下,布局长远,坚持在大模型上做技术沉淀,避免未来被大模型卡脖子。

之所以选择做垂直领域的大模型是基于范特科技团队的基因考量,我们在金融、治理、应急和文旅等垂直领域深耕多年,有一帮孜孜不倦的持续创新者,我们既知道垂直领域需要什么样的大模型,又知道如何将大模型落地。

实际上大模型几乎可以刷新所有的垂直领域,但想和做是两回事,用最快的速度在你最熟悉的领域用大模型做业务创新,我们认为这是成功的关键。问题还是那些问题,但解决问题的手段有了质的提升,比如在视觉领域Meta开源的DINO和SAM大模型,让业界看到了检测一切和分割一切的能力,在这种能力的加持下,解决垂直领域的具体问题时,完全可以借助大模型的能力自动标注数据,自动训练轻量模型。以前这些过程需要大量数据标注人员和算法人员的参与,未来可能都不需要了,使用大模型的能力训练垂直领域的细分模型,可以是全自动的过程。

范特科技在大模型问世之前就搭建了一套AI自训练平台,以往平台实现了算法的自动训练,但是数据标注阶段还需要人工参与,在整合了CV大模型的能力之后,通用物体的检测和分割已经实现全自动训练,即便是不常见的物体借助CV大模型,也可以极大地加速标注的速度。大模型改变了AI企业自身的运作方式,改变了算法和应用的生产和设计思路,也拓宽了AI落地的能力边界,可以说大模型在垂直领域大有可为。

模型即服务(MaaS)创新满足客户需求

猎云网:范特技什么时候决定做垂直大模型的?内部讨论时有无分歧?

范特科技:从2020年的GPT3开始我们内部就一直密切关注大模型的发展,今年二月份ChatGPT爆火更是让我们见识了大模型的机会,我们内部也组织了针对AIGC和大模型的讨论会,大家一致看好大模型的发展,也一致认为以垂直领域作为突破口切入大模型赛道是当前最佳的选择,并且迅速开启了研发工作。对于垂直领域大模型研发工作,内部团队目前是争分夺秒、时不我待的状态,每个人都很兴奋,仿佛回到了2014年深度学习刚火起来那会儿。

猎云网:如何选择使用哪个大模型作为底层技术?

范特科技:选择哪个大模型作为底层技术需要结合自身的实际需求。目前,市面上的语言类大模型、视觉大模型、多模态大模型已经有很多选择,开源的也非常多。大模型作为技术底座,首要的是能力上足够支撑垂直领域的具体任务;其次考虑的是综合性价比,有时候“大炮打蚊子”对于垂直领域未必是最优方案;最后在好用的前提下优先选择真正开源的大模型,做到训练、调优、推理整套技术方案全掌握,避免潜在的知识产权和卡脖子问题。

猎云网:目前是如何将大模型与业务相结合的?

范特科技:大模型提供的是基础能力,具体业务则是专有能力的组合。模型即服务(MaaS)是一种创新的模式,即把大模型作为基础能力对外标准输出,端到端地解决用户需求。

不过,距离实际落地还有比较长的路要走,直接使用大模型端到端解决问题相对来说比较少,尤其是在CV领域,更多的是在基础能力之上,针对垂直领域做定制。比如使用大模型自动标注、训练垂直领域小模型,使用大模型更加普遍的特征做VQA、检测、分割和识别等二次开发。

除此之外,部分业务可能涉及多项大模型能力的组合,甚至需要语言和视觉特征对齐的多模态能力。这就要求我们在实际的业务中必须支持多种大模型的自定义业务流,实现大模型的自由组合和业务的深度定制。

猎云网:目前主要做哪个/哪些垂直领域的大模型?

范特科技:目前,我们主要面向金融、治理、应急、文旅这些行业,解决AI、AR方面的问题,以视觉大模型为主,语言类大模型和多模态大模型为辅。

大模型推动传统行业生产效能变革

猎云网:对于这个行业而言,大模型会带来什么影响?

范特科技:大模型对行业的影响深远,由于解决问题的手段有了质的提升,对于行业的创新有很大的刺激作用,短期内大模型和行业应用的结合会出现爆发式增长,大量传统应用在大模型能力的加持下将重新焕发生机。长期来看基于大模型的MaaS以及基于大模型全新设计的应用不仅体验更好,成本可能还更低。举例来说,过去我们在金融行业面临大量长尾算法定制需求时,往往保持谨慎态度,因为我们知道,长尾算法数据收集难、标注时间长、数据不均衡,导致落地效果差,即便我们已经有了算法自训练平台,长尾算法的落地难度依然大且周期长,主要因为其中包含了大量的人工工作。

在结合了CV大模型的能力之后,现在对于常见物体的检测和分割已实现全自动训练,对于特殊物品也可以借助CV大模型把人工作业降到最低,不仅工作量降低了,工作难度也降低了。原来做分割的时候要沿着物体边缘仔细描边,现在只需要点一下就能自动分割,这样我们把系统私有化部署到客户那里,打通内部网络的云边两端,客户足不出户就可以对模型进行升级和维护,而我们专注做基础算法和底层平台能力建设,这样实际上分工也产生了变化。大模型是一种新的生产力,底层能力的突破不仅可以降本增效,长期来看必然带来上层应用的跃迁和变革。

猎云网:做垂直领域大模型的阻力有哪些?

范特科技:阻力来自两个极端,一个极端是因为AIGC的火爆而笃信通用人工智能即将到来的人,觉得垂直领域的大模型终将被通用基础大模型替代,不值得投入,持这种观点的人目前看来过于乐观了,通用人工智能依然有很长的路要走;另一个极端是抵触大模型的人,他们刻意贬低大模型的能力,笃信同样的场景用轻量级的算法和数据标注一样可以轻松解决,认为垂直领域不需要大模型,这种沉浸在过去的认知中出不来的人,也是垂直领域大模型落地的阻力。

猎云网:如何在技术和数据上形成差异化优势,避免被底层模型供应商所限制?

范特科技:在技术层面,首先要掌握大模型的训练、调优和推理全流程,这是差异化的前提;其次,要结合垂直领域的具体业务对大模型进行定制化,这里包括整体调优、部分调优、模态对齐等,通过这些优化将得到一个特定领域的细分模型,这个模型在特定领域有明显的优势;最后,要尽快将垂直领域的大模型落地,打造采集、训练、评估、推理的完整闭环,持续迭代大模型,实现半监督全自动的模型迭代流程;在落地之后形成数据积累,不断将垂直领域做深做透,形成差异化优势。

如果定位通用人工智能,则存在底层模型供应商潜在限制的问题,但在垂直领域可以避免这个问题。前面也提到做垂直领域掌握大模型全流程是基本要求,垂直领域本身就是差异化竞争,底层模型供应商提供的是基础能力,这个能力一般很难超越垂直领域的大模型,垂直领域的大模型厂商做到自主可控不难。

猎云网:有高薪挖人才吗?市场上是否存在人才短缺难题?

范特科技:硬件是可以买来的,热爱大模型并愿意付诸行动的人才是真的难得。现在我们也对大模型的人才求贤若渴,无论是语言大模型、视觉大模型还是多模态大模型,我们可以很容易地买到用来训练的设备,但真正擅长这个领域的人才非常稀缺,听说前段时间某大厂开出500万年薪招聘人才。我们目前采取的策略是紧跟国内外最新研究成果,确保自身技术不掉队,同时通过不同的渠道招揽人才。

猎云网:有估算过投入大模型要投入多少资金吗?如何优化成本和生成效率?

范特科技:前面也提到了做基础大模型的成本很高,有消息说GPT3单次训练成本是400万美元,所以之前有创业导师喊出“没个几千万不要做大模型”的“忠告”。目前,定位通用人工智能大模型依然是头部科技公司在做的事,但这不是大模型的全部,大模型在垂直领域已呈现百花齐放的状态,且成本已经低到普通开发者就可以定制的程度。对于创业企业来说,只要有好的理念和商业模式,资金不再是问题,甚至个人开发者也可以拥有自己的大模型。

在成本和生成效率方面,一方面在现有的产品中整合大模型能力,从而大幅提升内部创新效率;另一方面通过自研的推理引擎优化技术和并行计算技术,最大限度提升大模型推理速度和硬件利用效率,通过自研业务流编排引擎解决最后一公里的业务流自定义问题,完成基于大模型端到端的解决问题完整闭环,这也成为了范特科技在大模型领域的核心竞争力。

创业公司做垂直大模型占据天然优势

猎云网:一些AI大厂也在做垂直领域的大模型,创业公司的机会优势是什么?

范特科技:首先,生产力的提升带来的是整个产业体量的数量级提升,大模型在垂直领域的发展空间非常大,容得下大厂和众多创业公司。其次,对于大厂来说,大模型在横向和垂直领域是鱼和熊掌不可兼得的关系;做横向基础大模型的厂商的初衷是打造众多企业接入其大模型的生态体系,以它的大模型作为底座去赋能百业,这个时候它自己也下场踢球就和它的身份不符,所以它们一般不会轻易这样做。另外,在做事方式上也不尽相同,大厂往往是搞一套自己的标准和流程让用户遵守,看着高大上的产品落地性不强,对硬件的要求高,云边端的结合性低,产品兼容性不足,不愿意做定制服务等短板,致使大厂在这件事情上很难通吃。创业公司的专注技术、敢于创新、灵活高效和定制服务等特质,决定了在垂直领域大模型赛道上永远有机会。

猎云网:您认为做好垂直大模型的关键/核心是什么?

范特科技:深入垂直领域充分了解用户需求,端到端地解决客户问题,而不是只能提供工具。敢于创新,快速迭代,建立垂直领域大模型壁垒和数据壁垒,掌握大模型落地的全流程关键能力,从而形成核心竞争力。

猎云网:现在有积累种子客户吗?客户怎么看大模型?

范特科技:范特科技在金融、治理、应急、文旅行业深耕多年,当我们把垂直领域大模型技术以及模型即服务模式介绍给客户的时候,客户都非常感兴趣,尤其是多年来想创新又被厂商各种限制的金融科技客户,非常渴望利用我们的AI技术快速开发平台,搭建自主可控的AI算法模型和应用开发平台,当他们了解到大模型能自动标注绝大多数常见物体以及特定物体时,都认为很了不起,希望尽快投入应用。很多客户对于大模型的认知还停留在ChatGPT等语言类大模型上,对于视觉大模型和多模态大模型了解甚少,他们通常对我们的产品有着超高的预期,实际上现在我们很多时候在做降低客户预期的工作。

猎云网:有声音认为训练大模型的窗口期不会太长,最多半年到一年,就会有出局者诞生,您怎么看?

范特科技:我印象中在上一波AI浪潮开局之时,也不乏类似言论。当然,无论哪个行业都会有出局者诞生,但如果说训练大模型的窗口期不会太长,显然是不合适的。首先,训练大模型的成本在降低,不管是硬件成本还是人员成本,我们周围已经涌现出了一大批对大模型热衷的研发人员,随着他们对大模型技术理解的加深,整个行业的门槛会将降到足够低,应用的领域会足够广,能解决的问题将足够多。就目前的现状看,除非你想做的是通用人工智能,即一个模型解决所有问题,这个发展态势现在还不好说。如果是立足垂直领域的大模型,我认为不会有什么窗口期,因为整个市场体量足够大,做垂直领域的大模型,现在开始也不算晚。

猎云网:目前,范特科技垂直大模型处在什么阶段?接下来准备利用大模型技术做什么?

范特科技:范特科技已经完成了语言类大模型、视觉大模型以及多模态大模型的技术预研,掌握了训练、调优、推理全流程定制化能力。并且已经将大模型技术应用在产品研发的过程中,完成了AI快速开发平台等产品的大模型能力整合升级工作,将于近期推出相关产品。在技术预研的过程中,我们也发现了通用大模型在垂直细分领域的不足和缺陷,接下来我们将针对这些问题对大模型进行优化和迭代,让大模型在垂直领域更加通用和易用,在金融、治理、应急和文旅方面陆续会有更多的基于大模型的应用落地。

猎云网:有人把这波AI浪潮定位为2.0时代,AI技术的兴奋点从识别点转向了生成,您怎么看这波AI浪潮和此前的AI浪潮的区别?这波AI浪潮的标杆性变化是什么?

范特科技:这个未必如此,过去生成式技术发展的不够好,主要是因为生成的内容太差,文本内容不通顺,图像内容“一眼假”。在大模型时代,尤其是AIGC领域突飞猛进的最近这两年,生成内容突破奇点,已经非常接近人类水平,有些甚至超越普通人,使得内容生成领域大放异彩。而识别领域十年前就已经达到不错的状态,大量商业应用已经落地成型,这些年虽然也在不断迭代提高,但相对于生成式这两年变化没有那么大。可以说AIGC引爆了一波新的AI浪潮,这是叠加的关系,这波浪潮最大的助推器就是AI大模型。

猎云网:这波大模型浪潮,是否会改变AI公司的商业模式?具体如何理解?

范特科技:我们认为AI公司商业模式一定会发生改变,从以往的卖算法、卖平台演变成模型即服务(MaaS)的新模式,即大模型本身作为一项基础能力对外提供服务,端到端地解决用户需求。事实上,领先的大模型公司已经在这么做了,国内外也有这样的平台型公司出现,例如国外的HuggingFace,用户可以将自己基于大模型的应用免费放在他们的平台上供全世界人使用。随着MaaS理念的普及,模型直接提供服务意味着中间环节都可以省去,那么传统厂商的价值将不复存在,其地位岌岌可危,应该尽早转型,加强自身研发能力,用MaaS理念重塑自身产品和业务价值,更好地服务客户。

猎云网:这波大模型浪潮的想象空间有多大?

范特科技:这波大模型的浪潮是叠加在原有的AI和数字化浪潮基础上的,它是底层生产力的提升,这个提升带来的想象空间是巨大的,在这波浪潮中极有可能出现超越Google、微软的巨型科技公司,而这个公司肯定出自AI大模型相关领域。至于这家公司是不是一家中国公司,让我们拭目以待。