在LLM时代里更好的进行系统迭代

- 1 min

在大型语言模型(Large Language Model,简称LLM)的时代,我们可以将与此技术紧密相关的组织划分为以下三个主要类别:

  1. 底层通用大模型研发组织:这类组织专注于构建和优化底层的通用大模型,为上层应用提供基础和支持。

  2. 开源模型业务迁移组织:这些组织主要工作是将开源的大模型应用并迁移到具体的业务场景中,实现模型与实际应用的结合。

  3. 平台型和应用型工作组织:基于底层通用大模型,这类组织负责完成各种平台型和应用型的开发工作,将模型的能力具体化和个性化,以满足更具体的业务需求。

对于前两类组织,我们可以比较容易地理解他们的运作方式。他们在系统迭代的过程中,与已经集成了深度学习模型的传统系统保持一致。底层通用大模型的研发通常由大型公司和顶尖的创业公司担当,而将开源模型迁移到具体业务的任务,则通常由一些在原有业务基础上寻求“技术升级”的技术公司承接,至少表面上是这样的情况。

然而,对于第三类组织(也就是我目前所在的组织,已经从第二类切换为了这一类),作为真正由大型模型推动的新型系统,我们可能并不具备对底层通用大模型进行微调(fine-tune)的能力(或者说,这样做的成本太高)。在这种情况下,如何进行系统性的迭代升级,不仅关乎解决特性开发本身,更是面向企业自身价值积累和竞争壁垒构建的至关重要的一环。因此,我认为对于这最后一类组织,我们需要清楚地认识到以下几点:

  1. Prompt不是壁垒:即模型的输入语句(Prompt),并不能构成持久的竞争优势或者说壁垒。

  2. 系统架构和复杂的工程设计只是短期优势:虽然它们可能在短期内提供了竞争优势,但这些并不能形成长期持久的壁垒。

在我看来,组织的真正壁垒有两个。首先,持续的技术突破和创新速度,这主要源于成长型思维。然而,对于这种持续性,我保持一定的怀疑,因为它需要非常优秀、独立且思路清晰的领导者和相关团队。在不那么优秀的领导者的引领下,组织容易陷入焦虑和过度加班的困扰。其次,通过数据积累、用户习惯形成的壁垒。这种壁垒更加稳固,构建过程往往水到渠成,更加自然。

让我们回到本文的主题,结合第二种壁垒的构建,尽管无法调整底层的大模型,但我们也应该建立一种数据化的方案进行迭代。这个过程主要分为2个步骤:

定义核心指标和模块指标

在构建系统时,我们首先需要定义核心指标和模块指标。这些指标是系统迭代的基础,应满足以下几个条件:

建立体系

为了成功实现数据驱动,我们需要建立一个完整且健壮的数据体系。具体来说,这个体系应包括数据埋点、指标统计和在线监控以及新模块的A/B测试:

搜推广系统在这方面的工作已经做得非常好,其数据体系不仅健全而且成熟,可以支持他们做出快速且准确的决策,我们可以学习和借鉴。

作为技术管理者,我们不仅需要建立健壮的数据体系,还需要建立一套有效的运转机制。这一机制的目标是让每一位团队成员都能够顺畅地进入到这个数据驱动的迭代循环中,从而提高工作效率,提升团队整体的生产力。

在新兴的系统中,有机会重新定义核心指标构建迭代体系。这对于当前这波技术人来说是一项挑战,也是一次机遇。这不仅让我们有机会从零开始,更好地理解和掌握“算法”的本质含义:在用户交互中沉淀数据,在数据中发现价值,然后回到用户交互中验证,而不仅仅是训练模型。这也为我们提供了一个平台,去发掘并实践新的思考方式和方法,为我们的产品和服务创造更大的价值。