文章来源于互联网:阿里妈妈搜索广告2024大模型思考与实践

-
在保卫变革性的技术交替之际,回顾搜搜推广模型的历史演进,抓住三条关键路线(明线、暗线和辅助线)有助于更加清晰地理解技术升级的内在逻辑。同时,明确如何在新时期系统性发挥算力优势,深度挖掘搜搜推广领域的尺度规律,已成为推动技术进步的核心路线。 -
新探索的前哨站,诉状模型通过与大模型的深度结合,全面提升感知与推理能力。在感知方面,着眼于解决系统内容融合信息与行为良好信息的问题,持续优化多模态表征的质量,突破传统ID表征的前置,逐步实现对感知世界更丰富的感知建模;在推理层面,构建用户序列大模型,将生成式方法与判别行为方法有机结合,探索推理能力的持续进化之路。 -
大模型正在全面全面搜索广告系统。依托预训练(pre-train)与后(post-train)的模型迭代新范式,阿里妈妈自主研发了广告领域专属大模型LMA(Large Models for Advertising),并于2024年4月业务随宣推。LMA是电商基础大模型衍生出来的广告模型集合,迭代分支包括认知、推理和决策。新财年以来,LMA持续优化、认知分支聚焦多模态表征、推理分支聚焦搜索推广领域的用户行为大模型等。这些技术进展不仅推动了第一阶段体系实现多个版本迭代上线,还深度改造了认知、改写、相关性和创意等核心技术模块,推动技术全面升级。
-
明线,推理偏置(Induction Bias)的合理设计,是模型能力提升的核心驱动力。 -
暗线,硬件算力的指数级提升,为模型的规模化提供了强力支撑。 -
辅助线、CV和NLP领域的代际性技术升级,给搜推广领域带来重要启示。

-
AlexNet 在 ImageNet 竞赛中的突破性成功表明了 DNN 的巨大潜力,搜推广开启 DNN 时代;
-
Word2Vec奠定了表征的基础启示,使嵌入技术得以广泛推广的广泛应用;
-
注意力机制对翻译任务的大幅提升,深度影响用户行为兴趣建模;
-
基于Transformer结构的训练范式的普及,推动了对比学习、掩码学习、预训练和迁移学习等多种迭代模式的兴起。
-
一方面,从算力(暗线)角度来看,缩放法则在稀疏的更宽方向已经表现出第一生长曲线,新时期需要探索稀疏往稠密的转变,走出更深的新生长;
-
另一方面,从偏见(明线)角度来看,人工先验的偏见由精细化设计向朴素化范式转变。 正如《苦涩的教训》所言:“AI发展史最苦涩的教训是:试图将我们认为的思维方式编码硬进AI,长期来看是无效的。最后重要的,是那些能够随着计算能力高效增长而扩展的通用方法”。这一点紧迫感同身受,过去依赖精巧结构设计的短期收益,往往在算力提升的长期趋势下变得微不足道,甚至有些复杂结构反而成为算力扩展的障碍。真正支撑生产服务的模型,最终仍会朝着简洁、简化、方向的收敛,以适应计算资源的可扩展性和实际业务需求。
-
训练模式,包括分类、对比学习、掩码学习、自回归学习等,且骨干紧随主流更迭,包括BEiT3、BGE、BLIP2、EVA2等。
-
数据质量、图文质量包括视觉强相关的主体和关键词识别、难正负样本挖掘,结合行业特色挖掘兴趣样本例如拍立淘的图搜场景等。
-
规模效应,包括图片尺寸、训练样本和模型参数,模型尺寸经历了0.1B、1B和10B的升级过程,是更深层次规模化的主要路径。


-
【LUM】基于三步范式的大用户模型解锁工业推荐系统中的缩放定律
-
论文链接:https://arxiv.org/abs/2502.08309
-
【UQABench】UQABench:评估用户嵌入在个性化问答中提示 LLM 的效果
-
论文链接:https://arxiv.org/abs/2502.19178



文章来源于互联网:阿里妈妈搜索广告2024大模型思考与实践