在全球最大的职业社交平台LinkedIn上,寻找一位“对治疗癌症有深入了解”的专家,其搜索逻辑,正在发生一次根本性的、从“机械”到“智能”的革命。
近日,LinkedIn正式推出了其全新的、由AI驱动的人脉搜索功能。
这并非又一次简单的算法优化。它是一次深刻的范式转移,标志着LinkedIn的搜索框,正在从一个传统的“关键词匹配”引擎,进化为一个能够真正“理解人类意图”的语义搜索引擎。
在过去,如果你想在LinkedIn上找到一位癌症研究专家,你必须精确地,在其个人资料中,可能出现的关键词——例如,“癌症”、“肿瘤学”、“基因组研究”——之间,进行反复的、手动的尝试。
而现在,用户只需用最自然的、日常的语言,提出一个问题,例如:
“谁对治疗癌症有深入的了解?”
新的AI系统,将不再仅仅去寻找那些在其个人资料中,一字不差地,包含了“癌症”这个词的用户。
它会去理解“治疗癌症”这个意图背后,所关联的、一个庞大的、语义相关的知识网络。
-
它会自动地,将“癌症”,与“肿瘤学”、“基因组研究”、“CAR-T疗法”、“靶向药开发”等一系列相关的专业领域和技能,进行关联。
-
它会去分析用户的职业背景、发表的论文、参与的项目,来判断其在该领域的专业深度。
-
更重要的是,它还会在推荐最终的结果时,优先考虑那些与你,存在二度或三度社交网络关系的人,以确保你能够更容易地,通过共同的联系人,来与这些专家建立联系。
这种从“字面匹配”到“意图理解”的跃迁,正在将LinkedIn的搜索体验,提升到一个前所未有的、精准和高效的水平。
为了在其高达13亿用户的庞大平台上,实现这种智能化的搜索,LinkedIn的工程团队,在背后,进行了一系列艰苦而卓绝的技术优化。
他们开发了一套被内部称为“食谱”(Recipe)的高效技术框架。
通过这套框架,他们能够在小范围内,快速地,对各种不同的模型、数据和算法组合,进行大量的A/B测试。
经过持续不断的迭代和优化,团队最终,成功地,将支撑这套系统的核心模型的参数规模,从最初的440M(4400万),大幅地,缩减到了220M(2200万)——在保持甚至提升了核心性能的前提下,将模型的尺寸,压缩了一半。
这种极致的优化,极大地提升了系统的处理速度和响应能力,是其能够服务于全球海量用户的关键所在。
在底层的基础设施上,LinkedIn也进行了一次重大的转型。
他们将整个检索系统,从过去依赖于CPU的架构,全面地,迁移到了更适合并行计算的GPU架构之上,以应对AI时代,日益增长的、庞셔大的数据处理需求。
此外,团队还创建了一种全新的、智能的**“查询路由层”**。
这个路由层,能够实时地,分析用户输入的查询的特性——它是一个简单的关键词查询,还是一个复杂的、需要语义理解的自然语言问题?
然后,根据分析结果,它会自动地,将这个查询,路由到最适合处理它的后台系统中去——要么是传统的、高速的关键词检索引擎,要么是全新的、由大模型驱动的语义理解引擎。
爱力方的分析认为,LinkedIn的这次重大升级,其意义已远超一次产品功能的更新。
它更像是一次深刻的“技术宣言”。它向整个行业,清晰地,展示了,如何在一个拥有海量用户和历史数据的、成熟的、“传统”的互联网产品中,通过一种务实的、渐进式的、工程思维主导的方式,来深度地、有效地,整合生成式AI的革命性力量。
它没有去追求最大、最强的模型,而是通过持续的优化,找到了那个在“能力”、“速度”与“成本”之间,最完美的平衡点。
当一个拥有13亿用户的平台,其最核心的交互入口,开始真正地“听懂人话”时,它所能释放出的、关于知识发现和人脉连接的能量,可能才刚刚开始,被我们所真正地认识到。