数据融合:智能体时代企业AI规模化落地的核心引擎

温故智新AIGC实验室

TL;DR:

在AI与智能体浪潮下,企业级AI面临数据碎片化与集成复杂性挑战。甲骨文等巨头正通过多模态融合数据库,将异构数据一体化,这不仅是技术革新,更是推动AI从独立项目走向企业核心架构的关键策略,预示着数据范式与AI商业化路径的深层变革。

随着人工智能浪潮席卷全球,企业数字化转型的重心正从应用智能化迈向**“数据智能一体化”。传统意义上的数据管理体系在AI时代面临前所未有的挑战:数据形态日益多样化、智能体(Agent)应用对实时、融合数据的需求激增,以及AI落地中的安全与“幻觉”问题。甲骨文公司副总裁吴承杨强调,AI极大放大了数据的战略优势,而多模态数据融合**已成为企业级AI规模化落地的“至关重要”因素。1 这不仅是技术层面的演进,更是对未来企业架构、商业模式乃至产业生态的深远重塑。

数据基石的重构:AI时代的数据融合范式

长期以来,企业数据往往分散于各种异构系统:关系型数据库处理结构化数据,MongoDB存储JSON文档,Neo4J擅长图数据,各类IoT设备生成流式数据。这种分库分表、异构并存的模式,在传统业务流程中或许尚能勉强支撑,但在智能体驱动的AI时代,其固有的复杂性与低效率被无限放大。甲骨文中国区技术咨询部高级总监嵇小峰指出,

“若采用多个异构数据库,如MangoDB、MySQL、Neo4J等,数据整合的复杂性将远超处理能力。”

当需要对这些数据进行机器学习训练、RAG(检索增强生成)或智能体编排时,繁琐的数据抽取、格式转换、特征工程等步骤,不仅耗时耗力,更成为了AI项目“烂尾”的症结所在1

甲骨文提出的“融合数据库”概念,正是对这一困境的深刻回应。它突破了传统数据库单一数据模型的限制,旨在实现图数据、空间数据、向量数据、结构化数据与非结构化数据(如JSON)的底层一体化融合。例如,Oracle Database 23ai引入的AI Vector Search功能,允许企业安全地将文档、图像等非结构化数据与私有业务数据无缝结合进行搜索,而无需耗费大量资源进行数据迁移或复制2。这种一体化架构的核心在于:

  • 多模态支持:原生支持向量处理、图数据分析、JSON文档管理等,避免了数据类型带来的系统割裂。
  • 统一平台:所有数据汇聚于一个平台,简化了数据管道,降低了数据治理和集成的复杂性。
  • 无限扩展性与内建安全性:为海量、多样化的AI训练和推理数据提供稳定可靠的基础,同时从数据库层面强化数据安全。

这种**从“数据孤岛”到“融合基石”**的范式转变,不仅提升了数据利用效率,更从根本上降低了AI应用开发的门槛和运维成本。

智能体时代的效率革命与架构演进

智能体是AI发展的下一阶段,其核心在于多步骤的自主决策与行动编排。吴承杨生动地对比道,如果使用传统开源数据库,智能体编排可能需要多达二十步,而借助于Oracle的融合数据库,这一过程可精简至四步1 这种效率的提升,对于追求敏捷开发和快速迭代的智能体应用而言,具有颠覆性意义。

值得深思的是,当前许多企业在AI项目落地时,倾向于将现有数据抽取到外部,甚至“另起炉灶”搭建独立的AI平台,或过度依赖“数据中台”来解决异构数据集成问题。吴承杨对此直言不讳地指出,这往往是一种误区。

“AI 不应作为独立项目存在,而应融入整个系统架构。但AI难以融入的原因在于架构过于复杂:如果企业连十个数据库的整合、数据中台搭建以及安全管理都无法搞定,自然就无法将AI集成进来,这也是许多AI项目投入巨大却收效甚微,甚至烂尾的原因。”1

这一观点深刻揭示了企业级AI落地失败的深层逻辑:问题不在AI本身,而在承载AI的底层数据架构。当代码生成主要由机器完成,智能体的控制逻辑日益由大模型主导时,传统“中间层”或“数据中台”试图解决所有问题的方案,可能反而增加了数据库结构的复杂性,阻碍了AI的深度集成与安全性保障。融合数据库的价值在于,它淡化了对复杂“中台”的依赖,通过一体化架构从根源上解决了多数据类型与技术架构的融合问题,使AI能够“自然融入系统”1

商业价值:从数据孤岛到AI赋能的乘数效应

从商业角度看,甲骨文的这一战略无疑是其保持增长势头的关键。根据其财报预测,整体云业务增长率将从2025财年的24%提升至2026财年的40%以上,全年营收有望达到574亿美元1。这得益于其40多年在数据库领域积累的数据理解和成功的云转型战略。

融合数据库的商业价值体现在多个层面:

  • 加速AI应用开发与部署:通过简化数据访问和集成,如Oracle APEX能够通过自然语言交互构建应用,甚至自动生成应用蓝图,并提供丰富的控件支持RAG和聊天机器人功能1。这大幅缩短了AI项目的开发周期,降低了技术门槛。
  • 提升企业运营效率:例如在工业设计、知识库构建、代码开发、邮件处理和流程优化等领域,结合生成式AI技术,能够实现全面创新,提高整体运营效率3
  • 解锁数据潜力:将散落在不同部门、不同系统中的海量数据汇聚并结构化,使得原本难以挖掘的数据价值得以释放,为企业决策提供更全面、准确的洞察。特别是将向量化数据通过Oracle GoldenGate等技术进行集成,结合LangChain等开发框架,支持企业客户通过自然语言与数据库交互,极大提升了数据利用的便捷性1
  • 吸引AI时代的开发者生态:提供对主流AI开发框架(如LangChain)的兼容性API,内置RAG框架服务和加速开发包4,旨在构建一个对AI开发者友好的数据库生态,从而巩固其在企业级市场的领导地位。

这种对“一体化”和“融合”的执着,正是甲骨文在智能体时代构建其企业服务垂域大模型,提供大模型基座、垂域大模型和智能体应用一体化解决方案5的核心竞争力。

风险与伦理:AI安全与“幻觉”的深层考量

然而,AI的飞速发展也伴随着不容忽视的风险,尤其是数据访问安全与大模型“幻觉”问题。嵇小峰强调,

“安全问题在 AI 应用时代的重要性再怎么强调都不为过。”1

在AI时代,大模型可能生成数千行代码,其复杂性和不透明性使得开发人员难以逐行审查,传统三层架构下的权限控制和业务逻辑透明度面临挑战。更甚者,智能体的控制逻辑由大模型主导,其行为走向对开发人员和业务人员而言,并非完全透明。这种**“黑箱”效应**对企业的数据安全和业务可控性构成了潜在威胁。融合数据库通过在底层提供内建安全机制,能够更好地管理和控制数据访问权限,为AI应用提供更可靠的安全保障。

对于大模型普遍存在的“幻觉”问题,吴承杨提供了一个务实的解决方案:将多学科、多种数据类型的分析与大模型生成的内容相结合,可以显著提高结果的准确率。

“大语言模型的幻觉是其自身带来的,无法从根本上解决。但在企业级应用中,通过对多种数据的分析,最终可以将准确率从70%提升到90%,甚至更高。在企业级应用中,90%的准确率是一条基本线,如果达不到这一标准,就不会有人使用。”1

如果这些多源异构数据都能存储在融合数据库中,那么解决“幻觉”问题就变得相对简单和高效。这不仅是技术层面的优化,更是对AI伦理和可靠性的一种实践性回答。

展望:融合数据库如何重塑企业智能未来

当前,多种数据类型、技术架构和负载的融合已是大势所趋。甲骨文的战略洞察揭示了一个核心趋势:AI的规模化落地,其瓶颈不再仅仅是模型能力本身,而是数据基础设施的适应性与前瞻性。未来的企业智能系统将不再是独立AI模块的堆砌,而是深度融合了AI能力的统一数据平台。

这种融合趋势将带来:

  1. “AI原生”架构的普及:数据库将不仅仅是数据的存储层,而是内嵌AI能力,直接支持向量搜索、实时RAG和智能体编排的核心引擎。
  2. 数据专业角色再定义:数据工程师和AI工程师之间的界限将日益模糊,他们需要更深入地理解彼此领域,共同构建融合数据解决方案。
  3. 行业壁垒的消解与重构:那些能提供一体化、端到端AI数据解决方案的厂商,将在市场竞争中占据优势,促使整个产业生态向“融合”方向演进。
  4. 人机协作新范式:随着AI辅助开发工具(如APEX)的普及和智能体对底层数据的直接访问,软件开发的效率和模式将发生根本性变革,人类开发者将更多地聚焦于高层设计与创新。

最终,数据融合的深层意义在于,它为企业构建了一个更加智能、安全、敏捷的数字化神经系统。在这个系统中,数据不再是静态的资产,而是流动的血液,驱动着AI智能体的每一次思考和行动,从而真正释放AI的“乘数效应”3,推动企业乃至整个社会迈向一个更高效、更智能的未来。

引用


  1. 甲骨文副总裁吴承杨:AI放大了数据优势,数据融合至关重要·商业新知·吴承杨 (2024/6/30)·检索日期2024/7/1 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 甲骨文全面投入AI - 数字商业时代·数字商业时代 (2023/11/2)·检索日期2024/7/1 ↩︎

  3. 甲骨文:云数智融合释放创新“乘数效应”,推动企业级AI规模化落地·搜狐新闻·科技说 (2024/1/15)·检索日期2024/7/1 ↩︎ ↩︎

  4. 生成式AI 模型(LLM)·Oracle官方 (日期不详)·检索日期2024/7/1 ↩︎

  5. 甲骨文23ai营销AI,国产数据库没落伍;中美大模型生态技术PK - 墨天轮·墨天轮·AI数据库观察 (2024/2/1)·检索日期2024/7/1 ↩︎