北京 2025年7月1日 /美通社/ -- IBM 正在從根本上簡化面向 AI 的數(shù)據(jù)堆棧。IBM 在Think大會上預(yù)覽 watsonx.data 的重大演進,以幫助組織做好數(shù)據(jù)準備為AI所用,同時提供一個開放的混合數(shù)據(jù)基礎(chǔ)架構(gòu)和企業(yè)級的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)管理。
測試結(jié)果顯示,與傳統(tǒng)RAG相比,IBM watsonx.data的AI準確性提高了40%。IBM于6月推出的產(chǎn)品和功能包括:
Watsonx.data 集成和 Watsonx.data 智能將作為獨立產(chǎn)品提供,部分功能也將通過 Watsonx.data 提供,從而最大限度地提高客戶選擇和模塊化程度。
為了補充這些產(chǎn)品,IBM 近期宣布了收購 DataStax 的意向,DataStax 擅長將非結(jié)構(gòu)化數(shù)據(jù)用于生成式AI。借助 DataStax,客戶可以訪問其他矢量搜索功能。
基于內(nèi)部測試,對比使用 watsonx.data Premium Edition 檢索層與僅矢量 RAG 在三個常見用例中 AI 模型輸出答案的準確性,測試使用 IBM 專有數(shù)據(jù)集,采用相同的選定開源通用推理、評估和嵌入模型以及額外變量。測試結(jié)果可能因具體情況而異。
這一重大演進的背景
企業(yè)正面臨著實現(xiàn)準確且高性能的生成式AI——尤其是具有自主決策能力的智能體AI人的重大障礙,但該障礙并非如大多數(shù)企業(yè)領(lǐng)導(dǎo)者所想。
問題不在于推理成本或難以捉摸的"完美"模型。問題在于數(shù)據(jù)。
企業(yè)需要可信且具有公司特性的數(shù)據(jù),才能讓智能體AI真正創(chuàng)造價值——這些數(shù)據(jù)存在于電子郵件、文檔、演示文稿和視頻等非結(jié)構(gòu)化數(shù)據(jù)中。據(jù)估計,2022年企業(yè)產(chǎn)生的數(shù)據(jù)中90%是非結(jié)構(gòu)化數(shù)據(jù),但IBM預(yù)測其中僅有1%為大型語言模型(LLMs)所用。
非結(jié)構(gòu)化數(shù)據(jù)的利用往往面臨巨大挑戰(zhàn)。這類數(shù)據(jù)分布廣泛且動態(tài)變化,存儲于多種格式中,缺乏清晰的標簽,且常需額外上下文才能完整解讀。傳統(tǒng)檢索增強生成(RAG)技術(shù)難以有效提取其價值,也無法妥善整合非結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)。
與此同時,各類孤立的工具會使AI數(shù)據(jù)處理架構(gòu)變得復(fù)雜且繁瑣。企業(yè)需要同時管理數(shù)據(jù)倉庫、數(shù)據(jù)湖以及數(shù)據(jù)治理和數(shù)據(jù)集成工具。數(shù)據(jù)架構(gòu)可能與它本應(yīng)管理的非結(jié)構(gòu)化數(shù)據(jù)一樣令人困惑。
許多組織并未解決根本問題。它們僅關(guān)注生成式AI的應(yīng)用層,而非其下方的核心數(shù)據(jù)層。除非組織修復(fù)其數(shù)據(jù)基礎(chǔ)架構(gòu),否則AI智能體和其他生成式AI計劃將無法充分發(fā)揮其潛力。
幫助組織實現(xiàn)數(shù)據(jù)的AI 就緒
IBM提供的新功能將使組織能夠采集、治理和檢索非結(jié)構(gòu)化(及結(jié)構(gòu)化)數(shù)據(jù)——在此基礎(chǔ)上,實現(xiàn)準確、高性能的生成式AI的規(guī)?;瘧?yīng)用。
關(guān)于 IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過數(shù)千家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh