2025 OceanBase開發(fā)者大會(huì):詳解Data×AI戰(zhàn)略,發(fā)布首個(gè)RAG產(chǎn)品
升級(jí)AI戰(zhàn)略后的OceanBase迎來了首次開發(fā)者大會(huì)。5月17日在OceanBase第三屆開發(fā)者大會(huì)上,OceanBase發(fā)布面向AI的應(yīng)用產(chǎn)品PowerRAG,該產(chǎn)品提供開箱即用的RAG應(yīng)用開發(fā)能力,是OceanBase面向AI時(shí)代的探索之一。作為AI戰(zhàn)略一號(hào)位、CTO楊傳輝表示,OceanBase正致力于構(gòu)建Data×AI能力,面向AI時(shí)代推動(dòng)一體化數(shù)據(jù)庫向一體化數(shù)據(jù)底座的戰(zhàn)略演進(jìn)。此前,CEO楊冰曾通過全員信宣布公司全面進(jìn)入AI時(shí)代。
螞蟻集團(tuán)CTO何征宇在大會(huì)現(xiàn)場(chǎng)表示,螞蟻集團(tuán)將支持OceanBase在金融、醫(yī)療、生活等螞蟻AI的核心場(chǎng)景的突破,支持OceanBase去實(shí)踐DataxAI的理念和架構(gòu)創(chuàng)新。同時(shí)繼續(xù)支持OceanBase開源開放,把在Data×AI上的能力逐漸開放給行業(yè),為AGI的夢(mèng)想添磚加瓦。
從一體化數(shù)據(jù)庫向一體化數(shù)據(jù)底座演進(jìn)
AI時(shí)代帶來了新的數(shù)據(jù)難題,已成為行業(yè)共識(shí)。IDC報(bào)告指出,受生成式AI等技術(shù)驅(qū)動(dòng),預(yù)計(jì)2028年全球新生成數(shù)據(jù)量規(guī)模將達(dá)到393.9ZB,其中企業(yè)數(shù)據(jù)規(guī)模和增速尤為凸顯。于企業(yè)而言,數(shù)據(jù)倉庫的容量已實(shí)現(xiàn)質(zhì)的飛躍,結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)規(guī)模“突破PB級(jí)邁向EB級(jí)”成為新常態(tài),這給數(shù)據(jù)存儲(chǔ)、管理與分析帶來嚴(yán)峻挑戰(zhàn)。
螞蟻集團(tuán)CTO何征宇也在分享中指出,海量的互聯(lián)網(wǎng)數(shù)據(jù)成就了今天的大模型,但大模型幻覺問題的源頭也是數(shù)據(jù)問題。數(shù)據(jù)決定著大模型的能力上限,且依舊有四大挑戰(zhàn):一是數(shù)據(jù)的獲取成本顯著增加,二是嚴(yán)謹(jǐn)?shù)男袠I(yè)數(shù)據(jù)稀缺且流動(dòng)困難,三是多模態(tài)數(shù)據(jù)需要更強(qiáng)的處理能力,四是數(shù)據(jù)的質(zhì)量評(píng)估難。
面對(duì)行業(yè)的真實(shí)需求,OceanBase正在大膽探索。楊傳輝認(rèn)為,作為一個(gè)一體化分布式數(shù)據(jù)庫,OceanBase已經(jīng)具備了一定的AI時(shí)代數(shù)據(jù)處理能力,如分布式有效應(yīng)對(duì)海量數(shù)據(jù)的存儲(chǔ)計(jì)算、多模融合統(tǒng)一處理不同結(jié)構(gòu)數(shù)據(jù)、TP/AP一體化實(shí)現(xiàn)混合事務(wù)和實(shí)時(shí)分析處理。但大模型落地產(chǎn)生價(jià)值的核心在于數(shù)據(jù)與模型的一體化融合,這也是OceanBase提出的構(gòu)建Data×AI能力的關(guān)鍵。
基于這一能力,OceanBase致力于從一個(gè)一體化數(shù)據(jù)庫向一個(gè)一體化數(shù)據(jù)底座演進(jìn),通過一套引擎同時(shí)支持TP/AP/AI混合負(fù)載,支持向量數(shù)據(jù)庫,實(shí)現(xiàn)SQL與AI的混合檢索,這背后涉及OceanBase在Data與AI領(lǐng)域的工程與產(chǎn)品能力。
PowerRAG發(fā)布,提供開箱即用的RAG應(yīng)用開發(fā)能力
在楊傳輝描繪的一體化數(shù)據(jù)底座版圖中,OceanBase期望在未來實(shí)現(xiàn)從算力、基礎(chǔ)設(shè)施,到平臺(tái)層、應(yīng)用層、交付形態(tài)的全方位布局。
此次大會(huì)上,OceanBase首次發(fā)布面向AI的應(yīng)用產(chǎn)品PowerRAG,打造AI驅(qū)動(dòng)的開箱即用的RAG服務(wù)。
楊傳輝介紹,傳統(tǒng)RAG應(yīng)用常用開發(fā)模式包括組件森林開發(fā)模式、RAG平臺(tái)模式等,但存在開發(fā)周期長、維護(hù)成本高、灰箱調(diào)試?yán)щy、性能難以優(yōu)化等問題。
OceanBase PowerRAG提供開箱即用的RAG應(yīng)用開發(fā)能力,打通應(yīng)用開發(fā)數(shù)據(jù)層、平臺(tái)層、接口層與應(yīng)用層的全流程,提供Document(文檔)和 Chat(對(duì)話)兩個(gè)核心API接口,幫助用戶實(shí)現(xiàn)文檔知識(shí)庫、智能對(duì)話、圖像比對(duì)、數(shù)據(jù)分析等多種AI應(yīng)用場(chǎng)景的快速開發(fā)。
“致力于成為AI時(shí)代的一體化數(shù)據(jù)底座,PowerRAG是OceanBase在應(yīng)用層面探索的第一步,未來還將在應(yīng)用層面、平臺(tái)層面不斷突破。”楊傳輝表示。
據(jù)了解,過去十五年OceanBase誕生于雙11的海量交易場(chǎng)景并在螞蟻集團(tuán)的金融場(chǎng)景中經(jīng)受磨礪打磨技術(shù),未來,螞蟻集團(tuán)也將繼續(xù)向OceanBase開放核心AI場(chǎng)景,幫助OceanBase進(jìn)一步攻堅(jiān)AI關(guān)鍵能力,實(shí)現(xiàn)開放開源,為行業(yè)提供更多的AI創(chuàng)新服務(wù)。
向量性能已達(dá)開源向量數(shù)據(jù)庫業(yè)內(nèi)的領(lǐng)先水平
作為原生分布式數(shù)據(jù)庫,OceanBase原本就具有的企業(yè)級(jí)分布式數(shù)據(jù)庫能力為AI時(shí)代的海量數(shù)據(jù)處理分析打下基礎(chǔ)。在支持AI應(yīng)用落地的核心基礎(chǔ)設(shè)施——向量性能、混合檢索等層面,OceanBase也在持續(xù)探索,進(jìn)一步加強(qiáng)SQL+AI能力。
大會(huì)現(xiàn)場(chǎng),基于基準(zhǔn)測(cè)試工具VectorDBBench,采用Performamce768D1M測(cè)試數(shù)據(jù)集,OceanBase與業(yè)內(nèi)三款領(lǐng)先的開源向量數(shù)據(jù)庫進(jìn)行性能跑分測(cè)試。結(jié)果顯示,OceanBase的向量性能已經(jīng)達(dá)到開源向量數(shù)據(jù)庫業(yè)內(nèi)的領(lǐng)先水平。
面對(duì)AI時(shí)代的海量數(shù)據(jù),OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場(chǎng)景的內(nèi)存需求;引入針對(duì)JSON半結(jié)構(gòu)化數(shù)據(jù)的壓縮能力,降低AI場(chǎng)景中的半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)成本。根據(jù)測(cè)試結(jié)果,在同等召回率與性能的情況下,引入BQ量化算法能夠?qū)崿F(xiàn)內(nèi)存成本較引入前降低 95%,而在TPC-H 10G數(shù)據(jù)集上,OceanBase的JSON壓縮比可達(dá) MongoDB 的3倍。
此外,OceanBase已具備面向多種數(shù)據(jù)模型的混合檢索能力。在最新版本中,OceanBase混合檢索性能進(jìn)一步增強(qiáng),通過豐富的執(zhí)行策略、自研的向量算法庫、內(nèi)核級(jí)多模混合查詢等實(shí)現(xiàn)更快、更準(zhǔn)、更易用的混合檢索。
目前,OceanBase已被客戶應(yīng)用于多個(gè)AI相關(guān)場(chǎng)景的開發(fā),如聯(lián)通軟研院基于OceanBase打造AI助手,in銀泰商業(yè)則基于OceanBase打造零售業(yè)智能問數(shù)平臺(tái)等。
附:OceanBase CEO楊冰全員信
各位同學(xué):
今年是OceanBase獨(dú)立運(yùn)營的第二年,也是OceanBase成立的第十五年。
回望過去一年,是OceanBase的關(guān)鍵一年。這一年在公司層面,我們成立董事會(huì),正式獨(dú)立運(yùn)營;在商業(yè)化層面,我們實(shí)現(xiàn)了多個(gè)突破:我們堅(jiān)定地將“專有云”和“公有云”作為發(fā)展雙引擎,既抓住歷史機(jī)遇攻堅(jiān)金融政企市場(chǎng),首批通過國測(cè)名單,夯實(shí)競(jìng)爭(zhēng)優(yōu)勢(shì),也加速推進(jìn)云業(yè)務(wù)發(fā)展,成為云數(shù)據(jù)庫領(lǐng)域的獨(dú)立廠商第一,此外我們堅(jiān)定邁向全球化,實(shí)現(xiàn)從0到1的組織升級(jí),全面發(fā)力出海業(yè)務(wù)。
這一切成績,都得益于過去十五年的厚積薄發(fā)。自2010年誕生以來,OceanBase從無到有,堅(jiān)持100%根自研,毫無疑問已成為分布式數(shù)據(jù)庫的標(biāo)桿。我們堅(jiān)信,海量數(shù)據(jù)的時(shí)代需要的是一款原生分布式數(shù)據(jù)庫。OceanBase以攻堅(jiān)者的姿態(tài)、開創(chuàng)者的精神,逐一攻克分布式數(shù)據(jù)庫所遭遇的穩(wěn)定性、安全性、高并發(fā)性、可擴(kuò)展性、實(shí)時(shí)分析和多云等難題,打破世界紀(jì)錄、經(jīng)受真實(shí)場(chǎng)景考驗(yàn),為市場(chǎng)提供了一款高質(zhì)量的一體化分布式數(shù)據(jù)庫產(chǎn)品。
此刻,我們面向未來思考,AI正在成為新的主題,它將重塑一切。誰能更好地解決DATA和AI的融合,實(shí)現(xiàn)“DATA×AI”,誰就能成為AI時(shí)代的數(shù)據(jù)底座。OceanBase專注數(shù)據(jù)處理,無論是我們追求卓越的技術(shù)文化,還是我們的分布式能力和一以貫之的“一體化”產(chǎn)品理念都與AI時(shí)代的需求不謀而合。OceanBase將全面進(jìn)入AI時(shí)代,我們有信心打造出AI時(shí)代最好的數(shù)據(jù)底座,這是時(shí)代賦予我們的機(jī)遇和責(zé)任!
為全力保障AI戰(zhàn)略的高效落地,經(jīng)過管理層討論,啟動(dòng)人才和組織體系升級(jí),迎接AI新機(jī)遇。基于此決定:
· CTO楊傳輝擔(dān)任AI戰(zhàn)略一號(hào)位,全面統(tǒng)籌AI戰(zhàn)略制定和技術(shù)產(chǎn)品落地。
· 成立AI平臺(tái)與應(yīng)用部,由楊傳輝Acting,ODC、OAS兩個(gè)團(tuán)隊(duì)合并到AI平臺(tái)與應(yīng)用部,蔡飛志、王赫加入該團(tuán)隊(duì),全力推進(jìn)“DATA × AI”平臺(tái)的搭建與應(yīng)用開發(fā),該團(tuán)隊(duì)將核心打造RAG、AI平臺(tái)、知識(shí)庫等能力。
· 在原有OB 底層引擎團(tuán)隊(duì)里,新成立AI引擎組,由席華鋒負(fù)責(zé),單海康、黃人煌加入該團(tuán)隊(duì),聚焦打造AI推理引擎,元啟繼續(xù)向韓富晟匯報(bào),原元啟負(fù)責(zé)的系統(tǒng)組也直接向顏然匯報(bào)。
· 感謝螞蟻集團(tuán)的大力支持,接下來集團(tuán)將開放全部AI場(chǎng)景給OB,助力OB打造AI時(shí)代的數(shù)據(jù)底座!
至此,我們將形成AI時(shí)代從一體化存儲(chǔ)(行存、列存、KV、文檔、向量、倒排)到一體化計(jì)算(OLTP、OLAP、NoSQL、向量數(shù)據(jù)庫、搜索、推理、RAG)的全方位布局,依托螞蟻的豐富應(yīng)用場(chǎng)景將OceanBase的“DATA×AI”能力打磨成為新的核心競(jìng)爭(zhēng)力,并逐漸服務(wù)外部客戶,打造如分布式技術(shù)般的世界級(jí)AI數(shù)據(jù)底座。
近日舉辦的首屆“OceanBase擁抱AI Campaign”收獲了全員的熱情參與,也涌現(xiàn)了各種創(chuàng)意,這是OceanBase這個(gè)團(tuán)隊(duì)創(chuàng)新能力的最有力證明,我們鼓勵(lì)所有團(tuán)隊(duì)全面擁抱AI,積極儲(chǔ)備人才,一起打造下一個(gè)十年的OceanBase!一起創(chuàng)造下一個(gè)偉大!
楊冰
OceanBase CEO
2025年4月27日
免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】
猜你喜歡
奇富科技參加陸家嘴論壇開幕式:以智能科技助力上海金融、科技創(chuàng)新中心建設(shè)
以智能科技助力上海金融、科技創(chuàng)新中心建設(shè)。2025 OceanBase開發(fā)者大會(huì):詳解Data×AI戰(zhàn)略,發(fā)布首個(gè)RAG產(chǎn)品
螞蟻OceanBase發(fā)布首款面向 AI的PowerRAG產(chǎn)品。六大金融科技公司營收619億元背后:AI賦能助貸,行業(yè)穩(wěn)健增長
解讀金融科技公司年報(bào):行業(yè)穩(wěn)健前行,頭部公司深度“擁抱”AI金融科技助推消保升級(jí):科技如何為金融消費(fèi)者權(quán)益保駕護(hù)航
科技賦能金融消保:構(gòu)建智能化保護(hù)體系政府工作報(bào)告22次聚焦金融,五大核心部署看懂2025年經(jīng)濟(jì)調(diào)控新邏輯
五大核心部署看懂2025年調(diào)控新邏輯。樂信已全面部署DeepSeek-R1,助力業(yè)務(wù)數(shù)智化發(fā)展
樂信是國內(nèi)最早部署和應(yīng)用DeepSeek的金融平臺(tái)之一。
派財(cái)經(jīng)
共1014篇文章
聚焦數(shù)字經(jīng)濟(jì)融媒體平臺(tái)。