新聞資訊
了不起的青年·創(chuàng)投實錄|風語智能:瞄準開源情報新藍海,實現(xiàn)大語言模型的商業(yè)化
發(fā)布時間:
2024-05-13
來源:
2023年ChatGPT的問世被認為是人類科技發(fā)展史上重要的里程碑事件,短短幾個月里席卷全球,速度之快超出想象,也由此帶動包括AI算法、大模型和大數(shù)據(jù)等的迅猛發(fā)展。
作為有著突出處理大規(guī)模數(shù)據(jù)集能力的自然語言處理(NLP)大模型(簡稱“大語言模型”),便隨著ChatGPT的橫空出世走向全新的高度,市場呈現(xiàn)出產(chǎn)品和應用百花齊放的盛況,并通過與各行各業(yè)的應用結合,探索能夠有效落地的商業(yè)模式。其中開源情報便是因大語言模型的引入迎來重大變革和進步、并與人工智能融合形成商業(yè)閉環(huán)的行業(yè)。這一行業(yè)模式的探索者者是來自南京大學電子科學與工程學院的博士生,南京風語智能信息技術有限公司(以下簡稱“風語智能”)創(chuàng)始人路思遠。
緣起科研項目,思考商業(yè)前景
風語智能是一家專注于運用先進人工智能技術開展開源情報分析的公司,創(chuàng)辦于2023年9月,目前已獲得南京市創(chuàng)新投資集團、奇跡創(chuàng)壇的兩輪投資。
“大三時開始我就跟隨芯片設計和人工智能領域里的國際頂尖專家王中風教授從事新一代人工智能技術,特別是深度學習加速器設計的研究。考上研究生之后,我也正式加入了王教授領銜的集成電路與智能系統(tǒng)(ICAIS)實驗室,主攻語音識別和自然語言處理技術(NLP),有幸成為國內(nèi)最早關注大模型技術研究者中的一員。”路思遠在介紹自己求學歷程時展現(xiàn)出對于行業(yè)的激動與熱情,當2017年Google顛覆性地提出基于自注意力機制的神經(jīng)網(wǎng)絡結構——Transformer架構時,路思遠在和實驗室老師同學們的交流中,就認識到這一架構在深度學習領域具備顛覆性的潛質(zhì)。相比傳統(tǒng)深度神經(jīng)網(wǎng)絡,Transformer更加高效與簡潔,如果與醫(yī)療、金融、情報等行業(yè)結合,又可以進一步推動相關技術的發(fā)展,大大提升信息處理和決策效率。
隨著對技術的不斷挖掘與研究,路思遠開始對高效支持Transformer模型計算的硬件架構 “發(fā)起挑戰(zhàn)”,不斷地通過研發(fā)平衡計算效率、存儲訪問、能效比和靈活性等多方面需求,以適應不斷發(fā)展的AI模型和技術趨勢。讀博期間,他發(fā)表了第一篇Transformer硬件架構工作論文,并獲得2020年IEEE片上系統(tǒng)年會的最佳論文獎,也由此成為了國際上最早設計出Transformer硬件架構人員之一。
2022年11月,當搭載了GPT3.5的ChatGPT橫空出世,憑借逼真的自然語言交互與多場景內(nèi)容生成能力一鳴驚人時,也讓路思遠對大模型和商業(yè)相結合的前景有了更多期待。他坦言:“我一直有創(chuàng)業(yè)的夢想和念頭,也希望能夠抓住大模型技術迅速發(fā)展的風口,讓自己的研究能夠產(chǎn)生商業(yè)價值。”在王中風教授的支持下,他與深度學習數(shù)據(jù)壓縮方向的施禹伯博士組成團隊,從系統(tǒng)、算法、硬件三個維度入手,解決最新深度之習NLP算法部署難、落地難的問題,并希望可以實現(xiàn)RiSE架構和NPU部署工具鏈的自主設計,在研發(fā)過程中找到競爭優(yōu)勢和商業(yè)轉化機遇。
寧聚計劃留人才,校地融合促發(fā)展
2023年3月,在導師王中風教授和南京大學國際創(chuàng)新創(chuàng)業(yè)學院的支持下,風語智能在南京大學大學生創(chuàng)業(yè)園正式成立。
“‘風’象征著流動和快速傳播,‘語’則與語言、交流相聯(lián),以‘風語智能’命名公司,是希望公司的產(chǎn)品可以像風一樣高效且自然流暢地傳遞和處理信息。所以我們集中精力去做研發(fā),但是很快也發(fā)現(xiàn)初創(chuàng)公司資金、資源、人才是不得不面對的現(xiàn)實問題。”雖然是連續(xù)創(chuàng)業(yè)者,但是當真正作為創(chuàng)始人肩負公司的發(fā)展責任后,路思遠不得不思考和鉆研得更多一些。隨著寧聚計劃的深入貫徹落實,更多青年創(chuàng)客選擇留寧展業(yè)。為了獲得更多的支持與關注,路思遠決定攜手團隊參加了由市人社局主辦、南京市創(chuàng)新投資集團支持的2023年“贏在南京”青年大學生創(chuàng)新創(chuàng)業(yè)大賽。經(jīng)過激烈的廝殺拼搏,路思遠的“風語智能”從3500多個創(chuàng)業(yè)項目脫穎而出,獲得評委一致認可,斬獲了這屆大賽的一等獎桂冠,憑此得到了南京市創(chuàng)新投資集團天使基金的專項資金支持與財政獎勵,“南京大學在創(chuàng)業(yè)場地上、創(chuàng)業(yè)教育上給了我們很多支持,同事創(chuàng)投集團的天使投資與財政補助在資金上給與我們助力,創(chuàng)投集團專業(yè)的投后孵化服務,也讓我們在思考產(chǎn)品與市場間關系上有了更多的專業(yè)助力,讓我們的創(chuàng)業(yè)之路走的更穩(wěn)更安心。”同年,路思遠向知名AI天使投資機構奇績創(chuàng)壇提交了圍繞語言大模型應用的創(chuàng)業(yè)項目申請,得到創(chuàng)始人陸奇博士青睞,成為2023年春季創(chuàng)業(yè)營60個入選項目之一,自此邁開市場化融資的第一步。
瞄準開源情報,聚焦打造高性能產(chǎn)品
2023年4月,貝哲斯咨詢對外發(fā)布了《2023-2029年中國開源情報行業(yè)市場發(fā)展趨勢調(diào)研報告》,報告內(nèi)容覆蓋行業(yè)概況、上下游情況、行業(yè)頭部企業(yè),主要競爭力產(chǎn)品等,體現(xiàn)出開源情報對政企單位策略部署、戰(zhàn)略制定、趨勢判斷、風險預知等的重要意義。
路思遠和團隊敏銳地捕捉到開源情報行業(yè)的發(fā)展前景以及在大量商業(yè)情報檢測、搜集和分析過程中,對數(shù)據(jù)高效精準獲得、抓取、交互和大量文本快速總結的需求。“目前開源情報業(yè)持續(xù)以6.23%的CAGR增長,預計2028年市場規(guī)??赏_到395.89億元,對于人工智能應用落地而言,這是一片具有極大發(fā)展空間且與大語言模型優(yōu)勢高度匹配的藍海市場。所以我們在產(chǎn)品研發(fā)和市場開拓上做了大膽地嘗試。”
深度思考,謀定而動,風語智能聚焦開源情報業(yè),立足Transformer神經(jīng)網(wǎng)絡高性能計算、深耕深度學習數(shù)據(jù)壓縮等領域,將AI大模型在文字工作方面的優(yōu)勢充分發(fā)揮,結合大規(guī)模預訓練模型壓縮算法和高性能計算方案上的優(yōu)勢,打磨產(chǎn)品力,最終研發(fā)出在垂直領域集推理速度快、回答準確率高、響應速度快、吞吐率強、外掛數(shù)據(jù)庫容量大、數(shù)據(jù)可交互治理、能私有化部署等多重優(yōu)勢的“高性能智庫Agent”產(chǎn)品。大模型時代,訓練數(shù)據(jù)獲取和復用成本的降低,效率卻顯著提升。
“智庫Agent相較于傳統(tǒng)產(chǎn)品來說,性能更高、響應更快、保密性好,擁有針對多模態(tài)數(shù)據(jù)(視頻圖片、文字)的RAG算法且對上傳文件的數(shù)量沒有限制,能夠能快速分析上傳的文件內(nèi)容,實現(xiàn)各類數(shù)據(jù)統(tǒng)一治理加個性化推送。優(yōu)點足夠突出,用戶體驗感才能好。”路思遠介紹道。“但是大模型技術成本高,且最新深度學習NLP算法更是部署難、落地難。我們在NLP的算法、硬件、云端、嵌入式端部署等方面積累關鍵技術使得產(chǎn)品在軟件與硬件方面有突出優(yōu)勢,從而大大降低成本。”高性能智庫Agent產(chǎn)品屬性能很好地應用于開源情報領域,風語智能通過人工智能與開源情報的結合,在大模型產(chǎn)品落地方面上探索出一條新路徑,推動了該領域邁向智能化、自動化時代。
目前風語智能團隊已與5家客戶簽訂項目合作協(xié)議、與十余家進入探討合作,包括江蘇頭部政府智庫、博智安全、南京云創(chuàng)大數(shù)據(jù)等。其中為某醫(yī)院建立精神疾病問診的大模型知識庫已得到有效推進,通過提升醫(yī)院的數(shù)據(jù)分析能力與水平,實現(xiàn)病案智能生成,輔助醫(yī)生診治,達到醫(yī)院問診速度與準確性提升的目的。
團隊緊密合作,開創(chuàng)產(chǎn)品新未來
“創(chuàng)業(yè)征途,團隊為舵,齊心協(xié)力,行必致遠。”路思遠博士作為發(fā)起人,聯(lián)合深度學習數(shù)據(jù)壓縮方向的施禹伯博士組成團隊,邀請導師王中風教授和南大信息管理學院裴雷院長等學界與業(yè)界大咖擔任首席科學家和技術顧問,背靠南京大學ICAIS實驗室,在雄厚的技術研發(fā)背景和實力下,團隊緊密配合,分工明確,借鑒大模型技術迅速研發(fā)新產(chǎn)品。
“接下來,我們希望為客戶提供實際應用中所需的軟硬結合解決方案,實現(xiàn)產(chǎn)品軟硬一體”。談到規(guī)劃,路思遠表示將持續(xù)研發(fā)和迭代高性能的硬件設備,為風語智能產(chǎn)品的安全性能提供重要的保障,以確保產(chǎn)品接入網(wǎng)絡獲取外部信息時用戶內(nèi)部數(shù)據(jù)不外泄。與此同時,讓公司的產(chǎn)品服務在軟硬件一體的加持下,壁壘更高、競爭力更強。
如今,風語智能已研發(fā)出了針對情報行業(yè)細分需求的軟硬件一體化產(chǎn)品,申請了多項知識產(chǎn)權,并與多家公司達成項目合作,榮獲多個優(yōu)秀項目獎項……取得傲人成績的背后是風語智能團隊的創(chuàng)業(yè)投入和激情,以及對商業(yè)市場的敏銳度和拓展能力。
南京市創(chuàng)新投資集團大創(chuàng)投資團隊表示,“贏在南京”青年大學生創(chuàng)新創(chuàng)業(yè)大賽我們關注到了風語智能。風語智能作為開源情報業(yè)與人工智能領域的創(chuàng)新公司,作為來自南京大學的年輕創(chuàng)業(yè)團隊,擁有扎實的技術背景,助力產(chǎn)品落地開源情報領域。作為國有創(chuàng)投機構,我們將持續(xù)關注早期科技企業(yè)的發(fā)展,并圍繞資本、管理、資源、人才等給予團隊更多投后助力。未來,我們將不斷加強與在寧高??蒲性核暮献髀?lián)動,切實落實南京市校地融合發(fā)展要求,支持更多如風語智能一樣的青年創(chuàng)業(yè)企業(yè),大力促進更多高校青年科研成果轉化落地。”
“經(jīng)過探索,我們已經(jīng)瞄準賽道,逐步實現(xiàn)產(chǎn)品研發(fā)到落地的商業(yè)閉環(huán),”路思遠介紹說。“選擇開源情報行業(yè)深挖大語言模型的應用也是幾番思索的結果。大國博弈,情報是重要決策的基礎,科技實力是最直接的競爭。缺乏高質(zhì)量、及時準確的情報或許將讓企業(yè)乃至國家面臨極其被動的局面。所以,我們也想在自己擅長的領域,為中華民族偉大復興貢獻一份力量,至少在開源情報這條賽道上,助力國家建立自己的核心競爭力!”路思遠在談及對于深耕開源情報業(yè)的愿景時,目光堅定。
來源:創(chuàng)投集團
審核:薛瑤
發(fā)布:尤異
相關附件