國外創(chuàng)投新聞 | 神經(jīng)搜索公司「Jina.ai」A輪融資3000萬美元,拓展北美業(yè)務(wù)
據(jù)TechCrunch報道,總部位于柏林的Jina.ai今日宣布完成3000萬美元的A輪融資,由Canaan Partners領(lǐng)投。Jina.ai是一家開源創(chuàng)業(yè)公司,該公司利用神經(jīng)搜索幫助用戶在非結(jié)構(gòu)化數(shù)據(jù)(包括視頻和圖像)中查找信息。參與本輪融資的有Mango Capital和之前的投資方GGV Capital,SAP.iO和Yunqi Partners。迄今為止,該公司的融資總額已達到3900萬美元。
圖片截自企業(yè)官網(wǎng)
Jina.ai首席執(zhí)行官兼聯(lián)合創(chuàng)始人肖涵(與王楠、何冰共同創(chuàng)立了該公司)解釋說,神經(jīng)搜索背后的理念是使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)超越傳統(tǒng)的基于關(guān)鍵詞的搜索工具。利用遷移學(xué)習(xí)和表達學(xué)習(xí)等相對較新的機器學(xué)習(xí)技術(shù),該公司的核心Jina框架可以幫助開發(fā)人員快速構(gòu)建針對特定用例的搜索工具。
肖涵解釋說,對于圖像、音頻、視頻或其他內(nèi)容,他們首先使用深度神經(jīng)網(wǎng)絡(luò)將數(shù)據(jù)格式轉(zhuǎn)換為通用表達。在這種情況下,它們主要是一個數(shù)學(xué)向量(一百維向量)。之后匹配算法不計算有多少字母匹配,而是計算數(shù)學(xué)距離,也就是這兩個向量之間的向量距離。通過這種方式,人們基本上可以解決各種數(shù)據(jù)搜索問題或相關(guān)性問題。
肖涵認為Jina類似于搜索領(lǐng)域的TensorFlow(TensorFlow是谷歌的開源機器學(xué)習(xí)框架)。就像TensorFlow或PyTorch定義了人們?nèi)绾卧O(shè)計AI系統(tǒng)的設(shè)計模式一樣,Jina希望定義人們?nèi)绾螛?gòu)建神經(jīng)搜索系統(tǒng),并成為在這個過程中這樣做的事實標(biāo)準。
但Jina只是Jina.ai的其中一個產(chǎn)品。該公司還提供了Jina Hub,該產(chǎn)品像市場一樣,讓開發(fā)者分享和發(fā)現(xiàn)以Jina為基礎(chǔ)的的神經(jīng)搜索應(yīng)用的基本要素,以及最近推出的Finetuner,是一個可以微調(diào)任何深度神經(jīng)網(wǎng)絡(luò)的工具。
圖片截自企業(yè)官網(wǎng)
肖涵表示,在過去的18個月里,他們花了很多精力來建立核心基礎(chǔ)設(shè)施和這個大型神經(jīng)搜索大樓的基礎(chǔ),目前這一部分已經(jīng)完成了。現(xiàn)在他們正在慢慢地建造這座大樓的第一層和第二層,并且試圖提供端對端的開發(fā)體驗。
該公司表示,目前Jina AI開發(fā)者社區(qū)約有1000名用戶,有電子游戲開發(fā)者使用它在多個游戲編輯器中右鍵自動填充相關(guān)游戲資產(chǎn),也有法律技術(shù)初創(chuàng)企業(yè)利用該技術(shù),使其聊天機器人能夠利用PDF文檔中的數(shù)據(jù)提供問答體驗。
自2020年5月發(fā)布以來,開源Jina框架已經(jīng)有近200名外部貢獻者,該公司還圍繞該項目建立了一個活躍的Slack社區(qū)。
肖涵表示,做開源的主要原因是速度,他們相信開發(fā)的速度是一個軟件項目成功的關(guān)鍵因素。很多軟件因為速度趨近于零而消亡。他們正在創(chuàng)建社區(qū),并利用社區(qū)收集反饋以快速迭代,這對于像他們這樣的基礎(chǔ)設(shè)施軟件來說非常重要。他們需要所有頂級開發(fā)者給出關(guān)于可用性、易訪問性等方面的反饋,這可以幫助他們迅速改進。
Jina.ai計劃利用新一輪融資將其團隊擴大一倍,特別是要拓展其在北美的業(yè)務(wù)。有了這個擴大的團隊,公司計劃投資研發(fā),以擴大整個Jina生態(tài)系統(tǒng),并圍繞它推出新的工具和服務(wù)。
Canaan Partners的Joydeep Bhattacharyya表示,傳統(tǒng)的文本數(shù)據(jù)搜索系統(tǒng)無法在這個充斥著圖像、視頻和其他多媒體的世界中工作。Jina AI正在將公司從黑白模式轉(zhuǎn)變?yōu)椴噬J?,以一種快速、可變和數(shù)據(jù)不可知的方式解鎖非結(jié)構(gòu)化數(shù)據(jù)。神經(jīng)搜索為改進決策、優(yōu)化運營甚至創(chuàng)造新的收入來源提供了基礎(chǔ),這些開源框架的早期應(yīng)用已經(jīng)展現(xiàn)出了未來的曙光。