90後技術宅與他的非主流另類搜索引擎Magi
最近,一個名叫Magi 的搜索引擎成了重點關注對象,據稱這個搜索引擎和我們常見的搜索引擎很不一樣,有一種程序員們鍾愛的X 冷淡風格。於是我們打開Magi 看了看。確實,這個頁面看著就很讓人舒爽。
重要的是搜索結果也很不一般,屬性中的每一個結果有對應的鏈接,並帶有標籤和主要學習來源部分,搜索結果以結構化知識的形式呈現。這種模式和國內外主流的搜索引擎完全不一樣,讓人感覺新鮮。
當然,也讓人由此發出疑問:Magi到底是什麼,是誰開發的,好不好用?
按照開發者PeakJi 季逸超的講述和Magi 網站上的說明,Magi 其實並不是單純的網頁搜索引擎,而是自主閱讀文本並持續糾錯的AI。
Magi 是由Peak Labs 從無到有自研的基於機器學習的信息抽取和檢索系統,它能將任何領域的自然語言文本中的知識提取成結構化的數據,通過終身學習持續聚合和糾錯,進而為人類用戶和其他人工智能提供可解析、可檢索、可溯源的知識體系。11 月,Peak Labs 發布了公眾版Magi.com。
與搜索引擎不同,Magi 不僅收錄互聯網上的海量文本,還會去嘗試理解並學習這些文本中蘊含的知識和數據。此外,Magi 從零研發了一套互聯網搜索引擎,所以Magi.com 同時提供全網規模的普通搜索結果,學習過程是在無人干預的情況下7 x 24 小時不間斷運行。
互聯網數據浩如煙海,質量參差不齊,如何將這些數據處理成機器能夠理解的數據結構時隔巨大的挑戰。在“Magi 的使命”一項中,Peak Labs這樣寫道:作為公眾版本的magi.com 為人類用戶提供了與互聯網數據交互的新方式,而Magi 系統背後的技術平台則承載著另一半重要的意義:讓機器像人一樣能理解並充分利用互聯網中無窮無盡的知識。
對Magi 的技術感興趣的同學,可以訪問www.peak-labs.com 官網和季逸超的知乎,我們在這裡就不多說了。
下面來關註一下Magi 背後的團隊——Peak Labs,以及創始人PeakJi 。
創始人PeakJi真名季逸超,90後男生,在北大附中讀高中期間接觸iOS並加入威鋒網WEIP技術組,先後參與了wefit輸入法的完善和各種越獄研究,高三設計並開發猛獁1網頁瀏覽器,大一推出猛獁4。據說,PeakJi所有的產品都是由他獨自完成設計、美工、算法、編碼、測試和推廣,可見啊這是一個非常有想法,動手能力也很強的“技術宅”了。
2012 年,在北大唸書的季逸超創建Peak Labs,並發明了Rasgueado 輸入法。據說Peak Labs 的產品和技術還有很多,什麼神經信息提取系統Ireul,網頁大規模搜索引擎Ramiel,多語言分析pipeline Arael 和分佈式檢索系統Matarael 等等,利用這些技術構架,他們搭建了Magi 服務,包括普惠版和企業版兩種。
如果你要問Magi好不好用,我們暫時也無法給出明確回答,因為Magi目前完成度還有待提高。但是,比起當做搜索引擎來用,Magi應該更適合做知識學習鏈庫。
在使用的過程,我們會發現Magi 也有很多不足之處,尤其是在搜索規模和答案準確度上。面對一些簡單搜索,Magi 往往給不出讓人滿意的答案,而且速度也不夠快。另外,它不是一款搜索引擎,像搜索網址這類任務也達不到很好的效果,也無法進行圖片搜索。
對於Magi 的缺點,團隊和PeakJi 都大方坦誠。
Peak Labs 指出,Magi 已經展示出的開放領域信息提取能力,可以應用到企業客戶所在的細分領域內,變成一個更加強大的信息抽取系統,讓每一個領域、每一家企業都可以輕鬆地打造屬於自己的知識圖譜,他們希望未來的Magi 系統能夠成為“知識領域的ImageNet”。
Magi 現在還遠算不上成熟,但其特性決定了它無窮的可能性和成長空間。未來,也許Magi 會成為打破現有搜索引擎原理的新範式,開啟全新的結構化知識搜索引擎時代,改變我們對信息檢索和知識獲取方式的刻板印象,畢竟在信息大革命和人工智能大發展的時代,千帆競速,百舸爭流,誰都有機會。