搜索技術會變得越來越“聰明”?答案是肯定的。全球最大中文搜索引擎百度公司今日披露,他們目前正在研發一項名為“跨領域推薦”的搜索技術,可以更智能精准地感知用戶需求,並為其主動提供個性化信息服務。百度為此不僅成立了一個獨立研發團隊,而且還組建了一個小實驗室,以挖掘並滿足各種奇思妙想的推薦需求——比如說:通過技術手段,幫助工程師在“殺人游戲”中找出真正的“殺手”。
百度主任架構師、推薦引擎負責人廖若雪解釋說,所謂“跨領域推薦”引擎技術,就是“能夠聰明地理解和感知不同用戶對於信息的需求,並跨越產品、平台的局限,調用全網資源去努力滿足這些不同類型的需求。”
通過這種新搜索技術,用戶不用繁瑣地查詢或者郵件訂閱,就能及時獲得自己最喜歡的偶像的最新演出信息;輸入一句簡單的“怎麼向女友求婚”,便能找到一套針對自己及女友量身打造的完美求婚方案,甚至連道具、路線、天氣,乃至如何討得她家小狗歡心的方法都考慮得一應俱全。
廖若雪介紹說,百度已經成立了一個由技術精英組成的獨立研發團隊,專攻跨領域推薦技術,以“每天至少更新升級一次、每月大調一次”的頻率快速升級迭代。百度工程師們甚至還組建了一個小實驗室,設置了各種奇思妙想的推薦需求,並嘗試用技術手段進行解決和評估。例如嘗試為單身工程師們推薦“最佳女友”,或者為閒暇娛樂活動進行推薦技術分析。工程師們甚至開發出一款基於推薦的小分析軟件,用於他們喜愛的“殺人游戲”裡,通過分析游戲中每個人的發言,以幫助他們判斷和尋找“殺手”。
據介紹,要研發跨領域推薦引擎技術,關鍵要有足夠規模的用戶數據和技術積累,以便分析、區分各類用戶的個性化需求。而這正是百度先天的優勢:通過十多年來在網頁搜索、貼吧、知道、百科等方面的積累,百度擁有中文互聯網最大的數據倉庫,同時在復雜語義分析、自然語言處理、人工智能、海量數據計算方面也有深厚技術積澱。
目前,百度“跨領域推薦技術”研發已初見成效,這一技術已開始廣泛運用到了百度知道、貼吧、新首頁、圖片等產品中。基於該技術,百度知道的回答率提升超過50%,一個問題從提出到被推薦給合適的回答者,最多只需要5分鐘;在全新的百度首頁,推薦導航已經成為深受網民歡迎的應用,在其背後,是每天超過 1.5PB的數據挖掘量。這些數據打印出來超過 5千億張 A4紙,全部摞起來超過4萬公裡高,接近地球同步衛星軌道,平鋪可以鋪滿海南島……