2009年一月,在阿姆斯特丹舉行了一個(gè)名為Recked的活動(dòng),活動(dòng)由Wakoopa和Strands主辦,旨在討論工程師們感興趣的推薦系統(tǒng),
關(guān)于推薦引擎的5個(gè)問(wèn)題交互設(shè)計(jì)
。在活動(dòng)介紹的內(nèi)容中,提出了一些公司對(duì)于建造有效的推薦系統(tǒng)必須解決的幾個(gè)問(wèn)題。1.缺少數(shù)據(jù)
或許推薦系統(tǒng)面臨的最大問(wèn)題,是需要大量的數(shù) 據(jù),以便能形成有效的推薦,F(xiàn)在能給出最好的推薦的公司正是那些擁有大量數(shù)據(jù)的公司:google,amazon,Netflix,last.fm,這并不是巧合。下圖是Recked活動(dòng)中Strand’s的演示文檔,如該圖所示,一個(gè)好的推薦系統(tǒng)首先需要類目(種類)數(shù)據(jù)(從目錄或者其它形式得到),然 后系統(tǒng)必須捕獲并且分析這些用戶數(shù)據(jù)(用戶行為),然后,再應(yīng)用神奇的算法工作。分析越多的類目(種類)和用戶數(shù)據(jù),系統(tǒng)越有可能生產(chǎn)好的推薦。但是,這 又是一個(gè)蛋和雞的問(wèn)題:要形成好的推薦,首先需要有大量的用戶,這樣才能得到大量的推薦數(shù)據(jù)。
2.不斷變化的數(shù)據(jù)
這個(gè)問(wèn)題由Clicktorch公司(一家做“智能推薦”的公司)的CEO:Paul Edmunds 在ReadWriteWeb網(wǎng)站的評(píng)論中指出。他在評(píng)論中指出:系統(tǒng)通常偏向于舊的數(shù)據(jù)而難以有新的改進(jìn)。
這 方面的一個(gè)例子是David Reinke在StyleHop(一個(gè)時(shí)尚愛(ài)好者的社會(huì)團(tuán)體)的博客上寫道:“過(guò)去的用戶形為并不是好的工具,因?yàn)橼厔?shì)總是在不斷變化”。很明顯,運(yùn)算方 法將很難或者不可能跟上時(shí)尚趨勢(shì)。時(shí)尚-挑戰(zhàn)人們-我接受時(shí)尚-依靠值得依賴的有時(shí)尚意識(shí)的朋友和家人,把衣服推薦給他們。
David Reinke說(shuō),“類目(種類)推薦行不通,因?yàn)橛刑嗟漠a(chǎn)品屬性,而每個(gè)屬性(比如價(jià)錢,顏色,風(fēng)格,面料,等等)在不同的時(shí)候?qū)τ谙M(fèi)者的重要程度都是不一樣的”,他指出,社會(huì)化推薦可能可以“解決”這個(gè)問(wèn)題。
3.不斷變化的用戶喜好
提出這個(gè)問(wèn)題的仍然是Paul Edmunds,他認(rèn)為問(wèn)題在于:今天自己瀏覽amazon時(shí)是會(huì)有特定意圖的,明天或許會(huì)有另一個(gè)特定意圖,
電腦資料
《關(guān)于推薦引擎的5個(gè)問(wèn)題交互設(shè)計(jì)》(http://www.lotusphilosophies.com)。舉個(gè)典型的例子:有可能某天我會(huì)上amazon為自己買本書(shū),但第二天我到amazon的原因可能是要為姐姐找一份生日禮物。對(duì)于用戶喜好,推薦系統(tǒng)也可能錯(cuò)誤的標(biāo)注。華爾街雜志2002年有一篇文章“如果TiVo覺(jué)得你是個(gè)同性戀,這就是把你標(biāo)注成同性戀的方式”
4.不可預(yù)知的類目(事項(xiàng))
我們都知道,Netflix花100萬(wàn)美元來(lái)獎(jiǎng)勵(lì)能提升推薦引擎質(zhì)量10%的人。我們注意到對(duì)于一些古怪(特別)的電影會(huì)有一些問(wèn)題,有一些電影觀眾對(duì)它又愛(ài)又恨,比如:大人物拿破侖。這種類型的電影是很難去做推薦的,因?yàn)橛脩魧?duì)它們會(huì)有各種反映而且無(wú)法預(yù)計(jì)。
音樂(lè)中就有很多種這樣的類型。你能猜出來(lái)某個(gè)作者同時(shí)是卡彭特和金屬樂(lè)的愛(ài)好者嗎?Last.fm可能需要這種推薦
5.這個(gè)東西是復(fù)雜的
我們可以很簡(jiǎn)明的描述,但是從下面這張Strands的演示PPT截圖可以看到,哪怕是最簡(jiǎn)單的推薦,也需要涉及到非常多的參數(shù)和變量(而且我們想象到的這些只涉及到系統(tǒng)表面)
到目前為止,有很多公司都已經(jīng)建立起了用戶滿意程度較高的推薦引擎系統(tǒng)—amazon,Netflix,google這些名字跳入腦中。但是相對(duì)我們想 到的這些少數(shù)成功的案例,還有其它成百上千的網(wǎng)站和應(yīng)用,都在尋找推薦新產(chǎn)品和新內(nèi)容給用戶的道路上掙扎。的確,在ReadWriteWeb,我們更希望 讀者在網(wǎng)站上點(diǎn)擊發(fā)現(xiàn)更多其它的內(nèi)容,我們使用很多種插件和方法來(lái)達(dá)到這個(gè)目的,但目前我們并不滿意
問(wèn)題之外
推薦引擎可能發(fā)生的問(wèn)題有很多,比如:給出太多最低級(jí)公共屬性的推薦;對(duì)于長(zhǎng)尾的支持不夠;只推薦顯而易見(jiàn)的內(nèi)容,等等。
原文:5 Problems of Recommender Systems
本文來(lái)自:http://www.thinktag.cn/archives/73