99re热视频这里只精品,久久久天堂国产精品女人,国产av一区二区三区,久久久精品成人免费看片,99久久精品免费看国产一区二区三区

Solr查詢(xún)響應(yīng)的相關(guān)性

2018-11-21 15:06 更新

Solr 相關(guān)性是查詢(xún)響應(yīng)滿(mǎn)足正在搜索信息的用戶(hù)的程度。

查詢(xún)響應(yīng)的相關(guān)性取決于執(zhí)行查詢(xún)的上下文。一個(gè)單獨(dú)的搜索應(yīng)用程序可能會(huì)被不同的需求和期望的用戶(hù)在不同的環(huán)境中使用。例如,一個(gè)研究氣候數(shù)據(jù)的搜索引擎可能在以下的場(chǎng)合被使用,例如:一個(gè)研究長(zhǎng)期氣候趨勢(shì)的大學(xué)研究人員,一個(gè)有興趣計(jì)算春季最后霜凍的可能日期的農(nóng)民,一個(gè)對(duì)降雨模式和洪水頻率感興趣的土木工程師,以及一個(gè)大學(xué)生計(jì)劃去一個(gè)地區(qū)度假,想知道要收拾什么。由于這些用戶(hù)的動(dòng)機(jī)不同,對(duì)查詢(xún)的任何特定響應(yīng)的相關(guān)性也會(huì)有所不同。

查詢(xún)響應(yīng)應(yīng)該有多全面?與一般意義上的相關(guān)性一樣,這個(gè)問(wèn)題的答案取決于搜索的上下文。在某些情況下,不響應(yīng)查詢(xún)找到特定文檔的成本很高,例如響應(yīng)于傳票的法定 e-discovery 發(fā)現(xiàn)搜索,而在其他情況下相當(dāng)?shù)?,例如在網(wǎng)絡(luò)上搜索蛋糕配方,會(huì)出現(xiàn)幾十個(gè)或幾百個(gè)蛋糕食譜的網(wǎng)站。在配置 Solr 時(shí),您應(yīng)該權(quán)衡其他因素,如及時(shí)性和易用性。

上述提到的兩個(gè)例子:e-discovery 和菜譜實(shí)例,證明了與相關(guān)性相關(guān)的兩個(gè)概念的重要性:

  • 精度(precision)是返回結(jié)果中相關(guān)文檔的百分比。
  • 召回(recall)一下系統(tǒng)中所有相關(guān)結(jié)果的相關(guān)結(jié)果的百分比。獲得完美的召回是微不足道的:只需簡(jiǎn)單地將每個(gè)文檔返回到每個(gè)查詢(xún)的集合中。

回到上面的例子,一個(gè) e-discovery 搜索應(yīng)用程序有 100% 召回返回與傳票有關(guān)的所有文件是非常重要的。然而,一個(gè)菜譜應(yīng)用程序提供這樣的精確度就不那么重要了。在某些情況下,在不經(jīng)意的情況下返回太多的結(jié)果可能會(huì)壓倒用戶(hù)。在某些情況下,返回較少的結(jié)果具有更高的相關(guān)性可能是最好的方法。

使用精確度和召回的概念,可以將用戶(hù)的相關(guān)性和對(duì)文檔集合的查詢(xún)進(jìn)行量化。一個(gè)完美的系統(tǒng)對(duì)每個(gè)用戶(hù)和每個(gè)查詢(xún)都有100%的精度和100%的召回。換句話(huà)說(shuō),它將檢索所有相關(guān)的文件,沒(méi)有其他的。實(shí)際上,當(dāng)談到實(shí)際系統(tǒng)中的精確度和召回率時(shí),通常關(guān)注的是精確度和召回率,在一定數(shù)量的結(jié)果中,最常見(jiàn)的(也是有用的)是10個(gè)結(jié)果。

通過(guò) faceting、查詢(xún)過(guò)濾器和其他搜索組件,可以靈活配置 Solr 應(yīng)用程序,以幫助用戶(hù)對(duì)搜索進(jìn)行微調(diào),以便為用戶(hù)返回最具有相關(guān)性的結(jié)果。也就是說(shuō),Solr 可以配置為平衡精確度和召回率,以滿(mǎn)足特定用戶(hù)群體的需求。

Solr 應(yīng)用程序的配置應(yīng)該考慮到:

  • 應(yīng)用程序的各種用戶(hù)的需求(除了嚴(yán)格的信息需求外,還包括易用性和響應(yīng)速度)
  • 在不同的上下文中(如日期、產(chǎn)品類(lèi)別或地區(qū))對(duì)這些用戶(hù)有意義的類(lèi)別
  • 文檔的任何固有的相關(guān)性(例如,確保官方產(chǎn)品說(shuō)明或 FAQ 總是返回到搜索結(jié)果的頂部附近是有意義的)
  • 文件的日期是否重要(在某些情況下,最近的文件可能永遠(yuǎn)是最重要的)

記住所有這些因素,在Solr部署的規(guī)劃階段,通常會(huì)幫助您勾畫(huà)出您認(rèn)為搜索應(yīng)用程序應(yīng)該返回的示例查詢(xún)的響應(yīng)類(lèi)型。一旦應(yīng)用程序啟動(dòng)并運(yùn)行,您就可以使用一系列測(cè)試方法,如焦點(diǎn)組、內(nèi)部測(cè)試、TREC 測(cè)試和 A/B 測(cè)試來(lái)微調(diào)應(yīng)用程序的配置,以最好地滿(mǎn)足用戶(hù)的需求。

有關(guān)相關(guān)性的更多信息,請(qǐng)參閱 Grant Ingersoll 在  SearchHub.org 上提供的技術(shù)文章:調(diào)試搜索應(yīng)用程序相關(guān)性問(wèn)題。

以上內(nèi)容是否對(duì)您有幫助:
在線(xiàn)筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)