99re热视频这里只精品,久久久天堂国产精品女人,国产av一区二区三区,久久久精品成人免费看片,99久久精品免费看国产一区二区三区

術(shù)語(yǔ)向量組件:TermVectorComponent

2018-12-01 16:13 更新

TermVectorComponent 是一個(gè)搜索組件,用于返回關(guān)于與您的搜索匹配的文檔的附加信息。

對(duì)于響應(yīng)中的每個(gè)文檔,TermVectorCcomponent 可以返回術(shù)語(yǔ)向量、術(shù)語(yǔ)頻率、逆文檔頻率、位置和偏移量信息。

術(shù)語(yǔ)向量組件配置

TermVectorComponent 未在 Solr 中隱式啟用 - 它必須在 solrconfig.xml 文件中顯式配置。本頁(yè)中的示例顯示了如何在 Solr 的 "techproducts" 示例中進(jìn)行配置:

bin/solr -e techproducts

要啟用這個(gè)組件,您需要使用一個(gè) searchComponent 元素來(lái)配置它:

<searchComponent name="tvComponent" class="org.apache.solr.handler.component.TermVectorComponent"/>

然后必須將請(qǐng)求處理程序配置為使用此組件名稱。在這個(gè) techproducts 例子中,該組件與一個(gè)名為 /tvrh 的特殊請(qǐng)求處理程序相關(guān)聯(lián),默認(rèn)情況下,使用 tv=true 參數(shù)啟用術(shù)語(yǔ)向量;但您可以將其與任何請(qǐng)求處理程序關(guān)聯(lián):

<requestHandler name="/tvrh" class="org.apache.solr.handler.component.SearchHandler">
  <lst name="defaults">
    <bool name="tv">true</bool>
  </lst>
  <arr name="last-components">
    <str>tvComponent</str>
  </arr>
</requestHandler>

一旦您的處理程序被定義了,您可以和任何模式一起使用(uniqueKeyField)對(duì)于用 termVector 屬性配置的字段,例如在 techproducts 示例模式中:

<field name="includes"
       type="text_general"
       indexed="true"
       stored="true"
       multiValued="true"
       termVectors="true"
       termPositions="true"
       termOffsets="true" />

調(diào)用術(shù)語(yǔ)向量組件

下面的例子顯示了使用上面的配置調(diào)用這個(gè) TermVectorComponent 組件:

http://localhost:8983/solr/techproducts/tvrh?q=*:*&start=0&rows=10&fl=id,includes&wt=xml
...
<lst name="termVectors">
  <lst name="GB18030TEST">
    <str name="uniqueKey">GB18030TEST</str>
  </lst>
  <lst name="EN7800GTX/2DHTV/256M">
    <str name="uniqueKey">EN7800GTX/2DHTV/256M</str>
  </lst>
  <lst name="100-435805">
    <str name="uniqueKey">100-435805</str>
  </lst>
  <lst name="3007WFP">
    <str name="uniqueKey">3007WFP</str>
    <lst name="includes">
      <lst name="cable"/>
      <lst name="usb"/>
    </lst>
  </lst>
  <lst name="SOLR1000">
    <str name="uniqueKey">SOLR1000</str>
  </lst>
  <lst name="0579B002">
    <str name="uniqueKey">0579B002</str>
  </lst>
  <lst name="UTF8TEST">
    <str name="uniqueKey">UTF8TEST</str>
  </lst>
  <lst name="9885A004">
    <str name="uniqueKey">9885A004</str>
    <lst name="includes">
      <lst name="32mb"/>
      <lst name="av"/>
      <lst name="battery"/>
      <lst name="cable"/>
      <lst name="card"/>
      <lst name="sd"/>
      <lst name="usb"/>
    </lst>
  </lst>
  <lst name="adata">
    <str name="uniqueKey">adata</str>
  </lst>
  <lst name="apple">
    <str name="uniqueKey">apple</str>
  </lst>
</lst>

術(shù)語(yǔ)向量請(qǐng)求參數(shù)

下面的例子顯示了這個(gè)組件的一些可用的請(qǐng)求參數(shù):

http://localhost:8983/solr/techproducts/tvrh?q=includes:[* TO *]&rows=10&indent=true&tv=true&tv.tf=true&tv.df=true&tv.positions=true&tv.offsets=true&tv.payloads=true&tv.fl=includes
tv 參數(shù)

如果為true,將運(yùn)行術(shù)語(yǔ)向量組件。

tv.docIds 參數(shù)

對(duì)于給定的以逗號(hào)分隔的 Lucene 文檔 ID 列表(不是 Solr 唯一鍵),將返回術(shù)語(yǔ)向量。

tv.fl 參數(shù)

對(duì)于給定的以逗號(hào)分隔的字段列表,將返回術(shù)語(yǔ)向量。如果未指定,則使用fl參數(shù)。

tv.all 參數(shù)

如果為true將啟用以下列出的所有布爾參數(shù):tv.df,tv.offsets,tv.positionstv.payloads,tv.tftv.tf_idf

tv.df 參數(shù)

如果為true,將返回集合中該術(shù)語(yǔ)的文檔頻率(DF)。這可能在計(jì)算上是昂貴的。

tv.offsets 參數(shù)

如果為true,將返回文檔中每個(gè)術(shù)語(yǔ)的偏移信息。

tv.positions 參數(shù)

如果為true,則返回位置信息。

tv.payloads 參數(shù)

如果為true,則返回有效載荷信息。

tv.tf 參數(shù)

如果為true,返回文檔中每個(gè)術(shù)語(yǔ)的文檔術(shù)語(yǔ)頻率信息。

tv.tf_idf 參數(shù)

如果為true計(jì)算每個(gè)術(shù)語(yǔ)的 TF/DF(即:TF * IDF)。請(qǐng)注意,這是“ 字頻乘以逆文檔頻率” 的文字計(jì)算,而不是經(jīng)典的 TF-IDF 相似性度量。

這個(gè)參數(shù)需要tv.tftv.df是 true。這可能在計(jì)算上是昂貴的。(結(jié)果不顯示在示例輸出中)

要查看 TermVector 組件輸出的示例,請(qǐng)參閱Wiki頁(yè)面:http://wiki.apache.org/solr/TermVectorComponentExampleOptions

SolrJ 和術(shù)語(yǔ)向量組件

SolrQuery 類和 QueryResponse 類都不提供特定的方法調(diào)用來(lái)設(shè)置術(shù)語(yǔ)向量組件參數(shù)或獲取 "termVectors" 輸出。但是,它有一個(gè)補(bǔ)丁:SOLR-949。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)