QQ账号登录	立即注册>>

您现在的位置：论坛 › 资料库 › 开源社区 > solrConfig.xml文件配置说明

总共48087条微博

动态微博

发表新帖

查看: 1874|回复: 0

solrConfig.xml文件配置说明

admin

1244 主题	544 听众	1万金钱

管理员

TA的每日心情

	衰 2021-2-2 11:21

签到天数: 36 天

[LV.5]常住居民I

电梯直达

楼主

发表于 2015-10-09 12:27:13 |只看该作者 |倒序浏览

在配置方面，solrconfig.xml 文件不仅指定了 Solr 如何处理索引、突出显示、分类、搜索以及其他请求，还指定了用于指定缓存的处理方法的属性，以及用于指定 Lucene 管理索引的方法的属性。
配置取决于模式，但模式不取决于配置。solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。

2.1. dataDir parameter
<dataDir>/var/data/solr</dataDir>
用来指定一个替换原先在Solr目录下默认存放所有的索引数据，可以在Solr目录以外的任意目录中。
如果复制使用后应该符合该参数。如果这个目录不是绝对路径的话，那么应该以当前的容器为相对路径。
2.2. mainIndex
这个参数的值用来控制合并多个索引段。
<useCompoundFile>：通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则 false 的默认值应该就已经足够。
2.3. mergeFactor
决定低水平的 Lucene 段被合并的频率。较小的值（最小为 2）使用的内存较少但导致的索引时间也更慢。
较大的值可使索引时间变快但会牺牲较多的内存。
2.4. maxBufferedDocs
在合并内存中文档和创建新段之前，定义所需索引的最小文档数。
段是用来存储索引信息的 Lucene 文件。
较大的值可使索引时间变快但会牺牲较多的内存。
2.5. maxMergeDocs
控制可由 Solr ,000) 最适合于具有合并的 Document 的最大数。
较小的值 (< 10大量更新的应用程序。
该参数不允许lucene在任何索引段里包含比这个值更多的文档，但是，多余的文档可以创建一个新的索引段进行替换。
2.6. maxFieldLength
对于给定的 Document，控制可添加到 Field 的最大条目数，进而截断该文档。
如果文档可能会很大，就需要增加这个数值。然而，若将这个值设置得过高会导致内存不足错误。
2.7. unlockOnStartup
unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。
在某些情况下，索引可能会由于不正确的关机或其他错误而一直处于锁定，这就妨碍了添加和更新。
将其设置为 true 可以禁用启动锁定，进而允许进行添加和更新。
<mainIndex>

<useCompoundFile>false</useCompoundFile>
<mergeFactor>10</mergeFactor>
<maxBufferedDocs>1000</maxBufferedDocs>
<maxMergeDocs>2147483647</maxMergeDocs>
<maxFieldLength>10000</maxFieldLength>
  </mainIndex>
2.8. updateHandler
这个更新处理器主要涉及底层的关于如何更新处理内部的信息。
（此参数不能跟高层次的配置参数Request Handlers对处理发自客户端的更新相混淆）。
<updateHandler class="solr.DirectUpdateHandler2">

缓冲更新这么多的数目，设置如下比较低的值，可以约束索引时候所用的内存
<maxPendingDeletes>100000</maxPendingDeletes>

等待文档满足一定的标准后将自动提交，未来版本可以扩展现有的标准

<autoCommit>
   <maxDocs>10000</maxDocs> 

触发自动提交前最多可以等待提交的文档数量
   <maxTime>86000</maxTime> 

在添加了一个文档之后，触发自动提交之前所最大的等待时间
</autoCommit>

这个参数用来配置执行外部的命令。
一个postCommit的事件被触发当每一个提交之后
<listener event="postCommit" class="solr.RunExecutableListener">
   <str name="exe">snapshooter</str>
   <str name="dir">solr/bin</str>
   <bool name="wait">true</bool>
   
</listener>
exe--可执行的文件类型
dir--可以用该目录做为当前的工作目录。默认为"."
wait--调用线程要等到可执行的返回值
args--传递给程序的参数默认nothing
env--环境变量的设置默认nothing
<query>

<maxBooleanClauses>1024</maxBooleanClauses>
<query>:
控制跟查询相关的一切东东。

2.8. Caching
修改这个参数可以做为索引的增长和变化。

<filterCache
   class="solr.LRUCache"
   size="512"
   initialSize="512"
   autowarmCount="256"/>

查询结果缓存
<queryResultCache
   class="solr.LRUCache"
   size="512"
   initialSize="512"
   autowarmCount="256"/>
  
由于Lucene的内部文档ID标识（文档名称）是短暂的，所以这种缓存不会被自动warmed。
<documentCache
   class="solr.LRUCache"
   size="512"
   initialSize="512"
   autowarmCount="0"/>

这么做的的关键就是应该明确规定实现solr.search.CacheRegenerator接口如果autowarming是比较理想化的设置。


<useFilterForSortedQuery>true</useFilterForSortedQuery>

一种优化用于queryResultCache，当一个搜索被请求，也会收集一定数量的文档ID做为一个超集。举个例子，一个特定的查询请求匹配的文档是10到19，此时，queryWindowSize是50，这样，文档从0到50都会被收集并缓存。这样，任何更多的在这个范围内的请求都会通过缓存来满足查询。
<queryResultWindowSize>50</queryResultWindowSize>
  
<HashDocSet maxSize="3000" loadFactor="0.75"/>

<boolTofilterOptimizer enabled="true" cacheSize="32" threshold=".05"/>

<enableLazyFieldLoading>false</enableLazyFieldLoading>

科帮网 1、本主题所有言论和图片纯属会员个人意见，与本社区立场无关
2、本站所有主题由该帖子作者发表，该帖子作者与科帮网享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和科帮网的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体，但并不代表本站赞同其观点和对其真实性负责
6、如本帖侵犯到任何版权问题，请立即告知本站，本站将及时予与删除并致以最深的歉意
7、科帮网管理员和版主有权不事先通知发贴者而删除本文