主页 > 其他 > Drupal 7整合Apache Solr 4.7及中文分词

Drupal 7整合Apache Solr 4.7及中文分词

PDF版本

solr的版本升级较快,目前已经到5.x的版本,但是drupal的版本升级比较慢,因此关于drupal升级使用solr高版本的问题,进展也比较慢,另外一个原因是Drupal的apachesolr模块是否支持也是一个问题,所以作者建议不要盲目的升级使用高版本,一定要测试之后才能在正式服务器上使用。


这次是参考网上的一些教程,把Apache Solr整合了中文分词,然后配合了Drupal的schema设置步骤,已经添加了自定义的中文分词器,对Drupal7以及中文分词做了支持。

Solr4.x增加了collection的概念,其实collection就是一个数据库的table的概念,这样一个core就可以有多个collection,solr的存储基本跟数据库就类似了。core等于数据库、collection等于数据表。

由于Jetty的版本不一样,导致配置文件的修改也有不同,因此jetty也做了适当修改,比如context.xml中把war文件改成了resourceBase的设置模式,以至于每次war文件解压不会覆盖work目录的修改。

第二个就是solr/drupal7/conf/solrconfig.xml文件中会引用很多相对路径的jar包文件,这些文件原本在solr-example中工作正常,但是单独拿出来就报错,因此作者把solr包里面的contrib文件夹复制到了solr(jetty)的根目录,并做了适当修改。

详细的使用还是跟之前的solr4z类似,只是这次只支持Drupal7,没办法支持Drupal6了。

 #简单的启动请使用:(window/linux) 
 #端口号是:8983
 java -jar start.jar
 
 #使用辅助solrd (linux only)
 #端口号: 8993
 ./solrd start #启动
 ./solrd startx #前端启动
 ./solrd stop #停止solr

Drupal里面设置url的时候,注意一下,直接使用corename/collection-name 就可以,具体参考Drupal大学这个问题:
在drupal中Solr4如何配置url?

该版本只是一个测试版本,如果有问题,请大家留言。

文件的下载地址在百度网盘: http://pan.baidu.com/s/1dDy8KGL
或者点击本博右侧公告栏的solr介绍地址和链接。


声明: 本站所有文章欢迎转载,所有文章未说明,均属于原创,转载均请注明出处。
本文有效链接: http://www.drupal001.com/2014/12/drupal7-apache-solr-4-7/
版权所有: Drupal与高性能网站架构 http://www.drupal001.com


, , ,

评论:1

发表评论
  1. avatar
    回复 高翔
    15/01/13

    使用Apache Solr 4.7 无法在线创建新的核心,有什么 解决办法呢

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注


× 9 = 六十 三

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

引用:0

下面所列的是引用到本博客的链接
Drupal 7整合Apache Solr 4.7及中文分词 来自 Drupal与高性能网站架构
顶部