Drupal 7整合Apache Solr 4.7及中文分词

归类于其他 一条评论

solr的版本升级较快,目前已经到5.x的版本,但是drupal的版本升级比较慢,因此关于Drupal升级使用Solr高版本的问题,进展也比较慢,另外一个原因是Drupal的apachesolr模块是否支持也是一个问题,所以作者建议不要盲目的升级使用高版本,一定要测试之后才能在正式服务器上使用。

阅读全文 《Drupal 7整合Apache Solr 4.7及中文分词》

1,005 Views , , ,

用Drupal多站点架构来解决Drupal存储的性能问题

归类于Drupal | 其他 2 条评论

众所周知,drupal的核心部分是node,也是数据库性能的关键之处,随着内容的不断增长,node数据集就会变得较为庞大,尤其是当Drupal包含多种内容类型,也就是多种nodetype,Node的存储问题就变得尤为严重(Drupal6和Drupal7基本差不多,随着网站的数据增长,都会遇到类似的问题)。同时,有些模块,也会以把一些其他内容扩展到node的存储中,如content_profile, 把profile存储到node中,taxonomy_node把一个term也存储到node中,等等。

这样的结果就是node数据会不断的增长,变得巨大而不易维护和管理,数据存储的性能问题会逐渐成为整个网站的瓶颈。

阅读全文 《用Drupal多站点架构来解决Drupal存储的性能问题》

1,538 Views , , ,

Apache Solr 4.0 初试体验及LucidWorks介绍

归类于其他 | 数据库技术 一条评论

Apache Solr 4.0 发布一段时间了,最新的solr修改动作还是很大的,尤其从后台管理界面来看,体验和管理更加方便了。默认使用了multi-core模式,以及支持了对多个collection的管理、监控、优化。从内核来看,Solr 4也带来了很多新东西,如Solr Cloud、Realtime GET、NRT(Near-Real-Time Search)、Master/Slave扩展与ZooKeeper集成、Join查询等。
阅读全文 《Apache Solr 4.0 初试体验及LucidWorks介绍》

4,212 Views ,

Apache Solr 快速启动包以及中文分词集成

归类于Drupal | 数据库技术 | 服务器技术 2 条评论

Solr一键启动包,Apache Solr中文支持包。

apachesolr 作为一款全文搜索引擎大家都很了解,不过说到中文的支持,(4.0版本之前),总是不能让人满意。首先,我们感谢一下IKAnalyzer的作者,开发了Lucene的中文分词包。
阅读全文 《Apache Solr 快速启动包以及中文分词集成》

3,943 Views , , , ,

Drupal集成ApacheSolr-3.x以及中文分词处理

归类于服务器技术 5 条评论

本文主要讲解drupal和Apache solr-3.x的集成以及对中文分词的处理,如需详细了解Drupal Search以及Apache solr的工作原理,请参阅前文《Drupal北京聚会主题之 – Apache Solr》。

在默认情况下,Drupal6使用的是Apache Solr 1.4版本,但是Apache Solr新版本已经升级到了3.x,所以1.x版本可能会慢慢不再支持,所以升级到Apache Solr 3.x还是很有必要的,我们这里做一下简要的介绍以及在Drupal Apachesolr中如何处理中文分词的相关问题。

升级到apachesolr 3.x

由于版本的兼容问题,我们选择第一个3.x版本,Apache Solr-3.1.0作为Apache Solr的主版本,来与Drupal6一起测试。首先要安装Drupal的Apachesolr模块,具体的安装操作在Drupal Apchesolr模块的README.txt里面有详细说明,在这只大概列举一下。

  1. 下载apachesolr模块
  2. 下载SolrPhpClient包,具体参考apacheslor README文件
  3. 从Apache网站下载solr包
  4. 把drupal apachesolr中的schema.xml和solrconfig.xml拷贝到solr的example/solr/conf/下(注意备份源文件)
  5. 到solr的example下,java -jar start.jar 启动SOLR

阅读全文 《Drupal集成ApacheSolr-3.x以及中文分词处理》

4,552 Views , , , ,

Drupal北京聚会主题之 – Apache Solr

归类于数据库技术 | 服务器技术 6 条评论

此文是 “drupal北京秋季聚会”的演讲主题之一《drupal search和Apache solr应用》,这里做一个简单介绍以及附件下载。
关于Drupal的性能优化讲座的PPT请参考《让猪去飞-Drupal性能优化经验贴》。

内容列表:
1. Drupal Search介绍及原理
2. Apache solr和Luncene原理介绍
3. Drupal和apachesolr模块
4. Apache Solr的扩展 

阅读全文 《Drupal北京聚会主题之 – Apache Solr》

1,860 Views , ,

顶部