solr 自定义 dismax查询方式

13shu

浏览: 72044 次
性别:
来自: 深圳

最近访客更多访客>>

zbc0512

richand730

jason_onetwo

xmn1986

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

Solr 正则表达式算法 XML F#

1、在solrconfig.xml中增加

<queryParser name="imdismax"
		class="com.szhtp.search.parse.IMDisMaxQParserPlugin" />
<requestHandler name="imdismax" class="solr.SearchHandler">
		<lst name="defaults">
			<str name="defType">imdismax</str>

			<!-- 查询关键字和设置权重 -->
			<str name="qf">keywords^3 question^2 answer^0.4</str>

			<str name="pf">keywords^3 question^2 answer^0.4</str>

			<str name="mm">2&lt;-1 5&lt;-2 6&lt;90%</str>

			<!-- 输出时显示那些字段 -->
			<str name="fl">id,answer,score</str>

			<!-- 设置PhraseSlop的坡度 -->
			<int name="ps">100</int>

			<str name="hl.fl">answer</str>

			<!-- 默认查询语句用于容错处理 -->
			<str name="q.alt">*:*</str>

			<!-- 每个snippet返回的最大字符数。默认是100.如果为0，那么该字段不会被fragmented且整个字段的值会被返回。大字段时不会这么做。
			这里的answer=<str name="hl.fl">answer</str>
			  -->
			<str name="f.answer.hl.fragsize">50</str>

			<!-- instructs Solr to return the field itself if no query terms are
				found -->
			<!-- 如果没有生成snippet（没有terms 匹配），那么使用另一个字段值作为返回 -->
			<str name="f.answer.hl.alternateField">answer</str>

			<!-- 这个是solr制定fragment算法的扩展点。gap是默认值。
				regex是另一种选项，这种选项指明highlight的边界由一个正则表达式确定。
				这是一种非典型的高级选项。为了知道默认设置和fragmenters (and formatters)是如何配置的，
				可以看看solrconfig.xml中的highlight段 -->
			<str name="f.answer.hl.fragmenter">regex</str>

			<str name="tie">0.1</str>
		</lst>
	</requestHandler>

2、创建类IMDisMaxQParserPlugin.java

public class IMDisMaxQParserPlugin extends QParserPlugin
{
    public static String NAME = "imdismax";

    public void init(NamedList args) {
    }

    public QParser createParser(String qstr, SolrParams localParams, SolrParams params, SolrQueryRequest req) {
      return new IMDisMaxQParser(qstr, localParams, params, req);
    }
}

3、创建类IMDisMaxQParser.java 可以在里面增加中文分词

public class IMDisMaxQParser extends DisMaxQParser
{
    public IMDisMaxQParser(String qstr, SolrParams localParams,
            SolrParams params, SolrQueryRequest req)
    {
        super(qstr, localParams, params, req);

        if (null == this.qstr)
        {
            return;
        }

        Analyzer analyzer = req.getSchema().getQueryAnalyzer();

        if (null == analyzer)
        {
            return;
        }

        StringBuilder norm = new StringBuilder();
        try
        {
//对question分词
            TokenStream tokens = analyzer.reusableTokenStream("question",
                    new StringReader(this.qstr));
            tokens.reset();
            Token token = tokens.next();
            while (token != null)
            {
                norm.append(
                        new String(token.termBuffer(), 0, token.termLength()))
                        .append(" ");
                token = tokens.next();
            }
        }
        catch (Exception ex)
        {
                    }
        if (norm.length() > 0)
            this.qstr = norm.toString();
    }
}

分享到：

solr 数据源导入需要注意的问题 dataimpor ... | solr 查询解析流程

2010-09-03 17:13
浏览 9860
评论(3)
分类:企业架构
查看更多

3 楼青春的、脚步 2013-02-21

<str name="mm">2<-1 5<-2 6<90%</str> 这个是什么意思

2 楼 ihuangweiwei 2012-09-25

这个设置了有效果吗 <str name="mm">2<-1 5<-2 6<90%</str>

1 楼 poppop_2000 2012-07-11

[b][/b][b][/b][b][/b][b][/b][b][/b][b][/b][b][/i][i][/i][i][/i][i][/u][u][/u][u][/u][u][/b]

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

solr 自定义 dismax查询方式

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

solr 自定义 dismax查询方式

评论

发表评论

相关推荐

solr 数据源导入需要注意的问题 dataimport.xml

solr 查询解析流程

solr配置文件schema.xml需要注意的细节

solr 查询参数说明

把solr导入到Eclipse中进行发布

solr 安装

最近访客更多访客>>