]> source.dussan.org Git - archiva.git/blob
ba09036313a83467287f71e34b5c451b8993bde6
[archiva.git] /
1 package org.apache.maven.repository.indexing;
2
3 /*
4  * Copyright 2005-2006 The Apache Software Foundation.
5  *
6  * Licensed under the Apache License, Version 2.0 (the "License");
7  * you may not use this file except in compliance with the License.
8  * You may obtain a copy of the License at
9  *
10  *      http://www.apache.org/licenses/LICENSE-2.0
11  *
12  * Unless required by applicable law or agreed to in writing, software
13  * distributed under the License is distributed on an "AS IS" BASIS,
14  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
15  * See the License for the specific language governing permissions and
16  * limitations under the License.
17  */
18
19 import org.apache.lucene.analysis.Analyzer;
20 import org.apache.lucene.analysis.CharTokenizer;
21 import org.apache.lucene.analysis.TokenStream;
22
23 import java.io.Reader;
24
25 /**
26  * Class created specifically to index artifacts
27  *
28  * @author Edwin Punzalan
29  */
30 public class ArtifactRepositoryIndexAnalyzer
31     extends Analyzer
32 {
33     private Analyzer defaultAnalyzer;
34
35     /**
36      * constructor to for this analyzer
37      *
38      * @character defaultAnalyzer the analyzer to use as default for the general fields of the artifact indeces
39      */
40     public ArtifactRepositoryIndexAnalyzer( Analyzer defaultAnalyzer )
41     {
42         this.defaultAnalyzer = defaultAnalyzer;
43     }
44
45     /**
46      * Method called by lucence during indexing operations
47      *
48      * @return an analyzer to specific to the field name or the default analyzer if none is present
49      * @character fieldName the field name that the lucene object is currently processing
50      * @character reader a Reader object to the index stream
51      */
52     public TokenStream tokenStream( String fieldName, Reader reader )
53     {
54         TokenStream tokenStream;
55
56         if ( "version".equals( fieldName ) )
57         {
58             tokenStream = new VersionTokenizer( reader );
59         }
60         else
61         {
62             tokenStream = defaultAnalyzer.tokenStream( fieldName, reader );
63         }
64
65         return tokenStream;
66     }
67
68     /**
69      * Class used to tokenize an artifact's version.
70      */
71     private class VersionTokenizer
72         extends CharTokenizer
73     {
74         /**
75          * Constructor with the required reader to the index stream
76          *
77          * @reader the Reader object of the index stream
78          */
79         public VersionTokenizer( Reader reader )
80         {
81             super( reader );
82         }
83
84         /**
85          * method that lucene calls to check tokenization of a stream character
86          *
87          * @param character char currently being processed
88          * @return true if the char is a token, false if the char is a stop char
89          */
90         protected boolean isTokenChar( char character )
91         {
92             boolean token;
93
94             switch ( character )
95             {
96                 case '.':
97                 case '-':
98                     token = false;
99                     break;
100                 default:
101                     token = true;
102             }
103
104             return token;
105         }
106     }
107 }