StackOverflow2013

Note that there are some explanatory texts on larger screens.

plurals

POWeird results with Solr 1.4 and EdgeNGrams - some substrings match, some don't
primarykey
Id
6938226
data
AcceptedAnswerId
0
AnswerCount
2
ClosedDate
CommentCount
0
CommunityOwnedDate
CreationDate
2011-08-04T08:20:03.993
FavoriteCount
3
LastActivityDate
2012-03-12T00:48:47.883
LastEditDate
2011-08-11T18:26:36.057
LastEditorUserId
381787
OwnerUserId
381787
ParentId
0
PostTypeId
1
Score
4
ViewCount
1375
LastEditorDisplayName
text
Body
EDIT 3: The workaround I'm using right now is to strip anything but letters, digits, and whitespace from both my queries and my indexed fields. This produces the desired behavior, but it's very much a workaround rather than a true solution, and I would still like to understand why Solr is doing what it's doing...so still interested in an answer, if anyone has one. END EDIT 3 I have a document named "TT-14B" indexed by Solr 1.4 (via Django/Haystack). When I query the <code>content_auto</code> field for "tt-1" or "tt 14" or "tt 14b" I get the document back; when I query "tt-14" or "tt-14b" I get no results. I edited the Haystack-generated Solr schema a bit to try to fix this, to no avail. Using analyze.jsp, it seems to me that I should be getting a match for "tt-14"; I should certainly be getting one for "tt-14b". (Edit: Oh, and changing the default operator from AND to OR doesn't help.) Can someone help me understand why this isn't working? Thanks. ... results <pre><code>QUERY | WORKS =======|====== tt | yes tt- | yes tt-1 | yes tt-14 | no tt-14b | no tt 14 | yes tt 14b | yes </code></pre> EDIT 2 Got some more comparably weird results, might help debug the problem. In this case the test document was "abc'def". <pre><code>QUERY | WORKS ========|====== abc | yes abc'd | yes abc'de | no abc'def | no </code></pre> Same pattern, obviously, but I don't understand what's causing it. END EDIT 2 schema.xml relevant part (full file below) <pre><code><fieldType name="edge_ngram" class="solr.TextField" positionIncrementGap="1"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory" /> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="15" side="front" /> </analyzer> <analyzer type="query"> <tokenizer class="solr.WhitespaceTokenizerFactory" /> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> </analyzer> </fieldType> </code></pre> schema.xml (full) <pre><code><?xml version="1.0" ?>  <schema name="default" version="1.1"> <types> <fieldtype name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/> <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/>  <fieldType name="sint" class="solr.SortableIntField" sortMissingLast="true" omitNorms="true"/> <fieldType name="slong" class="solr.SortableLongField" sortMissingLast="true" omitNorms="true"/> <fieldType name="sfloat" class="solr.SortableFloatField" sortMissingLast="true" omitNorms="true"/> <fieldType name="sdouble" class="solr.SortableDoubleField" sortMissingLast="true" omitNorms="true"/> <fieldType name="date" class="solr.DateField" sortMissingLast="true" omitNorms="true"/> <fieldType name="text" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory"/>  <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="1" catenateNumbers="1" catenateAll="1"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/> <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="0" catenateNumbers="0" catenateAll="1"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/> <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> </analyzer> </fieldType> <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.WhitespaceTokenizerFactory"/> </analyzer> </fieldType> <fieldType name="ngram" class="solr.TextField" > <analyzer type="index"> <tokenizer class="solr.KeywordTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/> <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="15" /> </analyzer> <analyzer type="query"> <tokenizer class="solr.KeywordTokenizerFactory"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType> <fieldType name="edge_ngram" class="solr.TextField" positionIncrementGap="1"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory" /> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> <filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="15" side="front" /> </analyzer> <analyzer type="query"> <tokenizer class="solr.WhitespaceTokenizerFactory" /> <filter class="solr.LowerCaseFilterFactory" /> <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="0" preserveOriginal="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> </analyzer> </fieldType> </types> <fields>  <field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/> <field name="django_ct" type="string" indexed="true" stored="true" multiValued="false" /> <field name="django_id" type="string" indexed="true" stored="true" multiValued="false" /> <dynamicField name="*_i" type="sint" indexed="true" stored="true"/> <dynamicField name="*_s" type="string" indexed="true" stored="true"/> <dynamicField name="*_l" type="slong" indexed="true" stored="true"/> <dynamicField name="*_t" type="text" indexed="true" stored="true"/> <dynamicField name="*_b" type="boolean" indexed="true" stored="true"/> <dynamicField name="*_f" type="sfloat" indexed="true" stored="true"/> <dynamicField name="*_d" type="sdouble" indexed="true" stored="true"/> <dynamicField name="*_dt" type="date" indexed="true" stored="true"/> <field name="modelname_exact" type="string" indexed="true" stored="true" multiValued="false" /> <field name="modelname" type="text" indexed="true" stored="true" multiValued="false" /> <field name="name" type="text" indexed="true" stored="true" multiValued="false" /> <field name="text" type="text" indexed="true" stored="true" multiValued="false" /> <field name="name_exact" type="string" indexed="true" stored="true" multiValued="false" /> <field name="content_auto" type="edge_ngram" indexed="true" stored="true" multiValued="true" /> </fields>  <uniqueKey>id</uniqueKey>  <defaultSearchField>text</defaultSearchField>  <solrQueryParser defaultOperator="AND" /> </schema> </code></pre>
Tags
<search><lucene><indexing><solr><django-haystack>
Title
Weird results with Solr 1.4 and EdgeNGrams - some substrings match, some don't
singulars
PostAcceptedAnswerId
1. This table or related slice is empty.
PostParentId
1. This table or related slice is empty.
PostTypePostTypeId
1. PTQuestion
UserLastEditorUserId
1. USrfrankel
UserOwnerUserId
1. USrfrankel
plurals
PostLinksPostIdRelatedPostId
1. PL
 singulars
 LinkTypeLinkTypeId
 LTLinked
PostLinksRelatedPostIdPostId
1. This table or related slice is empty.
PostsAcceptedAnswerId
1. This table or related slice is empty.
PostsParentIdCreationDate
1. PO
 singulars
 PostTypePostTypeId
 PTAnswer
2. PO
 singulars
 PostTypePostTypeId
 PTAnswer
VotesPostIdCreationDate
1. VO
 singulars
 PostPostId
 POWeird results with Solr 1.4 and EdgeNGrams - some substrings match, some don't
 UserUserId
 This table or related slice is empty.
 VoteTypeVoteTypeId
 VTUpMod
2. VO
 singulars
 PostPostId
 POWeird results with Solr 1.4 and EdgeNGrams - some substrings match, some don't
 UserUserId
 USrfrankel
 VoteTypeVoteTypeId
 VTFavorite
3. VO
 singulars
 PostPostId
 POWeird results with Solr 1.4 and EdgeNGrams - some substrings match, some don't
 UserUserId
 USrfrankel
 VoteTypeVoteTypeId
 VTBountyStart
CommentsPostId
1. This table or related slice is empty.

Querying!

Guidance

A row detail

Detail views are divided into sections. All the information in the data section comes from columns in the selected row. The other sections display data from other, related rows.

Related data can be related in a to-one or a to-many fashion. Captions of data related in a to-many fashion link to a list view showing a filtered view of the table.

Try moving around until you find a non-empty to-many entry and click on the label to get to one. You can move back to the root by clicking on the database name in the header.