新手开店

什么是淘宝天猫搜索的分词逻辑

来源:manager     发布日期:2019-06-18 10:40

  以淘宝天猫中的一个宝贝标题为例,宝贝标题中涵盖了“太空棉外套女2016”等词语,其中,“太空棉”“外套”“女”“2016”就是分词,由这些分词组成长尾关键词,又称长尾词,其优点是具备可延伸性、针对性强、范围广。

  淘宝天猫在给这些长尾词权重时,主要是看每个分词的权重,然后组合起来,从而判断长尾词整体的权重。那么,淘宝天猫系统为什么会有这样的逻辑判断呢?举例来说,假如一件商品的标题里包含了“修身”这个词语,该词语的权重又很高,那么淘宝天猫系统会认为该商品与“修身”非常相关,从而包含“修身”的长尾词获得很高的权重

  那么,这些分词的权重又是如何决定的呢?主要是通过组合词点击率、组合词点击量、组合词转化率等因素来决定每个分词的权重。例如,搜索“太空棉中长款外套”时,发现点击率、成交率比较高,这就意味着,“太空棉”“中长款”“外套”这三个分词的权重比较高。假如某件产品的标题中与这三个分词非常相关,系统会进步提升其在排名方面的权重。

总的来说,淘宝天猫通过分词权重来定义产品关联度,当客户搜索关键词时,淘宝天猫会判断产品是否与这个关键词相匹配,从而决定给产品什么样的排名,一般而言,淘宝天猫的分词逻辑主要基于以下五个方面的原则。


淘宝天猫分词逻辑


1.紧密结合

  举例来说,淘宝开店的卖家在店铺里销售一款连衣裙,并在宝贝标题中包含了“雪纺连衣裙”,淘宝天猫会把这个词进行拆分,变成“雪纺”和“连衣裙”,接着,淘宝天猫依靠其庞大的词库,去找这些词所对应的最优类目的交集,这样交集出来的词就是比较相关的了,这是简单的拆次和匹配。假如用户在搜索“雪纺连衣裙”时,店铺内包含了该长尾词的宝贝在类目属性上又有高度的匹配,那么会有更好的排名权重

  2.不要有异议

  淘宝天猫上的商品种类繁多,为了给用户呈现高度相关的商品,淘宝天猫系统不希望宝贝标题模棱两可,含有歧义。为此,宝贝标题中要尽力避免有异议的分词。比如,“ bei zi”这个拼音,既可以是“被子”,也可以是“杯子”,明显带有争议假如宝贝标题中有这样的分词,会对排名权重不利

3. 宝贝属性进索引

一般情况下,用户在淘宝天猫中搜索时,系统会先去匹配用户搜索的关键词的类目分布,然后去匹配标题高度相关的宝贝,并根据一系列的权重规则决定宝贝的呈现与排名。其中,建议适当将宝贝的若干属性写入标题中,以作为系统判断关键词时的一种索引。

  比如,有件男士西装的标题是“西服套装男士西装三件套新郎结婚礼服职业商务韩版修身正装冬季蓝”,将标题中的分词依次分开,即为“西服/套装/男士西装/三件套/新郎结婚礼服/职业商务/韩版/修身/正装/冬季/蓝”,其中,“韩版”“蓝”等分词便为该西装的属性,包含在标题中,会增加搜索的针对性。需要注意的是,属性和标题不能冲突,假如宝贝属性中选择的是“红色”,标题中却是“蓝”,这就属于违规,会被进行降权处理,卖家对此要引起注意。另外,宝贝标题的字数极其有限在标题中通常不会加上类似“/”这样的符号,我们在这里加上“/”,是为了便于分割关键词进行观察,这点需注意。

  4.词性

  宝贝标题是由淘宝天猫系统去识别的,那么,如何才能让淘宝天猫系统准确识别宝贝的标题呢?系统会识别词性,从中判断出中心词,假如宝贝标题没有被系统识别出中心词或识别错了,那么对宝贝排名会不利。为此,宝贝标题中的中心词通常要使用名词予以强调,比如在上面男士西装标题的例子中,标题的前面部分就强调了“西服/套装/男士西装”的概念。

  5书写顺序

  淘宝天猫中的宝贝标题在书写上通常有两种顺序:一种是搜索顺序,比如“牛仔裤/女/韩版”,这是根据搜索习惯排列的顺序;另一种是用户的阅读顺序,比如“韩版/牛仔裤/女”。一般来说,宝贝的标题是供用户阅读的,淘宝天猫搜索引擎也是在致力于不断为用户提供更佳的搜索购物体验,所以,宝贝标题往往也要参考用户的阅读顺序来确定。


标签:淘宝开店,