大家好,今天我们来讲一下小红书的搜索机制。如果说我们推荐机制是内容找人的话,那么我们今天要讲的搜索就是人找内容这种人的主观意志,它赋予了品牌在做小红书推广时更大的一个价值用户在进行搜索的时候,大多数是带着需求来的。比如说用户想买面膜的时候,它就会在小红书上搜索面膜这个关键词。这个时候就会呈现出搜索引擎在小红书笔记库中抓取到的内容和推荐机制相比,我们可以看到搜索机制它具有更强的用户主动共性,所以它凝聚着更强的用户需求。那反过来呢,这也就意味着通过搜索来的用户,他转化为我们品牌的忠实用户,付费用户的转化率。会更高。所以品牌在做小红书推广时,必须了解搜索机制,才能够更好的提升我们用户的一个转化。那一般我们品牌大多数会通过做官司排名刷到我们笔记的互动数量。比如说转屏占这些来提升自己在搜索引擎中的优势。但是大多数人他只知其表,不知其理。小红书。搜索引擎的工作机制到底是怎么样的。其实到今天搜索引擎的工作机制已经不是什么秘密啊。在scm 领域,相关的研究已经很多了。小红书的app 内搜索其实和百度三六零这些大的搜索引擎没有什么很大的区别。小兔的搜索引擎功能其实可以概括为三个流程索引匹配展示。那当用户输入关键词进行搜索之后。会在已有的笔记库内进行搜索,并且根据笔迹的特征和关键词来做一个匹配。那么在完成匹配之后。会按照相应的规则进行一个排序展示完整的搜索引擎的工作机制。但是有一点我们要注意。上述的工作流程是以用户搜索关键词为起点的,所以我们没有把收录算到搜索引擎的工作流程中去。因为收录过程是在用户搜索之前就完成的。但是收录是搜索引擎最为重要的一项工作流程。在途中的小红书笔记库,实际上就是通过收录建立起来的。
简单来讲,输入就是搜索引擎通过抓取把符合要求的笔记存储的比库中去。所以收录是整个搜索流程的前置工序。那没有经过收录,我们就建立不起来这个笔记库啊,也就没有之后的笔记内容的一个排名展示。这
也是我们在小牧猪场经常会遇到的一个问题就是我们的笔记已经通过审核了,发布成功了。但是我们通过搜索关键词去找的时候,去找到我们的笔记,很多时候并不是因为你的笔记排名太靠后了,你刷不到他,而是你根本就没有被搜索引擎收录。没有收录,也就意味着你的笔记没有进入到小红书的笔记库中去,所以也就不会在搜索结果页面进行一个展示。重点笔记发布成功,并不意味着你能够被所有人看到,甚至我们前面讲的小红书内容推荐机制,它和搜索机制是相互独立的。哪怕你的笔记进入到推荐池中,被系统分发出去,作为内容分发被推荐出去了。但是你在搜索行为当中依旧是检测不到你的笔记的。当然这可能是一种极端情况,但是通常情况下没有被收录的笔记。哪怕他进入到推荐池中,他的权重也是很低的,不会有太好的一个表现。
整个收录的流程大概是这个样子的。搜索引擎的蜘蛛每天会在小红书站内的数据上爬行,不断的抓取新产生的笔记,按照一定的算法策略。把这个笔记抓取到搜索引擎的服务器上,然后来进行一个内容处理。比如说提取关键词啊,进行原创对比,一些违规信息的分析等等啊,完成了内容处理之后。会把不合格的笔记过滤掉。把合格的笔记收录到小红书的笔记库当中去。当然这个过程和用户搜索也不是绝对独立的。收录过程是在随时进行不断更新的。所以数据库也是在不断进行更新的,这也是我们为什么每次搜索出来的结果都有可能会出现变化。
我们再回归到用户的搜索行为路径中来。当用户输入关键词,点击搜索之后,首先就会进入到一个索引阶段。在索引阶段小红书搜索引擎的蜘蛛,也就是抓取工具。会根据用户搜索的关键词,像小红书的笔记库发起抓取请求,从笔记库中抓取与关键词相关的笔记内容。搞到一个临时的语句缓存库当中去。这个笔迹缓存库当中包含有和关键词强相关以及微相关的各项内容。所以我们讲这个缓存的笔记库内的内容同样是需要过滤和筛选才能够展示给用户的那这个过滤和筛选的过程就是匹配。但匹配环节其实是覆盖索引的。在用户输入关键词进行搜索的时候,就已经会对关键词进行一个分词处理。然后再根据处理后的分词,到小红书笔记库内进行抓取。比如说我们说评价口红,只有二十万线搜,好用的口红有四十一万线。但是我们去搜评价好用刀口红,就有一百零七万篇笔记。我们可以看到不同的分词结构给出的第一顺位的关键词是不同的。这几个关键词中,口红肯定是第一关键词。口红这个关键词是小红书的专家系统人工设置的品类关键词,所以它的精准度会很高。但是你像评价好用这样的关键词,它是属于统计系统在发挥作用的,是根据相关性来进行展示的。所以就会出现不同分词组合的这种差异。当然在这里要吐槽一下小红书的中文分词做的其实并不怎么好。那么除了在索引前会对关键词进行分词,以方便蜘蛛在笔记库内进行。可以抓取之外呢,在临时缓存的底库中还会进行二次的更为精准的一个匹配。主要就是根据相似性、相关性等等来进行一个内容的筛选,跟我们之前讲的特征匹配的逻辑是相同的。在完成对临时数据库内的笔记的匹配筛选之后。会把搜索结果推入到展示系统中,按照展示系统的规则来进行排名展示。那么排名肯定是我们品牌最关心的一个问题。大家都希望是自己的。
笔记排在第一位啊,所以会有很多人去刷赞啊,但是往往并没有什么效果。因为小红书搜索引擎的展示规则是非常复杂的。并不是只有点赞、评论收藏这些数据这么简单啊,简单的对展示规则进行概括的话,可以分为关键词权重。用户行为数据三个最重要最基本的规则,关键词可以说是搜索系统最为重要的逻辑基础。我们也看到在之前的几个工作流程当中,关键词是串联整个搜索流程的一个线笔记内容和关键词的相关程度,直接决定了你的笔迹是否能够进入到这一轮的搜索过程中来。当然这个相关的,他也决定着你的笔记在最终展示页面的排名。所以我们常规的s u o 中会有很多关键词的优化,那良心一点的排名的供应商也会告诉你,你首先要把你的笔记类的关键词布局优化好,但是具体如何优化也是一个很复杂的工作。
另外一个权重,它就是一个更为复杂的规则体系,它包括笔记质量本身带来的权重比,及发布账号自身的权重。笔记点击率、点赞、评论、收藏等等这些数据带来的权重,甚至还要包括评论你的用户,他自身的一个权重。
但是最核心的规则是很简单粗暴的。那就是权重越高,排名越靠前。
就像小红书自身在百度里面的权重很高。所以我们经常会在百度搜索里面看到小红书的文章排名非常的靠前,并不是写文章的作者都有钱投了很多的广告。就是小红书作为一个内容站,他在百度这个搜索引擎自身的高权重给这篇文章带来了一个好的排名。那除了关键词和权重之外呢,用户行为数据往往是会被大多数人所忽略的一项规则,搜索的结果并不是我们想象中的千篇一律的,他其实上也是千人千面的。
有人做过一个化妆水的观测测试,两个不同账户最终呈现出来的搜索结果也是有细微的差异的,这是因为搜索结果在进行匹配和排名的时候。会根据用户在小红书站内的行为数据给出不一样的相关性的分析。比如说你所关注的达人啊,你浏览过的历史笔记。你评论过的笔记。怎么这些系统会根据这些数据对用户进行一个判断,给出一个更符合用户需求的搜索结果。所以我们讲搜索和分发一样,也是千人千面。就像我们如果每天买的都是五十块钱以下的东西,那么你在淘宝上搜索商品的时候,按照综合排序价格就会在这个排序中占据。更高的一个权重成为影响你这个排序的重要因素。所以你看到的排名靠前的商品可能都是五十块钱以下的,所以也会有供应商利用这一点来做假排名,比如说他给你他自己帮你做的排名的截图,或者说你自己去搜索以及排名,就发现他很靠前。
但其实这个时候因为你多次的去搜索您自己的笔记,去点击它,或者说你关注了这个笔记的作者,甚至你在笔记下面去做了评论。
那么这篇评论在你自身的这个行为数据里边就会占有很高的一个权重。自然而然的他在你的搜索结果里面,最终的排名也就会很靠前。
那么究竟如何才能把笔记排名真正的做上去呢?怎么让我的笔记成为热门,我们以后再续