搜索的收录和信息流的推荐算法

瑜伽教练培训班logo

会员中心站长统计

当前位置:瑜伽教练培训班 > 生活百科 > 笔记 > 【电商】搜索的收录和信息流的推荐算法-笔记

.

生活百科

瑜伽分类
瑜伽联系电话
笔记

【电商】搜索的收录和信息流的推荐算法-笔记

时间:2020-01-02 来源:收集 作者:小美

传统的搜索(什么时候搜索也变成传统的媒体广告形式了?我下意识就这么想了),而信息流已然成为时下主流,当然还有时下热门的直播和带货,今天主要跟大家分享的,就是对搜索和信息流的理解,虽然头条之前公布过头条信息流算法,但是原文看的实在头疼,连我这个10多年搜索从业人员都看着费劲,我觉得今天有必要把它说的通俗易懂一些。
 

1、搜索并不落后于信息流的技术


搜索的起源就不多说了,发扬光大应该是从老美的Google和中国的BAIDU开启的——虽然搜索时代还没结束,但是信息流的出现已然是搜索走向下坡路的开始。
 

为什么我会在文章开头强调搜索的技术,并不落后于信息流,有以下几个因素决定的
 

(1) 时代不同,机器处理效率和算法机制不同,所以技术本身只是当下最好的一种解决方案,无所谓谁先进谁落后。

(2)信息流算法,某种程度上是搜索技术的升华和迭代,甚至可以说信息流的算法是借鉴了前者的优点并且更简单和直接的处理海量信息,我在这里可以称之为更为简捷而又智能的搜索技术(搜索的动作不再是人,而是机器代替人进行搜索,用户端的手机触屏行为替代了早期搜索端的搜索关键词)

(3)搜索算法目前为止大家公认的最少有200多种,而信息流算法暂时还未有官方公布过,目前看来都是基于一些主流平台的说法来理解信息流算法。而且,原来搜索算法是经历了20多年的沉淀和积累,而信息流媒体里的算法,大多数是从早起从事搜索引擎的这些技术人群里转型做信息流的,应该说还处于摸索实践阶段,真要比谁更先进或者成熟,我估计还是搜索算法更成熟一些。
 

2、搜索和信息流的算法对比来看更清晰明了


既然说起两者,应该还是要一个对比图来解读两者区别和联系,可能这是圈内第一张关于搜索和信息流算法对比对图了,简单的一塌煳涂但贵在一目了然。

以下是通俗的总结了两者区别

搜索算法与信息流推荐算法区别


接下来就展开聊聊主要的几个区别,也算是捋一捋目前的现状。


(1)搜索算法的基石,是爬虫抓取 ,信息流的算法基石是内容推荐
 

下图是通用爬虫架构,搜索引擎内容皆是通过基础爬虫年复一年的抓取才获得如今海量内容的(只有你有入口,爬虫就能爬到,原理上是如此)

通用爬虫结构

图来源:简书作者-努力拼搏的80后
 

下图对应的应该是头条为代表的信息流内容推荐了,引用今日头条曹欢欢的一张图,用来说明目前主流的内容推荐算法
 

典型推荐算法


从基础构架上来说,搜索算法是从全互联网在内的域名网站出发,去抓取有价值的内容,具有相对滞后的特性(所以搜索结果里经常有快照这么一个专业名词,就是因为时间节点),而信息流算法是生态内容的实时推荐,两者比起来当然后者更具备实时性,变化更快,反应更迅速。
 

(2)搜索强调关键词检索和匹配,而信息流更注重人的行为习惯和召回
 

搜索引擎我们都明白,你必须输入一个关键词,才能获得你想要的内容,这是基本前提,也就是搜索引擎索引排序的数据库排名展现内容,而信息流是把这个过程变得更个性化了,它先入为主的把人的行为,习惯和爱好打上了一个个标签,其实这些个标签也就是传统意义上的关键词,但是你不用搜,信息流也会给你默认你是具备这些标签属性的,而且会随着时间地点和行为变化而不断变化。所以,搜索的关键词匹配相对固定,变化较小,而信息流的推荐是随时变换的。
 

并且,搜索引擎是没有召回系统的,比如用户在搜索关键词后点击以及阅读内容,你下次再检索,或者隔几天检索都可能是同样的结果排序(一周1-2更新,1个月一次大更新是搜索引擎的基本更新规则),而信息流是存在召回系统的,信息流会通过用户对已经阅读的内容进行召回分析,并且给予新的内容给到用户,如此循环往复,直到更佳精准,应该说信息流算法既能满足你新鲜感,又能给你熟悉的相似内容,所以大家刷的不亦乐乎~~~

(再上一张召回策略架构图)

召回策略架构图


(3)搜索索引的是互联网的海量网站内容,信息流索引是靠用户行为日志
 

这是搜索引擎和信息流最大的区别,有些人可能会说信息流也是从互联网获得的内容,你这么说不是忽略了内容来源吗?其实,真的要区别两者,大家还真的必须要扭转观念,搜索引擎依赖的不是自身的内容,而信息流却实实在在需要索引用户的行为和习惯才能给到信息流最有价值的内容,这也是信息流为什么能够吸引更多用户使用并且持续长时间使用的最强武器。
 

形象点来描述:搜索引擎是帮你找东西,然后放在巨大的仓库里,你要学会自己去寻找,而信息流是通过分析你的行为得出你要的东西,从而推送给你,前者需要很大的时间成本形成用户搜索习惯的,而后者更多的是通过机器学习实现智能推送,让用户更加省心省力(感觉会让人越变越懒,越变越笨,因为不动脑子了,刷-刷-刷),所以信息流的算法,更注重的是通过机器学习来分析用户最后不断通过召回系统来刷新推送内容,并且可以做到真正的千人千面,当然搜索算法也能做到千人千面但是相对来说就简单很多,内容丰富度也相差甚远。
 

3、搜索和信息流现在是交叉工作的
 

也许你觉得我今天打算聊的是两者区别,可现状不允许啊,今天得跟大家伙谈谈搜索跟信息流是怎么一起工作的。

众所周知,百度有搜索,有信息流,头条有搜索有信息流,总之其他家也都有。

甚至,搜索和信息流,在某种程度上是傻傻分不清的状态,先给大家回顾一下目前的界面。

下图,绿色框部分是搜索,剩下的全部是信息流了······(你告诉我百度是搜索?)
 

百度移动版主界面


所以,现在的状况就很尴尬,百度在拼命强化信息流,而头条今年在3月份就紧锣密鼓的再做搜索,从最近跟同行交流的情况来看,头条的搜索已经做的有模有样,至少从SEM和SEO两个维度去看,已经可以尝试去投放了,嗯,再强调下是头条的SEM和头条的SEO,不多啰嗦,先截个图在头条搜『1more』,(最近吴青峰比较火,他代言的耳机1more)
 

目前,很多站外的官网结果,都能展现了(如果你们家头条还没有你家官网的话,嗯,你懂的,可以来撩我了)简单点总结10个大类搜索结果来源
 

1 官方网站收录

2 SEM广告结果

3 苏宁是个大主顾,好多结果都是苏宁SEM

4 百科来自互动百科

5 微头条

6 小视频

7 头条号

8 其他站外(头条系之外的网站和平台)

9 悟空问答

10官方热线或者其他的
 

那么问题来了,百度也是搜索和信息流,头条也是信息流+搜索,你用的最多的是哪个?我自己先回答,头条是生活中用的多一些,百度是工作中用的多一些,你们呢?
 

言归正传哈,搜索跟信息流本质上,是两个维度的展示结果,从我们用户角度理解就是一个主动,一个被动,因为人都有惰性,所以更多无聊的时候,我们都在刷头条?但是我们也有很多时候是需要主动找东西的,这也是为什么头条要做搜索的原因罢(微信也做搜索,道理应该是一样的,推送算法还是连蒙带猜的毕竟,你说真的有多个性化来满足你,我看目前的技术还是够呛的)
 

所以,搜索跟信息流必须要一起工作,互相配合,用户切换起来无缝,嗯,舒服了······其实对于普通用户来说,你只要会两个动作,就已经是被百度和头条给套住了:第一,会用关键词搜索,第二,会手机刷屏!
 

4、搜索和信息流的小结


搜索虽然是熟悉的媒体,但是新媒体里的搜索,却是目前搜索领域里的新鲜玩意,而基本上目前主流的头条,微信,抖音等都慢慢变成了具备信息流和搜索双重属性的APP,怎么能结合内容做好信息流里的搜索好像在未来很长一段时间内,都是个颇具挑战的工作,我们一起期待。

阅读过本文的朋友还看了