先了解下什么是搜狗知立方?
为了让用户获取信息更简单,搜狗搜索发布全新的知识库搜索引擎--“知立方”,这是国内搜索引擎行业中首家知识库搜索产品。
知立方通过整合海量的互联网碎片化信息,对搜索结果进行重新优化计算,将最核心的信息展现给用户。而这就需要区别于传统的“关键词搜索”,不是单纯的抓取网页数据,而是引入“语义理解”技术,试图理解用户的搜索意图,才能将搜索结果准确地传递给用户。
今天我先给大家带来对搜狗搜索引擎右侧推荐网站的算法探索。希望能够抛砖引玉,共同探索了解搜索引擎引入知识图谱的算法。
经过小编仔细的观察发现影响搜索引擎右侧推荐网站的因素有如下几个:
①内容相关性(用户搜索习惯)
②网站关联性(搜狗百科)
③网站重要度(搜狗评级)
那下面就以我们熟悉的“威客”行业来举例说明。如下图所示,在搜狗搜索“威客网”,右边出现推荐的网站。
现在我们就以下面4个网站来举例说明是否符合我们上诉因素。
猪八戒威客网,三打哈网,微推推以及全球设计网。
①内容相关性(用户搜索习惯),这点只要看下网站就能了解确实都是威客类型的网站。
②网站关联性(搜狗百科),4个网站的搜狗百科内容里面分别都有威客网性质的介绍,调取了搜狗百科的大数据。
“猪八戒威客网”搜狗百科含有威客字样
“微推推”搜狗百科含有威客字样
③网站重要度(搜狗评级),4个网站的搜狗评级都在4以上,且按照搜狗评级大小顺序排列。是巧合还是必然呢?
更有意思的一点是,很有一些网站已经访问不了或者改版了!但是还依然出现在推荐栏里面。不得不说搜狗知立方算法bug还是挺多的。
最后,给大家分享一个关于知识图谱研究的讲座资料《第一届全国中文知识图谱研讨会的学习笔记》(附百度网盘下载链接)。
评论留言