首页 > 搜索 > 一、搜索引擎简介和原理
2020
05-22

一、搜索引擎简介和原理

现在搜索引擎可以说是五花八门了,各种功能都有,目前国内市场份额比较大的有百度、搜狗、360、神马搜索……搜索引擎可以说是目前互联网流量分发入口最大的之一,尤其是现在人们想在网上找资源必备神器。


目前来说搜索引擎分为两种:

一、综合类搜索引擎——>优点:搜索到内容多、范围广、速度快,缺点:内容杂需要自己判断是否为自己所需要的、广告多(虚假信息也很多)

搜索引擎简介和原理1

二、垂直类搜索引擎——>优点:能直接找到最专业的内容、专业的资源、内容真实度很高;缺点:速度慢、首先要自己能找到专业的搜索引擎、有可能收费、内容不全面。

搜索引擎简介和原理2

下面来说说搜索引擎的原理:

爬虫——>内容清洗——>存入数据库——>索引(现在都是智能索引了)

不说技术实现,首先搜索引擎先要采集互联网上的一些数据内容等等(这个就是爬虫以后有机会会特别写文章说明的);然后把采集到的内容进行分析(进行关键词提取、长尾词提取、内容相关性分析、可读性行分析、去重分析),内容分析是很重要的一个环节这个环节确定了网站网页会不会被收录,收录的质量等;然后进行存取如数据库(具体的怎么优化存入就是不是我等可以理解得了);通过一系列算法进行索引,比如我们输入“床前明月光,疑是地上霜”,搜索引擎会根据相关性进行索引排序……

手机扫描二维码访问

作者:小蚂蚁
小蚂蚁

本文》有 0 条评论

留下一个回复