前言

在搭建的个人博客时,若想让其他朋友检索到我们的博文,就需要将网站推送到搜索引擎,即设置对应网站收录博客,以下是详细的操作步骤:
内容参考:

欢迎阅读第6篇博客,希望你有所收获!


查看博客是否被收录

使用想要查找的搜索引擎 (BaiduBingGoogle等),输入:

site:你的网站
比如我的:site:www.93cloud.online

永久化 URL 网址链接

在点击博客文章时,我们可以发现Hexo 默认生成的文章地址路径是 [网站名称/年/月/日/文章名称]

但这些链接对搜索爬虫名不友好,其Url结构超过三层,因此我们要对其进行调整

  1. 安装abbrlink插件:
npm install hexo-abbrlink --save

安装此插件的目的是将文章的链接转化为数字和字母,即将博客的网页转化成.html永久链接的格式,这样有利于搜索引擎的收录

  1. 修改hexo根目录下的_config.yml中的permalink值:
# URL
## Set your site url here. For example, if you use GitHub Page, set url as 'https://username.github.io/project'
url: https://www.93cloud.online/
permalink: posts/:abbrlink.html

然后在_config.yml最后添加abbrlink config

# abbrlink config
abbrlink:
alg: crc32 # support crc16(default) and crc32
rep: hex # support dec(default) and hex
# 不用添加其它代码
  1. 配置完成后,网站的链接应该类似于这样:
https://www.93cloud.online/posts/b5cbad33.html     # 有.html后缀

站点地图

站点地图即 sitemap,是一个页面,上面放置了网站上需要搜索引擎抓取的所有页面的链接。站点地图可以告诉搜索引擎网站上有哪些可供抓取的网页,以便搜索引擎可以更加智能地抓取网站。所以我们首先需要生成一个站点地图

  1. 安装百度和 Google 的站点地图生成插件
npm install hexo-generator-baidu-sitemap --save
npm install hexo-generator-sitemap --save
  1. 之后来到 hexo 根目录配置文件 config.yml,在下面添加:
# 站点地图
sitemap:
path: sitemap.xml
baidusitemap:
path: baidusitemap.xml
  1. 然后重新推送服务器,访问如下URL:
https://域名/sitemap.xml        
https://域名/baidusitemap.xml

看看有没有出现代码,有的话就成功

  1. 给你的 hexo 网站添加蜘蛛协议 robots.txt, 把 robots.txt 放在你的 hexo 站点的 source 文件下即可
# hexo robots.txt
User-agent: *
Allow: /

Sitemap: https://www.93cloud.online/sitemap.xml
Sitemap: https://www.93cloud.online/baidusitemap.xml

百度收录

通过百度站长平台进行链接提交,增加网站的索引量。先去注册并登录:百度站长平台
图1
图2
然后需要验证网站,我选择的是 https://,这根据你前面是否添加 SSL 证书来选择。之后选择站点属性,确认后进入第三步,我使用的 HTML 标签验证。你也可以选择自己喜欢的方式
图3
content 中的字符串复制到主题配置文件 _config.butterfly.yml 中的 baidu_site_verification

# Verification (站长验证)
# --------------------------------------

site_verification:
# - name: google-site-verification
# content: xxxxxx
- name: baidu-site-verification
content: # 在这里填上面的字符串

需要将网站部署完后,再去百度站长平台完成 HTML 标签验证

百度站长平台的链接提交方式分为自动提交手动提交两种

自动提交

主动推送是最为快速的提交方式,是被百度收录最快的推送方式。主动推送可以通过安装插件实现:

npm install hexo-baidu-url-submit --save

然后在 hexo 根目录配置文件 _config.yml 中,添加:

# 主动推送百度,被百度收录
baidu_url_submit:
count: 10 # 提交最新的10个链接
host: # 百度站长平台中注册的域名
token: # 秘钥,百度站长平台 > 普通收录 > 推送接口 > 接口调用地址中token字段
path: baidu_urls.txt # 文本文档的地址, 新链接会保存在此文本文档里,不用改
  • host 为自己网站的域名,例如我的为 https://www.93cloud.online
  • token 需要打开普通收录 --> 推送接口

图4

其次,记得查看 hexo 根目录中 _config.yml 文件中 url 的值, 必须包含是百度站长平台注册的域名
最后,在 _config.yml 文件中的 deploy 加入新的 type:

# Deployment
## Docs: https://hexo.io/docs/one-command-deployment
deploy:
- type: git
repository: https://github.com/ImagitionBest/ImagitionBest.github.io.git
bramch: main"
- type: baidu_url_submitter

这里是新建的 type,一定要注意代码缩进

主动推送实现原理如下:

  • 新链接生成,hexo g会产生一个文本文件,内含最新的链接
  • 新连接提交,hexo d会从上述文件中读取链接,提交至百度搜索引擎

手动提交

手动提交需要将下列代码粘贴到百度站长平台的"手动收录"地址窗口即可:

https://域名/sitemap.xml
https://域名/baidusitemap.xml

图5

谷歌收录

提交谷歌搜索引擎比较简单,在提交之前,我们依然可以使用 site:域名 查看网站是否被收录
比如我的网站收录情况:
图10

进入Google 搜索中心,登录你的谷歌账号。然后找到注册 Search Console (在 “使用入门–>SEO 新手指南” 中可以找到入口),就直接输入你要收录的网站域名就行

图6
选择第一个或者第二个都可以的,我这里选择的是第二个
图7
图8

你可以下载个 HTML 文件然后放在站点目录下的 source 中,然后推送到服务器。或者把 content 中的字符串复制到 _config.butterfly.yml 中的 google_site_verification

# Google Webmaster tools verification.
# See: https://www.google.com/webmasters
google_site_verification:

输入完浏览器会自动收录

必应收录

必应收录也是很简单,在提交之前,我们依然可以使用 site:域名 查看网站是否被收录
比如我的网站收录情况:
图11

点击必应站长。先注册登录,必应收录有两种方式,一种使用刚刚谷歌导入过去,第二种是就是自己添加 Url。我这里选择的是第一种
图9
整体来说都比较类似。然后就等着收录就好了

添加nofollow标签

给非友情链接的出站链接添加「nofollow」标签,nofollow 标签是由谷歌领头创新的一个「反垃圾链接」的标签,并被百度、yahoo 等各大搜索引擎广泛支持,引用 nofollow 标签的目的是:用于指示搜索引擎不要追踪(即抓取)网页上的带有 nofollow 属性的任何出站链接,以减少垃圾链接的分散网站权重

npm install hexo-filter-nofollow --save

再在 hexo 根目录的 _config.yml 中添加配置,将 nofollow 设置为 true

nofollow:
enable: true
field: site
exclude:
- 'exclude1.com'
- 'exclude2.com'

这样,exclude 的链接将不会被加上 nofollow 属性