为什么要提交收录

Github上搭建的博客是无法被搜索引擎爬取到的。所以为了让博客被搜索引擎检索到,我们需要手动将博客提交给搜索引擎。如果你的博客是部署在GitHub上,那么你是无法被百度收录的,只能被谷歌收录因为 GitHub 禁止了百度爬虫。(挖个坑,下次补一篇如何用阿里云服务器部署hexo博客的教程)

查看自己博客有没有被搜索引擎收录可以在对应的搜索引擎中搜索 site:your_website 来确认

提交百度收录

验证网站

进入百度搜索资源平台添加网站,之后会要求验证网站所有权,有两种验证方式:文件验证和HTML验证,目前不允许使用CNAME验证了。文件验证比较方便,把文件放到主题的source目录下部署上去等一会儿就能完成验证,例如./themes/butterfly/source

提交收录

百度提供了三种提交收录的方式

API提交(主动提交)

  1. 安装npm install hexo-baidu-url-submit --save插件,然后在_config.yml中添加以下配置:

    1
    2
    3
    4
    5
    baidu_url_submit:
    count: 1 # 提交最新的多少个链接
    host: southwind.tech # 与百度搜索资源平台验证的域名一致
    token: xxx # 秘钥
    path: baidu_urls.txt # 记录新提交链接的位置
  1. _config.yml中的url修改为与平台上验证的一致,默认为xxx.github.io

  2. 在Deploy中添加一个任务

    1
    2
    3
    4
    5
    6
    7
    8
    9
    # Deployment
    ## Docs: https://hexo.io/docs/one-command-deployment
    deploy:
    - type: git
    repo:
    - git@southwind.tech:/var/repo/hexo.git # 阿里云部署
    # - https://github.com/SouthWind6510/SouthWind6510.github.io
    branch: master
    - type: baidu_url_submitter # 新增的
  3. 之后在执行hexo d时,就会主动推送到百度搜索资源平台了。

sitemap提交

  1. 首先需要安装npm install hexo-generator-sitemap --save插件,用于生成sitemap
  2. 使用hexo g -d命令生成并部署博客,就能通过域名/sitemap.xml看到生成的sitemap了
  3. 将sitemap的地址提交到百度搜索资源平台即可,之后网站有更新时,可以点击手动更新文件更新sitemap

手动提交

直接把需要收录的url复制到平台上,这种方案效率比较低,仅适用于url较少的情况。

提交谷歌收录

验证网站

进入Google Search Console验证网站,推荐使用第一种网域验证

将TXT记录添加到DNS域名解析中

sitemap提交

复用上面百度收录时生成的sitemap即可