其实国外蜘蛛还是不少的,
- AhrefsBot:属于Ahrefs公司,这是一家提供SEO、竞争研究和营销工具的公司。
- DotBot:属于DotBot公司,该公司专注于为网站提供搜索引擎优化服务。
- SemrushBot:属于Semrush公司,该公司是一套专业的网络营销工具集。
- Uptimebot:属于Uptime Robot公司,主要提供网站和服务器监控服务。
- MJ12bot:MJ12bot是由Matt Cutts创建的一个网络爬虫,用于测试搜索引擎优化(SEO)的效果。
- MegaIndex.ru:MegaIndex是一家俄罗斯的互联网信息提供商。
- ZoominfoBot:Zoominfo是一家提供企业信息搜索和潜在客户挖掘服务的公司。
- Mail.Ru:Mail.Ru是一家俄罗斯的网络公司,旗下拥有各种互联网产品和服务。
- SeznamBot:Seznam是捷克的一家互联网科技公司,提供各种在线服务。
- BLEXBot:BLEX是Searchblox Technologies Ltd.的一款搜索引擎优化工具。
- ExtLinksBot:ExtLinks是一款链接管理软件,帮助用户管理和增加他们网站的外部链接。
- aiHitBot:aiHit是一家提供搜索引擎营销(SEM)和网站优化服务的公司。
- Researchscan:Researchscan是一家专业的市场研究公司,为客户提供市场情报和竞争对手分析服务。
- DnyzBot:Dnyz是一家俄罗斯的搜索引擎公司。
- spbot:spbot由Semalt公司使用,Semalt是一家提供数字营销解决方案的公司。
- ImageSiftBot是ImageSift网络智能产品套件的一部分,它是一个专门在互联网上抓取并获取公开图像的网络爬虫。
其实这些爬虫对国内站长来说基本没什么用,可以直接禁止。下面是禁止代码,直接放到网站robots.txt文件就行,一般的爬虫都能遵守爬虫协议。
HTML
User-agent: AhrefsBot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: Uptimebot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: MegaIndex.ru
Disallow: /
User-agent: ZoominfoBot
Disallow: /
User-agent: Mail.Ru
Disallow: /
User-agent: SeznamBot
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: ExtLinksBot
Disallow: /
User-agent: aiHitBot
Disallow: /
User-agent: Researchscan
Disallow: /
User-agent: DnyzBot
Disallow: /
User-agent: spbot
Disallow: /
User-agent: ImagesiftBot
Disallow: /