爬虫的叫法
爬虫有很多种常见的叫法,整理如下:
爬虫- 常见英文说法:
crawler=爬取数据的工具crawl英文原意:爬,爬行
spider=蜘蛛=像蜘蛛捕获昆虫一样你去捕获你要的数据spider英文原意:蜘蛛- 为何把爬取数据的工具叫做蜘蛛,见后续的类比解释:为何叫爬虫
scraper=刮取到你想要的数据的工具scrape英文原意:刮取
grab=抓取你要的数据的工具grab英文原意:攫取,夺取
- 常见英文说法:
爬取数据- 常见英文说法:
crawl data=crawling datascraping datagrabbing data
- 常见英文说法:
爬取网站=爬取网页- 常见英文说法:
crawl website
- 常见英文说法:
模拟登录- 常见英文说法:
emulate loginlogin emulation
- 为何(把爬虫)叫做模拟登录?
- 简答:
- 爬虫在需要用户登录的场景中应用时的叫法
- 详解:
- 对于一些情况:想要爬取很多网站上的数据,需要用户(使用账号和密码等方式)去登录后才能获取到
- 所以要先去
模拟(用户)登录,然后才能爬取数据 - 而模拟登录的过程,有时候或者经常,比后续的爬取数据更难,更复杂
- 所以此时的爬取全称是
先要模拟用户登录后再去爬取数据 - 也就常简称为
模拟登陆- 用
模拟登陆指代爬虫
- 用
- 简答:
- 常见英文说法: