- 精通Scrapy網絡爬蟲
- 劉碩
- 317字
- 2020-11-28 14:59:37
1.2 Scrapy簡介及安裝
Scrapy是一個使用Python語言(基于Twisted框架)編寫的開源網絡爬蟲框架,目前由Scrapinghub Ltd維護。Scrapy簡單易用、靈活易拓展、開發社區活躍,并且是跨平臺的。在Linux、 MaxOS以及Windows平臺都可以使用。Scrapy應用程序也使用Python進行開發,目前可以支持Python 2.7以及Python 3.4+版本。
在任意操作系統下,可以使用pip安裝Scrapy,例如:
$ pip install scrapy
為確認Scrapy已安裝成功,首先在Python中測試能否導入Scrapy模塊:
>>> import scrapy >>> scrapy.version_info (1, 3, 3)
然后,在shell中測試能否執行Scrapy這條命令:
$ scrapy Scrapy 1.3.3- no active project Usage: scrapy [options] [args] Available commands: bench Run quick benchmark test commands fetch Fetch a URL using the Scrapy downloader genspider Generate new spider using pre-defined templates runspider Run a self-contained spider (without creating a project) settings Get settings values shell Interactive scraping console startproject Create new project version Print Scrapy version view Open URL in browser, as seen by Scrapy [ more ] More commands available when run from project directory Use "scrapy -h" to see more info about a command
通過了以上兩項檢測,說明Scrapy安裝成功了。如上所示,我們安裝的是當前最新版本1.3.3。
推薦閱讀
- 算法精粹:經典計算機科學問題的Java實現
- Mastering Spring MVC 4
- 實戰Java程序設計
- ASP.NET動態網頁設計教程(第三版)
- Learning SQLite for iOS
- 精通API架構:設計、運維與演進
- MySQL數據庫管理與開發實踐教程 (清華電腦學堂)
- INSTANT Passbook App Development for iOS How-to
- Symfony2 Essentials
- AIRIOT物聯網平臺開發框架應用與實戰
- HTML 5與CSS 3權威指南(第3版·上冊)
- OpenResty完全開發指南:構建百萬級別并發的Web應用
- 區塊鏈技術進階與實戰(第2版)
- ArcGIS for Desktop Cookbook
- 算法圖解