您可以硬編碼(hardcode)一個樣例(sample)url，設(shè)置多個條件來測試回調(diào)函數(shù)處理 repsponse 的結(jié)果，來測試 spider 的回調(diào)函數(shù)。每個 contract 包含在文檔字符串(docstring)里，以@開頭。查看下面的例子：

def parse(self, response):
    """ This function parses a sample response. Some contracts are mingled
    with this docstring.

    @url http://www.amazon.com/s?field-keywords=selfish+gene
    @returns items 1 16
    @returns requests 0 0
    @scrapes Title Author Year Price
    """

該回調(diào)函數(shù)使用了三個內(nèi)置的 contract 來測試：

class scrapy.contracts.default.UrlContract

該 constract(@url)設(shè)置了用于檢查 spider 的其他 constract 狀態(tài)的樣例 url。該 contract 是必須的，所有缺失該 contract 的回調(diào)函數(shù)在測試時將會被忽略：

@url url

class scrapy.contracts.default.ReturnsContract

該 contract(@returns)設(shè)置 spider 返回的 items 和 requests 的上界和下界。上界是可選的：

@returns item(s)|request(s) [min [max]]

class scrapy.contracts.default.ScrapesContract

該 contract(@scrapes)檢查回調(diào)函數(shù)返回的所有 item 是否有特定的 fields：

@scrapes field_1 field_2 ...

使用 check 命令來運行 contract 檢查。

自定義 Contracts

如果您想要比內(nèi)置 scrapy contract 更為強大的功能，可以在您的項目里創(chuàng)建并設(shè)置您自己的 contract，并使用 SPIDER_CONTRACTS 設(shè)置來加載：

SPIDER_CONTRACTS = {
    'myproject.contracts.ResponseCheck': 10,
    'myproject.contracts.ItemValidate': 10,
}

每個 contract 必須繼承 scrapy.contracts.Contract 并覆蓋下列三個方法：

class scrapy.contracts.Contract(method, *args)

參數(shù)：

method (function) – contract 所關(guān)聯(lián)的回調(diào)函數(shù)
args (list) – 傳入 docstring 的(以空格區(qū)分的)argument 列表(list)

adjust_request_args(args)

接收一個字典(dict)作為參數(shù)。該參數(shù)包含了所有 Request 對象參數(shù)的默認值。該方法必須返回相同或修改過的字典。

pre_process(response)

該函數(shù)在 sample request 接收到 response 后，傳送給回調(diào)函數(shù)前被調(diào)用，運行測試。

post_process(output)

該函數(shù)處理回調(diào)函數(shù)的輸出。迭代器(Iterators)在傳輸給該函數(shù)前會被列表化(listified)。

該樣例 contract 在 response 接收時檢查了是否有自定義 header。在失敗時 Raise scrapy.exceptions.ContractFaild 來展現(xiàn)錯誤：

from scrapy.contracts import Contract
from scrapy.exceptions import ContractFail

class HasHeaderContract(Contract):
    """ Demo contract which checks the presence of a custom header
        @has_header X-CustomHeader
    """

    name = 'has_header'

    def pre_process(self, response):
        for header in self.args:
            if header not in response.headers:
                raise ContractFail('X-CustomHeader not present')

上一篇：Item Pipeline下一篇：實踐經(jīng)驗(Common Practices)

在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

Spiders Contracts