如何从一头雾水的运行中获取统计数据?

阿尼什

我正在按照外部文件中的示例从外部文件运行爬行蜘蛛。我想抓取Core API提供的统计信息,并在抓取完成后将其存储到mysql表中。

from twisted.internet import reactor
from scrapy.crawler import Crawler
from scrapy import log, signals
from test.spiders.myspider import *
from scrapy.utils.project import get_project_settings
from test.pipelines import MySQLStorePipeline
import datetime

spider = MySpider()


def run_spider(spider):        
    settings = get_project_settings()
    crawler = Crawler(settings)
    crawler.signals.connect(reactor.stop, signal=signals.spider_closed)
    crawler.configure()
    crawler.crawl(spider)
    crawler.start()
    log.start()
    reactor.run()
    mysql_insert = MySQLStorePipeline()
        mysql_insert.cursor.execute(
            'insert into crawler_stats(sites_id, start_time,end_time,page_scraped,finish_reason) 
              values(%s,%s,%s, %s,%s)',
                  (1,datetime.datetime.now(),datetime.datetime.now(),100,'test'))

    mysql_insert.conn.commit()

run_spider(spider)

如何在上面的代码中获取start_time,end_time,pages_scraped,finish_reason等统计信息的值?

ec

crawler.stats收藏家那里获取它们

stats = crawler.stats.get_stats()

示例代码(在spider_closed信号处理程序中收集统计信息):

def callback(spider, reason):
    stats = spider.crawler.stats.get_stats()  # stats is a dictionary

    # write stats to the database here

    reactor.stop()


def run_spider(spider):        
    settings = get_project_settings()
    crawler = Crawler(settings)
    crawler.signals.connect(callback, signal=signals.spider_closed)
    crawler.configure()
    crawler.crawl(spider)
    crawler.start()
    log.start()
    reactor.run()


run_spider(spider)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

mpi_recv 只接收 mpi_send 发送的数据的一半?一头雾水

来自分类Dev

从表中获取员工和经理的统计数据

来自分类Dev

PHP + Mysql - 获取过去 30 天中每一天的统计数据

来自分类Dev

从数组中给出的统计数据列表中计算一个统计数据的单独奖励值

来自分类Dev

如何从 API 或 DB(SQL) 获取上一季度(3 个月)的 TeamCity 构建统计数据?

来自分类Dev

统计数据中的流入/流出计数

来自分类Dev

Google Analytics(分析)如何获取人口统计数据(年龄/性别)

来自分类Dev

在PostgreSQL中获取给定时期的销售统计数据

来自分类Dev

获取CS:GO玩家统计数据

来自分类Dev

使用R获取足球(足球)统计数据

来自分类Dev

统计数据框中的特定数据并显示

来自分类Dev

如何在Rebol 3中解释统计数据/显示

来自分类Dev

如何在Elasticsearch中获得每学期统计数据

来自分类Dev

在熊猫中,如何计算跨组变化的统计数据

来自分类Dev

如何从棒球运动员的统计数据中得出百分比

来自分类Dev

如何将统计数据(* .sta)导入R

来自分类Dev

如何创建汇总统计数据框架?

来自分类Dev

iperf如何计算网络统计数据

来自分类Dev

如何将统计数据(* .sta)导入R

来自分类Dev

iperf如何计算网络统计数据

来自分类Dev

如何观察整个会话的游戏统计数据?

来自分类Dev

使用Sunspot在Solr中按统计数据分组

来自分类Dev

统计数据库目录中的文档

来自分类Dev

调整统计数据在ggpubr中的位置

来自分类Dev

统计数据框中的150个变量

来自分类Dev

熊猫的groupby统计数据中的NaN值

来自分类Dev

从表创建统计数据

来自分类Dev

令人毛骨悚然的统计数据

来自分类Dev

gnuplot多列的统计数据

Related 相关文章

热门标签

归档