找回密码
 会员注册
查看: 23|回复: 0

pythonpython中的任务调度神器APScheduler详细用法攻略,企业应用实战分享

[复制链接]

2万

主题

0

回帖

7万

积分

超级版主

积分
72943
发表于 2024-9-5 11:55:16 | 显示全部楼层 |阅读模式
✨✨欢迎大家来到景天科技苑✨✨🎈🎈养成好习惯,先赞后看哦~🎈🎈🏆作者简介:景天科技苑🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。🏆《博客》:Python全栈,PyQt5和Tkinter桌面开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi,flask等框架,云原生K8S,linux,shell脚本等实操经验,网站搭建,数据库等分享。所属的专栏:python综合应用,基础语法到高阶实战教学景天的主页:景天科技苑文章目录Python中APScheduler的详细用法教程引言安装APScheduler基本用法创建调度器示例:使用BlockingScheduler示例:使用BackgroundScheduler进阶功能触发器(Trigger)DateTriggerCronTrigger任务存储(JobStores)执行器(Executors)线程池执行器(ThreadPoolExecutor)异常处理实战案例:定时发送邮件日志记录任务监听器任务持久化并发和性能总结Python中APScheduler的详细用法教程引言在Python中,实现定时任务调度是一个常见的需求,比如定时发送邮件、定时备份数据、定时抓取数据等。虽然Python内置了如sleep(),threading.Timer,sched等方法来实现定时任务,但这些方法往往存在资源占用高、功能有限等问题。因此,APScheduler(AdvancedPythonScheduler)应运而生,成为了一个轻量级且功能强大的Python定时任务调度框架。本文将结合实际案例,详细介绍APScheduler的安装、基本用法、进阶功能以及异常处理。安装APScheduler首先,你需要通过pip安装APScheduler。打开你的命令行工具,输入以下命令:pipinstallapscheduler1安装完成后,你就可以在Python项目中引入并使用APScheduler了。基本用法创建调度器APScheduler提供了多种调度器,以满足不同的需求。以下是几种常用的调度器:BlockingScheduler:在主线程中运行,会阻塞当前线程。BackgroundScheduler:在后台线程中运行,不会阻塞当前线程。AsyncIOScheduler:适用于使用了asyncio模块的应用程序。GeventScheduler:适用于使用gevent模块的应用程序。TwistedScheduler:适用于构建Twisted的应用程序。QtScheduler:适用于构建Qt的应用程序。TornadoScheduler:适用于构建Tornado的应用程序。在本教程中,我们将主要使用BlockingScheduler和BackgroundScheduler来演示基本用法。示例:使用BlockingScheduler首先,我们创建一个简单的任务,并使用BlockingScheduler来调度这个任务。fromapscheduler.schedulers.blockingimportBlockingSchedulerdefjob_function():print("Hello,APScheduler!")#创建调度器scheduler=BlockingScheduler()#添加任务scheduler.add_job(job_function,'interval',seconds=3)#启动调度器scheduler.start()12345678910111213在这个例子中,我们定义了一个名为job_function的任务,它简单地打印一句话。然后,我们创建了一个BlockingScheduler调度器,并将job_function以每3秒一次的间隔添加到调度器中。最后,我们调用start()方法启动调度器,它将阻塞当前线程并持续运行,直到我们手动停止它(比如通过Ctrl+C)。示例:使用BackgroundScheduler如果你不想阻塞当前线程,可以使用BackgroundScheduler。fromapscheduler.schedulers.backgroundimportBackgroundSchedulerdefjob_function():print("Hello,APSchedulerinbackground!")#创建调度器scheduler=BackgroundScheduler()#添加任务scheduler.add_job(job_function,'interval',seconds=3)#启动调度器scheduler.start()#在这里你可以继续执行其他任务try:whileTrue:time.sleep(2)except(KeyboardInterrupt,SystemExit):#关闭调度器scheduler.shutdown()123456789101112131415161718192021在这个例子中,我们使用BackgroundScheduler创建了一个调度器,并同样将job_function以每3秒一次的间隔添加到调度器中。然而,与BlockingScheduler不同的是,BackgroundScheduler不会阻塞当前线程,因此我们可以在启动调度器后继续执行其他任务。最后,我们使用try...except块来捕获键盘中断信号,并在程序退出前关闭调度器。进阶功能触发器(Trigger)APScheduler提供了多种触发器,用于定义任务的执行时间。除了上面示例中使用的interval触发器外,还有date触发器和cron触发器。DateTriggerdate触发器允许你在特定的日期和时间只触发一次任务。fromapscheduler.schedulers.blockingimportBlockingSchedulerfromdatetimeimportdatetimedefjob_function():print("Triggeredbydate!")#创建调度器scheduler=BlockingScheduler()#添加任务,指定在2023-04-0112:00:00触发run_date=datetime(2023,4,1,12,0,0)scheduler.add_job(job_function,'date',run_date=run_date)#启动调度器scheduler.start()123456789101112131415CronTriggercron触发器允许你以类似于Linuxcrontab的格式来定义任务的执行时间。fromapscheduler.schedulers.blockingimportBlockingSchedulerdefjob_function():print("Triggeredbycron!")#创建调度器scheduler=BlockingScheduler()#添加任务,使用cron触发器#假设我们想要任务在每个工作日的上午10点触发scheduler.add_job(job_function,'cron',day_of_week='mon-fri',hour=10)#启动调度器scheduler.start()1234567891011121314在上面的cron触发器示例中,我们设置了任务在每个工作日的上午10点触发。day_of_week参数可以是数字(0-6,代表周一到周日)或字符串(‘mon’,‘tue’,‘wed’,‘thu’,‘fri’,‘sat’,‘sun’),而hour参数则设置了小时数。任务存储(JobStores)APScheduler支持将任务信息存储到各种存储后端中,以便于在程序重启后恢复调度任务。常见的任务存储有内存存储(默认)、数据库存储(如SQLAlchemy、MongoDB)等。由于内存存储不支持任务持久化,这里不展开说明。如果你需要任务持久化,可以考虑使用SQLAlchemy等存储后端。执行器(Executors)执行器负责执行调度器中的任务。APScheduler提供了多种执行器,包括线程池执行器、进程池执行器等。线程池执行器(ThreadPoolExecutor)线程池执行器使用线程池来执行任务,适用于I/O密集型任务。fromapscheduler.schedulers.blockingimportBlockingSchedulerfromapscheduler.executors.poolimportThreadPoolExecutor#配置线程池执行器executors={'default':ThreadPoolExecutor(20)}#创建调度器,并配置执行器scheduler=BlockingScheduler(executors=executors)#添加任务(略)#...#启动调度器scheduler.start()12345678910111213141516在这个例子中,我们创建了一个包含20个线程的线程池执行器,并将其配置到调度器中。异常处理当任务执行过程中发生异常时,默认情况下,APScheduler会捕获这些异常并记录到日志中。但如果你需要自定义异常处理逻辑,可以通过在任务中添加异常处理代码来实现。defjob_function():try:#假设这里有一些可能会引发异常的代码1/0#故意制造一个除零错误exceptExceptionase:print(f"Anerroroccurred:{e}")#添加任务(略)#...123456789在这个例子中,我们在job_function中添加了try...except块来捕获并处理可能发生的异常。实战案例:定时发送邮件接下来,我们将通过一个实战案例来演示如何使用APScheduler来定时发送邮件。首先,确保你已经安装了smtplib和email模块(Python标准库自带),以及APScheduler。pipinstallapscheduler#如果你还没有安装1然后,编写代码来实现定时发送邮件的功能。fromapscheduler.schedulers.backgroundimportBackgroundSchedulerfromsmtplibimportSMTP_SSLfromemail.mime.textimportMIMETextfromemail.mime.multipartimportMIMEMultipartimportosdefsend_email():#邮件发送者账号sender='your_email@example.com'#邮件接收者列表receivers=['receiver1@example.com','receiver2@example.com']#SMTP服务器smtp_server='smtp.example.com'#SMTP服务器端口,SSL一般为465smtp_port=465#发件人邮箱密码password=os.getenv('EMAIL_PASSWORD')#出于安全考虑,建议从环境变量中读取密码#创建邮件对象message=MIMEMultipart()message['From']=sendermessage['To']=','.join(receivers)message['Subject']='HelloAPSchedulerEmail'#邮件正文message.attach(MIMEText('ThisisatestemailsentbyAPScheduler.','plain'))try:#连接到SMTP服务器smtp=SMTP_SSL(smtp_server,smtp_port)smtp.login(sender,password)smtp.sendmail(sender,receivers,message.as_string())smtp.quit()print("Emailsentsuccessfully!")exceptExceptionase:print(f"Failedtosendemail:{e}")#创建调度器scheduler=BackgroundScheduler()#添加任务,每天上午10点发送邮件scheduler```python#添加任务,每天上午10点发送邮件scheduler.add_job(send_email,'cron',day_of_week='mon-fri',hour=10)#启动调度器scheduler.start()#如果你的脚本是主程序,你可能想保持程序运行以便调度器继续工作#这里使用了一个简单的循环来阻塞主线程try:#这将保持程序运行,直到你手动停止它(例如,通过Ctrl+C)whileTrue:time.sleep(2)#休眠2秒以减少CPU占用except(KeyboardInterrupt,SystemExit):#如果用户按下Ctrl+C或发送了系统退出信号,则优雅地关闭调度器scheduler.shutdown()print("Schedulershutdown!")12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758请注意,在上面的代码中,我添加了importtime来确保主线程保持活动状态,以便调度器可以继续运行。然而,在实际应用中,如果你的程序是一个长期运行的服务或后台进程,你可能不需要这个whileTrue循环。此外,我添加了对KeyboardInterrupt和SystemExit异常的捕获,以便在程序接收到中断信号时能够优雅地关闭调度器。这是处理程序退出时清理资源的一种好习惯。最后,请确保你已经将EMAIL_PASSWORD环境变量设置为你SMTP发件人账号的密码,或者你可以将密码直接硬编码在send_email函数中(尽管出于安全考虑,不推荐这样做)。现在,当你运行这个脚本时,它会启动一个后台调度器,该调度器将在每个工作日的上午10点调用send_email函数来发送邮件。请记住,这个示例假设你已经有一个可以发送邮件的SMTP服务器配置,并且你的发件人账号有权使用该SMTP服务器发送邮件。如果你使用的是Gmail等公共邮件服务,你可能需要为你的账号启用“低安全性应用”的访问权限(尽管这不是一个安全的做法),或者使用OAuth2等更安全的认证机制。然而,这些超出了本示例的范围。另外,请确保在将你的代码部署到生产环境之前,对所有的敏感信息(如密码)进行适当的保护,避免硬编码在代码中或存储在容易被访问的地方。当然,我们可以继续讨论关于APScheduler的更多高级特性和最佳实践。日志记录在生产环境中,日志记录是监控和调试任务执行的关键部分。APScheduler支持通过Python的标准日志系统来记录调度器的活动。你可以配置日志级别来捕获不同类型的日志信息,如错误、警告、信息或调试信息。importlogging#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(name)s-%(levelname)s-%(message)s')#获取调度器的日志记录器(如果需要的话)#scheduler_logger=logging.getLogger('apscheduler.scheduler')#scheduler_logger.setLevel(logging.DEBUG)#...(调度器和任务设置代码)12345678910在上面的代码中,我们配置了基本的日志记录器,将日志级别设置为INFO,并指定了日志消息的格式。如果你需要更详细的日志,可以调整日志级别或获取特定组件(如调度器)的日志记录器,并设置其级别。任务监听器APScheduler允许你添加任务监听器来监控任务的各种事件,如任务添加、移除、完成、失败等。这对于跟踪任务执行状态和执行后处理非常有用。defmy_listener(event):ifevent.exception:print(f'Thejobcrashed:{event.exception}')else:print('Thejobransuccessfully')#添加监听器scheduler.add_listener(my_listener,APSCHEDULER_EVENT_JOB_EXECUTED|APSCHEDULER_EVENT_JOB_ERROR)#注意:上面的APSCHEDULER_EVENT_JOB_EXECUTED和APSCHEDULER_EVENT_JOB_ERROR是示例中的占位符,#实际使用时,你应该使用apscheduler.events模块中定义的常量,如EVENT_JOB_EXECUTED和EVENT_JOB_ERROR。#正确的导入和使用方式fromapscheduler.eventsimportEVENT_JOB_EXECUTED,EVENT_JOB_ERROR#然后在添加监听器时使用scheduler.add_listener(my_listener,EVENT_JOB_EXECUTED|EVENT_JOB_ERROR)1234567891011121314151617任务持久化如之前提到的,如果你需要任务在程序重启后仍然有效,你可以使用支持持久化的任务存储后端。这通常涉及到将任务信息存储在数据库中。对于SQLAlchemy等数据库存储后端,你需要安装相应的库(如SQLAlchemy),并配置数据库连接。然后,你可以在创建调度器时指定使用哪个任务存储。fromapscheduler.schedulers.backgroundimportBackgroundSchedulerfromapscheduler.jobstores.sqlalchemyimportSQLAlchemyJobStorefromsqlalchemyimportcreate_engine#配置数据库连接engine=create_engine('sqlite:///jobs.sqlite',echo=True)#配置任务存储jobstores={'default':SQLAlchemyJobStore(engine)}#创建调度器,并配置任务存储scheduler=BackgroundScheduler(jobstores=jobstores)#...(添加任务和其他配置)12345678910111213141516请注意,上面的echo=True参数在create_engine中用于打印SQL语句到控制台,这在调试时很有用,但在生产环境中应该设置为False。并发和性能当你有大量的任务需要并发执行时,选择合适的执行器和调整其参数变得非常重要。线程池执行器(ThreadPoolExecutor)和进程池执行器(ProcessPoolExecutor)各有优缺点,线程池通常适用于I/O密集型任务,而进程池则更适合CPU密集型任务。此外,你可以通过调整执行器的参数(如线程数或进程数)来优化性能。然而,请注意,过多的并发可能会导致系统资源耗尽,因此你应该根据系统的实际能力和需求来设置这些参数。总结APScheduler是一个功能强大的Python任务调度库,它提供了灵活的调度选项、任务存储、执行器以及事件监听等特性。通过合理使用这些特性,你可以轻松地实现复杂的定时任务调度需求。然而,请注意,在生产环境中部署和使用时,你应该关注日志记录、任务持久化、并发和性能等方面的问题,以确保系统的稳定性和可靠性。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-12 09:58 , Processed in 0.899243 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表