找回密码
 会员注册
查看: 39|回复: 0

Python酷库之旅-第三方库Pandas(069)

[复制链接]

2万

主题

0

回帖

7万

积分

超级版主

积分
70610
发表于 2024-9-10 02:44:45 | 显示全部楼层 |阅读模式
目录一、用法精讲276、pandas.Series.dt.is_quarter_start属性276-1、语法276-2、参数276-3、功能276-4、返回值276-5、说明276-6、用法276-6-1、数据准备276-6-2、代码示例276-6-3、结果输出277、pandas.Series.dt.is_quarter_end属性277-1、语法277-2、参数277-3、功能277-4、返回值277-5、说明277-6、用法277-6-1、数据准备277-6-2、代码示例277-6-3、结果输出278、pandas.Series.dt.is_year_start属性278-1、语法278-2、参数278-3、功能278-4、返回值278-5、说明278-6、用法278-6-1、数据准备278-6-2、代码示例278-6-3、结果输出279、pandas.Series.dt.is_year_end属性279-1、语法279-2、参数279-3、功能279-4、返回值279-5、说明279-6、用法279-6-1、数据准备279-6-2、代码示例279-6-3、结果输出280、pandas.Series.dt.is_leap_year属性280-1、语法280-2、参数280-3、功能280-4、返回值280-5、说明280-6、用法280-6-1、数据准备280-6-2、代码示例280-6-3、结果输出二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页一、用法精讲276、pandas.Series.dt.is_quarter_start属性276-1、语法#276、pandas.Series.dt.is_quarter_start属性pandas.Series.dt.is_quarter_startIndicatorforwhetherthedateisthefirstdayofaquarter.Returns:is_quarter_startSeriesorDatetimeIndexThesametypeastheoriginaldatawithbooleanvalues.Serieswillhavethesamenameandindex.DatetimeIndexwillhavethesamename.276-2、参数    无276-3、功能        用于检查日期时间索引是否是季度开始的属性,这在处理时间序列数据时非常有用。276-4、返回值        返回一个布尔值的序列,指示时间序列中的每个日期是否为季度开始。276-5、说明    使用场景:276-5-1、财务报表分析:在财务分析中,公司通常会根据季度进行报告。这使得识别每个季度的起始日期变得非常重要,以便分析每个季度的表现。例如,通过标记季度的开始,分析师可以轻松地比较不同季度的财务数据,例如收入、支出和利润。276-5-2、销售数据分析:销售数据往往具有季节性特点,季度开始可能意味着新的销售周期的开始。例如,分析销售趋势时,识别季度开始以判断季度销售策略的有效性。276-5-3、经济数据分析:经济数据如GDP、失业率等通常按季度发布,因此在分析时需要识别和提取季度起始数据。例如,比较不同季度的经济指标以评估经济增长或衰退的情况。276-5-4、项目管理:在项目管理中,特别是涉及跨季度的项目时,识别季度开始可以帮助项目经理更好地计划和分配资源。例如,根据季度开始调整项目资源和预算。276-5-5、投资组合分析:在投资领域,许多投资策略和分析都是基于季度进行的,识别季度开始有助于进行投资组合的分析和调整。例如,在季度开始时进行投资组合的再平衡以优化收益。276-6、用法276-6-1、数据准备无276-6-2、代码示例#276、pandas.Series.dt.is_quarter_start属性#276-1、财务报表分析importpandasaspd#示例数据:公司每月的收入date_range=pd.date_range(start='2023-01-01',periods=12,freq='MS')revenue=[10000,12000,11000,15000,14000,13000,16000,17000,16500,18000,17500,19000]df=pd.DataFrame({'date':date_range,'revenue':revenue})df.set_index('date',inplace=True)#标记季度开始df['is_quarter_start']=df.index.to_series().dt.is_quarter_start#过滤出季度开始的数据quarterly_revenue=df[df['is_quarter_start']]print(quarterly_revenue,end='\n\n')#276-2、销售数据分析importpandasaspd#示例数据:每月销售量date_range=pd.date_range(start='2023-01-01',periods=12,freq='MS')sales=[500,600,550,700,650,620,750,770,760,800,790,810]df=pd.DataFrame({'date':date_range,'sales':sales})df.set_index('date',inplace=True)#标记季度开始df['is_quarter_start']=df.index.to_series().dt.is_quarter_start#筛选季度开始的销售数据quarterly_sales=df[df['is_quarter_start']]print(quarterly_sales,end='\n\n')#276-3、经济数据分析importpandasaspd#示例数据:每月GDP增长率date_range=pd.date_range(start='2023-01-01',periods=12,freq='MS')gdp_growth=[0.3,0.4,0.2,0.5,0.4,0.35,0.45,0.5,0.48,0.55,0.52,0.6]df=pd.DataFrame({'date':date_range,'gdp_growth':gdp_growth})df.set_index('date',inplace=True)#标记季度开始df['is_quarter_start']=df.index.to_series().dt.is_quarter_start#筛选季度开始的数据quarterly_gdp_growth=df[df['is_quarter_start']]print(quarterly_gdp_growth,end='\n\n')#276-4、项目管理importpandasaspd#示例数据:项目进度(每月完成的任务数量)date_range=pd.date_range(start='2023-01-01',periods=12,freq='MS')tasks_completed=[10,15,12,18,16,14,20,22,21,25,23,27]df=pd.DataFrame({'date':date_range,'tasks_completed':tasks_completed})df.set_index('date',inplace=True)#标记季度开始df['is_quarter_start']=df.index.to_series().dt.is_quarter_start#筛选季度开始的项目数据quarterly_tasks=df[df['is_quarter_start']]print(quarterly_tasks,end='\n\n')#276-5、投资组合分析importpandasaspd#示例数据:每月投资组合收益率date_range=pd.date_range(start='2023-01-01',periods=12,freq='MS')returns=[0.02,0.03,0.025,0.04,0.035,0.03,0.045,0.05,0.048,0.055,0.052,0.06]df=pd.DataFrame({'date':date_range,'returns':returns})df.set_index('date',inplace=True)#标记季度开始df['is_quarter_start']=df.index.to_series().dt.is_quarter_start#筛选季度开始的投资收益率数据quarterly_returns=df[df['is_quarter_start']]print(quarterly_returns)276-6-3、结果输出#276、pandas.Series.dt.is_quarter_start属性#276-1、财务报表分析#revenueis_quarter_start#date#2023-01-0110000True#2023-04-0115000True#2023-07-0116000True#2023-10-0118000True#276-2、销售数据分析#salesis_quarter_start#date#2023-01-01500True#2023-04-01700True#2023-07-01750True#2023-10-01800True#276-3、经济数据分析#gdp_growthis_quarter_start#date#2023-01-010.30True#2023-04-010.50True#2023-07-010.45True#2023-10-010.55True#276-4、项目管理#tasks_completedis_quarter_start#date#2023-01-0110True#2023-04-0118True#2023-07-0120True#2023-10-0125True#276-5、投资组合分析#returnsis_quarter_start#date#2023-01-010.020True#2023-04-010.040True#2023-07-010.045True#2023-10-010.055True277、pandas.Series.dt.is_quarter_end属性277-1、语法#277、pandas.Series.dt.is_quarter_end属性pandas.Series.dt.is_quarter_endIndicatorforwhetherthedateisthelastdayofaquarter.Returns:is_quarter_endSeriesorDatetimeIndexThesametypeastheoriginaldatawithbooleanvalues.Serieswillhavethesamenameandindex.DatetimeIndexwillhavethesamename.277-2、参数    无277-3、功能        用于检查日期时间对象是否落在季度的最后一天。277-4、返回值        返回一个布尔型的pandas.Series对象,其中每个元素是一个布尔值,如果该日期是季度的最后一天,则返回True;否则,返回False。277-5、说明    使用场景:277-5-1、财务报告:在财务数据处理中,季度末通常是报告的关键日期,使用该属性可以帮助确定每个季度的结束日期,以便生成季度财务报告、进行季度结算和审计。277-5-2、季度分析:分析季度销售额、季度利润或季度业绩时,需要知道哪些日期属于季度末,这样可以方便地将数据按季度进行分组和比较。277-5-3、时间序列分析:在时间序列分析中,确定数据的季度末点对于预测和模型验证很重要,可以利用该属性识别和标记这些关键日期,以进行特殊处理或建模。277-5-4、投资组合管理:在投资领域,季度末通常是重新平衡投资组合、计算回报率和评估绩效的时间点,通过识别季度末日期,可以进行相关的投资操作和分析。277-5-5、预算和计划:企业和组织通常以季度为单位制定预算和计划,使用该属性可以帮助确定预算周期的结束日期,以便进行预算跟踪和调整。277-5-6、数据可视化:在数据可视化中,可以利用季度末标记突出显示关键时间点。例如,在时间序列图中,可以将季度末用不同颜色或标记表示,以便更直观地展示数据的季度变化。277-6、用法277-6-1、数据准备无277-6-2、代码示例#277、pandas.Series.dt.is_quarter_end属性#277-1、财务报告importpandasaspd#生成示例财务数据date_range=pd.date_range(start='2022-01-01',end='2023-12-31',freq='ME')revenue=[100,150,120,130,180,170,160,140,200,190,210,220]*2df=pd.DataFrame({'date':date_range,'revenue':revenue})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#筛选出季度末的数据quarter_end_report=df[df['is_quarter_end']]print(quarter_end_report,end='\n\n')#277-2、季度分析importpandasaspdimportnumpyasnp#生成示例销售数据date_range=pd.date_range(start='2023-01-01',end='2023-12-31',freq='D')sales=np.random.randint(50,200,len(date_range))df=pd.DataFrame({'date':date_range,'sales':sales})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#计算季度总销售额quarterly_sales=df[df['is_quarter_end']].resample('QE').sum()print(quarterly_sales,end='\n\n')#277-3、时间序列分析importpandasaspdimportnumpyasnp#生成示例时间序列数据date_range=pd.date_range(start='2023-01-01',end='2023-12-31',freq='D')values=np.random.randn(len(date_range))df=pd.DataFrame({'date':date_range,'value':values})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#识别并标记季度末点df['quarter_end_value']=df['value'].where(df['is_quarter_end'])print(df,end='\n\n')#277-4、投资组合管理importpandasaspdimportnumpyasnp#生成示例投资组合数据date_range=pd.date_range(start='2022-01-01',end='2023-12-31',freq='B')portfolio_value=np.cumsum(np.random.randn(len(date_range)))+1000df=pd.DataFrame({'date':date_range,'portfolio_value':portfolio_value})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#筛选出季度末的投资组合价值quarter_end_portfolio=df[df['is_quarter_end']]print(quarter_end_portfolio,end='\n\n')#277-5、预算和计划importpandasaspd#生成示例预算数据date_range=pd.date_range(start='2023-01-01',end='2023-12-31',freq='ME')budget=[10000,12000,11000,11500,13000,12500,14000,13500,14500,15000,15500,16000]df=pd.DataFrame({'date':date_range,'budget':budget})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#筛选出季度末的预算数据quarter_end_budget=df[df['is_quarter_end']]print(quarter_end_budget,end='\n\n')#277-6、数据可视化importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#生成示例数据date_range=pd.date_range(start='2023-01-01',end='2023-12-31',freq='D')values=np.random.randn(len(date_range))df=pd.DataFrame({'date':date_range,'value':values})#设置日期为索引df.set_index('date',inplace=True)#添加季度末标记df['is_quarter_end']=df.index.to_series().dt.is_quarter_end#生成时间序列图plt.figure(figsize=(10,6))plt.plot(df.index,df['value'],label='DailyValues')plt.scatter(df[df['is_quarter_end']].index,df[df['is_quarter_end']]['value'],color='red',label='QuarterEnd',zorder=5)plt.title('DailyValueswithQuarterEndHighlights')plt.xlabel('Date')plt.ylabel('Value')plt.legend()plt.show()277-6-3、结果输出#277、pandas.Series.dt.is_quarter_end属性#277-1、财务报告#revenueis_quarter_end#date#2022-03-31120True#2022-06-30170True#2022-09-30200True#2022-12-31220True#2023-03-31120True#2023-06-30170True#2023-09-30200True#2023-12-31220True#277-2、季度分析#salesis_quarter_end#date#2023-03-311991#2023-06-301061#2023-09-301351#2023-12-311451#277-3、时间序列分析#valueis_quarter_endquarter_end_value#date#2023-01-011.134182FalseNaN#2023-01-02-0.246785FalseNaN#2023-01-03-0.924551FalseNaN#2023-01-04-0.072634FalseNaN#2023-01-051.326382FalseNaN#............#2023-12-27-0.511110FalseNaN#2023-12-28-1.399089FalseNaN#2023-12-29-0.159974FalseNaN#2023-12-300.643342FalseNaN#2023-12-310.399300True0.3993##[365rowsx3columns]#277-4、投资组合管理#portfolio_valueis_quarter_end#date#2022-03-31999.132484True#2022-06-30991.091731True#2022-09-30992.471551True#2023-03-31999.789461True#2023-06-30994.793638True#277-5、预算和计划#budgetis_quarter_end#date#2023-03-3111000True#2023-06-3012500True#2023-09-3014500True#2023-12-3116000True#277-6、数据可视化#见图1图1:278、pandas.Series.dt.is_year_start属性278-1、语法#278、pandas.Series.dt.is_year_start属性pandas.Series.dt.is_year_startIndicatewhetherthedateisthefirstdayofayear.Returns:SeriesorDatetimeIndexThesametypeastheoriginaldatawithbooleanvalues.Serieswillhavethesamenameandindex.DatetimeIndexwillhavethesamename.278-2、参数    无278-3、功能        用于检查Series中的每个时间戳是否是该年的第一天(即1月1日)。278-4、返回值        返回一个布尔类型的Series,其中每个元素表示对应时间戳是否为该年的第一天,具体来说,如果某个时间戳是1月1日,则对应的值为True,否则为False。278-5、说明        使用场景:278-5-1、筛选特定日期:在时间序列数据中,筛选出每年开始的日期。278-5-2、标记事件:标记时间序列数据中的特定日期,以便后续分析。278-5-3、数据分组:按每年的开始日期进行数据分组和聚合。278-6、用法278-6-1、数据准备无278-6-2、代码示例#278、pandas.Series.dt.is_year_start属性#278-1、筛选每年开始的日期importpandasaspd#创建包含日期的Seriesdates=pd.Series(pd.date_range('2020-01-01','2024-07-31',freq='D'))#筛选每年开始的日期year_start_dates=dates[dates.dt.is_year_start]print(year_start_dates,end='\n\n')#278-2、标记每年开始的日期importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2020-01-01','2023-12-31',freq='D'),'value':range(1461)})#标记每年开始的日期data['is_year_start']=data['date'].dt.is_year_startprint(data.head(10),end='\n\n')#278-3、按每年开始的日期进行数据分组和聚合importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2020-01-01','2023-12-31',freq='D'),'value':range(1461)})#添加每年开始的标记(这一步实际上对于计算整年总值不是必需的)data['is_year_start']=data['date'].dt.is_year_start#按年份进行分组并计算每年的value总和grouped_data=data.groupby(data['date'].dt.year)['value'].sum().reset_index()print(grouped_data)278-6-3、结果输出#278、pandas.Series.dt.is_year_start属性#278-1、筛选每年开始的日期#02020-01-01#3662021-01-01#7312022-01-01#10962023-01-01#14612024-01-01#dtype:datetime64[ns]#278-2、标记每年开始的日期#datevalueis_year_start#02020-01-010True#12020-01-021False#22020-01-032False#32020-01-043False#42020-01-054False#52020-01-065False#62020-01-076False#72020-01-087False#82020-01-098False#92020-01-109False#278-3、按每年开始的日期进行数据分组和聚合#datevalue#0202066795#12021200020#22022333245#32023466470279、pandas.Series.dt.is_year_end属性279-1、语法#279、pandas.Series.dt.is_year_end属性pandas.Series.dt.is_year_endIndicatewhetherthedateisthelastdayoftheyear.Returns:SeriesorDatetimeIndexThesametypeastheoriginaldatawithbooleanvalues.Serieswillhavethesamenameandindex.DatetimeIndexwillhavethesamename.279-2、参数    无279-3、功能        用于检查每个日期是否为一年中的最后一天的属性。279-4、返回值        返回一个布尔型的Series,用于标识日期是否为每年的结束。279-5、说明        使用场景:279-5-1、筛选特定日期:在时间序列数据中,筛选出每年结束的日期。279-5-2、标记事件:标记时间序列数据中的特定日期,以便后续分析。279-5-3、数据分组:按每年的结束日期进行数据分组和聚合。279-6、用法279-6-1、数据准备无279-6-2、代码示例#279、pandas.Series.dt.is_year_end属性#279-1、筛选每年结束的日期importpandasaspd#创建包含日期的Seriesdates=pd.Series(pd.date_range('2020-01-01','2023-12-31',freq='D'))#筛选每年结束的日期year_end_dates=dates[dates.dt.is_year_end]print(year_end_dates,end='\n\n')#279-2、标记每年结束的日期importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2020-01-01','2023-12-31',freq='D'),'value':range(1461)})#标记每年结束的日期data['is_year_end']=data['date'].dt.is_year_endprint(data.head(10),end='\n\n')#279-3、按每年结束的日期进行数据分组和聚合importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2020-01-01','2023-12-31',freq='D'),'value':range(1461)})#添加每年结束的标记(这一步实际上对于计算整年总值不是必需的)data['is_year_end']=data['date'].dt.is_year_end#按年份进行分组并计算每年的value总和grouped_data=data.groupby(data['date'].dt.year)['value'].sum().reset_index()print(grouped_data)279-6-3、结果输出#279、pandas.Series.dt.is_year_end属性#279-1、筛选每年结束的日期#3652020-12-31#7302021-12-31#10952022-12-31#14602023-12-31#dtype:datetime64[ns]#279-2、标记每年结束的日期#datevalueis_year_end#02020-01-010False#12020-01-021False#22020-01-032False#32020-01-043False#42020-01-054False#52020-01-065False#62020-01-076False#72020-01-087False#82020-01-098False#92020-01-109False#279-3、按每年结束的日期进行数据分组和聚合#datevalue#0202066795#12021200020#22022333245#32023466470280、pandas.Series.dt.is_leap_year属性280-1、语法#280、pandas.Series.dt.is_leap_year属性pandas.Series.dt.is_leap_yearBooleanindicatorifthedatebelongstoaleapyear.Aleapyearisayear,whichhas366days(insteadof365)including29thofFebruaryasanintercalaryday.Leapyearsareyearswhicharemultiplesoffourwiththeexceptionofyearsdivisibleby100butnotby400.Returns:SeriesorndarrayBooleansindicatingifdatesbelongtoaleapyear.280-2、参数    无280-3、功能        用于检查日期是否在闰年中的属性。280-4、返回值        返回一个布尔型的Series,用于标识每个日期所在的年份是否为闰年。280-5、说明        使用场景:280-5-1、筛选闰年数据:在时间序列数据中,筛选出闰年的数据。280-5-2、数据分析:分析闰年与非闰年的数据差异。280-5-3、数据可视化:对闰年和非闰年的数据进行区分和可视化。280-6、用法280-6-1、数据准备无280-6-2、代码示例#280、pandas.Series.dt.is_leap_year属性#280-1、筛选闰年中的日期importpandasaspd#创建包含日期的Seriesdates=pd.Series(pd.date_range('2018-01-01','2023-12-31',freq='D'))#筛选闰年中的日期leap_year_dates=dates[dates.dt.is_leap_year]print("闰年中的日期:")print(leap_year_dates,end='\n\n')#280-2、标记闰年日期importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2018-01-01','2023-12-31',freq='D'),'value':range(2191)})#标记闰年中的日期data['is_leap_year']=data['date'].dt.is_leap_yearprint("标记闰年日期的数据前十行:")print(data.head(10),end='\n\n')#280-3、统计闰年和非闰年的数据importpandasaspd#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2018-01-01','2023-12-31',freq='D'),'value':range(2191)})#添加闰年的标记data['is_leap_year']=data['date'].dt.is_leap_year#统计闰年和非闰年的数据leap_year_data=data[data['is_leap_year']]non_leap_year_data=data[~data['is_leap_year']]print("闰年数据总和:",leap_year_data['value'].sum())print("非闰年数据总和:",non_leap_year_data['value'].sum(),end='\n\n')#280-4、可视化闰年和非闰年的数据importpandasaspdimportmatplotlib.pyplotasplt#创建包含日期的DataFramedata=pd.DataFrame({'date':pd.date_range('2018-01-01','2023-12-31',freq='D'),'value':range(2191)#一些示例数据})#添加闰年的标记data['is_leap_year']=data['date'].dt.is_leap_year#统计每年的数据总和yearly_data=data.groupby(data['date'].dt.year)['value'].sum()#标记闰年leap_years=yearly_data[yearly_data.index.to_series().apply(lambdax:pd.Timestamp(str(x)).is_leap_year)]#绘制图表plt.figure(figsize=(10,6))plt.bar(yearly_data.index,yearly_data.values,color='skyblue',label='AllYears')plt.bar(leap_years.index,leap_years.values,color='green',label='LeapYears')plt.xlabel('Year')plt.ylabel('TotalValue')plt.title('TotalValueperYearwithLeapYearsHighlighted')plt.legend()plt.show()280-6-3、结果输出#280、pandas.Series.dt.is_leap_year属性#280-1、筛选闰年中的日期#闰年中的日期:#7302020-01-01#7312020-01-02#7322020-01-03#7332020-01-04#7342020-01-05#...#10912020-12-27#10922020-12-28#10932020-12-29#10942020-12-30#10952020-12-31#Length:366,dtype:datetime64[ns]#280-2、标记闰年日期#标记闰年日期的数据前十行:#datevalueis_leap_year#02018-01-010False#12018-01-021False#22018-01-032False#32018-01-043False#42018-01-054False#52018-01-065False#62018-01-076False#72018-01-087False#82018-01-098False#92018-01-109False#280-3、统计闰年和非闰年的数据#闰年数据总和:333975#非闰年数据总和:2065170#280-4、可视化闰年和非闰年的数据#见图2图2:二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-8 12:43 , Processed in 2.374453 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表