找回密码
 会员注册
查看: 21|回复: 0

Python酷库之旅-第三方库Pandas(110)

[复制链接]

6

主题

0

回帖

19

积分

新手上路

积分
19
发表于 2024-9-10 04:20:10 | 显示全部楼层 |阅读模式
目录一、用法精讲481、pandas.DataFrame.all方法481-1、语法481-2、参数481-3、功能481-4、返回值481-5、说明481-6、用法481-6-1、数据准备481-6-2、代码示例481-6-3、结果输出482、pandas.DataFrame.any方法482-1、语法482-2、参数482-3、功能482-4、返回值482-5、说明482-6、用法482-6-1、数据准备482-6-2、代码示例482-6-3、结果输出483、pandas.DataFrame.clip方法483-1、语法483-2、参数483-3、功能483-4、返回值483-5、说明483-6、用法483-6-1、数据准备483-6-2、代码示例483-6-3、结果输出484、pandas.DataFrame.corr方法484-1、语法484-2、参数484-3、功能484-4、返回值484-5、说明484-6、用法484-6-1、数据准备484-6-2、代码示例484-6-3、结果输出485、pandas.DataFrame.corrwith方法485-1、语法485-2、参数485-3、功能485-4、返回值485-5、说明485-6、用法485-6-1、数据准备485-6-2、代码示例485-6-3、结果输出二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页一、用法精讲481、pandas.DataFrame.all方法481-1、语法#481、pandas.DataFrame.all方法pandas.DataFrame.all(axis=0,bool_only=False,skipna=True,**kwargs)ReturnwhetherallelementsareTrue,potentiallyoveranaxis.ReturnsTrueunlessthereatleastoneelementwithinaseriesoralongaDataframeaxisthatisFalseorequivalent(e.g.zeroorempty).Parameters:axis{0or‘index’,1or‘columns’,None},default0Indicatewhichaxisoraxesshouldbereduced.ForSeriesthisparameterisunusedanddefaultsto0.0/‘index’:reducetheindex,returnaSerieswhoseindexistheoriginalcolumnlabels.1/‘columns’:reducethecolumns,returnaSerieswhoseindexistheoriginalindex.None:reduceallaxes,returnascalar.bool_onlybool,defaultFalseIncludeonlybooleancolumns.NotimplementedforSeries.skipnabool,defaultTrueExcludeNA/nullvalues.Iftheentirerow/columnisNAandskipnaisTrue,thentheresultwillbeTrue,asforanemptyrow/column.IfskipnaisFalse,thenNAaretreatedasTrue,becausethesearenotequaltozero.**kwargsany,defaultNoneAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithNumPy.Returns:SeriesorDataFrameIflevelisspecified,then,DataFrameisreturned;otherwise,Seriesisreturned.481-2、参数481-2-1、axis(可选,默认值为0):{0或'index',1或'columns'},指定沿着哪个轴进行计算,0或'index'表示对每一列进行操作,结果是每一列的布尔值;1或'columns'表示对每一行进行操作,结果是每一行的布尔值。481-2-2、bool_only(可选,默认值为False):布尔值,如果为True,则只考虑布尔类型的数据,如果DataFrame中包含其他类型的数据,则这些列将被忽略。481-2-3、skipna(可选,默认值为True):布尔值,如果为True,则在计算时会忽略NaN值;如果为False,则如果存在NaN值,结果将为False。481-2-4、**kwargs(可选):用于传递给底层函数的其他关键字参数。481-3、功能        用于检查DataFrame在指定轴上是否所有元素都为真值,它通常用于数据清洗、验证等场景,例如检查某一列或某一行是否满足特定条件。481-4、返回值        返回一个布尔值(如果axis=0)或布尔Series(如果axis=1),表示指定轴上的所有元素是否都为真。如果axis=0,返回的Series中每个元素对应于DataFrame每一列的结果;如果axis=1,返回的Series中每个元素对应于DataFrame每一行的结果。481-5、说明    无481-6、用法481-6-1、数据准备无481-6-2、代码示例#481、pandas.DataFrame.all方法#481-1、检查每一列是否所有元素都为Trueimportpandasaspd#创建一个示例DataFramedata={'A':[True,True,False],'B':[True,True,True],'C':[False,True,True]}df=pd.DataFrame(data)result_col=df.all(axis=0)print(result_col)#481-2、检查每一行是否所有元素都为Trueimportpandasaspd#创建一个示例DataFramedata={'A':[True,True,False],'B':[True,True,True],'C':[False,True,True]}df=pd.DataFrame(data)result_row=df.all(axis=1)print(result_row)481-6-3、结果输出#481、pandas.DataFrame.all方法#481-1、检查每一列是否所有元素都为True#AFalse#BTrue#CFalse#dtype:bool#481-2、检查每一行是否所有元素都为True#0False#1True#2False#dtype:bool482、pandas.DataFrame.any方法482-1、语法#482、pandas.DataFrame.any方法pandas.DataFrame.any(*,axis=0,bool_only=False,skipna=True,**kwargs)ReturnwhetheranyelementisTrue,potentiallyoveranaxis.ReturnsFalseunlessthereisatleastoneelementwithinaseriesoralongaDataframeaxisthatisTrueorequivalent(e.g.non-zeroornon-empty).Parameters:axis{0or‘index’,1or‘columns’,None},default0Indicatewhichaxisoraxesshouldbereduced.ForSeriesthisparameterisunusedanddefaultsto0.0/‘index’:reducetheindex,returnaSerieswhoseindexistheoriginalcolumnlabels.1/‘columns’:reducethecolumns,returnaSerieswhoseindexistheoriginalindex.None:reduceallaxes,returnascalar.bool_onlybool,defaultFalseIncludeonlybooleancolumns.NotimplementedforSeries.skipnabool,defaultTrueExcludeNA/nullvalues.Iftheentirerow/columnisNAandskipnaisTrue,thentheresultwillbeFalse,asforanemptyrow/column.IfskipnaisFalse,thenNAaretreatedasTrue,becausethesearenotequaltozero.**kwargsany,defaultNoneAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithNumPy.Returns:SeriesorDataFrameIflevelisspecified,then,DataFrameisreturned;otherwise,Seriesisreturned.482-2、参数482-2-1、axis(可选,默认值为0):{0或'index',1或'columns'},指定沿着哪个轴进行操作,0或'index'表示沿着行进行检查,1或'columns'表示沿着列进行检查。482-2-2、bool_only(可选,默认值为False):布尔值,如果为True,则仅考虑布尔列;如果为False,则考虑所有列,即使它们不是布尔类型。482-2-3、skipna(可选,默认值为True):布尔值,是否忽略NaN值,若设为True,NaN不会影响结果;若设为False,一旦遇到NaN,将返回False。482-2-4、**kwargs(可选):额外的关键字参数,通常用于进一步控制输出或行为,但在大多数情况下不常用。482-3、功能        用于检查DataFrame是否有任何一个元素为True,可以用来快速判断某一列或某一行是否包含有效的(非零、非空等)数据。482-4、返回值        如果axis=0,返回一个包含每一列是否有任何元素为True的布尔值的Series;如果axis=1,则返回一个包含每一行是否有任何元素为True的布尔值的Series。如果DataFrame是空的,返回的Series将是空的。482-5、说明    无482-6、用法482-6-1、数据准备无482-6-2、代码示例#482、pandas.DataFrame.any方法importpandasaspd#创建示例DataFramedata={'A':[False,False,True],'B':[False,False,False],'C':[True,False,True]}df=pd.DataFrame(data)#沿着列检查print(df.any(axis=0))#沿着行检查print(df.any(axis=1))482-6-3、结果输出#482、pandas.DataFrame.any方法#ATrue#BFalse#CTrue#dtype:bool#0True#1False#2True#dtype:bool483、pandas.DataFrame.clip方法483-1、语法#483、pandas.DataFrame.clip方法pandas.DataFrame.clip(lower=None,upper=None,*,axis=None,inplace=False,**kwargs)Trimvaluesatinputthreshold(s).Assignsvaluesoutsideboundarytoboundaryvalues.Thresholdscanbesingularvaluesorarraylike,andinthelattercasetheclippingisperformedelement-wiseinthespecifiedaxis.Parameters:lowerfloatorarray-like,defaultNoneMinimumthresholdvalue.Allvaluesbelowthisthresholdwillbesettoit.Amissingthreshold(e.gNA)willnotclipthevalue.upperfloatorarray-like,defaultNoneMaximumthresholdvalue.Allvaluesabovethisthresholdwillbesettoit.Amissingthreshold(e.gNA)willnotclipthevalue.axis{{0or‘index’,1or‘columns’,None}},defaultNoneAlignobjectwithlowerandupperalongthegivenaxis.ForSeriesthisparameterisunusedanddefaultstoNone.inplacebool,defaultFalseWhethertoperformtheoperationinplaceonthedata.*args,**kwargsAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithnumpy.Returns:SeriesorDataFrameorNoneSametypeascallingobjectwiththevaluesoutsidetheclipboundariesreplacedorNoneifinplace=True.483-2、参数483-2-1、lower(可选,默认值为None):标量、数组、Series或DataFrame,指定元素的下界,如果元素小于此值,则将其替换为此值。483-2-2、upper(可选,默认值为None):标量、数组、Series或DataFrame,指定元素的上界,如果元素大于此值,则将其替换为此值。483-2-3、axis(可选,默认值为None):{0或'index',1或'columns'},用于对齐输入的lower和upper参数,如果没有指定,方法将对DataFrame的所有元素进行操作。483-2-4、inplace(可选,默认值为False):布尔值,如果为True,则直接在原DataFrame上进行操作;如果为False,则返回一个新的DataFrame,而不修改原有DataFrame。483-2-5、**kwargs(可选):额外的关键字参数,通常不常用。483-3、功能        用于将DataFrame中的值限制在给定的下界和上界之间,超出范围的值会被替换为下界或上界,这在数据预处理和清洗时非常有用。483-4、返回值        返回一个新的DataFrame,具有与原始DataFrame相同的索引和列,但所有值都被限制在指定的上下界范围内(如果存在)。483-5、说明    无483-6、用法483-6-1、数据准备无483-6-2、代码示例#483、pandas.DataFrame.clip方法importpandasaspd#创建示例DataFramedata={'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]}df=pd.DataFrame(data)#使用clip方法clipped_df=df.clip(lower=3,upper=8)print(clipped_df)483-6-3、结果输出#483、pandas.DataFrame.clip方法#ABC#0358#1368#2378#3488484、pandas.DataFrame.corr方法484-1、语法#484、pandas.DataFrame.corr方法pandas.DataFrame.corr(method='pearson',min_periods=1,numeric_only=False)Computepairwisecorrelationofcolumns,excludingNA/nullvalues.Parameters:method{‘pearson’,‘kendall’,‘spearman’}orcallableMethodofcorrelation:pearson:standardcorrelationcoefficientkendall:KendallTaucorrelationcoefficientspearman:Spearmanrankcorrelationcallable:callablewithinputtwo1dndarraysandreturningafloat.Notethatthereturnedmatrixfromcorrwillhave1alongthediagonalsandwillbesymmetricregardlessofthecallable’sbehavior.min_periodsint,optionalMinimumnumberofobservationsrequiredperpairofcolumnstohaveavalidresult.CurrentlyonlyavailableforPearsonandSpearmancorrelation.numeric_onlybool,defaultFalseIncludeonlyfloat,intorbooleandata.Newinversion1.5.0.Changedinversion2.0.0:Thedefaultvalueofnumeric_onlyisnowFalse.ReturnsataFrameCorrelationmatrix.484-2、参数484-2-1、method(可选,默认值为'pearson'):字符串,可以选择以下几种方法计算相关系数:'pearson':皮尔逊相关系数(默认选项)'kendall':肯德尔相关系数'spearman':斯皮尔曼等级相关系数484-2-2、min_periods(可选,默认值为1):整数,表示在计算相关系数时所需的最小观测值数量,只有当两个列都有至少min_periods次有效值时,才会计算它们的相关系数。484-2-3、numeric_only(可选,默认值为False):布尔值,表示是否只计算数字列的相关性,如果设置为True,将忽略非数字列。484-3、功能        用于计算数据框中各列之间的相关系数,相关系数是衡量变量之间线性关系强度的统计量。484-4、返回值        返回一个DataFrame,其中包含输入DataFrame中各列之间的相关系数,行和列的索引为原DataFrame的列名。484-5、说明484-5-1、相关系数的值范围从-1到1,-1表示完全负相关,1表示完全正相关,0表示没有线性相关关系。484-5-2、在数据缺失的情况下,通过min_periods可以控制是否计算相关系数。484-6、用法484-6-1、数据准备无484-6-2、代码示例#484、pandas.DataFrame.corr方法importpandasaspd#创建一个示例DataFramedata={'A':[1,2,3,4,5],'B':[5,4,3,2,1],'C':[1,2,None,4,5]}df=pd.DataFrame(data)#计算相关系数矩阵correlation_matrix=df.corr(method='pearson',min_periods=1)print(correlation_matrix)484-6-3、结果输出#484、pandas.DataFrame.corr方法#ABC#A1.0-1.01.0#B-1.01.0-1.0#C1.0-1.01.0485、pandas.DataFrame.corrwith方法485-1、语法#485、pandas.DataFrame.corrwith方法pandas.DataFrame.corrwith(other,axis=0,drop=False,method='pearson',numeric_only=False)Computepairwisecorrelation.PairwisecorrelationiscomputedbetweenrowsorcolumnsofDataFramewithrowsorcolumnsofSeriesorDataFrame.DataFramesarefirstalignedalongbothaxesbeforecomputingthecorrelations.ParameterstherDataFrame,SeriesObjectwithwhichtocomputecorrelations.axis{0or‘index’,1or‘columns’},default0Theaxistouse.0or‘index’tocomputerow-wise,1or‘columns’forcolumn-wise.dropbool,defaultFalseDropmissingindicesfromresult.method{‘pearson’,‘kendall’,‘spearman’}orcallableMethodofcorrelation:pearson:standardcorrelationcoefficientkendall:KendallTaucorrelationcoefficientspearman:Spearmanrankcorrelationcallable:callablewithinputtwo1dndarraysandreturningafloat.numeric_onlybool,defaultFalseIncludeonlyfloat,intorbooleandata.Newinversion1.5.0.Changedinversion2.0.0:Thedefaultvalueofnumeric_onlyisnowFalse.Returns:SeriesPairwisecorrelations.485-2、参数485-2-1、other(必须):要与之计算相关性的另一个DataFrame或Series,它的数据结构应该可以进行对齐,通常是同一列或行标签。485-2-2、axis(可选,默认值为0):{0或'index',1或'columns'},0或'index'表示按列计算相关性(默认值);1或'columns'表示按行计算相关性,将other的行与当前DataFrame的列进行比较。485-2-3、drop(可选,默认值为False):布尔值,指示是否在计算之前丢弃包含缺失值的行,如果设为True,则将不考虑那些含有NA值的行。485-2-4、method(可选,默认值为'pearson'):字符串,可以选择以下几种方法计算相关系数:'pearson':皮尔逊相关系数(默认选项)'kendall':肯德尔相关系数'spearman':斯皮尔曼等级相关系数485-2-5、numeric_only(可选,默认值为False):布尔值,若设置为True,则仅考虑数值类型的列进行计算,非数值列将被排除。485-3、功能        用于计算一个DataFrame与另一个DataFrame或Series之间的相关性。485-4、返回值        返回的是一个包含相关系数的Series,索引为原DataFrame或Series的列或索引名,值为相关系数。485-5、说明    无485-6、用法485-6-1、数据准备无485-6-2、代码示例#485、pandas.DataFrame.corrwith方法importpandasaspd#创建示例DataFramedf1=pd.DataFrame({'A':[1,2,3,4,5],'B':[5,4,3,2,1]})df2=pd.DataFrame({'A':[1,3,5,7,9],'B':[9,7,5,3,1]})#计算df1与df2的相关性correlation=df1.corrwith(df2,axis=0,drop=False,method='pearson',numeric_only=False)print(correlation)485-6-3、结果输出#485、pandas.DataFrame.corrwith方法#A1.0#B1.0#dtype:float64二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-8 11:31 , Processed in 1.223996 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表