Python酷库之旅-第三方库Pandas(110)

风中飘雪 · 发表于 2024-9-10 04:20:10

目录一、用法精讲481、pandas.DataFrame.all方法481-1、语法481-2、参数481-3、功能481-4、返回值481-5、说明481-6、用法481-6-1、数据准备481-6-2、代码示例481-6-3、结果输出482、pandas.DataFrame.any方法482-1、语法482-2、参数482-3、功能482-4、返回值482-5、说明482-6、用法482-6-1、数据准备482-6-2、代码示例482-6-3、结果输出483、pandas.DataFrame.clip方法483-1、语法483-2、参数483-3、功能483-4、返回值483-5、说明483-6、用法483-6-1、数据准备483-6-2、代码示例483-6-3、结果输出484、pandas.DataFrame.corr方法484-1、语法484-2、参数484-3、功能484-4、返回值484-5、说明484-6、用法484-6-1、数据准备484-6-2、代码示例484-6-3、结果输出485、pandas.DataFrame.corrwith方法485-1、语法485-2、参数485-3、功能485-4、返回值485-5、说明485-6、用法485-6-1、数据准备485-6-2、代码示例485-6-3、结果输出二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页一、用法精讲481、pandas.DataFrame.all方法481-1、语法#481、pandas.DataFrame.all方法pandas.DataFrame.all(axis=0,bool_only=False,skipna=True,**kwargs)ReturnwhetherallelementsareTrue,potentiallyoveranaxis.ReturnsTrueunlessthereatleastoneelementwithinaseriesoralongaDataframeaxisthatisFalseorequivalent(e.g.zeroorempty).Parameters:axis{0or‘index’,1or‘columns’,None},default0Indicatewhichaxisoraxesshouldbereduced.ForSeriesthisparameterisunusedanddefaultsto0.0/‘index’:reducetheindex,returnaSerieswhoseindexistheoriginalcolumnlabels.1/‘columns’:reducethecolumns,returnaSerieswhoseindexistheoriginalindex.None:reduceallaxes,returnascalar.bool_onlybool,defaultFalseIncludeonlybooleancolumns.NotimplementedforSeries.skipnabool,defaultTrueExcludeNA/nullvalues.Iftheentirerow/columnisNAandskipnaisTrue,thentheresultwillbeTrue,asforanemptyrow/column.IfskipnaisFalse,thenNAaretreatedasTrue,becausethesearenotequaltozero.**kwargsany,defaultNoneAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithNumPy.Returns:SeriesorDataFrameIflevelisspecified,then,DataFrameisreturned;otherwise,Seriesisreturned.481-2、参数481-2-1、axis(可选，默认值为0)：{0或'index',1或'columns'}，指定沿着哪个轴进行计算，0或'index'表示对每一列进行操作，结果是每一列的布尔值；1或'columns'表示对每一行进行操作，结果是每一行的布尔值。481-2-2、bool_only(可选，默认值为False)：布尔值，如果为True，则只考虑布尔类型的数据，如果DataFrame中包含其他类型的数据，则这些列将被忽略。481-2-3、skipna(可选，默认值为True)：布尔值，如果为True，则在计算时会忽略NaN值；如果为False，则如果存在NaN值，结果将为False。481-2-4、**kwargs(可选)：用于传递给底层函数的其他关键字参数。481-3、功能用于检查DataFrame在指定轴上是否所有元素都为真值，它通常用于数据清洗、验证等场景，例如检查某一列或某一行是否满足特定条件。481-4、返回值返回一个布尔值(如果axis=0)或布尔Series(如果axis=1)，表示指定轴上的所有元素是否都为真。如果axis=0，返回的Series中每个元素对应于DataFrame每一列的结果；如果axis=1，返回的Series中每个元素对应于DataFrame每一行的结果。481-5、说明无481-6、用法481-6-1、数据准备无481-6-2、代码示例#481、pandas.DataFrame.all方法#481-1、检查每一列是否所有元素都为Trueimportpandasaspd#创建一个示例DataFramedata={'A':[True,True,False],'B':[True,True,True],'C':[False,True,True]}df=pd.DataFrame(data)result_col=df.all(axis=0)print(result_col)#481-2、检查每一行是否所有元素都为Trueimportpandasaspd#创建一个示例DataFramedata={'A':[True,True,False],'B':[True,True,True],'C':[False,True,True]}df=pd.DataFrame(data)result_row=df.all(axis=1)print(result_row)481-6-3、结果输出#481、pandas.DataFrame.all方法#481-1、检查每一列是否所有元素都为True#AFalse#BTrue#CFalse#dtype:bool#481-2、检查每一行是否所有元素都为True#0False#1True#2False#dtype:bool482、pandas.DataFrame.any方法482-1、语法#482、pandas.DataFrame.any方法pandas.DataFrame.any(*,axis=0,bool_only=False,skipna=True,**kwargs)ReturnwhetheranyelementisTrue,potentiallyoveranaxis.ReturnsFalseunlessthereisatleastoneelementwithinaseriesoralongaDataframeaxisthatisTrueorequivalent(e.g.non-zeroornon-empty).Parameters:axis{0or‘index’,1or‘columns’,None},default0Indicatewhichaxisoraxesshouldbereduced.ForSeriesthisparameterisunusedanddefaultsto0.0/‘index’:reducetheindex,returnaSerieswhoseindexistheoriginalcolumnlabels.1/‘columns’:reducethecolumns,returnaSerieswhoseindexistheoriginalindex.None:reduceallaxes,returnascalar.bool_onlybool,defaultFalseIncludeonlybooleancolumns.NotimplementedforSeries.skipnabool,defaultTrueExcludeNA/nullvalues.Iftheentirerow/columnisNAandskipnaisTrue,thentheresultwillbeFalse,asforanemptyrow/column.IfskipnaisFalse,thenNAaretreatedasTrue,becausethesearenotequaltozero.**kwargsany,defaultNoneAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithNumPy.Returns:SeriesorDataFrameIflevelisspecified,then,DataFrameisreturned;otherwise,Seriesisreturned.482-2、参数482-2-1、axis(可选，默认值为0)：{0或'index',1或'columns'}，指定沿着哪个轴进行操作，0或'index'表示沿着行进行检查，1或'columns'表示沿着列进行检查。482-2-2、bool_only(可选，默认值为False)：布尔值，如果为True，则仅考虑布尔列；如果为False，则考虑所有列，即使它们不是布尔类型。482-2-3、skipna(可选，默认值为True)：布尔值，是否忽略NaN值，若设为True，NaN不会影响结果；若设为False，一旦遇到NaN，将返回False。482-2-4、**kwargs(可选)：额外的关键字参数，通常用于进一步控制输出或行为，但在大多数情况下不常用。482-3、功能用于检查DataFrame是否有任何一个元素为True，可以用来快速判断某一列或某一行是否包含有效的(非零、非空等)数据。482-4、返回值如果axis=0，返回一个包含每一列是否有任何元素为True的布尔值的Series；如果axis=1，则返回一个包含每一行是否有任何元素为True的布尔值的Series。如果DataFrame是空的，返回的Series将是空的。482-5、说明无482-6、用法482-6-1、数据准备无482-6-2、代码示例#482、pandas.DataFrame.any方法importpandasaspd#创建示例DataFramedata={'A':[False,False,True],'B':[False,False,False],'C':[True,False,True]}df=pd.DataFrame(data)#沿着列检查print(df.any(axis=0))#沿着行检查print(df.any(axis=1))482-6-3、结果输出#482、pandas.DataFrame.any方法#ATrue#BFalse#CTrue#dtype:bool#0True#1False#2True#dtype:bool483、pandas.DataFrame.clip方法483-1、语法#483、pandas.DataFrame.clip方法pandas.DataFrame.clip(lower=None,upper=None,*,axis=None,inplace=False,**kwargs)Trimvaluesatinputthreshold(s).Assignsvaluesoutsideboundarytoboundaryvalues.Thresholdscanbesingularvaluesorarraylike,andinthelattercasetheclippingisperformedelement-wiseinthespecifiedaxis.Parameters:lowerfloatorarray-like,defaultNoneMinimumthresholdvalue.Allvaluesbelowthisthresholdwillbesettoit.Amissingthreshold(e.gNA)willnotclipthevalue.upperfloatorarray-like,defaultNoneMaximumthresholdvalue.Allvaluesabovethisthresholdwillbesettoit.Amissingthreshold(e.gNA)willnotclipthevalue.axis{{0or‘index’,1or‘columns’,None}},defaultNoneAlignobjectwithlowerandupperalongthegivenaxis.ForSeriesthisparameterisunusedanddefaultstoNone.inplacebool,defaultFalseWhethertoperformtheoperationinplaceonthedata.*args,**kwargsAdditionalkeywordshavenoeffectbutmightbeacceptedforcompatibilitywithnumpy.Returns:SeriesorDataFrameorNoneSametypeascallingobjectwiththevaluesoutsidetheclipboundariesreplacedorNoneifinplace=True.483-2、参数483-2-1、lower(可选，默认值为None)：标量、数组、Series或DataFrame，指定元素的下界，如果元素小于此值，则将其替换为此值。483-2-2、upper(可选，默认值为None)：标量、数组、Series或DataFrame，指定元素的上界，如果元素大于此值，则将其替换为此值。483-2-3、axis(可选，默认值为None)：{0或'index',1或'columns'}，用于对齐输入的lower和upper参数，如果没有指定，方法将对DataFrame的所有元素进行操作。483-2-4、inplace(可选，默认值为False)：布尔值，如果为True，则直接在原DataFrame上进行操作；如果为False，则返回一个新的DataFrame，而不修改原有DataFrame。483-2-5、**kwargs(可选)：额外的关键字参数，通常不常用。483-3、功能用于将DataFrame中的值限制在给定的下界和上界之间，超出范围的值会被替换为下界或上界，这在数据预处理和清洗时非常有用。483-4、返回值返回一个新的DataFrame，具有与原始DataFrame相同的索引和列，但所有值都被限制在指定的上下界范围内(如果存在)。483-5、说明无483-6、用法483-6-1、数据准备无483-6-2、代码示例#483、pandas.DataFrame.clip方法importpandasaspd#创建示例DataFramedata={'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]}df=pd.DataFrame(data)#使用clip方法clipped_df=df.clip(lower=3,upper=8)print(clipped_df)483-6-3、结果输出#483、pandas.DataFrame.clip方法#ABC#0358#1368#2378#3488484、pandas.DataFrame.corr方法484-1、语法#484、pandas.DataFrame.corr方法pandas.DataFrame.corr(method='pearson',min_periods=1,numeric_only=False)Computepairwisecorrelationofcolumns,excludingNA/nullvalues.Parameters:method{‘pearson’,‘kendall’,‘spearman’}orcallableMethodofcorrelation:pearson:standardcorrelationcoefficientkendall:KendallTaucorrelationcoefficientspearman:Spearmanrankcorrelationcallable:callablewithinputtwo1dndarraysandreturningafloat.Notethatthereturnedmatrixfromcorrwillhave1alongthediagonalsandwillbesymmetricregardlessofthecallable’sbehavior.min_periodsint,optionalMinimumnumberofobservationsrequiredperpairofcolumnstohaveavalidresult.CurrentlyonlyavailableforPearsonandSpearmancorrelation.numeric_onlybool,defaultFalseIncludeonlyfloat,intorbooleandata.Newinversion1.5.0.Changedinversion2.0.0:Thedefaultvalueofnumeric_onlyisnowFalse.Returns

ataFrameCorrelationmatrix.484-2、参数484-2-1、method(可选，默认值为'pearson')：字符串，可以选择以下几种方法计算相关系数：'pearson'：皮尔逊相关系数(默认选项)'kendall'：肯德尔相关系数'spearman'：斯皮尔曼等级相关系数484-2-2、min_periods(可选，默认值为1)：整数，表示在计算相关系数时所需的最小观测值数量，只有当两个列都有至少min_periods次有效值时，才会计算它们的相关系数。484-2-3、numeric_only(可选，默认值为False)：布尔值，表示是否只计算数字列的相关性，如果设置为True，将忽略非数字列。484-3、功能用于计算数据框中各列之间的相关系数，相关系数是衡量变量之间线性关系强度的统计量。484-4、返回值返回一个DataFrame，其中包含输入DataFrame中各列之间的相关系数，行和列的索引为原DataFrame的列名。484-5、说明484-5-1、相关系数的值范围从-1到1，-1表示完全负相关，1表示完全正相关，0表示没有线性相关关系。484-5-2、在数据缺失的情况下，通过min_periods可以控制是否计算相关系数。484-6、用法484-6-1、数据准备无484-6-2、代码示例#484、pandas.DataFrame.corr方法importpandasaspd#创建一个示例DataFramedata={'A':[1,2,3,4,5],'B':[5,4,3,2,1],'C':[1,2,None,4,5]}df=pd.DataFrame(data)#计算相关系数矩阵correlation_matrix=df.corr(method='pearson',min_periods=1)print(correlation_matrix)484-6-3、结果输出#484、pandas.DataFrame.corr方法#ABC#A1.0-1.01.0#B-1.01.0-1.0#C1.0-1.01.0485、pandas.DataFrame.corrwith方法485-1、语法#485、pandas.DataFrame.corrwith方法pandas.DataFrame.corrwith(other,axis=0,drop=False,method='pearson',numeric_only=False)Computepairwisecorrelation.PairwisecorrelationiscomputedbetweenrowsorcolumnsofDataFramewithrowsorcolumnsofSeriesorDataFrame.DataFramesarefirstalignedalongbothaxesbeforecomputingthecorrelations.Parameters

therDataFrame,SeriesObjectwithwhichtocomputecorrelations.axis{0or‘index’,1or‘columns’},default0Theaxistouse.0or‘index’tocomputerow-wise,1or‘columns’forcolumn-wise.dropbool,defaultFalseDropmissingindicesfromresult.method{‘pearson’,‘kendall’,‘spearman’}orcallableMethodofcorrelation:pearson:standardcorrelationcoefficientkendall:KendallTaucorrelationcoefficientspearman:Spearmanrankcorrelationcallable:callablewithinputtwo1dndarraysandreturningafloat.numeric_onlybool,defaultFalseIncludeonlyfloat,intorbooleandata.Newinversion1.5.0.Changedinversion2.0.0:Thedefaultvalueofnumeric_onlyisnowFalse.Returns:SeriesPairwisecorrelations.485-2、参数485-2-1、other(必须)：要与之计算相关性的另一个DataFrame或Series，它的数据结构应该可以进行对齐，通常是同一列或行标签。485-2-2、axis(可选，默认值为0)：{0或'index',1或'columns'}，0或'index'表示按列计算相关性(默认值)；1或'columns'表示按行计算相关性，将other的行与当前DataFrame的列进行比较。485-2-3、drop(可选，默认值为False)：布尔值，指示是否在计算之前丢弃包含缺失值的行，如果设为True，则将不考虑那些含有NA值的行。485-2-4、method(可选，默认值为'pearson')：字符串，可以选择以下几种方法计算相关系数：'pearson'：皮尔逊相关系数(默认选项)'kendall'：肯德尔相关系数'spearman'：斯皮尔曼等级相关系数485-2-5、numeric_only(可选，默认值为False)：布尔值，若设置为True，则仅考虑数值类型的列进行计算，非数值列将被排除。485-3、功能用于计算一个DataFrame与另一个DataFrame或Series之间的相关性。485-4、返回值返回的是一个包含相关系数的Series，索引为原DataFrame或Series的列或索引名，值为相关系数。485-5、说明无485-6、用法485-6-1、数据准备无485-6-2、代码示例#485、pandas.DataFrame.corrwith方法importpandasaspd#创建示例DataFramedf1=pd.DataFrame({'A':[1,2,3,4,5],'B':[5,4,3,2,1]})df2=pd.DataFrame({'A':[1,3,5,7,9],'B':[9,7,5,3,1]})#计算df1与df2的相关性correlation=df1.corrwith(df2,axis=0,drop=False,method='pearson',numeric_only=False)print(correlation)485-6-3、结果输出#485、pandas.DataFrame.corrwith方法#A1.0#B1.0#dtype:float64二、推荐阅读1、Python筑基之旅2、Python函数之旅3、Python算法之旅4、Python魔法之旅5、博客个人主页

		自动登录	找回密码
密码			会员注册