找回密码
 会员注册
查看: 30|回复: 0

数据分析统计学基础及Python具体实现

[复制链接]

8

主题

0

回帖

25

积分

新手上路

积分
25
发表于 2024-9-12 12:30:58 | 显示全部楼层 |阅读模式
各位大佬好,这里是阿川的博客,祝您变得更强个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力阿川水平有限,如有错误,欢迎大佬指正Python初阶Python–语言基础与由来介绍Python–注意事项Python–语句与众所周知数据清洗前基本技能数据分析—技术栈和开发环境搭建数据分析—Numpy和Pandas库基本用法及实例统计学基础前必看数据分析—三前奏:获取/读取/评估数据数据分析—数据清洗操作及众所周知数据分析—数据整理操作及众所周知目录统计学概述数值数据分析维度偏态解释数据分析与统计学不可分割统计学概述统计学主要是描述和推断描述分类数据有限数量的类别的数据定序有顺序的例如金银铜三枚奖牌,金大于银大于铜定类例如猫的种类,不能说有顺序数值数据对可进行数学运算和统计分析计算有意义的数据连续例如1~2之间区间有很多连续的数字离散只能以整数或自然数为单位的数据数值数据分析维度数值数据是数据分析的重点,分析维度主要从三个方面来分析集中趋势数据集中分布在哪里mean平均数median中位数mode众数离散趋势数据偏离中心分布在哪里max-min极差var/std方差/标准差quantile(0.75)-quantile(0.25)四分位距四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-表示中间一半数值的离散程度越大说明数据越分散越小说明数据越集中分布形状可以看出数据的偏态、峰度、异常值分布形状主要是指直方图plot表示画图kind参数具体什么形状hist表示直方图偏态解释直方图一般为正态分布(平均值、中位数、众数差不多都位于中央)偏态(平均数、中位数、众数偏离中央)正偏态即右偏态负偏态及左偏态注意一下直方图数据量小,分布形状较不明显数据量大,分布形状较明显好的,到此为止啦,祝您变得更强想说的话实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累,希望大佬支持道阻且长行则将至个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-26 13:54 , Processed in 0.347050 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表