数据分析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lxG7cKS6-1585839654329)(attachment:image.png)]

python 数据分析–数据处理工具Pandas(1)

数据处理工具Pandas1. 序列和数据框的构造1.1 构造序列1.2 构造数据框2. Pandas从外部读取数据2.1 文本文件的读取2.2 电子表格的读取2.3 数据库的读取3. 数据描述统计 说明: 本文用到的数据集下载地址: 链接:https://pan.baidu.com/s/1zSOypUVoYlGcs-z2pT2t0w 提取码:z95a Pands模块可以帮助数据分析师轻松地解决数据... »

在这里插入图片描述

SQL 数据分析:销售数据的小计/合计/总计以及数据透视表

文章目录小计、合计与总计多维度交叉统计自定义统计维度数据透视表总结 学习过 SQL 的人都知道,使用聚合函数(AVG、SUM、COUNT、MIN/MAX 等)和分组操作(GROUP BY)可以对数据进行基本的统计分析,例如统计公司员工的人数、每个部门的平均月薪等。如果想要回顾这些基础概念,可以参考这篇文章。 不过 SQL 不仅仅能够进行这些基本的分组汇总,它还提供了许多高级的统计分析功能。本文就来... »

在这里插入图片描述

Python数据分析数据可视化–看一眼就能学会的的Pandas数据结构DataFrame(上)

前面两篇博客写了一维数组Series,接下来再来写写二维数组DataFrame,DataFrame是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等,它的数据以一个或多个二维块存放,不是列表、字典或一维数组结构。 (1)Dataframe数据结构 Dataframe数据结构是一个表格型的数据结构,是带有标签的二维数组,带有行标签(index)和列标签(columns... »

在这里插入图片描述

利用Python+matplotlib对泰坦尼克号进行数据分析

主要分析有数据接:https://pan.baidu.com/s/1jn88GiOr7uWA8BDQocFXxg 密码: s0e0不同舱位等级中幸存者和遇难者的乘客比例不同性别的幸存比例幸存和遇难旅客的票价分布幸存和遇难乘客的年龄分布不同上船港口的乘客仓位等级分布幸存和遇难乘客堂兄弟姐妹的数量分布幸存和遇难旅客父母子女的数量分布单独乘船与否和幸存之间有没有联系是否成年男性和幸存之间有没有联系 数据... »

在这里插入图片描述

ufunc函数常用运算、ufunc函数广播机制——《Python数据分析与应用》笔记

ufunc 函数全称为通用函数,是一种能够对 数组 中的所有元素进行操作的函数。 Numpy ufunc函数常用的 ufunc 函数运算数组的四则运算数组的比较运算逻辑运算ufunc 函数的广播机制 常用的 ufunc 函数运算 常用的 ufunc 函数运算有四则运算、比较运算和逻辑运算等。 数组的四则运算 数组间的四则运算是对每个数组中的对应位置的元素分别进行四则运算,所以进行四则运算的两个数组... »

在这里插入图片描述

【Python数据分析】文本情感分析——电影评论分析(一)

  情感分析是文本分析的一种,它能够从一段文本描述中理解文本的感情色彩,是褒义、贬义还是中性。常见的情感分析的使用场景就是客户对商品或服务的评价、反馈,传统模式下的人工审核,不仅消耗大量人力,而且效率(速度和准确度)也不高。   这里使用Python对电影《哪吒之魔童降世》的评论进行文本分析,这种分析方式还可用于垃圾邮件的过滤、新闻的分类等场景。   分析步骤:   1、对文本数据进行预处理,包括... »

在这里插入图片描述

数据分析师一定要掌握的基础——描述性统计分析

以下博客内容讲解了描述性统计分析的所有知识点,以及利用鸢尾花数据集的分析加强对各个统计量的理解。 数理统计基础-描述性统计分析1、数理统计基础2、描述性统计分析概述(1)概念(2)变量的类型3、统计量(1)频数与频率a. 频数b. 频率(2)集中趋势a. 均值b. 中位数c. 众数d. 分位数(3)离散程度a. 极差b. 方差c.标准差(4)分布形状a. 偏度b. 峰度4、总结 1、数理统计基础 ... »

1 Python数据分析——pandas——series01

       Series对象类似于一维array数组,能保存任何类型的数据,如整数、字符串、浮点数等。主要由一组值(value)和与之相关的索引(index)组成。        需强调的是Series对象的索引包含位置索引和名称索引: 位置索引 又称隐式索引,由系统分配,固定为从0开始的整数 名称索引 又称显示索引,由用户自定义,如无特别说明后文的index指名称索引 Series对象通吃一维... »

03

Python 数据分析三剑客之 NumPy(二):NumPy 数组索引、切片、广播、拼接、分割

文章目录【1×00】认识 Numpy 中的 nan 和 inf【1×01】判断是否为 nan 和 inf【1×02】统计数组中 nan 的个数【1×03】统计数组中 inf 的个数【1×04】替换 inf 和 nan【2×00】NumPy 索引【2×01】获取具体元素【2×02】获取行或列【2×03】布尔索引... »

在这里插入图片描述

(四)金融数据分析–股票移动平均计算

股票移动平均 1.引入数据库 #引入数据库 import pandas_datareader as pdr #可视化 import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline 2.导入数据(上证指数的数据为例) #选择一个数据上证指数为例(通过pandas库引入) szzs=pdr.get_data_yahoo... »

机器学习和数据分析-Jupyter的魔法命令使用

机器学习和数据分析-Jupyter的魔法命令使用

1. %load  读取文件内容 2. %run   执行文件 3. %timeit  多次测试代码执行时间,求平均值 4. %time   单次测量代码执行时间 5. %%html 执行html代码 6. %%js    执行js代码 7.%%writefile  将内容写入到文件中 1.在桌面创建一个文件夹,名字叫做jupyter 2.进入文件夹jupyter中,按住shift键,【右击】,选... »

战疫 | 疫情数据分析展示(2)

战疫 | 疫情数据分析展示(2)

目录 项目介绍 后端数据的更改 前端数据渲染 项目预览 项目地址 python制作动态疫情地图 在之前我发过两篇疫情地图展示的文章 利用python画河南疫情图 战疫 | pyecharts画全国各地区疫情图 接着我就遇到了萝卜大佬做的疫情大屏展示 疫情大屏优化-ECharts 地图下钻功能实现 我也萌生了做大屏展示的想法,如何实现呢?我做了以下尝试,将之前pyecharts做的地图直接插入到大屏... »

大数据分析的PYTHON基础(选择练习)

第一章 单元测试 1、判断题: Python语言是一种高级语言。 选项: A:对 B:错 答案: 【对】 2、多选题: Jupyter notebook中运行单元格的方法有哪几种?( ) 选项: A:Enter B:Shift+Enter C:Ctrl+Enter D:F5 答案: 【Shift+Enter;Ctrl+Enter】 3、单选题: Jupyter notebook的记事本文件扩展名为... »

在这里插入图片描述

Python数据分析–科学计算工具Numpy通用函数(持续更新中)

前面我们讲了科学计算工具Numpy的基础数据结构,不知道看过的小伙伴学习的咋样,今天呢我们继续上一节的内容讲一下Numpy的通用函数,如果有小伙伴以后想要做数据分析和数据可视化,Numpy这部分还是非常重要的,有必要好好学一下,其实学习本来就是一个很枯燥的过程,我开始学习的时候也是断断续续的,最终坚持下来的原因是自己第一次参加学校组织的数学建模时做数据分析的时候感觉自己用的方法太笨速度太慢了,拖了... »

数据分析系列 16/32 | MySQL中子查询与联合查询

数据分析系列 16/32 | MySQL中子查询与联合查询

前面说了很多MySQL中的查询,比如条件查询、分组聚合查询、连接查询,今天来说一下另外两个非常的重要的查询,MySQL中的子查询和联合查询。 PART01   子查询 子查询也称嵌套查询,是将一个查询语句嵌套在另一个查询语句的WHERE子句或者HAVING短语中,前者被称为内层查询或子查询,后者被称为外层查询或父查询。在整个SELECT语句中,先计算子查询,然后将子查询的结果作为父查询的过滤条件,... »

在这里插入图片描述

Python数据分析工具—安装Anaconda3详细教程及Jupter Notebook使用方法

昨天有小伙伴私信我初学者用哪个软件来写Python代码比较合适,我非常推荐Anaconda3,为什么?因为简单!!! Anaconda是一个方便的Python包管理和环境管理软件,一般用来配置不同的项目环境。我们有时会遇到这样的情况,项目A和项目B分别基于python2和python3,但是我们的电脑只能安装一个环境,这个时候Anaconda就派上了用场,它可以创建多个互不干扰的环境!!!分别运行... »

在这里插入图片描述

Python数据分析–科学计算工具Numpy基础数据结构

Numpy是Python开源的科学计算工具包,是一个非常高级的数值编程工具,具有强大的N维数组对象,对数组数据结构进行运算时不需要遍历循环,具有随机数,傅里叶变换,线性代数等基本功能。今天我们首先来讲一下Numpy基础的数据结构。 Numpy的数组是一个多维数组对象,成为ndarray,其是有两个部分组成:(1)实际的数据(2)描述这些数据的原数据,下面我们来看几个具体的例子: import nu... »

iris鸢尾花数据集最全数据分析

iris鸢尾花数据集最全数据分析

# plot直接展示数据的分布情况,kde核密度估计对比直方图来看iris.plot() iris.plot(kind = 'kde')   # KNNfrom sklearn import neighbors model_fit_show(neighbors.KNeighborsClassifier(), 'neighbors.KNeighborsClassifier', X, y) (105,... »

在这里插入图片描述

Python数据分析神器——pandas(进阶教程)

重塑层次化索引stack:将数据的列“旋转”为行unstack:将数据的行“旋转”为列默认情况下,unstack操作的是最内层。 »

在这里插入图片描述

[笔记整理] Task2 – 数据分析 EDA

Task2 – 数据分析 EDA定义步骤1. 载入各种数学科学以及可视化库2. 载入数据step1: 载入训练集和测试集step2: 简略观察数据3. 数据总览step1: 数据的相关统计量step2: 熟悉数据类型4. 判断数据缺失和异常step1: 每列存在 NAN 的情况 —可视化step2: 查看异常值检测5. 了解预测值的分布step1: 预测值的总体分布step... »

在这里插入图片描述

DataWhale数据挖掘学习–Task 2 数据分析

EDA数据分析2.1 数据加载2.2 查看数据概况2.3 检测缺失值、异常值、重复值2.3.1 缺失值判断2.3.2 缺失值可视化missingno矩阵查看缺失值missingno条形图查看缺失值2.3.3异常值检测倾斜值检测2.4 查看预测值分布查看skewness和kurtosis查看具体频数2.5 数据特征分析2.5.1数字特征分析相关性分析查看几个特征的 偏度和峰值每个数字特征得分布可视化... »

在这里插入图片描述

数据分析三剑客之 Numpy 基础教程

其余两剑客: »

小白学 Python 数据分析(18):Matplotlib(三)常用图表(上)

小白学 Python 数据分析(18):Matplotlib(三)常用图表(上)

人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):Pandas (二)数据结构 Series 小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame 小白学 Python 数据分析(5):Pandas (四)基础操作(1... »

Datawhale 数据挖掘入门:数据分析 笔记

TASK2:数据分析 摘自 AI蜗牛车 在Datawhale 数据挖掘入门:数据分析部分的讲义 赛题:零基础入门数据挖掘 – 二手车交易价格预测 地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281957.1004.1.38b02448ausjSX 1 主要的内容 载入... »

在这里插入图片描述

[MATLAB]专题五单元作业(数据分析与多项式计算)答案

本实验取材于中南大学《MATLAB与科学计算》一、对多项式f与g做加、减、乘、除运算,并计算它们的商的导函数。请分别用3次和5次多项式进行拟合,并绘制拟合曲线。>> x=[1,2,4,7,9,12,13,15,17];>> y=[1.5,3.9,6.6,11.7,15.6,18.8,19.6,20.6,21.1];>> p=polyfit;>> su... »

Page 1 of 9123»