机器学习入门

python机器学习入门案例——基于SVM分类器的鸢尾花分类(附完整代码)

python机器学习入门案例——基于SVM分类器的鸢尾花分类(附完整代码)

数据集介绍 总共包含150行数据 每一行数据由 4 个特征值及一个目标值组成。 4 个特征值分别为:萼片长度、萼片宽度、花瓣长度、花瓣宽度 目标值为三种不同类别的鸢尾花,分别为: Iris Setosa、Iris Versicolour、Iris Virginica 数据集中每朵鸢尾花叫做一个数据点,它的品种叫做它的标签 数据集样式: 导入需要的模块包 import numpy as np fro... »

在这里插入图片描述

机器学习入门 — 特征编码

数值特征 离散值处理 数值特征的处理,最常见的方法,就是离散值处理了 对于一份新拿到手的数据来说,会有很多不能被计算机识别的数据,这就需要对它们进行处理 LabelEncoder import pandas as pd import numpy as np # 加载数据 vg_df = pd.read_csv('datasets/vgsales.csv', encoding = "ISO-8859... »

在这里插入图片描述

机器学习入门 — LDA与PCA算法(公式推导、纯python代码实现、scikit-learn api调用对比结果)

为什么要做降维: 提高计算效率 留存有用的特征,为后续建模使用 在项目中实际拿到的数据,可能会有几百个维度(特征)的数据集,这样的数据集在建模使用时,非常消耗计算资源,所以需要通过使用降维方法来优化数据集 线性判别分析(Linear Discriminant Analysis) 用途:数据预处理中的降维,分类任务(有监督问题) 目标:LDA关心的是能够最大化类间区分度的坐标轴成分 将特征空间(数据... »

机器学习入门——决策树图解(附代码)

引言 本文介绍了决策树,它和KNN一样,也是一个非参数学习算法;决策树可以解决多分类问题,同时也可以解决回归问题。 决策树具有非常好的可解释性。 决策树 先来看下什么是决策树。决策树描述了一些规则,根据这些规则可以做出决策。比如某公司想招聘机器学习算法工程师,他们可能会先看应聘者是否在顶级会议上发表过论文,如果发表过的话则直接录用;否则看应聘者是否为研究生,如果是并且读研期间做的项目是和机器学习有... »

在这里插入图片描述

机器学习入门(七):多项式回归, PolynomialFeatures详解

文章目录前言PolynomialFeatures详细探讨如何实现多项式回归代码实现:正规方程验证 前言 在机器学习入门(六)中,已经通过pipeline快速实现了多项式回归。代码如下: PolyRegr = Pipeline([ ('poly',PolynomialFeatures(degree=2)), ('clf',LinearRegression()) ]) PolyRegr.fit(X, ... »

在这里插入图片描述

机器学习入门 — K-means、DBSCAN聚类算法(概念、图解、代码示例)

聚类概念 聚类是把相似的东西分到一组,它是一个无监督问题,没有标签使用 难点: 对于有标签的有监督学习问题,标签可以便于我们来评估模型,无监督学习问题在评估上比较难一点 对于不同的参数组合,得到的学习结果,因为比较难对模型做评估,所以不能通过一个精确度的好坏来选择参数组合 K-MEANS算法 K-MEANS算法是聚类问题中,最简单,也是最实用的一个算法 基本概念 一个数据放进来,需要指定K值,来声... »

在这里插入图片描述

机器学习入门 — 基于随机森林的气温预测(三)随机森林参数选择

本文中将针对树模型的参数进行优化 数据预处理 前面已经做过好几次数据预处理了,这里直接上代码 得到数据 # 导入工具包 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split # 读取数据 features = pd.read_csv('data/temps_extend... »

在这里插入图片描述

机器学习入门 — 根据推导公式使用Python实现梯度下降与逻辑回归

关于梯度下降与逻辑回归,我在之前的文章中已经写过了公式推导,本文中将用python代码进行实现并做简单的实验 机器学习入门 — 梯度下降原理 机器学习入门 — 逻辑回归算法 案例概述 在这里我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。此大学会根据两次考试的结果来决定每个申请人的录取机会。大学里有以前的申请人的历史数据,可以用它作为逻辑回归的训练集。对于每一个学生例子,有两个考试的申请人... »

在这里插入图片描述

机器学习入门(二):KNN算法和决策边界(Decision Boundary)绘制

1)KNN算法基础知识: KNN全称K Nearest Neighbor, k是指最近邻居的个数。 俗话说物以类聚,人以群分,我们通常判别一个人是好是坏的方式就是看他周围是一群好人还是坏人。 这个算法也是如此,假如A的周围有一堆好人,我们就认为他是个好人。即使他周围有两个坏人(干扰项),我们也不会把它当成坏人。 而人与人的关系也有远近之分,计算远近,我们就需要用距离来衡量,有时候远亲不如近邻就体现... »

在这里插入图片描述

机器学习入门——线性回归

引言 本文介绍线性回归算法。 它主要解决回归问题,思想简单,实现容易; 是很多强大的非线性模型的基础; 它的结果具有很好的可解释性。 我们在机器学习基础概念中说过,如果结果是一个连续数值,而不是一个类别的话, 那么就是回归问题。回顾问题要预测的是具体的数值,通常这些数值在一个连续的空间里面。今天我们学习的线性回归算法就是一个最简单的回归算法。 线性回归算法 假设我们有房屋面积和房屋价格的一些数据。... »

上学期回顾以及机器学习入门建议

我开始学习各种包,天真的认为机器学习只是那么简单,只是调调包,丝毫无技术含量可言,我甚至在想,以前的学都白上了。2020年1月:为了机器学习,我从最基本的开始,学习了基础线代知识,还有剩余的高数知识。机器学习的根本是数学,刚入门的时候不需要很深厚的数学底子,但越往后,才发现数学的水很深。 »

在这里插入图片描述

机器学习入门之无监督学习(四)

引言 本文主要介绍深度自动编码器(Deep Auto encoder),做的事情还是降维,不过降维的时候是使用神经网络。 自动编码器 把很多隐藏层的神经网络当成编码器,输入一个图像后能得到一个编码。比如传入784维的手写数字,得到的编码通常会小于784维。 现在问题是我们如何得到这样一个编码器呢。要训练这个编码器我们需要同时训练一个解码器,能更加编码解码成原来的784维图像数据。 这件事情其实和P... »

机器学习入门研究(十五)-模型保存与加载

目录 1.模型的保存和加载 2.实例 之前我们在使用模型进行预测的时候,都是需要重新训练,那经过一段时间模型训练的准确率已经可以达到一定的标准,那么我们可以通过保存模型和加载模型的方式来完成预测,不需要每次都去训练模型。 1.模型的保存和加载 在sklearn中提供了API来实现该功能。 (1)模型保存 #4)直接将模型保存 sklearn.externals.joblib.dump(value,... »

ac_risk.png

机器学习入门教程5-使用 Python 和 scikit-learn 学习聚类算法

在本教程中,您将使用无监督学习来发现数据中的分组和异常点。在无监督学习中,没有用于显示期望结果的真值(ground truth) 或带标签的数据集。而是获取原始数据并使用各种算法来发现数据集群。如果您想了解无监督学习背后的理论和概念,请阅读用于数据分类的无监督学习。 在集群变得明显(例如在 3D 图表中)后,您可能想将标签应用于集群。这就是使用无监督学习来发现数据中的隐藏特征的一个示例。如果您不关... »

频率分布

机器学习入门教程4-使用 Python 和 scikit-learn 学习分类算法

在本教程中,我们将介绍有关解决基于分类的机器学习问题的基础知识,并提供对当前最受欢迎的一些算法的比较研究。 设置 注册或登录。 通过从试用 IBM Watson 页面登录到 IBM Cloud 帐户来激活 Watson Studio。 通过从 https://dataplatform.cloud.ibm.com 页面登录来访问 Watson Studio。 创建一个空白项目。 单击 Create ... »

频率分布

机器学习入门教程3-使用 Python 和 scikit-learn 学习回归算法

在本教程中,我们将介绍解决基于回归的机器学习问题的基础知识,并对当前最流行的一些算法进行比较研究。 设置 注册或登录。 从 Try IBM Watson 页面登录到您的 IBM Cloud 帐户来激活 Watson Studio。 在 https://dataplatform.cloud.ibm.com 处登录以访问 Watson Studio。 创建一个空白项目。 单击 Create a pro... »

加载数据

机器学习入门教程2-使用 Python 和 scikit-learn 构建并测试您的第一个机器学习模型

在本教程中,我们演示了如何从头到尾完整地创建和运行分类模型的实践示例。本教程包括以下步骤: 数据探索 数据预处理 拆分数据以用于训练和测试 准备一个分类模型 使用管道组装所有步骤 训练模型 对模型运行预测 评估模型性能并使之可视化 设置 本教程包括一个用 Python 编写的 Jupyter Notebook。您可以使用免费试用帐户,通过 Watson Studio 在 IBM Cloud 上运行... »

tensor.png

机器学习入门教程1-机器学习简介

机器学习是一门为了预测某个值而对系统应用算法来学习数据中模式的科学。利用足够的数据,在所有输入变量与待预测值之间建立关系。在给定其他输入变量的情况下,系统更容易预测一个新的值。这种方法不同于传统编程,在传统编程中,应用程序是基于先前设置的规则开发的。虽然机器学习的基本概念已经存在了一段时间,但这一领域最近才迅猛发展,这要归功于先进的处理器和丰富的可用数据,这两者都是实现精确预测的关键。因为介绍机器... »