无监督学习

在这里插入图片描述

无监督学习之PCA降维

无监督学习:通过无标签的数据,学习数据的分布或数据与数据之间的关系。 1. 降维算法 1 定义:用低维的概念去类比高维的概念.将高维的图形转化为低维的图形的方法。 1.1. 算法模块 :PCA算法、NMF(非负矩阵分解)算法、LDA算法等。 1.2. Python库 :sklearn.decomposution; 2. 主成分分析( PCA )降维算法 1 主成分分析:主成分分析( Princip... »

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rXcJDQkm-1582713296549)(attachment:image.png)]

无监督学习PCA降维处理和K-means聚类

1、无监督学习 没有目标值(变量)的算法 常见的无监督学习算法: 降维: – 主成分分析PCA降维处理 聚类: – K-means(k均值聚类) 2、主成分分析 应用PCA实现特征的降维 ·定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量 ·作用:是数据维散压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 ·应用:回归分析或者聚类分析当中 PCA的APA: ·s... »

在这里插入图片描述

K-means聚类算法

聚类 “类”指的是具有相似性的集合,聚类是指将数据集划分为若干类,使得各个类之内的数据最为相似,而各个类之间的数据相似度差别尽可能的大。聚类分析就是以相似性为基础,在一个聚类中的模式之间比不在同一个聚类中的模式之间具有更多的相似性。对数据集进行聚类划分,属于无监督学习。 K-Means聚类算法 是无监督学习的一种。 K-Means算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定... »

机器学习第一弹——概述区分

正在学习机器学习,写下博文梳理下思路机器学习分为:1. 有监督学习2. 无监督学习3. 强化学习三者区别:1.输入数据带有标签——有监督学习;2.输入数据不带标签——无监督学习;3.数据需要从环境中自行探索获得(即不存在带有标签数据的输入)且环境可以对每个行动提供反馈(可以理解探索到的的数据此时又带有标签了)——强化学习进一步分解:监督学习可以根据标签类型区 »

谷歌Hinton团队最新力作:让ImageNet无监督学习的指标提升了 7-10%,可媲美有监督学习的效果

谷歌Hinton团队最新力作:让ImageNet无监督学习的指标提升了 7-10%,可媲美有监督学习的效果

如今,ImageNet上图像识别精度的性能提升通常一次只有零点几个百分点,而来自谷歌研究人员的最新研究,如图灵奖获得者杰弗里·辛顿已经将无监督学习的指数提高了7-10%,甚至可以与有监督学习的效果相媲美。通过结合这些发现,我们能够轻松超过ImageNet上用于自我监督和半监督学习的方法。我们的方法与ImageNet上的标准监督学习的不同之处仅在于数据增强的选择,网络末端使用非线性投射头以及损失函数... »

MachineLearning学习——0216——无监督学习之聚类、PCA、顺便试试markdown

参考:https://github.com/apachecn/vt-cs4624-pyml-zh/blob/master/docs/18.md 聚类 介绍:使用无标注数据,将相似数据分组,同时隔离不相似数据。注意,与分类不同的是,聚类用于识别数据集中的潜在组,分类用于将输入与现有组匹配。简单的说,聚类前没有已知类别,分组前已知需要的类别。 如何理解潜在组:如用户群体聚类。用户特征很多,可以是xx岁... »

在这里插入图片描述

机器学习入门之无监督学习(四)

引言 本文主要介绍深度自动编码器(Deep Auto encoder),做的事情还是降维,不过降维的时候是使用神经网络。 自动编码器 把很多隐藏层的神经网络当成编码器,输入一个图像后能得到一个编码。比如传入784维的手写数字,得到的编码通常会小于784维。 现在问题是我们如何得到这样一个编码器呢。要训练这个编码器我们需要同时训练一个解码器,能更加编码解码成原来的784维图像数据。 这件事情其实和P... »

python实现聚类算法原理

本文主要内容: 聚类算法的特点 聚类算法样本间的属性(包括,有序属性、无序属性)度量标准 聚类的常见算法,原型聚类(主要论述K均值聚类),层次聚类、密度聚类 K均值聚类算法的python实现,以及聚类算法与EM最大算法的关系 参考引用 先上一张gif的k均值聚类算法动态图片,让大家对算法有个感性认识: 其中:N=200代表有200个样本,不同的颜色代表不同的簇(其中 3种颜色为3个簇),星星代表每... »

聚类方法对比示意

什么是聚类分析?聚类分析方法的类别

聚类分析方法的类别目前存在大量的聚类算法,算法的选择取决于数据的类型、聚类的目的和具体应用。与基于距离的聚类算法不同的是,基于距离的聚类算法的聚类结果是球状的簇,而基于密度的聚类算法可以发现任意形状的簇。图 4基于网格的聚类算法示意基于网格的聚类方法的主要优点是处理速度快,其处理时间独立于数据对象数,而仅依赖于量化空间中的每一维的单元数。 »

ac_risk.png

机器学习入门教程5-使用 Python 和 scikit-learn 学习聚类算法

在本教程中,您将使用无监督学习来发现数据中的分组和异常点。在无监督学习中,没有用于显示期望结果的真值(ground truth) 或带标签的数据集。而是获取原始数据并使用各种算法来发现数据集群。如果您想了解无监督学习背后的理论和概念,请阅读用于数据分类的无监督学习。 在集群变得明显(例如在 3D 图表中)后,您可能想将标签应用于集群。这就是使用无监督学习来发现数据中的隐藏特征的一个示例。如果您不关... »