机器学习逻辑回归
逻辑回归(Logistic Regression)是一种最基本的二分类模型,逻辑回归的目的是寻找非线性函数Sigmoid的一个最佳拟合参数。 Sigmoid函数…
逻辑回归(Logistic Regression)是一种最基本的二分类模型,逻辑回归的目的是寻找非线性函数Sigmoid的一个最佳拟合参数。 Sigmoid函数…
当模型和损失函数形式较为简单时,误差最小化问题的解可以直接用公式表达出来,这类解叫作解析解,例如文章机器学习线性回归与最小二乘法中讲解的算法就属于此类。然而,大…
假设有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就叫做回归。 一元线性回归 对于训练样本,线性回归试图学得,使得尽可能逼近…
kNN算法(即k邻近算法)是机器学习中最简单有效的一个分类算法,简单的说,kNN算法通过计算样本之间的距离进行分类。 工作原理 首先存在一个训练样本集合,集合中…
AUC(Area Under Curve)常被用来评价一个二值分类器的优劣,我们首先看一下 AUC 的定义:AUC 值是一个概率值,随机挑选一个正样本和一个负样…
Grafana 是大规模指标数据可视化展现的开源工具,广泛应用于监控报警、数据分析。它可以支持多种数据源,包括 Graphite,Elasticsearch,C…
安装:下载并启动 Flink Flink 可以运行在 Linux,Mac OS X 和 Windows 上,唯一的要求就是已经安装了 Java 8.x。 可以通…
时间窗口 剩下的两种无界数据处理的方法都是时间窗口的变种。在介绍它们之前,我应该先明确时间窗口的含义。时间窗口就是将数据源(无界或者有界)沿着时间线划分成有限的…
数据处理模式 现在我们可以开始讲一些有界和无界数据处理的重要模式了:批量和流式,这里我把微批归类为流式,因为二者的区别不是很重要。 有界数据 处理有界数据很简单…
在流式计算方面,有两篇经典文章是必读的:The world beyond batch: Streaming 101与The world beyond batch…