4-from-linear-regression-to-logistic-regression

从线性回归到逻辑回归

在第2章,线性回归里面,我们介绍了一元线性回归,多元线性回归和多项式回归。这些模型都是广义线性回归模型的具体形式,广义线性回归是一种灵活的框架,比普通线性回归要求更少的假设。这一章,我们讨论广义线性回归模型的具体形式的另一种形式,逻辑回归(logistic regression)。

Read more…

6-clustering-with-k-means

K-Means聚类

前面几章我们介绍了监督学习,包括从带标签的数据中学习的回归和分类算法。本章,我们讨论无监督学习算法,聚类(clustering)。聚类是用于找出不带标签数据的相似性的算法。我们将介绍K-Means聚类思想,解决一个图像压缩问题,然后对算法的效果进行评估。最后,我们把聚类和分类算法组合起来,解决一个半监督学习问题。

Read more…

5-nonlinear-classification-and-regression-with-decision-trees

决策树——非线性回归与分类

前面几章,我们介绍的模型都是广义线性模型,基本方法都是通过联接方程构建解释变量与若干响应变量的关联关系。我们用多元线性回归解决回归问题,逻辑回归解决分类问题。本章我们要讨论一种简单的非线性模型,用来解决回归与分类问题,称为决策树(decision tree)。首先,我们将用决策树做一个广告屏蔽器,可以将网页中的广告内容屏蔽掉。之后,我们介绍集成学习(lensemble learning)方法,通过将一系列学习方法集成使用,以取得更好的训练效果。

Read more…

1-the-fundamentals-of-machine-learning

机器学习基础

本章我们简要介绍下机器学习(Machine Learning)的基本概念。主要介绍机器学习算法的应用,监督学习和无监督学习(supervised-unsupervised learning)的应用场景,训练和测试数据的用法,学习效果评估方式。最后,我们介绍scikit-learn及其安装方法。

Read more…