博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
2020/11/13 01-机器学习线性回归算法实现与应用1
阅读量:3926 次
发布时间:2019-05-23

本文共 1181 字,大约阅读时间需要 3 分钟。

在这里插入图片描述

在这里插入图片描述
做为一个新的笔记

在这里插入图片描述

先确定数据源,线性回归的数学基础
在这里插入图片描述
·在这里插入图片描述
线性回归在数学来讲有2个作用,预测的作用,分类的作用
在这里插入图片描述
三面学习法,背景面(数学推导),基础面,影射法,围攻法

在这里插入图片描述

线性回归两大背景,预测,分类,从这两方面入手
这些是科学计数法表达的数据,年龄和身高的关系
在这里插入图片描述

在这里插入图片描述

这两个是dat的文本文件格式

在这里插入图片描述

引入魔法指令,图形前如到网页中,是notebook常用的魔法指令

nump主要是做数据的表达方式,把传统的标量概念,变成向量的概念,就是对python链式态的元组的扩展,matplotlib是数据可视化,sklearn是标准数据集,也可以网上下载它的文本文件加载工具

在这里插入图片描述
需要先加载年龄,这个数据就比较抽象
在这里插入图片描述
加载身高,一般人们就是用视觉感觉到有规律,规律要论证可靠,才去上升到数学去,数学可靠后,上升到工程的应用
在这里插入图片描述
figure(标题,fgsize大小)
添加一个坐标图,add_axes(指定大小和宽度,label标签)
左边是从1岁开始,右边到10岁
身高 最低0,最高1.5m
给年龄和身高加标签
scatter 画一个图出来,x坐标是年龄,y身高,
在这里插入图片描述
在这里插入图片描述
还可以设置颜色,marker可以设置就是个点,大小设置10

在这里插入图片描述

这样我们就可以看到年龄和身高其实是有正比关系的,在数学也叫线性。
那么计算机如何知道身高和年龄的关系成正比?也就可以预测一个8岁小孩的正常身高是多少,但是这样还不够让计算机智能的学习这种正比关系,就是让计算机学习线性回归的关系
在这里插入图片描述
现在这些点,如何让计算机去从中模拟出折线的规律,也就是线性回归,计算机去着手处理规律(算法)

这里也可以用plt.show,调用的也是这个方法

在这里插入图片描述
下面加载鸢尾花的数据,两个坐标,一个数据,一个叫target。
load_iris,iris就是鸢尾花(鸢尾花是一个数据结构),其实是采用美国三个地区的鸢尾花指数,一个是花瓣的长度宽度,一个是花萼的宽度长度。4 个数据就可以把这个三个地区鸢尾花指数,直接就可以分开。
但是之前的二维坐标就表达不了现在的多维数据
在这里插入图片描述
鸢尾花一共是150个样本,50个,一个50个分一类,前面50个跟后面的关系非常明显,下面可以看下表达数据,分三类,从0-50,50-100,100-150,红绿蓝。
最后ax.legend画一个主题
figure.show(warn=False把警告屏蔽
在这里插入图片描述
ABC类的数据看的很清楚。从前面的身高和年龄是成关系的状态,它的数据是沿着一条直线周边做分布,把直线精确的找出来就叫线性回归。
但是鸢尾花的数据并不是在一条直线上,但是我们只要判定它是跟哪一类的数据扎堆就可以

在这里插入图片描述

线性回归的几个准则:
 关系基本是直线,可以在多维空间里直接表达出来
预测
分类
算法只是第一关,沿用到实际,要到工程这一块

在这里插入图片描述

在这里插入图片描述
显示的更大一点

在这里插入图片描述

这个数据就更加明显,所谓线性回归就是找一条直线,要么做预测,要么做分类
在这里插入图片描述
在这里插入图片描述

转载地址:http://whzgn.baihongyu.com/

你可能感兴趣的文章
poj 2886 Who Gets the Most Candies?(线段树单点更新+反素数)真难。。。
查看>>
poj 3468 A Simple Problem with Integers(线段树成段更新,懒惰标记的使用)经典题目
查看>>
关于线段树懒惰标记的理解,成段更新(poj 3468为例)
查看>>
poj 2528 Mayor's posters(线段树区间更新+离散化)经典题目,较难。。。
查看>>
codeforces 394A Counting Sticks(题目虽简单,但是考虑的情况多,需仔细)
查看>>
codeforces 394 B. Very Beautiful Number(思路较难,优化的地方多)好题。。。
查看>>
poj 3225 Help with Intervals(线段树+区间的交集,差集,补集,并集)好难的题目,一天了,真是纠结
查看>>
poj 1664 放苹果(递推,记忆化搜索)简单题
查看>>
poj 1436 Horizontally Visible Segments(线段树成段覆盖问题+简单hash),好题,覆盖问题想法较难
查看>>
hdu 3308 LCIS(线段树单点更新+区间合并)中等难度的题目
查看>>
poj 3042 Grazing on the Run(区间DP,三维DP)
查看>>
poj 1991 Turning in Homework(区间DP,大区间推出小区间的思想)好题,想法很独特
查看>>
codeforces 395 B1. iwiwi(待续)
查看>>
hdu 4283 You Are the One(区间DP)题目转换难,状态难,。。。
查看>>
poj 2299 Ultra-QuickSort(树状数组+离散化的题目)据说是简单题,不过还是觉得好难。。。
查看>>
poj 2352 Stars(简单树状数组)此题也可以用线段树来做
查看>>
树状数组详细解释
查看>>
hdu 1596 find the safest road(最短路求最大值的题目,有两种稍微不同的处理方式)
查看>>
poj 1195 Mobile phones(二维的树状数组)得好好看。。。
查看>>
poj 2481 Cows(树状数组)题目有陷阱,转换后与stars类似
查看>>