数据预处理:归一化/标准化详解

前言

一般而言,样本的原始特征中的每一维特征由于来源以及度量单位不同,其特征取值的分布范围往往差异很大,比如身高、体重、血压等它们的度量和分布范围往往是不一样的。当我们计算不同样本之间的欧氏距离时,取值范围大的特征会起到主导作用。这样,对于基于相似度比较的机器学习方法(比如最近邻分类器),必须先对样本进行预处理,将各个维度的特征归一化到同一个取值区间,并且消除不同特征之间的相关性,才能获得比较理想的结果。虽然神经网络可以通过参数的调整来适应不同特征的取值范围,但是会导致训练效率比较低。

阅读全文

深入理解model.eval()与torch.no_grad()

我们用pytorch搭建神经网络经常见到model.eval()与torch.no_grad(),它们有什么区别?是怎么工作的呢?现在就让我们来探究其中的奥秘

阅读全文

使用VGG迁移学习开启《猫狗大战挑战赛》

使用VGG迁移学习开启《猫狗大战挑战赛》,内容如下:
一、前言
二、加载数据集
三、数据预处理
四、构建VGG模型
五、训练VGG模型
六、保存与测试模型
七、总结

阅读全文

Typora需要注意的换行符

在Typora中一定要换行符,包括普通换行,以及整个段落的换行,这些和普通的markdown编辑器是不太一样的

阅读全文

使用pytorch的auto_grad实现线性模型对mnist数据集多分类

使用pytorch的auto_grad实现线性模型对mnist数据集多分类,选取mnist100张图片,前80张为测试集,后20张为训练集,eporch 500次

知识储备

使用多个线性模型进行多分类 原理:每一个线性模型做二分类
多个线性模型 = 感知机,实质就是每一个线性模型做二分类

阅读全文

numpy和torch数据类型转化

在实际计算过程中,float类型使用最多,因此这里只介绍numpy和torch数据float类型转化,其他类型同理。

阅读全文

Google Colab挂载drive上的数据文件

Google Colab是完全云端的,所以,每次如果想让他访问谷歌云盘的内容,必须要先进性授权操作,直接在colab的jupyter中进行绑定授权操作

每次在Google Colab中打开notebook文件时,都必须重新执行命令获得授权。

阅读全文