AI

分类下相关文章

PyTorch 基础概念 - 数据集 Dataset

Datasets and Dataloaders Dataset (torch.utils.data.Dataset) 存储了样本及其对应的标签。 DataLoader (torch.utils.data.DataLoader) 方便访问 Dataset。 Dataset 的类型 图片 文本 音频 等等。 现成的 Dataset 有哪些 例如, FashionMNIST。 >>> from torchvision import datasets >>> dir(datasets) ['CIFAR10', 'CIFAR100', 'CLEVRClass ...

阅读全文...

PyTorch 基础概念 - 张量 Tensors

无论是 PyTorch 还是 TensorFlow,我们首先都会遇到一个基础概念,张量 (Tensor)。 张量 (Tensor) 的作用 模型 (Model) 的输入和输出都是用张量 (Tensor) 表示的。 张量 (Tensor) 是什么 张量 (Tensor) 就是一种数据结构,类似数组 (array),矩阵 (matrix),向量 (vector)。 更形象地理解张量 (Tensor) 例如,如果我们要做一个二手车价格预测模型 (Model),那么如何表示一辆二手车呢? 就可以用一个一维数组来表示,每个元素代表: 生产年份 形式里程数 品牌 事故数 是否泡水过 等等。 也就是,用 ...

阅读全文...

PyTorch 学习计划及相关学习资料

之前用 OpenCV 实现的一个小麦图像识别的 Android APP,但是做到第二版时, 想增加功能,发现大部分类似项目都是用 PyTorch 实现的,所以不得不换技术方案。 可是断断续续看了一个多月的 PyTorch,发现自学效果不佳,连代码都没怎么写。 可能都是在等车,或者车上看的,没有实际敲代码,所以理解不深。 PyTorch 市面上的书籍非常多,但我看的几本口碑不错的书,都是虎头蛇尾。 前面讲的挺细致,比如基础概念、一些原理之类的,还能接受。 但是,一旦到了解决实践问题的章节,需要大量代码说明的部分,就完全滥竽充数。 也不知道是为了水一本书,还是里面确实有核心的业务逻辑不舍得分享, ...

阅读全文...

Windows 11 安装 PyTorch

安装 conda 从介绍来看 conda 是一个比 pip 更强大的包管理工具,除了支持 python 的包管理也支持其他语言。 https://conda.io/projects/conda/en/latest/user-guide/install/windows.html 里面有两个安装包 Miniconda 和 Anaconda,如何选择呢? Miniconda installer = Python + conda Anaconda installer = Python + conda + meta package anaconda 大概 1500 个内置包,3G 空间 看起来 Mi ...

阅读全文...

机器学习 - Training and Loss

在监督学习 (supervised learning)中,机器学习算法的目标是通过检验一堆 examples, 建立一个模型 (model),以最小化 loss。 这个 loss,我的理解是,设置一个阈值,当曲线与 example 点的偏差小于某个差值时,表示这个 example 可以接受,否则则是 loss。训练出的最佳 model 即是能接受最多的 examples 的 model. 假设 x 轴代表博客文章数,y 轴代表日 UV,那么 Good 曲线比 bad 曲线的预测效果更好。 所以评判一个训练的出的 model 的好坏,就是判断其对 examples 的 loss 的多少。Lo ...

阅读全文...

机器学习 - Linear Regression 线性回归

这个图是每分钟蟋蟀叫的次数,与温度的关系。 W 代表 Feature x 的权重,一个 Linear Regression 中,可能包含多个 Feature。即,可能有多个因素影响结果。 B 截距,即所有 feature 均为 0 时,y 的值。联系一元一次方程的直线与 y 轴的交点。 ...

阅读全文...

机器学习的基本概念和术语

什么是机器学习 机器学习系统是基于学习训练,然后,分析未曾见过的数据,并产生有价值的结论或预测。 Labels Label,即我们预测的结果。Linear regression 的 Y 变量。 Label 可以是预测的小麦价格,图片中的动物,一段音频的翻译。 Features Feature,即输入的变量。Linear regression 的 X 变量。 简单的机器学习项目,可能只使用一个 Feature。 而复杂的项目,可能使用成百上千个 Feature, 例如,X1, X2, … XN. 在垃圾邮件判定中,可能包含的 Feature: 邮件字数 发件人地址 邮件的发送时间 关键字 ...

阅读全文...

机器学习的应用场景

垃圾邮件过滤 监督学习,需要训练数据。 提取访客的人群特征 非监督学习,无需训练数据。 例如,收集到自己博客的访客信息之后,在没有训练数据的前提下,自动提取特征。例如, 男女比例 男性更喜欢哪些分类的文章 周末女性更喜欢哪些分类的文章 凌晨时分哪些分类更受关注 超市商品关联度 非监督学习,无需训练数据。 根据结算时顾客的购物清单,推算出关联性高的商品,例如,红酒和红酒起子。方便超市运营人员,调整货架,将关联度高的商品距离拉近。 周期性数据预测 ... google 照片 app 的图片自动分类功能 半监督学习,即提供大部分的 labeled 数据及小部分 unlabeled 数据。 用户上 ...

阅读全文...

机器学习是什么

英文,machine learning。 最初的应用场景 ocr,文字识别 spam filter,垃圾内容过滤 以垃圾评论为例 在没有使用机器学习的情况下,只能一条一条的写规则,例如 不能包含 http:// 不能包含 .com ... 然后,你会发现,每天都会遇到新的不在旧有规则覆盖范围之内的垃圾评论。(这就是我关闭了实时评论的原因,采用规则加人工审核) 归纳一下,规则流,就是分析-写规则-运行-看效果-再分析-再写规则,如此反复。 机器学习的做法是,首先利用样本,例如垃圾评论样本,非垃圾评论样本,自动提取特征,然后运行-看效果-再训练-如此反复。 理论上,机器学习反复的过程要比人 ...

阅读全文...

太浮躁了!屁大点的功能都要扯上 AI

AI = artificial intelligence 每天看到的新闻都是这种恶心的标题 OneDrive和Sharepoint月底上线AI新功能:可搜索图片中文字 牵手富士康,吴恩达宣布创业新项目,要用AI复兴制造业 为了提升GIF图的分辨率,这家公司用上了AI算法 ... 还有李开复这个 AI 大忽悠,每一句话都令人恶心。 AI 来 AI 去的,都不过是做了个图片识别,这算哪门子的人工智能。就算是图片识别,也不如 reddit 上的 r/CelebFakes 里的人工合成小电影对人类的贡献大!但是人家可没有天天吹嘘我用了 TensorFlow,永远都是那么朴实的标题。。。 人工智能难 ...

阅读全文...