【叶培大】人工智能与科研写作
Week 3 CNN/SVM/决策树/K-means
K-means
K-Means算法,也叫做K-均值,是机器学习中一种广泛使用的聚类算法,也可以成为其他聚类算法的基础
工作流程
- 输入:样本集,聚类簇数K,算法步骤为
- 随机选择K个簇中心
- 对于每个样本判断归属
- 计算每个样本与簇中心的欧几里得距离
- 将样本标记为距离它最近的簇
- 将样本划入相应的簇
- 将各簇中心更新为隶属于该簇所有样本的均值
- 重复上面两步
- 输出:簇划分
算法的优缺点
- 优点:简单 快速 适合常规数据集
- 缺点:K值难以确定,难以发现任意形状的簇
应用
图像压缩(图像矢量量化)
支持向量机
支持向量机(Support Vector Machine, SVM),是机器学习中一种广泛使用的有监督的分类及回归方法。
- 支持向量机寻找的最优分类直线应满足:
- 该直线分开了两类
- 该直线最大化间隔
- 该直线处于间隔的中间
决策树
决策树原理
信息增益
表示得知特征A的信息而使得类X的信息不确定性减少的程度。
决策树构造的基本思路
- 随着深度增加,节点熵迅速降低。(熵降低越快,完成越快)
- 有望得到一棵高度最矮的决策树。
- 叶子节点熵值为0,此时叶子节点为纯节点,即,每个叶子节点中的实例属于同一类。
构造过程
- 计算熵和信息增益,取最大的作为划分属性
- 过程迭代,选取划分属性
总结
- 原理
- 构造过程
深度学习-CNN
CNN:卷积神经网络(Convolutional neural network)
卷积
CNN特点之一:局部卷积
Week 04 图像语义分割
语义分割的基本概念及原理
定义:对图像每个像素进行分类,并划定物体的边界
- 任务特点
- 图像分类:识别存在的内容
- 物体识别和目标检测:识别图像中的内容和位置(通过边界框)
- 语义分割:识别图像中存在的内容及位置(查找所有的像素)
Week 05 虚拟现实(AI+三维模型)
计算机视觉
评论
评论插件加载失败
正在加载评论插件