当前位置: 首页 > news >正文

AI基础知识(3)--神经网络,支持向量机,贝叶斯分类器

1.什么是误差逆传播算法(error BackPropagation,简称BP)?

是神经网络通用训练算法,BP算法的基础是基于梯度下降(gradient descent)的误差函数优化,梯度是基于误差对每一个权重值的梯度。因为利用了神经网络的层次结构,所以显著提高了计算效率。BP的算法工作流程大致是:先将输入样本输入给输入层神经元,再将误差逆向传播至隐层神经元最后根据隐层神经元的误差来对连接权(connection weight)和阈值(threshold)进行调整,这也是“基于误差”的思想所在,该过程迭代调整,直到训练误差达到一个很小的值。

2.如何解决误差函数中参数寻优陷入局部极小的问题?

(1)以多组不同的值初始化多个神经网络,按标准方法训练之后,取其中误差最小的解作为参数。这相当于从不同的初始点开始搜索,这样就可能陷入不同的局部最小。

(2)使用“模拟退火”(simulated annealing)技术,模拟退火每一步都在以一定的概率接受比当前更差的结果,从而有助于“跳出”局部极小。

(3)使用随机梯度下降,与标准梯度下降计算机误差精度不同,随机梯度下在计算梯度时加入了随机因素,即使陷入局部极小点,它计算出的梯度仍可能不为0,这样就有机会跳出局部极小。

3.什么是预训练(pre-training)?

由于多隐层神经网络在多隐层逆传播时,往往会“发散”(diverse)而不能收敛到稳定状态,所以采用预训练方法,训练时将上一层隐结点的输出作为输入,而本层隐结点的输出作为下一层隐结点的输入。在预训练结束后,再对整个网络进行微调(fine-tuning)。

4.什么是支持向量机(support vector machine)?

首先解释支持向量(support vector),是指距离超平面w^Tx_i+b=0,最近的几个点使得下面公式的等号成立,他们被称为“支持向量”。

两个异类支持向量到超平面的距离称为间隔(margin),欲找到具有“最大间隔”(maximum margin)的划分超平面,也就是找到能满足上面约束条件的参数w和b,使得margin最大,这就是支持向量机(SVM)的基本型:对于二分类问题,找到一个超平面,使得margin最大。

相关文章:

  • S32 Design Studio 中断
  • python日常刷题(一)
  • web蓝桥杯真题:灯的颜色变化
  • Java使用itextpdf往pdf中插入图片
  • Python Windows系统 虚拟环境使用
  • JavaEE 初阶篇-深入了解进程与线程(常见的面试题:进程与线程的区别)
  • Spring Boot 实现程序的优雅退出
  • 软考真题详解-系统架构设计师-计算机基础知识(1)
  • binary.write 和 binary.read
  • 分布式事务的解决方案--Seata架构
  • Linux的基本使用
  • vue3+threejs新手从零开发卡牌游戏(七):创建卡组
  • 掌握Go语言:Go语言结构体,精准封装数据,高效管理实体对象(22)
  • 重磅|国家能源局开展配电网安全风险管控重点行动
  • 微前端架构
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • Apache Zeppelin在Apache Trafodion上的可视化
  • ComponentOne 2017 V2版本正式发布
  • C学习-枚举(九)
  • JS+CSS实现数字滚动
  • Material Design
  • overflow: hidden IE7无效
  • Python 反序列化安全问题(二)
  • Sass Day-01
  • Vue实战(四)登录/注册页的实现
  • 基于Dubbo+ZooKeeper的分布式服务的实现
  • 将 Measurements 和 Units 应用到物理学
  • 为视图添加丝滑的水波纹
  • 一些关于Rust在2019年的思考
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • 大数据全解:定义、价值及挑战
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • ​力扣解法汇总1802. 有界数组中指定下标处的最大值
  • ​云纳万物 · 数皆有言|2021 七牛云战略发布会启幕,邀您赴约
  • # Swust 12th acm 邀请赛# [ E ] 01 String [题解]
  • #我与Java虚拟机的故事#连载04:一本让自己没面子的书
  • #我与Java虚拟机的故事#连载06:收获颇多的经典之作
  • #我与Java虚拟机的故事#连载15:完整阅读的第一本技术书籍
  • (+3)1.3敏捷宣言与敏捷过程的特点
  • (6)添加vue-cookie
  • (Mirage系列之二)VMware Horizon Mirage的经典用户用例及真实案例分析
  • (附源码)ssm本科教学合格评估管理系统 毕业设计 180916
  • (规划)24届春招和25届暑假实习路线准备规划
  • (黑马C++)L06 重载与继承
  • (三)mysql_MYSQL(三)
  • (一) storm的集群安装与配置
  • (转)EXC_BREAKPOINT僵尸错误
  • (转贴)用VML开发工作流设计器 UCML.NET工作流管理系统
  • ***监测系统的构建(chkrootkit )
  • .bat批处理(十):从路径字符串中截取盘符、文件名、后缀名等信息
  • .NET CF命令行调试器MDbg入门(三) 进程控制
  • .net refrector
  • .NET(C#) Internals: as a developer, .net framework in my eyes