博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
深度神经网络:特点、问题及解决
阅读量:5264 次
发布时间:2019-06-14

本文共 1011 字,大约阅读时间需要 3 分钟。

  • CNN:具有强大的提取局部特征的能力
  • dropout:防止过拟合(drop 层内的一些 neurons);
    • residual learning,是跳过某一些 layer
    • 加快模型的训练速度;
  • softmax(全连接):多分类任务

0. deep learning

  • high-level abstractions in data
  • deep graph with multiple processing layers
  • composed of multiple linear & non-linear transformations

1. Vanishing Gradient(梯度消失)

  • Greedy Layer-wised Pretraining(贪婪逐层预训练)和有监督调优训练,
    • Hinton 和他的学生 Salakhutdinov
    • G. E. Hinton and R. R. Salakhutdinov,”Reducing the dimensionality of data with neural networks,” Science, vol. 313, pp. 504-507, 2006.

2. auto-encoder

一种 compressed representation,压缩表示;

本身的架构 autoencoder 包括,encoder 和 decoder。

  • autoencoder(input, output)

    • encoder(input, encoded)
    • decoder()
  • input train input,以实现一种无监督的方式;

    • auto,自,是和 无监督相对应的;

其主要的特点在于(大量的学习):

  • data-specific,数据依赖;
  • lossy,有损耗的,失真,
  • learn from examples,如果是用 face 来 train,它可能会对 face 的压缩比较好;

后因为有一些新的算法的出现,取代了 auto-encoder 在模型预训练上的使命,使其主要应用在:

  • 数据降噪;
  • 数据降维;

3. 从 AE 到 SDA

SDA 的两大优势在于:

  • nonlinearity:非线性性;
    • h()
  • deep;
    • stacking of multiple layers;

转载于:https://www.cnblogs.com/mtcnn/p/9422966.html

你可能感兴趣的文章
12010 解密QQ号(队列)
查看>>
javascript performence
查看>>
[转载]背包问题九讲(九)
查看>>
【端口占用】系统占用80端口解决
查看>>
web工程中URL地址的推荐写法
查看>>
布尔代数
查看>>
软件测试常见风险分析
查看>>
python:利用configparser模块读写配置文件
查看>>
3675: [Apio2014]序列分割
查看>>
搜索与回溯算法
查看>>
pushlet的简单使用
查看>>
Com Excel组件释放资源关闭进程总结
查看>>
AnsibleTower
查看>>
无损扩容,调整Centos服务器分区大小,简明扼要
查看>>
开通博客的感想和规划
查看>>
MapReduce 多表连接
查看>>
python包安装和使用机制
查看>>
Nginx/LVS/HAProxy负载均衡软件的优缺点
查看>>
存储基本知识_基本分区管理
查看>>
thinkPHP 数字字典
查看>>