电子产业
数字化服务平台

扫码下载
手机洽洽

  • 微信小程序

    让找料更便捷

  • 扫码下载手机洽洽

    随时找料

    即刻洽谈

    点击下载PC版
  • 华强电子网公众号

    电子元器件

    采购信息平台

  • 华强电子网移动端

    生意随身带

    随时随地找货

  • 华强商城公众号

    一站式电子元器件

    采购平台

  • 芯八哥公众号

    半导体行业观察第一站

想从事深度学习工作的进来看,经典面试问题帮你整理好了

来源:电子之家 作者:华仔 浏览:245

标签:

摘要: 更新几个面试被问到或者联想出来的问题,后面有时间回答

更新几个面试被问到或者联想出来的问题,后面有时间回答

SGD 中 S(stochastic)代表什么
个人理解差不多就是Full-Batch和Mini-Batch
监督学习/迁移学习/半监督学习/弱监督学习/非监督学习?

本笔记主要问题来自以下两个问题,后续会加上我自己面试过程中遇到的问题。
深度学习相关的职位面试时一般会问什么?会问一些传统的机器学习算法吗?

如果你是面试官,你怎么去判断一个面试者的深度学习水平?
以下问题来自@Naiyan Wang

CNN最成功的应用是在CV,那为什么NLP和Speech的很多问题也可以用CNN解出来?为什么AlphaGo里也用了CNN?这几个不相关的问题的相似性在哪里?CNN通过什么手段抓住了这个共性?


Deep Learning -Yann LeCun, Yoshua Bengio & Geoffrey Hinton


Learn TensorFlow and deep learning, without a Ph.D.


The Unreasonable Effectiveness of Deep Learning -LeCun 16 NIPS Keynote


以上几个不相关问题的相关性在于,都存在局部与整体的关系,由低层次的特征经过组合,组成高层次的特征,并且得到不同特征之间的空间相关性。如下图:低层次的直线/曲线等特征,组合成为不同的形状,最后得到汽车的表示。


CNN抓住此共性的手段主要有四个:局部连接/权值共享/池化操作/多层次结构。


局部连接使网络可以提取数据的局部特征;权值共享大大降低了网络的训练难度,一个Filter只提取一个特征,在整个图片(或者语音/文本) 中进行卷积;池化操作与多层次结构一起,实现了数据的降维,将低层次的局部特征组合成为较高层次的特征,从而对整个图片进行表示。如下图:


上图中,如果每一个点的处理使用相同的Filter,则为全卷积,如果使用不同的Filter,则为Local-Conv。


为什么很多做人脸的Paper会最后加入一个Local Connected Conv?


DeepFace: Closing the Gap to Human-Level Performance in Face Verification
以FaceBook DeepFace 为例:


DeepFace 先进行了两次全卷积+一次池化,提取了低层次的边缘/纹理等特征。


后接了3个Local-Conv层,这里是用Local-Conv的原因是,人脸在不同的区域存在不同的特征(眼睛/鼻子/嘴的分布位置相对固定),当不存在全局的局部特征分布时,Local-Conv更适合特征的提取。


以下问题来自@抽象猴

什麽样的资料集不适合用深度学习?
数据集太小,数据样本不足时,深度学习相对其它机器学习算法,没有明显优势。


数据集没有局部相关特性,目前深度学习表现比较好的领域主要是图像/语音/自然语言处理等领域,这些领域的一个共性是局部相关性。图像中像素组成物体,语音信号中音位组合成单词,文本数据中单词组合成句子,这些特征元素的组合一旦被打乱,表示的含义同时也被改变。对于没有这样的局部相关性的数据集,不适于使用深度学习算法进行处理。举个例子:预测一个人的健康状况,相关的参数会有年龄、职业、收入、家庭状况等各种元素,将这些元素打乱,并不会影响相关的结果。


对所有优化问题来说, 有没有可能找到比現在已知算法更好的算法?
机器学习-周志华


没有免费的午餐定理:


对于训练样本(黑点),不同的算法A/B在不同的测试样本(白点)中有不同的表现,这表示:对于一个学习算法A,若它在某些问题上比学习算法 B更好,则必然存在一些问题,在那里B比A好。


也就是说:对于所有问题,无论学习算法A多聪明,学习算法 B多笨拙,它们的期望性能相同。


但是:没有免费午餐定力假设所有问题出现几率相同,实际应用中,不同的场景,会有不同的问题分布,所以,在优化算法时,针对具体问题进行分析,是算法优化的核心所在。


用贝叶斯机率说明Dropout的原理


Dropout as a Bayesian Approximation: Insights and Applications

近日,相关研究人员预测,到2020年人们跟聊天机器人的交谈时间会远多于跟配偶交谈的时间。不得不说,目前专注于研发聊天机器人应用的公司已经找到了正确的方向,他们已经看到了聊天机器人的良好前景。
 
越来越多的公司开始使用聊天机器人,预计到2020年,80%的公司都会将聊天机器人应用在客户服务这个环节上。一个合适的聊天机器人对公司的业绩发展起到非常重要的作用,但是市场上的聊天机器人多种多样,有成功的,也有很多只是简单的对话程序,远不能满足消费者的需求。如何评判聊天机器人性能好坏,对许多公司来说仍然是个不小的难题。
 
本文中列举了7大关键指标,通过这7大指标可以衡量一个公司使用的聊天机器人是否合格,以此做出相应改善。
 
 
一.营收增长
任何潜在投资者想要了解一家公司的第一件事就是看这个公司的营收表现。同样,聊天机器人证明其价值的最重要的指标就是看它为这个公司带来了何种经济效益。
 
例如,一个公司可以选择让人工服务团队与用户保持24小时全天候服务,也可以选择让聊天机器人为用户服务。两者相比,显然前者所需要付出的代价极大,不仅人工成本高,而且难免出现疏漏。而聊天机器人可以保持24小时在线,让用户随时可以咨询问题,为公司节省了一大笔开支。
 
另外,如果聊天机器人令用户感到满意,那将会带来更多回头客和更高的在线销售额,从而使营收得到增长。
 
二.自助服务率
公司最希望看到的,就是不通过任何人力的协助,用户就能在聊天机器的帮助下解决他们遇到的问题。
 
假如用户的需求是修改密码,公司可以根据机器人在离开人工帮助下完成“修改密码”这一任务的百分比程度来衡量其表现。假如聊天机器人功能越好越完善,用户体验越好,则用户自主修改密码的过程越多。若是机器人的功能漏洞百出,即便再有耐心的用户也会失去积极性。
 
自助服务率与公司成本密切相关。换句话说,聊天机器人的自助服务程度越高,公司就能省下越多钱。
 
三.用户满意度
要想知道聊天机器人好不好使,直接询问用户是最有效的方法。
 
通过NPS(净推荐值)的方法,我们就能够确定用户对聊天机器人服务的满意度。比如,在聊天机器人与用户的互动结束之后,向用户立即推送一个“在1-10的范围内,你有多大可能会向朋友/同事推荐我们的聊天机器人?”这一问题,以此获得用户的反馈。
 
通过用户的反馈数据,就能够得到有效的NPS数据。NPS作为一个核心增长指标,让公司在了解用户满意度方面有了至关重要的基础。
型号 厂商 价格
EPCOS 爱普科斯 /
STM32F103RCT6 ST ¥461.23
STM32F103C8T6 ST ¥84
STM32F103VET6 ST ¥426.57
STM32F103RET6 ST ¥780.82
STM8S003F3P6 ST ¥10.62
STM32F103VCT6 ST ¥275.84
STM32F103CBT6 ST ¥130.66
STM32F030C8T6 ST ¥18.11
N76E003AT20 NUVOTON ¥9.67