您好、欢迎来到现金彩票网!
当前位置:2019全年免费资料大全 > 桶链算法 >

机器学习笔试面试题——day4

发布时间:2019-07-17 10:23 来源:未知 编辑:admin

  3、假如我们使用非线性可分的SVM目标函数作为最优化对象, 我们怎么保证模型线

  6、我们建立一个5000个特征, 100万数据的机器学习模型. 我们怎么有效地应对这样的大数据训练 :

  我们先把所有特征都使用, 去训练一个模型, 得到测试集上的表现. 然后我们去掉一个特征, 再去训练, 用交叉验证看看测试集上的表现. 如果表现比原来还要好, 我们可以去除这个特征.

  1 在随机森林的单个树中, 树和树之间是有依赖的, 而GradientBoosting Trees中的单个树之间是没有依赖的

  1 随机森林是基于bagging的, 在随机森林的单个树中, 树和树之间是没有依赖的。 2 Gradient Boosting trees是基于boosting的,且GradientBoosting Trees中的单个树之间是有依赖关系。 3 这两个模型都使用随机特征子集, 来生成许多单个的树。

  9、对于PCA(主成分分析)转化过的特征 , 朴素贝叶斯的”不依赖假设”总是成立, 因为所有主要成分是正交的, 这个说法是 :

  核函数(线性核、ploy、rbf、sigmod)、损失函数、惩罚系数(C)、多分类策略

  n_ estimators:基学习器的个数(这里是树的颗数),是否用采样法(bootstrap )

  学习率:常用策略1)学习率衰减2)用自使用学习率作为优化器,如Adam和Adagrad

  mini batch:小的mini batch size可能因为收敛的抖动比较厉害反而不容易卡在局部最低点,但是mini batch也不能太大,反而准确率下降。

  epoch:用早停法选择合适核Epoch,观察validation error上升时就early stop,但是别一看到上升就停,再观察一下,因为有可能只是暂时的现象,这时候停止反而训练会不充分

  这部分主要是针对上面问题的一些更细节的补充,包括公式的推倒思路、模型的基本构成、细节问题的分析等等。一、问题杂烩1、PCA的第二主成分第二个主成分时域第一成分方向正教的差异性次大方向。2、什么时候用组...

  参考网址:机器学习笔试题精选试题一1.在线性回归问题中,利用R平方(R-Squared)来判断拟合...

  前面一直在准备出国留学申请,中间投递了华为、腾讯、阿里三家公司。幸运的是拿到了华为多媒体算法岗,腾讯机器学习算法岗,阿里巴巴菜鸟物流算法岗。接下来将投入到论文发表、计算机名校申请中。Attention...

  2018/08/04更新:最近在复习功课,为了秋招做准备,一些新的知识总结也会穿插进来。2018.02.06-携程面试问题:(1) 决策树的节点划分准则:1、信息熵的前后变化-信息增益,ID3算法用的...

  2016百度‘机器学习/数据挖掘岗位’面经,一面+二面+三面,9月25日

http://linkzoo.net/tongliansuanfa/397.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有