添加10道【机器学习】【计算机视觉】【Python】等方向的面试题

amusi · amusi · commit 4f26877c1b3c · 2019-12-15T12:01:46.000+08:00
diff --git a/docs/数据结构与算法.md b/docs/数据结构与算法.md
@@ -1111,6 +1111,16 @@ if __name__ == "__main__":
 
 - [ ] TODO
 
+## 堆
+
+### 构建堆的复杂度
+
+- [ ] TODO
+
+### 堆找出第k大元素的复杂度 
+
+- [ ] TODO
+
 ## 打印螺旋矩阵
 
 - [ ] TODO
diff --git a/docs/机器学习.md b/docs/机器学习.md
@@ -133,6 +133,10 @@ $$J(\phi(z),y;w)=-yln(\phi(z))-(1-y)ln(1-\phi(z))$$
 
 - [ ] TODO
 
+### 逻辑回归是处理线性问题还是非线性问题的？ 
+
+- [ ] TODO
+
 ## 线性回归
 
 ### 基本原理
@@ -318,7 +322,7 @@ SVM的目标函数
 
 第三，在解决非线性问题时，支持向量机采用核函数的机制，而LR通常不采用核函数的方法。
 
-​这个问题理解起来非常简单。分类模型的结果就是计算决策面，模型训练的过程就是决策面的计算过程。通过上面的第二点不同点可以了解，在计算决策面时，SVM算法里只有少数几个代表支持向量的样本参与了计算，也就是只有少数几个样本需要参与核计算（即kernal machine解的系数是稀疏的）。然而，LR算法里，每个样本点都必须参与决策面的计算过程，也就是说，假设我们在LR里也运用核函数的原理，那么每个样本点都必须参与核计算，这带来的计算复杂度是相当高的。所以，在具体应用时，LR很少运用核函数机制。​
+这个问题理解起来非常简单。分类模型的结果就是计算决策面，模型训练的过程就是决策面的计算过程。通过上面的第二点不同点可以了解，在计算决策面时，SVM算法里只有少数几个代表支持向量的样本参与了计算，也就是只有少数几个样本需要参与核计算（即kernal machine解的系数是稀疏的）。然而，LR算法里，每个样本点都必须参与决策面的计算过程，也就是说，假设我们在LR里也运用核函数的原理，那么每个样本点都必须参与核计算，这带来的计算复杂度是相当高的。所以，在具体应用时，LR很少运用核函数机制。​
 
 第四，​线性SVM依赖数据表达的距离测度，所以需要对数据先做normalization，LR不受其影响。（引自http://www.zhihu.com/question/26768865/answer/34078149）
 
@@ -739,6 +743,10 @@ Boosting：各个预测函数只能顺序生成，因为后一个模型参数需
 - [机器学习实战（三）——决策树](https://blog.csdn.net/jiaoyangwm/article/details/79525237)
 - [决策树基本概念及算法优缺点](https://www.jianshu.com/p/655d8e555494)
 
+### 决策树的ID3和C4.5介绍一下
+
+- [ ] TODO
+
 ## 随机森林（RF）
 
 ### 基本原理
@@ -1477,6 +1485,10 @@ L2正则化参数
 
 - [ ] TODO
 
+###  Softmax代码实现
+
+- [ ] TODO
+
 ## 交叉熵损失函数
 
 - [ ] TODO
diff --git a/docs/深度学习.md b/docs/深度学习.md
@@ -216,7 +216,7 @@ if (this->layer_param_.pooling_param().pool() == PoolingParameter_PoolMethod_MAX
 
 - [ ] TODO
 
-### BN可以防止过拟合么？
+### BN 可以防止过拟合么？为什么
 
 - [ ] TODO
 
@@ -862,76 +862,6 @@ W∗=argminw∗∑iN(ti∗−w^T∗ϕ5(Pi))2+λ||w^∗||2
 
 - [如何理解空洞卷积（dilated convolution）？](<https://www.zhihu.com/question/54149221>)
 
-## RetinaNet（Focal loss）
-
-《Focal Loss for Dense Object Detection》
-
-- arXiv：https://arxiv.org/abs/1708.02002
-
-清华大学孔涛博士在知乎上这么写道：
-
-目标的检测和定位中一个很困难的问题是，如何从数以万计的候选窗口中挑选包含目标物的物体。只有候选窗口足够多，才能保证模型的 Recall。
-
-目前，目标检测框架主要有两种：
-
-一种是 one-stage ，例如 YOLO、SSD 等，这一类方法速度很快，但识别精度没有 two-stage 的高，其中一个很重要的原因是，利用一个分类器很难既把负样本抑制掉，又把目标分类好。
-
-另外一种目标检测框架是 two-stage ，以 Faster RCNN 为代表，这一类方法识别准确度和定位精度都很高，但存在着计算效率低，资源占用大的问题。
-
-Focal Loss 从优化函数的角度上来解决这个问题，实验结果非常 solid，很赞的工作。
-
-何恺明团队提出了用 Focal Loss 函数来训练。
-
-因为，他在训练过程中发现，类别失衡是影响 one-stage 检测器准确度的主要原因。那么，如果能将“类别失衡”这个因素解决掉，one-stage 不就能达到比较高的识别精度了吗？
-
-于是在研究中，何恺明团队采用 Focal Loss 函数来消除“类别失衡”这个主要障碍。
-
-结果怎样呢？
-
-为了评估该损失的有效性，该团队设计并训练了一个简单的密集目标检测器—RetinaNet。试验结果证明，当使用 Focal Loss 训练时，RetinaNet 不仅能赶上 one-stage 检测器的检测速度，而且还在准确度上超越了当前所有最先进的 two-stage 检测器。
-
-**参考**
-
-- [如何评价Kaiming的Focal Loss for Dense Object Detection？](https://www.zhihu.com/question/63581984)
-- [首发 | 何恺明团队提出 Focal Loss，目标检测精度高达39.1AP，打破现有记录](https://zhuanlan.zhihu.com/p/28442066)
-
-
-## FPN 特征金字塔网络
-
-- [ ] TODO
-
-## Faster R-CNN的RPN网络
-
-RPN结构说明： 
-
-1) 从基础网络提取的第五卷积层特征进入RPN后分为两个分支，其中一个分支进行针对feature map（上图conv-5-3共有512个feature-map）的每一个位置预测共（9*4=36）个参数，其中9代表的是每一个位置预设的9种形状的anchor-box，4对应的是每一个anchor-box的预测值（该预测值表示的是预设anchor-box到ground-truth-box之间的变换参数），上图中指向rpn-bbox-pred层的箭头上面的数字36即是代表了上述的36个参数，所以rpn-bbox-pred层的feature-map数量是36，而每一张feature-map的形状（大小）实际上跟conv5-3一模一样的；
-
-2) 另一分支预测该anchor-box所框定的区域属于前景和背景的概率（网上很对博客说的是，指代该点属于前景背景的概率，那样是不对的，不然怎么会有18个feature-map输出呢？否则2个就足够了），前景背景的真值给定是根据当前像素（anchor-box中心）是否在ground-truth-box内；
-
-3) 上图RPN-data(python)运算框内所进行的操作是读取图像信息（原始宽高），groun-truth boxes的信息（bounding-box的位置，形状，类别）等，作好相应的转换，输入到下面的层当中。
-
-4) 要注意的是RPN内部有两个loss层，一个是BBox的loss,该loss通过减小ground-truth-box与预测的anchor-box之间的差异来进行参数学习，从而使RPN网络中的权重能够学习到预测box的能力。实现细节是每一个位置的anchor-box与ground-truth里面的box进行比较，选择IOU最大的一个作为该anchor-box的真值，若没有，则将之class设为背景（概率值0，否则1），这样背景的anchor-box的损失函数中每个box乘以其class的概率后就不会对bbox的损失函数造成影响。另一个loss是class-loss,该处的loss是指代的前景背景并不是实际的框中物体类别，它的存在可以使得在最后生成roi时能快速过滤掉预测值是背景的box。也可实现bbox的预测函数不受影响，使得anchor-box能（专注于）正确的学习前景框的预测，正如前所述。所以，综合来讲，整个RPN的作用就是替代了以前的selective-search方法，因为网络内的运算都是可GPU加速的，所以一下子提升了ROI生成的速度。可以将RPN理解为一个预测前景背景，并将前景框定的一个网络，并进行单独的训练，实际上论文里面就有一个分阶段训练的训练策略，实际上就是这个原因。
-
-5) 最后经过非极大值抑制，RPN层产生的输出是一系列的ROI-data，它通过ROI的相对映射关系，将conv5-3中的特征已经存入ROI-data中，以供后面的分类网使用。
-
-另外两个loss层的说明： 
-也许你注意到了，最后还有两个loss层，这里的class-loss指代的不再是前景背景loss，而是真正的类别loss了，这个应该就很好理解了。而bbox-loss则是因为rpn提取的只是前景背景的预测，往往很粗糙，这里其实是通过ROI-pooling后加上两层全连接实现更精细的box修正（这里其实是我猜的）。 
-ROI-Pooing的作用是为了将不同大小的Roi映射（重采样）成统一的大小输入到全连接层去。
-
-以上。
-
-**参考资料**
-
-- [Faster-Rcnn中RPN（Region Proposal Network）的理解](https://blog.csdn.net/mllearnertj/article/details/53709766)
-
-## ROI Pooling、ROI Align和ROI Warping对比
-
-- [ ] TODO
-
-**参考资料**
-
-- [Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp对比](https://blog.csdn.net/lanyuxuan100/article/details/71124596)
-
 ## Pooling层原理
 
 - [ ] TODO
@@ -940,10 +870,6 @@ ROI-Pooing的作用是为了将不同大小的Roi映射（重采样）成统一
 
 - [ ] TODO
 
-## 非极大值抑制NMS
-
-- [ ] TODO
-
 ## 为什么降采用使用max pooling，而分类使用average pooling
 
 - [ ] TODO
diff --git a/docs/编程语言.md b/docs/编程语言.md
@@ -561,6 +561,10 @@ C++中有哪些容器（序列容器，关联容器）？vetor与list的区别
 
 - [ ] TODO
 
+Python的全局锁
+
+- [ ] TODO
+
 ### Python 字典采用的是什么数据结构？
 
 答：使用的是key-value匹配的哈希结构
diff --git a/docs/计算机视觉.md b/docs/计算机视觉.md
@@ -607,6 +607,10 @@ def voc_ap(rec, prec, use_07_metric=False):
 - [图像语义分割准确率度量方法总结](https://zhuanlan.zhihu.com/p/38236530)
 - [论文笔记 |　基于深度学习的图像语义分割技术概述之5.1度量标准](https://blog.csdn.net/u014593748/article/details/71698246)
 
+## 非极大值抑制NMS
+
+- [ ] TODO
+
 ## 目标检测中的Anchor
 
 - [ ] 
@@ -1174,6 +1178,76 @@ NMS_demo.py：<https://github.com/humengdoudou/object_detection_mAP/blob/master/
 
 - [YOLOv1，YOLOv2，YOLOv3解读](<https://blog.csdn.net/hancoder/article/details/87994678>)
 
+## RetinaNet（Focal loss）
+
+《Focal Loss for Dense Object Detection》
+
+- arXiv：https://arxiv.org/abs/1708.02002
+
+清华大学孔涛博士在知乎上这么写道：
+
+目标的检测和定位中一个很困难的问题是，如何从数以万计的候选窗口中挑选包含目标物的物体。只有候选窗口足够多，才能保证模型的 Recall。
+
+目前，目标检测框架主要有两种：
+
+一种是 one-stage ，例如 YOLO、SSD 等，这一类方法速度很快，但识别精度没有 two-stage 的高，其中一个很重要的原因是，利用一个分类器很难既把负样本抑制掉，又把目标分类好。
+
+另外一种目标检测框架是 two-stage ，以 Faster RCNN 为代表，这一类方法识别准确度和定位精度都很高，但存在着计算效率低，资源占用大的问题。
+
+Focal Loss 从优化函数的角度上来解决这个问题，实验结果非常 solid，很赞的工作。
+
+何恺明团队提出了用 Focal Loss 函数来训练。
+
+因为，他在训练过程中发现，类别失衡是影响 one-stage 检测器准确度的主要原因。那么，如果能将“类别失衡”这个因素解决掉，one-stage 不就能达到比较高的识别精度了吗？
+
+于是在研究中，何恺明团队采用 Focal Loss 函数来消除“类别失衡”这个主要障碍。
+
+结果怎样呢？
+
+为了评估该损失的有效性，该团队设计并训练了一个简单的密集目标检测器—RetinaNet。试验结果证明，当使用 Focal Loss 训练时，RetinaNet 不仅能赶上 one-stage 检测器的检测速度，而且还在准确度上超越了当前所有最先进的 two-stage 检测器。
+
+**参考**
+
+- [如何评价Kaiming的Focal Loss for Dense Object Detection？](https://www.zhihu.com/question/63581984)
+- [首发 | 何恺明团队提出 Focal Loss，目标检测精度高达39.1AP，打破现有记录](https://zhuanlan.zhihu.com/p/28442066)
+
+
+## FPN 特征金字塔网络
+
+- [ ] TODO
+
+## Faster R-CNN的RPN网络
+
+RPN结构说明： 
+
+1) 从基础网络提取的第五卷积层特征进入RPN后分为两个分支，其中一个分支进行针对feature map（上图conv-5-3共有512个feature-map）的每一个位置预测共（9*4=36）个参数，其中9代表的是每一个位置预设的9种形状的anchor-box，4对应的是每一个anchor-box的预测值（该预测值表示的是预设anchor-box到ground-truth-box之间的变换参数），上图中指向rpn-bbox-pred层的箭头上面的数字36即是代表了上述的36个参数，所以rpn-bbox-pred层的feature-map数量是36，而每一张feature-map的形状（大小）实际上跟conv5-3一模一样的；
+
+2) 另一分支预测该anchor-box所框定的区域属于前景和背景的概率（网上很对博客说的是，指代该点属于前景背景的概率，那样是不对的，不然怎么会有18个feature-map输出呢？否则2个就足够了），前景背景的真值给定是根据当前像素（anchor-box中心）是否在ground-truth-box内；
+
+3) 上图RPN-data(python)运算框内所进行的操作是读取图像信息（原始宽高），groun-truth boxes的信息（bounding-box的位置，形状，类别）等，作好相应的转换，输入到下面的层当中。
+
+4) 要注意的是RPN内部有两个loss层，一个是BBox的loss,该loss通过减小ground-truth-box与预测的anchor-box之间的差异来进行参数学习，从而使RPN网络中的权重能够学习到预测box的能力。实现细节是每一个位置的anchor-box与ground-truth里面的box进行比较，选择IOU最大的一个作为该anchor-box的真值，若没有，则将之class设为背景（概率值0，否则1），这样背景的anchor-box的损失函数中每个box乘以其class的概率后就不会对bbox的损失函数造成影响。另一个loss是class-loss,该处的loss是指代的前景背景并不是实际的框中物体类别，它的存在可以使得在最后生成roi时能快速过滤掉预测值是背景的box。也可实现bbox的预测函数不受影响，使得anchor-box能（专注于）正确的学习前景框的预测，正如前所述。所以，综合来讲，整个RPN的作用就是替代了以前的selective-search方法，因为网络内的运算都是可GPU加速的，所以一下子提升了ROI生成的速度。可以将RPN理解为一个预测前景背景，并将前景框定的一个网络，并进行单独的训练，实际上论文里面就有一个分阶段训练的训练策略，实际上就是这个原因。
+
+5) 最后经过非极大值抑制，RPN层产生的输出是一系列的ROI-data，它通过ROI的相对映射关系，将conv5-3中的特征已经存入ROI-data中，以供后面的分类网使用。
+
+另外两个loss层的说明： 
+也许你注意到了，最后还有两个loss层，这里的class-loss指代的不再是前景背景loss，而是真正的类别loss了，这个应该就很好理解了。而bbox-loss则是因为rpn提取的只是前景背景的预测，往往很粗糙，这里其实是通过ROI-pooling后加上两层全连接实现更精细的box修正（这里其实是我猜的）。 
+ROI-Pooing的作用是为了将不同大小的Roi映射（重采样）成统一的大小输入到全连接层去。
+
+以上。
+
+**参考资料**
+
+- [Faster-Rcnn中RPN（Region Proposal Network）的理解](https://blog.csdn.net/mllearnertj/article/details/53709766)
+
+## ROI Pooling、ROI Align和ROI Warping对比
+
+- [ ] TODO
+
+**参考资料**
+
+- [Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp对比](https://blog.csdn.net/lanyuxuan100/article/details/71124596)
+
 ## DeepLab系列（V1-V3+）
 
 - [ ] TODO
diff --git a/docs/面试经验.md b/docs/面试经验.md
@@ -107,12 +107,12 @@
 - [ ] [寒武纪服务器软件工程师面经](https://www.nowcoder.com/discuss/211983)
 - [ ] [春招计算机视觉面经(阿里海康大华 华为腾讯、水晶光电、虹软)](https://www.nowcoder.com/discuss/190511)
 - [ ] [美的提前批面试【数据挖掘】](https://www.nowcoder.com/discuss/203015)
-- [ ] [发个面经吧，bat加字节](https://www.nowcoder.com/discuss/198905)
-- [ ] [回馈牛客，字节算法三面许愿求offer](https://www.nowcoder.com/discuss/211763)
-- [ ] [字节跳动2020届提前批 AI Lab cv 三面视频面](https://www.nowcoder.com/discuss/210508) 
-- [ ] [春招实习数分面经](https://www.nowcoder.com/discuss/189529)
-- [ ] [阿里算法面经](https://www.nowcoder.com/discuss/209306)
-- [ ] [菜鸡总结暑期实习求职经历（附部分面经](https://www.nowcoder.com/discuss/205718)
+- [x] [发个面经吧，bat加字节](https://www.nowcoder.com/discuss/198905)
+- [x] [回馈牛客，字节算法三面许愿求offer](https://www.nowcoder.com/discuss/211763)
+- [x] [字节跳动2020届提前批 AI Lab cv 三面视频面](https://www.nowcoder.com/discuss/210508) 
+- [x] [春招实习数分面经](https://www.nowcoder.com/discuss/189529)
+- [x] [阿里算法面经](https://www.nowcoder.com/discuss/209306)
+- [x] [菜鸡总结暑期实习求职经历（附部分面经）](https://www.nowcoder.com/discuss/205718)
 - [x] [字节AiLab CV 面经，已经收到感谢信](https://www.nowcoder.com/discuss/211352)
 - [x] [寒武纪加面，C++ 面经](https://www.nowcoder.com/discuss/210657)
 - [x] [面试体验：Facebook 篇](https://www.nowcoder.com/discuss/211670)