ALL

所有文章

Writing Index

全部文章

Read

2019-11-25

两句话到底像不像，机器没法像人一样先“感觉一下”。比较常见的做法是：先把文本变成向量，再比较两个向量的方向。余弦相似度做的就是这件事。它不太关心向量有多长，更关心两个向量是不是朝着差不多的方向走。方向越接近，相似度越高。

Read

2019-11-02

Read

2019-11-01

Read

2019-10-28

有些目标检测文章一讲到 `loss` 就开始一串公式劈头盖脸砸下来，看着像懂了，回头一写代码又有点发懵。这个话题其实没必要绕那么远： - 真实标签到底长什么样 - 网络最后吐出了什么 - 这些量分别在逼着模型优化什么

Read

2019-10-08

Read

2019-10-04

普通卷积很好用，但也很“费”。输入通道多、输出通道多、卷积核又不小的时候，计算量和参数量都会蹭蹭上去。可分离卷积的思路很妙：既然普通卷积同时做了“空间特征提取”和“通道混合”，那我们能不能把这两件事拆开？先在每个通道里单独看空间，再用 `1×1` 卷积把通道信息混起来。

Read

2019-09-09

Read

2019-09-04

聊生成对抗网络时，很多人一开始会被各种图绕晕。明明只想搞懂一句话，结果一眼望过去全是 `G`、`D`、真假标签、双向箭头、回环路径，脑子直接开始打结。

Read

2019-08-10

深度学习里的 Norm 家族很热闹：BN、LN、IN、GN、SN，看名字像一串缩写暗号。但它们的出发点并不玄乎：网络越深，中间层的数据分布越容易乱跑。分布一乱，后面的层就要一边学习任务，一边适应前面层不断变化的输出，训练自然会变慢、变抖，甚至变得难收敛。

Read

2019-07-16