ALL

所有文章

Writing Index

全部文章

三维视图看懂 `keras.permute_dimensions` 和 `numpy.transpose`
三维视图看懂 `keras.permute_dimensions` 和 `numpy.transpose`

Read
词句相似度计算:余弦相似度和 TF-IDF
词句相似度计算:余弦相似度和 TF-IDF

两句话到底像不像,机器没法像人一样先“感觉一下”。比较常见的做法是:先把文本变成向量,再比较两个向量的方向。 余弦相似度做的就是这件事。它不太关心向量有多长,更关心两个向量是不是朝着差不多的方向走。方向越接近,相似度越高。

Read
清华的秋天
清华的秋天

Read
马克西姆来北京了!
马克西姆来北京了!

Read
FRCNN 和 YOLOv3 损失函数详解
FRCNN 和 YOLOv3 损失函数详解

有些目标检测文章一讲到 `loss` 就开始一串公式劈头盖脸砸下来,看着像懂了,回头一写代码又有点发懵。这个话题其实没必要绕那么远: - 真实标签到底长什么样 - 网络最后吐出了什么 - 这些量分别在逼着模型优化什么

Read
欢迎空军 giegie来访
欢迎空军 giegie来访

Read
深度学习里的可分离卷积:把大卷积拆成轻快两步
深度学习里的可分离卷积:把大卷积拆成轻快两步

普通卷积很好用,但也很“费”。输入通道多、输出通道多、卷积核又不小的时候,计算量和参数量都会蹭蹭上去。 可分离卷积的思路很妙:既然普通卷积同时做了“空间特征提取”和“通道混合”,那我们能不能把这两件事拆开?先在每个通道里单独看空间,再用 `1×1` 卷积把通道信息混起来。

Read
云南旅游
云南旅游

Read
GAN 与 CycleGAN
GAN 与 CycleGAN

聊生成对抗网络时,很多人一开始会被各种图绕晕。明明只想搞懂一句话,结果一眼望过去全是 `G`、`D`、真假标签、双向箭头、回环路径,脑子直接开始打结。

Read
层层逼近,搞懂 Norm 系列到底在解决什么
层层逼近,搞懂 Norm 系列到底在解决什么

深度学习里的 Norm 家族很热闹:BN、LN、IN、GN、SN,看名字像一串缩写暗号。 但它们的出发点并不玄乎:网络越深,中间层的数据分布越容易乱跑。分布一乱,后面的层就要一边学习任务,一边适应前面层不断变化的输出,训练自然会变慢、变抖,甚至变得难收敛。

Read