Felix Blog

Every setback has a major comeback.

smooth L1 loss

"Smooth L1 Loss"

理由 “a robust L1 loss that is less sensitive to outliers than the L2 loss used in R-CNN and SPPnet.” 意思是L1比L2对其在异常点不敏感,两方面来说明: 1、当预测框与 ground truth 差别过大时,梯度值不至于过大; 2、当预测框与 ground truth 差别很小时,梯度...

像素级样本不平衡问题loss设计

"balanced cross entropy/focal loss"

balanced cross entropy     训练时正负样本数目相差较大,常见的做法就是给正负样本加上权重,给数量较少的正样本的loss更大的权重,减小负样本loss的权重。     主要用于FCN/U-net等分割,边缘检测的网络,用于对像素级别的2分类样本不平衡进行优化。 sigmoid_cross_entropy公式:     -y_hat * log(sigmoi...

CTC算法在OCR文字识别上的应用

"CTC algorithm"

​ OCR(Optical Character Recognition)在文字识别阶段,使用基于深度学习的端到端的方案,将文字识别转化为序列学习的问题,我们采用CRNN+CTC,本文主要记录在文字对齐时采用的CTC算法。 ​ CRNN模型大致流程描述如下图1,Transcript Layer就是我们使用CTC算法实现的过程,目的是在预测时从循环层获取的sequence分布通过去重整合等操作转...

Welcome to Felix Blog

"Hello Blog"

“Yeah It’s on. ” 前言 Hello, This is Felix’s Blog .