Sundrops Blog

coding and reading

RNN/LSTM

RNN, LSTM, Multi-Dimensional LSTM, Grid LSTM, Graph LSTM系列解读

RNN/Stacked RNN rnn一般根据输入和输出的数目分为5种 一对一 最简单的rnn 一对多 Image Captioning(image -> sequence of words) 多对一 Sentiment Classification(sequence of words -> sentiment) 多对多: 时序不齐 Machine Tra...

Relation Networks for Object Detection解读

"Relation Networks for Object Detection"

现在做detection的竞争相当激烈,能记住的就是ross kaiming团队和sunjian老师团队,还有今天的主角daijifeng老师团队了arxiv link Motivation 众所周知,如果能model出物体之间的关系,那么对物体识别是大有裨益的。可是在深度学习领域上还没人把这个做work,当前主流的检测模型faster rcnn等都是使用RoIPooling后独...

Path Aggregation Network for Instance Segmentation解读

"Path Aggregation Network for Instance Segmentation"

本篇论文是COCO 2017 instance segmentation的冠军,读了这篇论文再加上之前读论文的体会,和朱神交流后得到一个感悟: 同样一个work的小改动,你不能挖的深或者看得很浅,那你就是trick,而别人就能给科研界带来启发,ResNet很简单,但是kaiming他们就能把解决的问题和起因经过解释的很清楚,然后实验也很solid,给你一步一步解释,但是方法是十分简洁的...

RoIAlign源码解析

"Mask rcnn"

RoIAlign源码及示意图 /* * 参数解释 * bottom_data 需要做RoIAlign的feature map * spatial_scale feature map放缩的尺寸 vgg是1/16 * channels height width feature map的通道高和宽不用多说 * pooled_height pooled_width RoIAlign后的featur...

CapsuleNet一个小例子

"Dynamic Routing Between Capsules"

引用YouTube上一个up主的视频,讲解一个capsulenet的一个小例子 识别的过程 假设我们要识别右面的”船”,经过卷积得到2个识别矩形和三角形的胶囊(即向量,之前一篇博客有介绍 CapsuleNet解读),这两个胶囊为简单起见假设只有一维,代表旋转角度。可以看到经过Conv后得到的primary capsules,每个feature map的位置有2个胶囊,每个胶囊都是...