Blog

风过留声,雁过留痕

像素级别的生成模型(二)

本文接上文对Pixel Diff的探索之后,我们开始探索搭建一个高效的Pixel AR 方法 B:Dual-level AR。 方法 B:Dual-level AR 的探索 在这个设计中,我们使用两个级联的 AR 模型: 第一层:Semantic AR(语义级别) 第二层:Pixel AR(像素级别) 核心直觉 第一层 AR 更像是在 downsample 后...

像素级别的生成模型(一)

背景 最近三个月,我尝试构建一个 pixel-level generator,这从某种方面是为了追寻研究热点,从另一个方面也是为了探究以下几个问题: 1:一个生成器到底能不能生成pixel? 2:Pixel Gen能生成到什么地步? 3:PixelGen和传统的生成latent到底有啥区别? 有啥意义? 我相信第一个问题已经被解决,最近有很多工作已然出现,包括Tianhong的JiT,D...

改进分类任务来让目标检测更加精准

一看我的博客,已经整整两年没写文章啦。这几天跑着实验也有些无聊,不如来总结一下整个检测领域的进展,还有我的科研进展 首先,什么是Accurate object detection 呢,顾名思义哈,这里的accurate肯定指的是提高检测框的精准度。可是话又说回来,咱们对这个课题最直接的理解是提高检测框质量,那么这个课题就只能局限于定位子网络了? 非也非也,在我们用localization分...