GodWriter


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

论文泛读2:基于Adjustable Parameters的Style Transfer

发表于 2020-02-15 | 分类于 Paper
1. Adjustable Real-Time Style Transfer (ICLR 2020) 针对什么问题 ​ 本文指出基于现有风格迁移算法训练得到的模型,只能生成固定内容结构及风格模式的Stylized Images(风格化图)。此外,选取不同的风格图作为输入,总是得调整损失函数中每一层卷积特征的权重$w$,一旦使用者对生成的结果不满意,就要重新训练该模型。 提出什么方法 ​ 本文提出一种可以在训练和测试阶段自动调整关键参数的方法,使得训练得到的风格迁移模型可以通过调 ...
阅读全文 »

Seeing What a GAN Cannot Generate

发表于 2020-01-03 | 分类于 Paper
1. Abstract 虽然GAN很成功,但是模式崩塌(Mode Collapse)的问题依然存在,而现在少有论文去理解并量化GAN到底抛弃了哪些模式。 故本文在两个级别的基础上可视化了模式崩塌:分布级(Distribution Level)和实例级(Instance Level)。 首先,对生成数据集和目标数据集使用语义分割网络,统计两个数据集中被分割出来的物体的分布。分布的不同将会透露出GAN在生成过程中所遗漏的物体。 其次,当确定被遗忘的物体类别后,直接可视化GAN遗忘的过程。即比较特定图 ...
阅读全文 »

论文泛读1:基于Disentangle的Image-to-Image Translation

发表于 2019-12-11 | 分类于 Paper
1. Unsupervised Image-to-Image Translation Networks 针对什么问题? 图像翻译旨在将图像从一个领域映射到另一个领域。在监督的设定下,数据集是成对的,领域之间的映射是可行的。但在非监督的情况下,即数据集不是成对的,而是分成两个彼此独立的领域,图像翻译的任务将会变得艰难。而现实生活中,成对的数据是很难获得的,故无监督的图像翻译更实在。 提出什么方法? 本文指出图像翻译的主要挑战是学习两个不同领域之间的联合分布。在无监督条件下,两个数据集合分别包 ...
阅读全文 »

Self-Ensembing with GAN-based Data Augmentation for Domain Adaption in Sematic Segmentation

发表于 2019-12-10 | 分类于 Paper
1. Abstract 基于深度学习的语义分割有着固有的缺陷:需要大量的数据 本文引入self-ensembling,想基于无监督下的领域自适应来解决数据问题,但通过self-ensembling中微调过的人工数据难以缩减语义分割中巨大的领域距离(Domain Gap) 为此,本文提出一个由两部分组成的框架 首先,基于GAN提出一个数据增强方法,能有效促进领域的对齐(Domain Alignment) 其次,基于增强后的数据,将self-ensembling运用到分割网络中以提升模型的能力 ...
阅读全文 »

第二章 K近邻法

发表于 2019-12-05 | 分类于 统计学习方法
1. 题目分析给定一个二维空间数据集T={正实例:(5, 4), (9, 6), (4, 7);负实例:(2, 3), (8, 1), (7, 2)},试基于欧氏距离,找到数据点S(5, 3)的最近邻(k=1),并对S点进行分类预测 输入:训练集数据$T = \left\{(5, 4, 1), (9, 6, 1), (4, 7, 1), (2, 3, 2), (8, 1, 2), (7, 2, 2)\right\}$;测试集$S = \left\{(5, 3, _)\right\}$; 输出: ...
阅读全文 »

第一章 感知机

发表于 2019-12-03 | 分类于 统计学习方法
1. 题目分析已知训练数据集D,其正实例点是$x_1 = (3, 3)$,$x_2 = (4, 3)$, 负实例点是$x_3 = (1, 1)^T$,求感知机模型 输入:训练数据集$T = \left\{(x_1, 1), (x_2, 1), (x_3, 1)\right\}$;学习率$\eta(0 < \eta \leq1)$; 输出:w, b;感知机模型$f(x) = sign(w\cdot{x} + b)$. 选取初值$w_0, b_0$ 在训练集中选取数据$(x_i, y_i)$ ...
阅读全文 »

N way to write

发表于 2019-09-25 | 分类于 Paper
1. 常用词的N种说法1.1 Besides Moreover In addition 1.2 Get obtain 1.3 Show exhibit demonstrate present 1.4 Improve be boosted to 1.5 Compare In contrast 1.6 Can allow to attempt to be able to be exploited for play the role of be capable of 1.7 Many ...
阅读全文 »

Faster-RCNN

发表于 2019-09-07 | 分类于 目标检测
1. 几个问题 Anchor和全卷积输出值之间的关系 “回归系数”是什么,有什么用? 在选择RPN Boxes时,既要考虑RPN Boxes与Ground Truth的IOU来筛选,又要考虑每个RPN boxes为物体前景的概率。那么在筛选RPN Boxes的时候,哪个先考虑,哪个后考虑,还是说同时考虑?如果说是同时考虑,又怎么考虑? 2. Anchor Generation Layer Anchor主要为了在输入的图像上产生多个可能存在物体的bounding box,所以Anchor肯定是要 ...
阅读全文 »

Faster RCNN 源码理解

发表于 2019-09-03 | 分类于 目标检测
1. Anchor Generation Layer对于生成anchors的源码理解主要来源于两个代码 RBG大神的caffe源码:https://github.com/rbgirshick/py-faster-rcnn Github上复现的pytorch源码:https://github.com/chenyuntc/simple-faster-rcnn-pytorch 由于两种方法生成anchors的技巧不同,故分开讨论,并主要以RBG大神的代码为主,讲解anchors的生成原理与生成技巧 ...
阅读全文 »

ROI Align理解

发表于 2019-08-30 | 分类于 目标检测
1. 几个问题 Mask R-CNN中为何要使用ROI Align取代Faster R-CNN中的ROI Pooling 何为线性插值,何为双线性插值?插值的意义? ROI Align的具体步骤 2. ROI Pooling 在Faster RCNN中(不懂Faster RCNN的点击这里),通过Achor生成的RPN Boxes经过一系列筛选后,会得到一系列ROIs用于后面的识别等工作。但是用于识别的网络需要输入固定维度的图像特征,而ROIs的大小不一致,故抽取的图像特征也不一致。为此,在F ...
阅读全文 »
123
GodWriter

GodWriter

21 日志
6 分类
7 标签
© 2021 GodWriter
由 Hexo 强力驱动
|
主题 — NexT.Gemini v5.1.4