curl 直接登录
重要的事情写在开头:现在 10.3.8.211
使用命令行登录可能会出现问题。
- 登录默认计流量的账号
1
curl 'http://10.3.8.217/login' --data 'user=student_id&pass=password&line='
重要的事情写在开头:现在 10.3.8.211
使用命令行登录可能会出现问题。
1 |
|
SVD(Singular Value Decomposition),即奇异值分解,本质上是一种矩阵分解技术,在应用领域已经出现了进百年。矩阵分解技术指的是将一个原始矩阵表示成新的易于处理的形式,这种形式是两个或多个矩阵的乘积,可以简单的理解为因式分解。最早使用 SVD 的应用的领域为信息检索,使用 SVD 的检索方法称为隐性语义索引(Latent Semantic Index,LSI)或隐性语义分析(Latent Semantic Analysis,LSA)。
PCA 的全称为主成分分析(Principal Component Analysis)。简单的来说,PCA 的本质是将原来的坐标系转变为新的坐标系,而新的坐标系的基的选择为原始数据中方差最大的方向。
OKR (Objectives and Key Results) is a goal system used by Google and others. It is a simple tool to create alignment and engagement around measurable goals.
最终训练模型的效果需要达到,给模型之前完全没见过的 $N$ 个新类,每个新类中只有 $K$ 个样本。该模型需要能够通过利用这仅有的 $N \times K$ 个样本,来对接下来给出的新样本进行分类。在 RelationNet work 1 的问题描述中,将这给出的 $N \times K$ 个样本集称为 Support Set ,待分类的图片集称为 Query Set。
若我们使用数据集 $D$ 来训练模型, 而 $D$ 中所有的类中 $a$ 个样本,eg. mini-imagenet 中每个类有 600 个样本,则 $a=600$。整体的训练过程可以分为多个 meta-learning 的过程,在每个 meta-learning 开始的时候,从训练集 $D$ 中随机抽取 $N$ 个类,每个类中抽取 $K$ 个样本做成 Support Set,除此之外,还从已经抽取得到每个类中,除已抽取的样本外,再抽取 $T$ 个样本作为 Query Set。之后,模型将会去学习如何根据 Support Set 的样本,来正确分类 Query Set 的样本。
Learning to Compare:Relation Network for Few-Shot Learning CVPR 2018 ↩
当我们在拷贝或者解压的时候,我们需要一个进度条。但是遗憾的是,Linux 自带的指令的选项中并没有这个选项,所以我们需要手动给他创造一个。这时候就用到了一个 Github 上开源的软件 cv
,地址在这里。
上一篇我们讲了 MonteCarlo 和 TD 方法,他们都是用于在五模型的时候估算当前各个状态的 Value 的,即已经有了 Policy Evaluation 部分。我们还需要一个 Policy Impovement 的部分。这部分就是来解决这个问题的。在优化控制部分,我们根据是否根据已经拥有他人的经验来更新自身的控制策略,将优化控制分类下面两类:
这一课帅小哥主要讲的内容是预测的部分,在第五课会加入控制的部分。其中预测的部分主要是两个相似的算法,一个为 Monte-Carlo(MC),另一个为 Temporal-Difference(TD)。两者的区别主要在于,MC 为需要在出现终止状态后,才能得到 Reward,而 TD 则是实时的。