CS224n 笔记04 Word Window Classification and Neural Networks

发表于 2018-11-03 | 分类于 NLP

| 字数统计 2013 | 阅读时长 10

简介

这次的课程视频中主要讲了神经网络的构成，和在神经网络下的 BP 算法。整体为接下来的作业打好了基础，视频的最后也给出了对一个项目研究的基本步骤。

阅读全文 »

CS224n笔记03 A Deeper Look at Word Vectors

发表于 2018-10-30 | 分类于 NLP

| 字数统计 1286 | 阅读时长 6

简述

这个课，简单的来说就是说，word2vec 除了之前的 skip-gram 算法，还有一个传统的算法使用基于窗口的共现矩阵来表示。他们都有缺点，于是诞生了 GloVe。

阅读全文 »

[CS224 Paper]A Simple but Tough-to-beat Baseline for Sentence Embeddings

发表于 2018-10-28 | 分类于 NLP

| 字数统计 761 | 阅读时长 3

简介

@Sanjeev Arora, Yingyu Liang, Tengyu Ma

@Princeton University

@ICLR 2017

简单介绍

在 CS224 的第二节课中我们学了 word2vec 算法。该算法的的目的是找出一种对文字更合适的表示方法。但是实际生活中我们更关心的是一个句子的意思。这篇文章就是找出一种合适的句子的向量表示。

阅读全文 »

CS224n 笔记02 词的向量表示：word2vec

发表于 2018-10-28 | 分类于 NLP

| 字数统计 1720 | 阅读时长 8

如何表达一个词语的意思

要表达一个词语的意思，首先我们要知道什么是词语的意思呢。

Definition: meaning (Webster dictionary)

the idea that is represented by a word, phrase, etc.

the idea that a person wants to express by using words, signs, etc.

the idea that is expressed in a work of writing, art, etc.

从这个定义中，我们可以看到，一个词语的意思是通过以一个含义和一个符号（词语）进行对应来表达的，有一种 key - value 的意味。

阅读全文 »

CS224n笔记01 自然语言处理与深度学习简介

发表于 2018-10-23 | 分类于 NLP

| 字数统计 973 | 阅读时长 4

简单声明

本笔记为 CS224n 课程在学习过程中留下的笔记。整体风格以简洁为主，尽量去掉不必要的背景知识说明，只留下个人觉得最重要的内容以供日后参考回忆。其中部分内容为了巩固英语，可能会因为方便采用英文记录。其中许多内容来源于学习过程中参考的博客内容，这些会在末尾的参考链接中汇总出来。

阅读全文 »

代理 Socks 转 http

发表于 2018-10-13 | 分类于 Linux ，小技巧

| 字数统计 301 | 阅读时长 1

前言

这两天，学长派的任务中，需要使用 Scrapy 爬去许多国外的网站，需要给 Scrapy 搭梯子，而 Scrapy 只支持 http 的代理，故记录下这次 socks 转 http 的步骤。

阅读全文 »

关于苏格兰启蒙运动的思索

发表于 2018-10-09 | 分类于读书笔记

| 字数统计 1195 | 阅读时长 5

关于苏格兰启蒙运动的思索

苏格兰启蒙运动，对于我这种纯编程的学生来说是很陌生的，也是在看了些关于《苏格兰：现代世界闻名的起点》这本书的书评后才有所了解，并有所感悟，特此记录。

阅读全文 »

列表解析和 for 循环的比较

发表于 2018-10-07 | 分类于 Python

| 字数统计 247 | 阅读时长 1

分析

首先先放上，Stackflow 的高票答案的结论

A list comprehension is usually a tiny bit faster than the precisely equivalent for loop (that actually builds a list), most likely because it doesn’t have to look up the list and its append method on every iteration. However, a list comprehension still does a bytecode-level loop.

显然，列表推导比 for 循环稍快。

答者的分析为列表解析没有创造一个列表的实体，所以它的稍微的性能提升来源于不需要在每次迭代中查找列表，和使用它的 append 函数。

阅读全文 »