列表解析和 for 循环的比较

发表于 2018-10-07 | 分类于 Python

| 字数统计 247 | 阅读时长 1

分析

首先先放上，Stackflow 的高票答案的结论

A list comprehension is usually a tiny bit faster than the precisely equivalent for loop (that actually builds a list), most likely because it doesn’t have to look up the list and its append method on every iteration. However, a list comprehension still does a bytecode-level loop.

显然，列表推导比 for 循环稍快。

答者的分析为列表解析没有创造一个列表的实体，所以它的稍微的性能提升来源于不需要在每次迭代中查找列表，和使用它的 append 函数。

阅读全文 »

命运的一些思考

发表于 2018-10-06 | 分类于读书笔记

| 字数统计 1805 | 阅读时长 9

命运的一些思考

在听了吴军老师的《硅谷来信 311～314》期的内容后有一些小小的感悟。我们的未来，也就是命运是由什么决定的呢，这个问题困扰我多年。今天就来记录下自己的所思所想。

阅读全文 »

显示键盘按键 - Keycastr

发表于 2018-10-05 | 分类于软件使用

| 字数统计 197 | 阅读时长 0

显示键盘按键 - Keycastr

前言

最近写 VIM 专栏需要显示能够实时显示按键顺序的插件，其中 Keycastr 这个 Github 的开源项目使用的最舒心，安装也是最方便，特意留个档记录下。

安装

很简单，使用 brew 安装即可。
1
brew cask install keycastr
在安装好了以后，给这个程序权限即可

阅读全文 »

Mac OS下安装Scapy后出现的YCM报错

发表于 2018-09-18 | 分类于 TroubleShoot

| 字数统计 61 | 阅读时长 0

起因

Mac OS 安装了 Scapy 后，在 YouCompleteMe 中出现如下报错：

1	`X:ValueError: unknown locale: UTF-8 in Python`

解决方案

添加如下代码到配置环境变量文件（zsh 或者 bash）

export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8

阅读全文 »

关于设置YouCompleteMe Python3语法支持

发表于 2018-09-16 | 分类于 TroubleShoot

| 字数统计 116 | 阅读时长 0

问题描述

YouCompleteMe 只能支持 Python2 的补全，不支持 Python3 库的补全。

阅读全文 »

Python 交互模式下自动补全

发表于 2018-09-15 | 分类于 Python

| 字数统计 238 | 阅读时长 1

前言

有时候我们需要测试一个小功能，懒人如我完全不愿意新建一个 python 文件去测试，但是默认的 python 交互模式下没有代码补全就很恼火，今天就把它解决了。

阅读全文 »

支持向量机的补充之核函数

发表于 2018-09-13 | 分类于机器学习

| 字数统计 616 | 阅读时长 3

在之前的SVM章节中我们介绍了其具体的原理和大致推导过程，但是由于SVM只能应用于线性可分的数据，那么如果出现了线性不可分的情况怎么办呢，这就要引入今天的重点核函数。这种思想将在未来的深度学习中也会出现。

阅读全文 »

Vim作者对高效使用编辑器的建议

发表于 2018-09-02 | 分类于 Vim

| 字数统计 1012 | 阅读时长 5

原文链接：《Seven Habits of Effective Text Editing》

前言

本文摘自Vim主要作者Bram Moolennar的2000年11月在其个人网站发布的提高文本编辑效率的7个方法，个人认为从工具作者那里学习如何使用工具是最好的学习方式。本篇文章重点介绍了，达到高效使用编辑器的方法。

阅读全文 »

集成学习

发表于 2018-08-24 | 分类于机器学习

| 字数统计 4704 | 阅读时长 23

集成学习

集成学习一句话版本

集成学习的思想是将若干个学习器（分类器&回归器）组合之后产生新的学习器。

在学习这一章节中，老师提到了这个说法，我觉得非常言简意赅就直接引用了过来。集成学习算法的成功在于保证若分类器（错误率略小于0.5，即勉强比瞎猜好一点）的多样性，且集成不稳定的算法也能得到一种比较明显的提升。

注：深度学习其实也可以看作是一种集成学习

阅读全文 »

贝叶斯算法

发表于 2018-08-19 | 分类于机器学习

| 字数统计 1954 | 阅读时长 9

知识前置

这个章节的机器学习，其实更像是一种概率论的学习，同时这也是机器学习和数据分析中非常重要的一环。如果学习遇到了困难非常推荐参考张宇考研概率论部分的内容。同时这一章的算法，也是在文本分类中使用的比较多的。

名词解释：

先验概率：$P(A)$
条件概率：$P(A|B)$
后验概率：$P(B|A)$
全概率：$P(B) = \sum_{i=1}^n P(A_i)*P(B|A_i)$
贝叶斯公式：$P(A|B) = \frac{P(A)P(B|A)}{\sum_{i=1}^n P(B|A_i)P(A_i)}$

概率分布：

高斯分布：简单的来说它的分布呈现的是正态分布的样子。参考链接
伯努利分布：伯努利分布是0-1分布，简单的来说就是那种仍硬币的概率分布。参考链接
多项式分布：是伯努利分布的推广，不再是只有两种情况，有多种情况的概率分布。参考链接

贝叶斯算法的核心思想：

找出在特征出现时，各个标签出现的概率，选择概率最大的作为其分类。

阅读全文 »