WangYu

Results 36 comments of WangYu

## 安装 neo4j 数据库 ### 1. 下载 进入 neo4j 官方网站的[下载页面](https://neo4j.com/download/other-releases/#releases),根据所用操作系统,下载适当的版本。 因为企业版需要授权,因此可暂先下载社区版本,下面以 Linux 系统为例: ```shell # 下载 $ wget https://neo4j.com/artifact.php?name=neo4j-community-3.4.1-unix.tar.gz # 解压 $ tar zxvf ./neo4j-community-3.4.1-unix.tar.gz ``` ### 2. 配置 下载并解压后得到的目录形如:...

## neo4j 数据库数据导入指南 在初始化数据库的时候,通常需要导入大量的数据,此时需要采用一种批量导入的方法,而非一条条插入。下面内容描述了如何准备数据,以及如何将数据导入 neo4j 数据库中。 本文主要参考了 neo4j 的关于导入数据的文档 [Use the Import tool](https://neo4j.com/docs/operations-manual/3.3/tutorial/import-tool/) ,并结合自己的实践经验做了些许说明。 ## neo4j 图数据库核心概念介绍 在关系型数据库中,如 MySql,数据以元组形式存储,多个同型元组构成表,表与表之间通过外键进行关联。在 neo4j 图数据库中,数据以节点(Node)存储,每个节点可以有各自的属性,节点间通过关系相连。 ![](https://neo4j.com/docs/developer-manual/3.4/images/graphdb-simple-labels.svg) 上图中,存在 3 个节点,其中 2 个 Person 节点,1 个...

## 其他技巧 ### 在一台机器上启动多个实例 => 1. 将 neo4j 拷贝一份 ```shell cp ./neo4j-community-3.4.0/ ./project/neo4j-community-3.4.0/ ``` => 2. 修改配置文件 修改端口至一个未使用的端口,参考前文 neo4j 数据库安装指南 ```shell vim ./project/neo4j-community-3.4.0/conf/neo4j.conf ``` => 3. 配置环境变量 将环境变量 `NEO4J_HOME` 临时指向新的...

> 中文输入法怎么弄呢 中文输入法无解,因为输入法是本地软件,你的按键都是传到服务器上,依靠服务器来解释按键的意义的。我觉得还是在本地运行比较好,可以在远程跑代码,在本地编辑。

## 机器学习 **[台大李宏毅 - 机器学习课程](http://speech.ee.ntu.edu.tw/~tlkagk/courses.html)** 李宏毅老师讲课很有趣,上课很有激情。李宏毅老师总能帮助学生去获得直观的认识,把抽象的东西尽可能形象化,非常难得的优秀老师,非常优秀的课程。建议初学者先看李老师的课程,并仔细地阅读 PPT,并理解其中内容。李老师的课程中包含基础的机器学习知识,如线性回归,也包含高阶知识,如强化学习等。 **[Hands-On Machine Learning with Scikit-Learn and TensorFlow](https://book.douban.com/subject/26840215/)** 这本书已经出了[第二版](https://book.douban.com/subject/30310982/),是目前市面上最佳的机器学习实践书籍。全书分为两个部分,第一部分讲传统机器学习算法的原理和应用,第二部分讲深度学习,结合实例讲解了深度学习中的涉及大部分知识。

## NLP 基础 **[Michael Collins 的讲义](http://www.cs.columbia.edu/~mcollins/)** Michael Collins 的 NLP 系列讲义包括了自然语言处理的很多基础知识。作者的英语行文非常优雅,用简单的词汇把复杂的问题讲的清清楚楚。只要你跟着讲义慢慢读,不会遇到卡壳的地方,作者的公式推导没有跳步,对初学者相当友好。 **[Speech and Language Processing](https://web.stanford.edu/~jurafsky/slp3/)** [Dan Jurafsky](http://web.stanford.edu/people/jurafsky/) 和 [James H. Martin](http://www.cs.colorado.edu/~martin/) 所写的这本书,是领域内的经典之作。本书涵盖了自然语言处理的基础,作者能够用平实的语言将复杂的问题讲清楚,对于初学 NLP 的同学,强烈推荐此书。 **Neural Network Methods for Natural Language...

## 部分正则语法 => `r"\n"` 表示两个字符 `\` 和 `n`,而 `"\n"` 表示一个字符,即换行符。 => `{m,n}?` 匹配尽可能少的字符 => `[]` 用来表示一组字符,在 `[]` 中特殊字符失去它们特殊的含义,即 `[(+*)]` 就匹配 `( + * )` 这四个字符。 => `[^5]` 匹配所有不是 `5` 的字符,`[^^]`...

## re 模块 => `re.compile` 返回一个正则表达式对象,上面有很多下面介绍的在 `re` 模块上包含的方法。 ```python re.compile(pattern, flags=0) ``` ```python > ('323',) ``` => `re.search` 在字符中搜索匹配的 pattern,如果有匹配则返回 match object,否则返回 None。 ```python match = re.search(pattern, string) if match:...

## Match 对象 => `Match.expand` ```python >> 'mailto:wangyu[at]163[dot]com' ``` => `Match.group` ```python '' > ('', 'wangyu', '163', 'com') ``` => `Match.groups` 以元组的形式返回所有分组。 ```python > ('wangyu', '163', 'com') ``` => `Match.groupdict`...

## 散点图 ### 各种 marker ```python import matplotlib as mpl import matplotlib.pyplot as plt for marker in ['o', '.', ',', 'x', '+', 'v', '^', '', 's', 'd']: plt.plot(np.random.rand(5), np.random.rand(5), marker,...