shell学习笔记 cygwin下用Python比较两个文本的相似性 cygwin下用Python比较两个文本的相似性,使用到了结巴分词以及余弦定理。 关于cygwin的安装以及python的安装,暂且不提,大家可以去看另一篇/shell/shell-extract-404-pages.html 关于结巴分词... 2015-05-312,557cygwin Python 阅读全文
shell学习笔记 cygwin下用Python+jieba给文本分词并提取高频词 今晚小折腾了一下在cygwin下用Python和jieba分词(结巴分词)组件给文本分词并提取高频词,过程记录如下: 目的 分析某行业中,用户最关心的一些需求,再根据这一需求去调整站内TDK,以及一些频道、内容的规划 过程 1、下载安装cy... 2015-05-309,831cygwin Python 阅读全文