相似度算法_木木彡_新浪博客 其他杂项

相似度算法_木木彡_新浪博客

在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分 类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很多,最近查阅...
阅读全文
文本相似度计算-JaccardSimilarity和哈希签名函数 - 笑笑的程序人生 - 博客频道 - CSDN.NET 其他杂项

文本相似度计算-JaccardSimilarity和哈希签名函数 – 笑笑的程序人生 – 博客频道 – CSDN.NET

在目前这个信息过载的星球上,文本的相似度计算应用前景还是比较广泛的,他可以让人们过滤掉很多相似的新闻,比如在搜索引擎上,相似度太高的页面,只需要展示一个就行了,还有就是,考试的时候,可以用这个来防作弊,同样的,论文的相似度检查也是一个检查论...
阅读全文
相似度计算方式的总结:java或python实现代码 - zy825316的专栏 - 博客频道 - CSDN.NET 其他杂项

相似度计算方式的总结:java或python实现代码 – zy825316的专栏 – 博客频道 – CSDN.NET

缘由这是之前定了的方案:我想要对比由不同相似度计算出来的歌曲相似度表,再由不同的歌曲相似度表来产生推荐列表,比较推荐列表中出现的我随机删除了的本来就被用户收藏了的歌曲的数量肯定有一种相似度计算公式最优根据原理分析为什么这种相似度方案最优即可...
阅读全文
19个常用的Chrome/360极速浏览器插件 其他杂项

19个常用的Chrome/360极速浏览器插件

360极速浏览器老是把我的插件搞丢,为了方便找回,在此记录一下常用的19个插件。 1、AdBlock: 最受欢迎的Chrome扩展,拥有超过4000万用户!屏蔽整个互联网上的广告。 2、Adblock Plus: 超过5000万人使用,适用...
阅读全文
pycurl 模块监控web服务质量应用 - 推酷 其他杂项

pycurl 模块监控web服务质量应用 – 推酷

做过运维的应该都做过http服务了。像一些电子商城,或者是一些互联网公司,web的服务之类是至关重要的,近期看了刘天斯大哥的书觉得自己运维平台应该也可以这样去监控服务之类,今天学习了pycurl模块,这里记录一下: 模块相关说明: c = ...
阅读全文