博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用jieba分词提取关键字及权重
阅读量:6248 次
发布时间:2019-06-22

本文共 434 字,大约阅读时间需要 1 分钟。

hot3.png

  1. 安装jieba pip install jieba
  2. 准备好txt文件和停用词表(网上可以下载到,txt格式即可)
  3. 编写代码
    import jieba.analysepath = '你的txt文件路径'file_in = open(path, 'r')content = file_in.read()try:    jieba.analyse.set_stop_words('你的停用词表路径')    tags = jieba.analyse.extract_tags(content, topK=100, withWeight=True)    for v, n in tags:        #权重是小数,为了凑整,乘了一万        print v + '\t' + str(int(n * 10000))finally:    file_in.close()

     

转载于:https://my.oschina.net/ranvane/blog/2251320

你可能感兴趣的文章
14.linux下复制粘贴
查看>>
网络编程
查看>>
List数据转Map数据并进行分组排序
查看>>
word - 如何让 图片任意移动
查看>>
安装Oracle
查看>>
LoadRunner基础知识
查看>>
How to helloworld on Xcode
查看>>
PHP常见设计模式简单实现
查看>>
java课堂相关问题
查看>>
图片溢出div问题的最终解决方案
查看>>
区分Web Server和应用服务器
查看>>
计算字符串长度,加车头
查看>>
$ sudo python -m pip install pylint 出错解决方法
查看>>
安卓返回信息方式
查看>>
20145209刘一阳 《网络对抗》Exp7 网络欺诈技术防范
查看>>
常用的 JS 排序算法整理
查看>>
Dora.Interception,为.NET Core度身打造的AOP框架 [3]:多样化拦截器应用方式
查看>>
win7为鼠标右键添加“用Photoshop编辑”选项
查看>>
内部div自动扩张剩余宽度
查看>>
hbase伪分布式搭建和完全分布式搭建
查看>>