当前位置: 首页 > backend >正文

编写程序,统计两会政府工作报告热词频率,并生成词云

代码:

import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as pltdef generate_wordcloud():try:# 读取文本文件with open('E:\\桌面\\s.txt', 'r', encoding='utf-8') as file:text = file.read()# 中文分词words = jieba.lcut(text)# 直接使用分词结果,不过滤停用词filtered_words = [word for word in words if len(word) > 1]# 统计词频word_counts = Counter(filtered_words)# 获取前 10 高频词top_10_words = word_counts.most_common(10)print("前 10 高频词:", top_10_words)# 生成词云wordcloud = WordCloud(font_path='simhei.ttf',  # 中文字体路径,可根据实际情况修改background_color='white',width=800,height=600).generate_from_frequencies(dict(top_10_words))# 显示词云plt.figure(figsize=(8, 6))plt.imshow(wordcloud, interpolation='bilinear')plt.axis('off')plt.show()except FileNotFoundError:print("未找到文本文件,请检查文件路径和文件名。")if __name__ == "__main__":generate_wordcloud()

运行截图:

http://www.xdnf.cn/news/4597.html

相关文章:

  • 【icpc陕西省赛】树的最大深度+基环树找环的大小
  • 注意力(Attention)机制详解(附代码)
  • LeetCode205_同构字符串
  • NHANES指标推荐:AISI
  • QML 动态加载组件
  • 论文解析[13] MIXED TRANSFORMER U-NET FOR MEDICAL IMAGE SEGMENTATION
  • 【C++】C++11(上)
  • RDD的处理过程
  • vue3的新特性
  • Spring cloud loadBalancer 负载均衡
  • Qwen2-VL详解
  • Unity3D 游戏内存优化策略
  • Anchor-based 和 Anchor-free
  • 修改图像分辨率
  • SLAM:单应矩阵,本质矩阵,基本矩阵详解和对应的c++实现
  • AtCoder 第404场初级竞赛 A~E题解
  • 【无标题】云计算运维
  • 代码随想录算法训练营第60期第二十九天打卡
  • 前端代码规范详细配置
  • CSS手动布局
  • 60页PDF | 四川电信数据湖 + 数据中台实施方案:覆盖数据能力、数据资产及数据治理的全流程建设指南
  • 从xjtu-sy数据集中看轴承故障的发展趋势与基本特征
  • 南京大学OpenHarmony技术俱乐部正式揭牌 仓颉编程语言引领生态创新
  • 5. HTML 转义字符:在网页中正确显示特殊符号
  • Linux系列:如何用perf跟踪.NET程序的mmap泄露
  • 水印落幕 7.0 | 专门用于去除图片和视频中水印的工具,支持自定义水印添加
  • 【测试开发】BUG篇 - 从理解BUG到如何处理
  • 递归element-ui el-menu 实现无限级子菜单
  • Spring 项目无法连接 MySQL:Nacos 配置误区排查与解决
  • AI——认知建模工具:ACT-R