当前位置：首页 > backend >正文

编写程序，统计两会政府工作报告热词频率，并生成词云

backend 2025/7/2 6:54:31

代码：

import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as pltdef generate_wordcloud():try:# 读取文本文件with open('E:\\桌面\\s.txt', 'r', encoding='utf-8') as file:text = file.read()# 中文分词words = jieba.lcut(text)# 直接使用分词结果，不过滤停用词filtered_words = [word for word in words if len(word) > 1]# 统计词频word_counts = Counter(filtered_words)# 获取前 10 高频词top_10_words = word_counts.most_common(10)print("前 10 高频词：", top_10_words)# 生成词云wordcloud = WordCloud(font_path='simhei.ttf',  # 中文字体路径，可根据实际情况修改background_color='white',width=800,height=600).generate_from_frequencies(dict(top_10_words))# 显示词云plt.figure(figsize=(8, 6))plt.imshow(wordcloud, interpolation='bilinear')plt.axis('off')plt.show()except FileNotFoundError:print("未找到文本文件，请检查文件路径和文件名。")if __name__ == "__main__":generate_wordcloud()

运行截图：

http://www.xdnf.cn/news/4597.html

相关文章：

【icpc陕西省赛】树的最大深度+基环树找环的大小

注意力（Attention）机制详解（附代码）

LeetCode205_同构字符串

NHANES指标推荐：AISI

QML 动态加载组件

论文解析[13] MIXED TRANSFORMER U-NET FOR MEDICAL IMAGE SEGMENTATION

【C++】C++11(上）

RDD的处理过程

vue3的新特性

Spring cloud loadBalancer 负载均衡

Unity3D 游戏内存优化策略

Anchor-based 和 Anchor-free

修改图像分辨率

SLAM:单应矩阵，本质矩阵，基本矩阵详解和对应的c++实现

AtCoder 第404场初级竞赛 A~E题解

【无标题】云计算运维

代码随想录算法训练营第60期第二十九天打卡

前端代码规范详细配置

CSS手动布局

60页PDF | 四川电信数据湖 + 数据中台实施方案：覆盖数据能力、数据资产及数据治理的全流程建设指南

从xjtu-sy数据集中看轴承故障的发展趋势与基本特征

南京大学OpenHarmony技术俱乐部正式揭牌仓颉编程语言引领生态创新

5. HTML 转义字符：在网页中正确显示特殊符号

Linux系列：如何用perf跟踪.NET程序的mmap泄露

水印落幕 7.0 | 专门用于去除图片和视频中水印的工具，支持自定义水印添加

【测试开发】BUG篇 - 从理解BUG到如何处理

递归element-ui el-menu 实现无限级子菜单

Spring 项目无法连接 MySQL：Nacos 配置误区排查与解决

AI——认知建模工具：ACT-R