当前位置: 首页 > backend >正文

文言文停词库 | 古文停词库 | 624个简体停词 |文言文python分词库-thulac

1、文言文 分词工具

文言文分词库-thulac,使用案例

pip install thulac
import thulac # 古文分词库thu = thulac.thulac(seg_only=True)  # 加载古文模型
text = "臣亮言:先帝創業未半而中道崩殂"
result = thu.cut(text)def lists2list(alist):return [i[0] for i in alist]lists2list(result)
['臣', '亮言', ':', '先帝', '創業', '未', '半', '而', '中道', '崩殂']

2、 停词库

以下是基于文言文语法特征整理的624个无重复的高频虚词,涵盖助词、连词、介词、叹词、语气词等非实义成分,适用于古文文本(简体)处理。

与
且
业
临
为
举
乃
久
之
乍
乎
也
予
于
云
些
亟
亦
人
仅
仆
今
仍
从
令
以
任
伊
伏
众
但
余
使
依
侪
便
俄
俟
俱
倏
假
兮
其
具
兹
兼
再
况
几
凡
凭
则
刚
初
到
动
卒
卬
即
厥
又
及
叨
只
可
台
叵
各
向
否
听
吾
呜
呼
咸
哉
哎
唯
善
嗟
嘻
噫
因
在
坐
垂
复
夙
多
夫
如
妄
妾
始
姑
宁
对
将
少
尔
尚
尝
尤
就
尽
属
屡
岂
巨
己
已
常
并
幸
庶
庸
弥
当
彼
待
徒
得
循
微
忝
忽
思
恒
悉
惟
想
愈
愚
我
或
所
才
抑
按
据
攸
故
敢
敬
数
斯
方
旋
无
既
时
昔
是
暂
暨
暴
曩
曰
更
曹
曾
朅
朕
权
极
某
欤
欲
止
正
此
殆
每
比
毕
永
沿
洎
滋
焉
然
照
爰
特
犹
独
猝
猥
现
甚
用
由
畴
登
皆
益
盍
盖
直
看
矣
矧
稍
窃
立
竟
第
等
管
粤
素
繄
纵
终
缘
羌
者
而
耳
耶
聊
聿
胜
臣
自
至
苟
若
藉
虽
行
见
言
讵
设
请
诸
诺
谓
谨
谬
越
身
辄
辈
迄
迨
迭
适
逮
遂
道
遵
遽
邪
重
长
闻
雅
靡
顺
须
顿
颇
频
饶
骤
一何
一尔
不亦
不惟
不意
且夫
乃今
乃者
乃至
乃遂
之属
之流
之类
之谓
于何
于是
云乎
云何
云尔
云胡
亡何
亦且
亦已
今夫
以为
伊于
伊何
何乃
何以
何其
何况
何则
何如
何者
便乃
俄而
倘或
倘若
借令
借如
借曰
傥使
其殆
兹故
况乃
况乎
况于
则亦
则安
则甚
即使
即或
可也
可以
可矣
向令
向使
否则
复次
大抵
夫何
奈何
奚其
奚啻
奚独
如令
如何
如使
如或
宁当
宁渠
安得
安所
尔来
尚尔
尚犹
尝闻
居然
岂其
岂得
岂惟
岂若
岂非
已矣
已而
庶乎
庶几
庸可
庸讵
徒以
得无
得非
或乃
所以
所自
抑且
抑亦
故夫
方今
方将
无乃
无以
无所
既乃
既已
既而
是以
是故
曷其
曷尝
有云
有以
有所
未尝
果尔
毋乃
比及
浸假
焉为
然且
然则
然后
然故
然而
特为
特以
甚且
畴昔
盖尝
矧夫
竟以
竟尔
终已
者乎
者邪
而今
而何
而况
而后
而已
聿怀
胡不
胡乃
自非
至乃
至于
至若
致令
苟且
苟为
若乃
若何
若使
若夫
若此
若苟
藉令
虽然
行且
行将
见在
见夫
譬夫
譬犹
讵可
讵料
讵知
设如
诚使
谓之
足以
遂乃
非徒
非惟
骤而
一何至
不亦乎
不至于
乃如此
乃尔尔
乃至于
乃若是
乃若此
之所以
之类乎
之谓乎
之谓也
于何有
于是乎
于是焉
云何哉
亡奈何
亦已焉
亦已矣
以至于
何至于
何足道
傥所谓
其或者
其然乎
则何如
则何至
则奈何
则已矣
可也夫
可奈何
奚足道
如之何
安足以
尚奚言
尚犹且
岂不尔
已焉哉
已矣乎
已矣夫
庶几乎
庶几哉
庸何伤
庸讵知
徒然耳
得毋乎
所谓之
所谓者
抑何至
是以故
是故以
浸假而
然且犹
者矣乎
者邪乎
而况于
而已矣
若之何
藉第令
行将及
讵可料
谓之曰
一至于斯
一至于此
不亦乐乎
不亦宜乎
不宁唯是
之乎者也
之谓何哉
之谓而已
于乎哀哉
云何勿思
云何吁矣
云胡不喜
亡何有乡
亡可奈何
亦复如此
亦已焉哉
伊于何底
伊于胡底
伊谁之力
何乃尔尔
何乃若是
何其甚也
何其衰也
借令如此
借曰不然
借曰未知
其不然乎
况乃如此
况于他人
况复如此
即如所言
即此一端
即此可见
可以已矣
向使当初
向若如是
大率如此
夫何足道
夫复何言
夫岂不可
奚为而然
奚啻如此
如之奈何
如彼如此
如斯而已
如此如此
宁有是理
宁有此事
宁有此理
尚何言哉
尚犹如此
岂不悲哉
岂不殆哉
岂不然乎
岂其然乎
岂其然哉
岂容置疑
已而已而
庶几乎此
庶几于此
庸可几乎
庸得而免
徒唤奈何
徒自苦耳
徒费唇舌
得无乃乎
得无厌乎
得未曾有
所为何事
所谓者何
抑亦如此
抑亦末矣
抑何足道
既已如此
既已若此
既而悔之
是以因之
是以圣人
是以谓之
是故以之
是故以是
是故君子
殆不可复
殆无虚日
浸假日久
浸假而至
然且如此
然则奈何
然则如何
繄我独无
者乎者也
者也之乎
而今现在
而今而后
若乃如此
若夫如此
若此之类
行且及矣
行将就木
行将焉往
见其一斑
见其大略
譬夫如此
譬犹如此
譬若如此
讵意如此
讵料及此
设使如此
设或如此
设若如此
非惟此也
非特此也
非独此也
一至于斯乎
之谓而已矣
亡之命矣夫
何乃太区区
奚独至于此
何其相似乃尔
见其一未见其二
http://www.xdnf.cn/news/10549.html

相关文章:

  • Baklib知识中台加速企业服务智能化实践
  • 达梦分布式集群DPC_分布式事务理解_yxy
  • 机器学习算法-k-means
  • LeetCode 40.组合总和II:含重复元素的组合问题去重策略详解
  • 生物化学笔记:神经生物学概论【脑客中国·科研】第186位讲者 | 何超:大脑的觉醒与睡眠
  • LCA(最近公共祖先)与树上差分
  • 【Dv3Admin】工具异常处理配置文件解析
  • 智能指针unique
  • 【MySQL】第13节|MySQL 中模糊查询的全面总结
  • Codeforces Round 1028 (Div. 2)(ABC)
  • JAVA实战开源项目:精简博客系统 (Vue+SpringBoot) 附源码
  • Python打卡训练营Day42
  • 阻塞队列BlockingQueue解析
  • Window系统程序加入白名单
  • LangChain-结合智谱AI大模型实现自定义tools应用实例
  • 吴恩达MCP课程(4):connect_server_mcp_chatbot
  • springboot中@Async做异步操作(Completable异步+ThreadPoolTaskExecutor线程池+@Async注解)
  • shp转3d tiles在cesium渲染楼宇白膜
  • Linux 驱动之设备树
  • Leetcode 2093. 前往目标城市的最小费用
  • SAR ADC 异步逻辑设计
  • Linux系统配置屏幕旋转和触摸旋转
  • 从冷上电到main()函数,Bootloader都做了什么?
  • 数据类型检测有哪些方式?
  • robot_lab学习笔记【MDP综述】
  • QuickJS 如何计算黄金分割率 ?
  • barker-OFDM模糊函数原理及仿真
  • Linux防火墙:全面解析IPTables的表、链、规则!
  • Cypress + TypeScript + Vue3
  • 数据库管理与高可用-MySQL全量,增量备份与恢复