当前位置: 首页 > backend >正文

【实证分析】MDA文本相似度分析(2008-2023年)

数据简介:管理层讨论与分析(Management's Discussion and Analysis,MD&A)是上市公司年报中由管理层撰写的核心内容,其通过分析公司财务状况、经营成果、风险因素和未来战略,向投资者传递关键决策信息。研究MD&文本相似度具有多重理论与实践意义。MD&文本相似度分析可有效识别“模板化披露”现象。若多家公司或同一公司不同年份的MD&内容高度趋同,可能暗示管理层存在敷衍披露、避重就轻的风险。MD&A文本相似度研究不仅是技术工具的创新,更是完善信息披露制度、优化资源配置效率的重要突破口。其价值在于构建“文本特征-管理层动机-市场反应”的逻辑闭环,为提升资本市场信息透明度提供量化支撑。本团队参考宋昕倍、陈莹、逯东、程杰(2024)的文章,按照如下步骤得出MD&A文本相似度:

首先遍历所有文件,找到所有年份的股票代码集合的交集,即所有年份都存在的上市公司数据;

然后对文本进行分词处理,分词过程中去掉阿拉伯数字和标点符号,使用潜在语义索引(Latent Semantic Indexing,LSI)余弦相似度计算法,计算得出当期MD&A文本与上一期MD&A文本的相似度;

数据来源:人工整理

时间跨度:2008-2023年

数据格式:Excel

包含指标:

股票代码

股票简称

年份

年度相似度

样例数据:

图1.png

图2.png

参考文献:宋昕倍,陈莹,逯东,程杰. 信息环境、上市公司增量信息披露与资本市场定价效率——基于MD&A文本相似度的研究[J]. 南开管理评论, 2024, 27(5): 30-39.

下载链接: https://download.csdn.net/download/m0_65541699/90838026

http://www.xdnf.cn/news/6400.html

相关文章:

  • 基于redis实现分布式锁方案实战
  • Linux:理解文件系统
  • 网络损伤仪功能介绍与应用场景剖析
  • Java详解LeetCode 热题 100(17):LeetCode 41. 缺失的第一个正数(First Missing Positive)详解
  • JavaScript的BOM、DOM编程
  • Java并发编程:CAS操作
  • java调用get请求和post请求
  • 无人机屏蔽与滤波技术模块运行方式概述!
  • Git命令总结
  • 视频质量分析时,遇到不同分辨率的对照视频和源视频,分辨率对齐的正确顺序。
  • Linux515 rsync定时备份
  • 使用LoRA微调Qwen2.5-VL-7B-Instruct完成电气主接线图识别
  • Android 图片自动拉伸不变形,点九
  • Linux 系统中的文件系统层次结构和重要目录的用途。
  • 隆重推荐(Android 和 iOS)UI 自动化工具—Maestro
  • 浏览器宝塔访问不了给的面板地址
  • CSS图片垂直居中问题解决方案
  • 【数据结构入门训练DAY-35】棋盘问题
  • 本地文件操作 MCP (多通道处理) 使用案例
  • 使用 TypeScript + dhtmlx-gantt 在 Next.js 中实现
  • docker(四)使用篇一:docker 镜像仓库
  • 全球宠物经济新周期下的亚马逊跨境采购策略革新——宠物用品赛道成本优化三维路径
  • SQL练习(3/81)
  • 【Python】【面试凉经】Fastapi为什么Fast
  • uniapp,小程序中实现文本“展开/收起“功能的最佳实践
  • 5G + 区块链:技术巨浪下的新型数字生态!
  • 【生活相关-日语-日本-东京-搬家后-引越(ひっこし)(3)-踩坑点:国民健康保险】
  • Cloudflare防火墙拦截谷歌爬虫|导致收录失败怎么解决?
  • 国产化中间件 替换 nginx
  • MySQL索引优化面试高频考点解析(附实战场景)