当前位置: 首页 > backend >正文

论文解读: 2018-Detection of spam reviews: a sentiment analysis approach

Title: Detection of spam reviews: a sentiment analysis approach
URL: link.springer.com/ar...

产品和服务的在线评论对于制造商和消费者都发挥着重要作用,因为它们拥有大量的用户意见和体验。正面评价比例高的产品会吸引更多的顾客,从而增加产品业务。与此同时,任何产品收到的负面评论比例较高,都会损害产品的声誉并导致财务损失 。一些冒牌货脚注1将此视为通过发布垃圾评论来误导系统或客户的机会,以提升某些不受欢迎的产品或企业的排名,或者降低某些受欢迎的优质产品或企业的排名。为了实现这一目标,他们任命了一些个人(也称为垃圾邮件发送者),不仅为自己的产品创建综合正面评论,还为其竞争产品创建具有破坏性的负面评论。客户经常会选择具有更积极评价的产品,因此会因这些不真实的评论而受到误导。这会影响产品以及电子商务网站的声誉,因为客户可能会避免从网站购买产品。

1. Motivation

由于产品评论的外观相同,人们很难将评论分类为垃圾文本或非垃圾文本,故论文研究对评论进行自动标注的问题。

2. Contribution

  • 创建垃圾评论数据集,训练机器学习模型,将其他未标记数据分类为垃圾文本和非垃圾文本

  • 使用两种过采样技术(SMOTE, ADASYN)缓解数据集的不平衡

  • 采用多种机器学习算法来设计垃圾评论检测模型

3. Method

论文提出的方法主要包括五个阶段,分别是数据收集、数据预处理、特征提取、数据标注、分类。

image.png

3.1 数据收集

使用python从亚马逊收集 39,382 条在线产品评论,来自手机、耳机、移动电源等电子产品类别。数据收集时间为 2017 年 6 月至 2017 年 7 月。
 

http://www.xdnf.cn/news/8234.html

相关文章:

  • 宝尊电商一季度净收入21亿元 品牌管理收入同比大增
  • 冲刺卷软考总结-案例分析
  • 地信GIS专业关于学习、考研、就业方面的一些问题答疑
  • Windows系统下Docker安装青龙面板
  • 常见高危端口解析:网络安全中的“危险入口”
  • 101个α因子#15
  • CentOS7安装 PHP-FPM 7.4
  • 2025海外短剧CPS系统开发指南:高付费市场解析与增速全景图
  • 【CSS】九宫格布局
  • openEuler 22.03 LTS-SP3 系统安装 docker 26.1.3、docker-compose
  • 微信小程序之Promise-Promise初始用
  • 笔记:将一个文件服务器上的文件(一个返回文件数据的url)作为另一个http接口的请求参数
  • 重读《人件》Peopleware -(11)Ⅱ 办公环境 Ⅳ 插曲:生产力测量与不明飞行物
  • Nginx核心功能
  • 【Linux系统】冯诺依曼体系结构 和 操作系统的介绍
  • Ctrl+鼠标滚动阻止页面放大/缩小
  • QFileDialog::getSaveFileName导致系统崩溃
  • Go语言gopacket库的HTTP协议分析工具实现
  • 学习人工智能:从0到1的破局指南与职业成长路径
  • vue3+vue-flow实现拖拽矩形框,端点连线,自定义宽高
  • BGP为什么要配置对等IP?
  • PyInstaller入门
  • 如何看navicat数据库连接的密码
  • C++效率掌握之STL库:unordered_map unordered_set底层剖析
  • JavaScript【8】异步请求与本地存储
  • 巢票赛演协议逆向分析
  • 建设工程窝工、停工损失案件庭审发问提纲
  • [Dify] 在Dify中优雅处理本地部署LLM的Token超限问题
  • TransMorph:用于无监督医学图像配准的变压器
  • 网络编程中的 Protobuf 和 JsonCpp 全面解析