当前位置: 首页 > web >正文

内容风控概念基础

目录

    • 内容风控的来源
    • 内容有哪些合规要求和潜在风险?
    • 文本防控
    • 图片防控
    • 音频防控
    • 视频防控
    • 一些内容安全产品

内容风控的来源

一切都可以是内容,常见的如文本、图片、音频、视频

内容有哪些合规要求和潜在风险?

一是要监管的合规要求。主要是涉政、违禁、暴恐、色情四大类内容,这将直接导致平台面临约谈、整顿、罚款乃至关停等监管风险。

  • 涉政:如领导人照片,事件,名字等
  • 违禁:强制弹药,毒品,赌博等
  • 暴恐:恐怖主意,杀人,暴乱等
  • 色情:一些低俗文字小说,色情文字图片,行为等

二是商业平台要维护用户权益。如防止虚假宣传、欺诈广告等误导消费者的行为,如淘宝广告中的生男生女药物广告,虽然可能提高点击率,但显然违反规定且不道德。

文本防控

文本审核一般通过深度学习与智能文本语义分析,识别同一词在不同语境中的风险。文本识别重在要同步网安和网信办合规要求,建立违规敏感词库,一般要建立数十万级词库,涵盖各类敏感信息。

如下文本防控的场景多种多样:
在这里插入图片描述

图片防控

图片审核重在建立数据库,以及针对不同类型进行模型训练。图片分类、分级、分场景。

  • 涉政图片:分普通、漫画、雕塑、恶搞、负面涉政等
  • 色情图片识别,也需要分级(性感、色情、重度色情)
  • 其它分场景(直播、视频、电商、社区、游戏)

音频防控

语音过滤可以利用人工智能将语音转文本,再识别文本中的涉政、色情、广告等内容。语音识别又涉及到不同语种,比如普通话、英语、各种方言等。

视频防控

需要将视频进行拆分,将视频进行画面截帧,从而过滤图片,图片中的字幕则利用OCR字幕来过滤。视频标题通过文本过滤模型来检测,视频语音则单独采用语音模型过滤。

视频识别需要视频内容中的画面、声音、文字进行全方位分析过滤,视频包括短视频、长视频、视频直播等多种场景。

一些内容安全产品

数美
在这里插入图片描述

  • 阿里云:https://help.aliyun.com/document_detail/2573826.html

  • 网易:https://dun.163.com/product/text-detection

http://www.xdnf.cn/news/14355.html

相关文章:

  • 前端基础知识CSS系列 - 03(em/px/rem/vh/vw)
  • WiFi7无线桌面式AP天线系统设计
  • 【CATIA的二次开发29】抽象对象Document涉及文档标识的属性
  • MLLM常见概念通俗解析(五)
  • Vue3 实现老虎机抽奖游戏
  • linux-进程管理
  • 人工智能学习18-Pandas-按标签选择
  • CH579 CH573 CH582 CH592 蓝牙主机(Central)实例应用讲解(二)——Central消息事件机制初探
  • Ansible
  • leetcode 2566. 替换一个数字后的最大差值 简单
  • ESP32的spi通讯(Arduino)
  • Ubuntu 实现 sudo 免密码关键步骤
  • 启动springboot项目提示没有主清单属性
  • C++ 内存泄露
  • 以下是 NumPy 在统计与矩阵运算中的核心用法总结
  • linux msyql8 允许远程连接
  • java中扩展运算符
  • 《开窍》读书笔记8
  • 无线USB转换器TOS-WLink露面1个月以来总结
  • Cesium快速入门到精通系列教程九:Cesium 中高效添加和管理图标/标记的标准方式​​
  • Verilog自适应位宽与指定位宽不同导致模块无法正常执行
  • csharp设计方法
  • 带中断计数器的UART接收中断程序 (8259@400H/402H)
  • RapidNJ软件的安装
  • 【Python 爬虫 防盗链】
  • 山东大学软件学院项目实训:基于大模型的模拟面试系统项目总结(九)
  • Apifox将base64转换为图片(调试时方便查看)
  • BeckHoff <---> Keyence (LJ-X8000) 2D相机 Profinet 通讯
  • IO之详解cin(c++IO关键理解)
  • 矩阵运算基础、矩阵求导