基于深度融合的中文UGC多模态智能审核系统

本项目是对 DUT-lujunyu/ToxiCN_MM 项目的改进与增强。

核心贡献

在 ToxiCN_MM 原有的 MHKE (多模态知识增强) 模型基础上，我们进行了以下核心改进：

引入深度融合机制:
- 将原始模型简单的特征拼接 (Concatenation) 策略，升级为基于 双向交叉注意力 (Bi-directional Cross-Attention) 的深度融合模块。
- 这使得模型能够实现对文本和图像特征的早期交互与深度融合，更有效地捕捉跨模态的复杂语义关联，解决了原模型融合层次较浅的问题。
增强的可视化展示:
- 我们使用 Gradio 构建了一个交互式的Web界面 (app.py)，用于直观地展示模型的预测能力。
- 演示系统不仅支持对单个Meme的实时预测，还提供了一键式的批量验证功能，能够自动在测试集上运行并生成包括混淆矩阵、各类别性能指标图在内的多维度性能分析报告。

快速开始

环境配置:
```
pip install -r requirements.txt
```
运行演示系统:
```
python app.py
```
在浏览器中打开提供的本地或公网链接即可访问。

系统功能概览

交互式预测界面

支持用户上传图片和输入文本，实时获取模型的分类结果与置信度。

批量评估与分析界面

一键在测试集上运行批量预测，并自动生成专业的性能分析图表，包括混淆矩阵、各类别P/R/F1分数等。

致谢

感谢 ToxiCN_MM 的作者们提供了出色的基线工作和数据集。

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
config		config
dataset		dataset
model		model
README.md		README.md
app.py		app.py
batch_evaluation.png		batch_evaluation.png
demo_data.json		demo_data.json
interactive_prediction.png		interactive_prediction.png
requirements.txt		requirements.txt
run.py		run.py
train_eval_.py		train_eval_.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

基于深度融合的中文UGC多模态智能审核系统

核心贡献

快速开始

系统功能概览

致谢

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

基于深度融合的中文UGC多模态智能审核系统

核心贡献

快速开始

系统功能概览

致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages