GitHub - wangagui/Simple-text-classification: Event extraction and short text classification · GitHub
Skip to content

wangagui/Simple-text-classification

Folders and files

Repository files navigation

本项目最终实现了短文本的简单分类。 语料库:ACE语料

项目流程:

一:事件抽取

1.事件发现:从语料中发现事件句

2.事件抽取:从事件中抽取事件元素

二:文本分类

1.构造样本集

2.预处理

3.特征工程

4.模型训练(随机森林)

5.预测

6.评估

关于ACE语料库:

划分样本集参照:https://blog.csdn.net/weixin_41650458/article/details/80186358

提取样本:

从xml文件和html文件中提取样本及对应的类别,包括关键信息和非关键信息。 如果一个句子中包含多个事件,则这个句子对应多个样本。

About

Event extraction and short text classification

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors