1.事件发现:从语料中发现事件句
2.事件抽取:从事件中抽取事件元素
1.构造样本集
2.预处理
3.特征工程
4.模型训练(随机森林)
5.预测
6.评估
划分样本集参照:https://blog.csdn.net/weixin_41650458/article/details/80186358
提取样本:
从xml文件和html文件中提取样本及对应的类别,包括关键信息和非关键信息。 如果一个句子中包含多个事件,则这个句子对应多个样本。
1.事件发现:从语料中发现事件句
2.事件抽取:从事件中抽取事件元素
1.构造样本集
2.预处理
3.特征工程
4.模型训练(随机森林)
5.预测
6.评估
划分样本集参照:https://blog.csdn.net/weixin_41650458/article/details/80186358
提取样本:
从xml文件和html文件中提取样本及对应的类别,包括关键信息和非关键信息。 如果一个句子中包含多个事件,则这个句子对应多个样本。