自然语言处理中的事件提取

新知榜官方账号

2023-12-02 22:36:13

自然语言处理中的事件提取

每天产生的文本信息令人叹为观止。数百万数据源以新闻稿、博客、消息、手稿和无数其他形式发布,因而自动组织和处理就必不可少。随着神经网络算法的改进、计算机算力的显著提升以及大量涌现的理解框架,自然语言处理的能力正被前所未有的探索。其中一个常见应用称为事件提取,即处理收集蕴藏在文本中的一个阶段内发生的事件,自动识别发生了什么和什么时候发生。

本文将构建一个简单的事件提取脚本,接收新闻输入处理后输出事件。获取数据首先需要收集数据。我们可以用任何形式的文本,只要这些文字的内容可通过时间线表示。本文选用newsapi,从该数据源获取数据很容易,其开发者计划每天可获取500个免费请求。以下是处理请求的代码:

......

最后用Plotly绘制一下时间线图:

就是这样,用一个脚本从2000篇文章中提取和组织事件。现在可以想象每天将这一技术应用于上百万篇文章有多大用处。仅以股票市场每日新闻影响为例,事件提取可以说非常有价值。可以增加许多步骤提升事件提取的效果,诸如更好的预处理包括POStagging和NER,使用更好的句子向量模型等等。不过本文的方法,已经可以快速达到理想的结果。感谢阅读本文。

本文聚焦NLP及事件提取。如果想了解更多有关数据科学和机器学习的信息,请follow我的账号。有任何想法、评论或问题,请给我留言。

点击查看相关链接和参考文献

社长今日推荐:AI入门、大数据、机器学习免费教程35本世界顶级原本教程限时开放,这类书单由知名数据科学网站KDnuggets的副主编,同时也是资深的数据科学家、深度学习技术爱好者的MatthewMayo推荐,他在机器学习和数据科学领域具有丰富的科研和从业经验。点击链接即可获取:https://ai.yanxishe.com/page/resourceDetail/417

本页网址:https://www.xinzhibang.net/article_detail-21791.html

寻求报道,请 点击这里 微信扫码咨询

关键词

自然语言处理 事件提取 神经网络算法

分享至微信: 微信扫码阅读

相关文章