新知榜官方账号
2023-12-02 22:36:13
每天产生的文本信息令人叹为观止。数百万数据源以新闻稿、博客、消息、手稿和无数其他形式发布,因而自动组织和处理就必不可少。随着神经网络算法的改进、计算机算力的显著提升以及大量涌现的理解框架,自然语言处理的能力正被前所未有的探索。其中一个常见应用称为事件提取,即处理收集蕴藏在文本中的一个阶段内发生的事件,自动识别发生了什么和什么时候发生。
本文将构建一个简单的事件提取脚本,接收新闻输入处理后输出事件。获取数据首先需要收集数据。我们可以用任何形式的文本,只要这些文字的内容可通过时间线表示。本文选用newsapi,从该数据源获取数据很容易,其开发者计划每天可获取500个免费请求。以下是处理请求的代码:
......
最后用Plotly绘制一下时间线图:
就是这样,用一个脚本从2000篇文章中提取和组织事件。现在可以想象每天将这一技术应用于上百万篇文章有多大用处。仅以股票市场每日新闻影响为例,事件提取可以说非常有价值。可以增加许多步骤提升事件提取的效果,诸如更好的预处理包括POStagging和NER,使用更好的句子向量模型等等。不过本文的方法,已经可以快速达到理想的结果。感谢阅读本文。
本文聚焦NLP及事件提取。如果想了解更多有关数据科学和机器学习的信息,请follow我的账号。有任何想法、评论或问题,请给我留言。
社长今日推荐:AI入门、大数据、机器学习免费教程35本世界顶级原本教程限时开放,这类书单由知名数据科学网站KDnuggets的副主编,同时也是资深的数据科学家、深度学习技术爱好者的MatthewMayo推荐,他在机器学习和数据科学领域具有丰富的科研和从业经验。点击链接即可获取:https://ai.yanxishe.com/page/resourceDetail/417
相关文章
推荐
幻舟 AI:动画创作领域的革新力量
2024-12-27 16:06
幻舟 AI:开启纪录片创作新征程
2024-12-27 16:03
幻舟 AI:教育短视频创作的得力助手
2024-12-27 15:59
幻舟 AI:影视创作多领域的创新利器
2024-12-27 15:55
幻舟 AI:影视创作多领域的创新利器
2024-12-27 15:51
幻舟 AI:影视创作的变革引擎
2024-12-27 15:45
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03