新知榜官方账号
2023-12-02 22:36:13
每天产生的文本信息令人叹为观止。数百万数据源以新闻稿、博客、消息、手稿和无数其他形式发布,因而自动组织和处理就必不可少。随着神经网络算法的改进、计算机算力的显著提升以及大量涌现的理解框架,自然语言处理的能力正被前所未有的探索。其中一个常见应用称为事件提取,即处理收集蕴藏在文本中的一个阶段内发生的事件,自动识别发生了什么和什么时候发生。
本文将构建一个简单的事件提取脚本,接收新闻输入处理后输出事件。获取数据首先需要收集数据。我们可以用任何形式的文本,只要这些文字的内容可通过时间线表示。本文选用newsapi,从该数据源获取数据很容易,其开发者计划每天可获取500个免费请求。以下是处理请求的代码:
......
最后用Plotly绘制一下时间线图:
就是这样,用一个脚本从2000篇文章中提取和组织事件。现在可以想象每天将这一技术应用于上百万篇文章有多大用处。仅以股票市场每日新闻影响为例,事件提取可以说非常有价值。可以增加许多步骤提升事件提取的效果,诸如更好的预处理包括POStagging和NER,使用更好的句子向量模型等等。不过本文的方法,已经可以快速达到理想的结果。感谢阅读本文。
本文聚焦NLP及事件提取。如果想了解更多有关数据科学和机器学习的信息,请follow我的账号。有任何想法、评论或问题,请给我留言。
社长今日推荐:AI入门、大数据、机器学习免费教程35本世界顶级原本教程限时开放,这类书单由知名数据科学网站KDnuggets的副主编,同时也是资深的数据科学家、深度学习技术爱好者的MatthewMayo推荐,他在机器学习和数据科学领域具有丰富的科研和从业经验。点击链接即可获取:https://ai.yanxishe.com/page/resourceDetail/417
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49