Al Arabiya人工智能报道的分析

Al Arabiya新闻网站介绍

阿拉伯卫星电视台,或音译为“阿拉比亚电视台”,是一家沙特阿拉伯所有的泛阿拉伯主义电视新闻频道,使用阿拉伯语报道。2003年3月3日开始运营。总部位于阿联酋迪拜。最大产权主为沙特阿拉伯的中东广播中心。该台播出新闻、目前事件、商业和财经市场、体育、谈话节目和记录片等节目。其收视率在中东国家的观众中位居前列。

访问Al Arabiya网站:https://www.alarabiya.net/

更多信息请检索

人工智能报道分析

近几年人工智能飞速发展,美国和中国是投资人工智能技术规模最大的两个国家,但在阿拉伯地区,人工智能的发展也在兴起,尤其是资金雄厚的海湾国家,以沙特和阿联酋为代表,正如火如荼进行”世界第四次经济革命”。

为了解阿拉伯社会对人工智能的看法和关注话题,我利用网络爬虫技术(ParseHub)爬取了沙特国有国际新闻频道Al Arabiya网站的相关报道,以“االذكاء الاصطناعي”(人工智能)为检索词共爬取报道2600+篇,包括标题、时间、地点和新闻文本,以段落为单位共收集2.7w+文本数,时间从2013年2月到2024年3月。

图1(worldcloud)生成了2.7w篇幅中词频前100的单词。 在统计词频时,首先加载阿拉伯语停用词词表(github),并手动加入阿拉伯语特殊符号进行文本预处理,在此基础上对文本进行分词并遍历统计。

图2(timeline)在图1的基础上进行了报道年份的分组,并加上时间线统计了2013-2024各个年份新闻报道中的前十高频词,以柱状图呈现,且有多个横轴标签,由此可以观察出各年份对人工智能关注领域的异同。

图3(News Count by Year)以柱状图呈现了各年份新闻报道的篇幅数变化。利用count函数计算各年份的出现次数,从而生成不同年份新闻报道篇幅的柱状图。由此可以看出人工智能热度的时间变化趋势。

图3(News Count by Year)以柱状图呈现了各年份新闻报道的篇幅数变化。利用count函数计算各年份的出现次数,从而生成不同年份新闻报道篇幅的柱状图。由此可以看出人工智能热度的时间变化趋势。

人工智能报道名词共现关系图

下图展示了人工智能相关报道中的名词共现关系,统计了2.7w篇幅中出现次数TOP150的名词概念,以及TOP100的名词连接。

“الذكاء”(智能)是出现次数最多的名词,共计4151次,和“شركة”(公司)的共现权重最多,高达8036336。

其次是"الذكاء""العالم"(智能和世界),共现达5263468。