新闻中心News Center

您现在的位置: 网站首页   新闻中心   学院要闻   正文 学院要闻

《新媒体数据挖掘》学术沙龙——做大数据时代的小爬虫

发布时间:2017年11月22日 点击次数:

2017年11月21日星期二晚,第一次《新媒体数据挖掘》学术沙龙在东六楼传播系办公室顺利召开。此次沙龙旨在紧跟大数据时代的研究脉搏,在交叉学科的背景下,带领年轻学者发现数据挖掘的趣味,培养兼具人文眼光和编程技术的创新型人才。此次沙龙由徐明华老师和徐涵老师共同促成,吸引了大量新闻学院的本科生、研究生还有在读博士生的参与。会上两位老师对大数据研究做了深度分析,让参与者对该领域的最新研究成果都有了新的了解,并展现出对数据挖掘的浓厚兴趣,在会上最终完成了数据挖掘兴趣小组的组建与分工。

 

徐明华老师首先阐述了自己对学科交叉的理解,表达了对交叉学科前景的积极期待。她表示,在新媒体时代下,单纯的IT技术者也许并不能很好地完成数据挖掘工作。我们的科研和教学工作应该尝试让文科专业的人才从中汲取学术养分,并让数据挖掘程序更准确地抓取新闻学科所需要的信息。徐明华老师还强调,如何在新媒体上挖掘到自己想要的数据是现在的讨论热点,因此兼有文科思想和编程技术的中间型人才是大势所趋。她希望,这成为一个契机,让传播系一直以来的文理融合的想法付诸实践。

   徐涵老师详细介绍了大数据的概念和研究前景,并用图表与案例说明了大数据时代数据挖掘的准确性与重要性。徐涵老师表示,大数据是当下的热点话题,“2017国家杰出青年科学基金项目” 中也出现了与大数据紧密相连的研究,而大数据之下的数据挖掘也在预测趋势,总结规律等方面起着越来越重要的作用。接着徐涵老师用“超市预知高中生怀孕”、“啤酒与尿布被一起购买”等实例生动展现了数据挖掘的神奇之处,传播专业的大四学生也在现场展示如何利用python程序抓取豆瓣信息,让同学们感叹不已,并产生了对数据挖掘的探索之心。

在徐明华老师与徐涵老师的倡议下组建了数据挖掘团队,在场的年轻学者们按照自己的理解与意愿分别组建三个队伍:网络爬虫组、数据挖掘组和数据可视化组。网络爬虫组将展开对Python等语言的学习,尝试爬取社交网站数据并利用数据库语言对数据进行整理。数据挖掘组将提前选修线性代数、概率论与数理统计3门课程与相关算法,为数据挖掘提供有力的技术支持。数据可视化组将学习R语言和可视化相关工具软件,让数据形象地展示出来。    

三个组分别确定了自己的学习方向与短期任务,并形成了定期汇报等学术制度。相信在不久的未来,能看到这群由大一新生到博士生组成的梯队,在大数据时代挖掘到越来越多的可靠数据,作出更多有价值的科研成果。