9月20日上午,东北师范大学副校长、博士生导师郭建华教授应数学与信息科学学院邀请,在学院多功能报告厅作了题为《汉语言文本数据挖掘的统计方法》的学术报告,二百余名师生共同聆听此次报告。
报告会上,郭建华教授从“市长公开电话”的典型事例讲起,对数据的收集、分类、筛选做了具体的阐释。他认为,处理大文本数据的技术关键在于数据分类筛选完毕后,如何采用不同关键字对其进行降维,使其成为低阶向量进行数据处理。他着重讲解了朴素贝叶斯分类这一结构降维策略模型的构建,并把朴素贝叶斯分类模型与普通的决策树模型、贝叶斯模型进行对比,指出其优点所在。郭建华教授还通过“吸烟是否会得肺癌”这一话题,告诉参会人员在处理大文本数据时应当如何考虑其他间接相关因素以及这些因素所带来的影响。
报告会中,郭建华教授将抽象的统计学知识联系实际以通俗易懂的方式进行解读,其学术造诣、科研素养和诙谐幽默的语言风格给在场师生留下了深刻的印象。报告结束之际,与会师生纷纷就自己关心的问题与他展开现场交流,现场气氛热烈。
(数学学院 张瑾 王艺斐)