为提高学生对文本挖掘技术的认识和兴趣,信息技术与工程学院于6月10日开展“文本分类技术研究”讲座。参加本次活动的有邹兰平老师及各二级学院师生代表们。本次讲座由学生科研助理刘晓锋主持,买买提依明·哈斯木博士主讲。
买买提依明·哈斯木博士首先从文本分类的定义入手,深入讲解了文本分类和文本聚类的区别、有监督机器学习方法和无监督机器学习方法的特点。结合案例介绍了文本分类在工业界的应用,详细解释了文本分类中的文本预处理、特征提取、特征选择、训练、测试等关键技术。随后,他介绍了基于深度学习文本分类的工作原理,同时比较了同时比较传统的文本分类与基于深度学习的文本分类性能,得出了基于深度学习的语言模型碾压了传统的文本分类方法的结论。
最后,他对文本分类中各个方法的效果比较和分析了文本分类算法存在的不足。他指出目前文本分类算法在一些复杂的场景中缺乏数据集,无法验证当前模型在复杂的场景中的效果和需要开发更小、更高效的文本分类模型是今后研究的热点等问题。
在互动环节,同学们积极提出自身的疑问,买买提依明·哈斯木博士针对所提出的问题进行耐心地解答,并对同学们在大学期间一定要找准自己的方向,并要坚定走下去。
本次讲座的开展,激发了同学们对文本分类技术的求知欲,强化了知识的累积和能力的培养,为同学们的职业规划和方向提供了一定的帮助。
主讲人:买买提依明·哈斯木 博士
互动环节
大合照