最新动态

当前位置: 首页» 最新动态

“运动与健康”学术沙龙系列活动(二十三)关联规则挖掘在医学科研数据中的应用


20201015日上午,业务支部承办的运动与健康学术沙龙系列活动第二十三期在腾讯会议平台上开展,该系列活动是本年度支部为促进师生学术交流的主要活动之一。本期邀请了运动人体科学学院体质与健康教研室代晓彤博士以“关联规则挖掘在医学科研数据中的应用”为题,向师生进行了大数据分析算法相关内容的分享,沙龙由张一民教授主持,研究院全体师生参与沙龙活动。

代晓彤博士于20169月至20197月就读于北京大学流行病与卫生统计学专业,获医学博士学位。20198月任教于体质与健康教研室至今。主要承担体质与健康教研室体质测量与评价、医学科研数据挖掘、慢性病流行病学等课程。主持多项课题,并发表多篇SCI论文。

本期所讲的关联规则最初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。代晓彤博士以“尿布与啤酒”的故事引出“关联规则”核心问题。通俗的理解,在实际生活中假设超市经理想更多的了解顾客的购物习惯,特别是想知道哪些商品顾客可能会在一次购物时同时购买?为回答该问题,可以对商店的顾客食物零售数量进行购物篮分析。该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。采用“关联规则”中所涉及的核心算法如Apriori算法、FP-树频集算法来解决医学科研数据、体育科研中的数据挖掘问题。在进行相关概念、核心算法分享的同时,代晓彤老师还向大家推荐了《医学大数据挖掘方法与应用》等初学者可以参考的书籍。

此次讲座提出了一些师生在科研中需要,但自己了解尚少的知识点。通过代老师的分享,师生有了对关联规则中的算法有了初步的认识,对于后续深入的学习起到了“敲门砖”的作用。