首先,李春涛教授发言,讲述了中文地址处理中遇到的问题,讲解了正则表达式和四个地图神器。以中国公司的注册地址的部分数据为例,讲解了面对注册地址,如何用正则表达式将省、市和县提取出来。接着讲解了地图神器,通过百度地图搜索到相应地址以及经度和纬度,再用命令找到详细地址并进行下一步提取。李教授通过几个案例的讲解让同学们充分重视提升搜集数据的能力以及学习网络爬虫的重要意义。
薛原博士发言,“向网络要数据:爬虫让你的研究更轻松”以一个简单的例子向大家展示用Stata进行网络爬虫的过程,即在新浪财经上抓取上市公司的公告数据。通过展示如何抓取青岛啤酒的最新公告数据,同学们学习到了提取数据用到的命令以及当源代码里有些独特信息时如何使用标签处理。
会议下半场由闫续文博士主持,以康美药业案的一审判决为例做事件研究,讲解了事件研究的具体步骤,看多家上市公司对康美药业案的市场反应,讲解了能够减轻编程工作量的输出文章标题和摘要信息、描述性统计信息、实证结果等的相关命令,让程序生成整篇论文。
最后,网课总经理刘子艳博士发布课程的相关资料以及公布一个月课程的答疑安排以及回答了同学们的提问。
(供稿审核人:彭红枫)