新闻公告
活动&公告
当前位置:  首页 新闻公告 活动&公告 科研 机器学习方法学术沙龙:曹正磊
机器学习方法学术沙龙:曹正磊
2023年06月09日

报告题目: 网络媒体数据抓取技术爬取和反爬取的应用

报告时间: 2023-06-09 15:30——2023-06-09 17:30

报告人: 曹正磊

报告地点: 腾讯会议号:977-758-517

主办单位: 数据科学与人工智能学院 智能商务研究中心

【报告人简介】

曹正磊,2011年毕业于大连海事大学网络工程专业,现就职于思科(大连)技术服务有限公司,任职网络软件方案架构师、网络软件全栈工程师。曾参与和服务联通、移动、电信三大运营商的网络监控运维以及(工,农,中,建)四大行和交通银行招商银行,平安集团,广发行等商业银行的国内金融行业的数据中心建设,骨干网建设,以及网络后期运维维护和支持。对网络及软件行业的业务具有极为丰富的实战经验。

【报告摘要】

B/S架构网站的发展过程伴随着网络的不断演进,自有网站以来,网络数据的抓取技术也随之不断地发展改进。从简单的静态网站,动态网站到交互式网站,从专业的媒体报道到全民媒体时代,从文字,到图文并茂再到流媒体,从电脑终端到手机客户端;数据在内容上和形式上都发生了巨大的变化。社交媒体的发展同样在不断发展和演进,社交媒体数据历来是大数据分析和AI研究的重要方向,数据的准确抓取变尤为重要。爬取与反爬取一直在攻防中不断演变。本次报告,主要介绍网络数据的爬取与反爬取的应用和应对。

 

撰稿:张婧  审核:富宇   单位:数据科学与人工智能学院