好大夫爬虫流程
2017-02-27 20:26:06 0 举报
好大夫爬虫流程主要包括以下几个步骤:首先,通过编写爬虫程序,设定爬取的目标网站和数据范围;其次,利用网络请求库发送请求,获取网页源代码;然后,使用解析库对网页源代码进行解析,提取所需信息,如医生姓名、职称、医院等信息;接着,对提取到的信息进行清洗和整理,去除无关内容,确保数据的准确性和完整性;最后,将整理好的数据存储到数据库或文件中,便于后续分析和使用。在整个过程中,需要注意遵守网站的爬虫协议,避免对目标网站造成过大的访问压力。
作者其他创作
大纲/内容
N
此网页结束
记录患者的提问Q1
记录医生的回复内容R1
疾病、病情描述、希望提供的帮助栏目中是否完整的包含标题
医生是否对患者的追问进行回复
记录医生的回复内容R2和回复次数RT
Y
患者是否对医生发起追问
获取患者的标题、疾病、病情描述、希望提供的帮助
患者的提问为标题、疾病、病情描述、希望提供的帮助
记录患者的追问内容Q2和追问次数QT
记录医生的回复和患者的追问
患者的提问为疾病、病情描述、希望提供的帮助
针对每一个网页
0 条评论
下一页