当前位置:首页 » php登录网站抓取内容 - 第1页

12月28日

php登录网站抓取内容,PHP Curl模拟登录并抓取数据

发布 : 小丽 | 分类 : 新媒体运营 | 评论 : 0 | 浏览 : 2088次
php登录网站抓取内容,PHP Curl模拟登录并抓取数据

使用PHP的Curl扩展库可以模拟实现登录,并抓取一些需要用户账号登录以后才能查看的数据。具体实现的流程如下(个人总结):1.首先需要对相应的登录页面的html源代码进行分析,获得一些必要的信息:我是钱QQ/微信:2081722(1)登录页面的地址;(2)验证码的地址;(3)登录表单需要提交的各个字段的名称和提交方式;(4)登录表单提交的地址;(5)另外要需要知道要抓取的数据所在的地址。2.获取cookie并存储(针对使用cookie文件的网站):$login_url='http://www.xxxxx';//登录页面地址$cookie_file=dirname(__FILE__)."/pic.cookie";//cookie文件存放位置(

搜索

网站分类

最近发表

标签列表

最新留言