首页 > 网站开发 > 采集类snoopy实例演示(带抓去COOKIE教程)

采集类snoopy实例演示(带抓去COOKIE教程)

最后更新: 2015-06-25    浏览次数:     

之前介绍过 “采集类snoopy的基本用法“, 本文将给大家介绍它的实例演示.

实例:
我们采集的站点需要登录, 我们可以登录的cookie保存下来, 来实现免登录采集.

代码:

<?php
include(“Snoopy.class.php”);
$snoopy = new Snoopy;
$snoopy->agent = “Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.104 Safari/537.36″; //浏览器信 息, 你用什么浏览器查看cookie, 就用那个浏览器的信息
$snoopy->referer = “http://blog.diebiang.com/internet/”; //来路页面
$snoopy->rawheaders[“COOKIE”]=”Name_1=Value_1;Name_2=Value_2;Name_3=Value_3;Name_4=Value_4;Name_5=Value_5″;

$snoopy->fetch(“http://blog.diebiang.com/”); //被采页面
$content = $snoopy->results;
echo $content;

?>
代码说明, 主要两个讲两个参数agent和rawheaders

 

agent:

使用Google Chrome浏览器, 可以直接在浏览器地址栏目输入: chrome://version/ 查看浏览器版本信息, 其中包括: agent信息. 如图:

采集类snoopy实例演示(带抓去COOKIE教程) - diê-biāng - 1

rawheaders[“COOKIE”]:

这里我们就需要抓去被采集网站的登录COOKIE信息了, 同样使用Google Chrome浏览器来登录, 首先打开登录页面, 按”F12″(右键点击”审查元素”)打开浏览器”审查元素”的功能, 依次点击: Resources->Cookies->选择你要抓去Cookie的页面地址. 如图:

采集类snoopy实例演示(带抓去COOKIE教程) - diê-biāng - 2

在登录页面输入帐号, 密码已经验证码等信息,然后登录, 你会看到”审查元素”抓去到的一些Cookie信息. 现在分析这些Cookie信息, 将Name和Value分别写入, 如:$snoopy->rawheaders[“COOKIE”]=”Name_1=Value_1;Name_2=Value_2;Name_3=Value_3;Name_4=Value_4;Name_5=Value_5″;

 

 

 

 

…待补充