龙盟编程博客 | 无障碍搜索 | 云盘搜索神器
快速搜索
主页 > web编程 > php编程 >

从某网站抓取图片并自动下载到文件夹内

时间:2014-07-22 14:48来源: 作者: 点击:
分享到:
。。。。因为某网站看图比较坑爹,要一页一页的翻页。。。。所以。。。。就写了这么个东西(我是产品不是程序员)运行速度简直无法忍受,而且经常会有错误发生,所以希望大家
。。。。因为某网站看图比较坑爹,要一页一页的翻页。。。。所以。。。。就写了这么个东西
(我是产品不是程序员)运行速度简直无法忍受,而且经常会有错误发生,所以希望大家帮忙改进(PHP)。。。
当然也欢迎看到PYTHON,GOLANG的版本~~^_^
对了,程序基于CodeIgniter
。。。。链接谨慎点击
$this->load->helper('date');
$this->load->helper('phpQuery');
//我是把phpQuery单文件放到helper里了

2. [代码]view内     跳至 [1] [2] [全屏预览]

//- -只是为了快速出产品,所以直接在VIEW里写的代码,请无视变量名。。。
<?php
$imageslist = phpQuery::newDocumentFile('http://g.e-hentai.org/g/xxxxx/xxxxxxx/');//首页
$pn = 1;//页数
$ps = $imageslist->find('.ptt td a');//从首页抓页面导航
//从页面导航开始获取页面内容
foreach($ps as $p)
{
    echo '第'.$pn++.'页:<a href="'.pq($p)->attr("href").'"/></br>';
    $imagesnow = phpQuery::newDocumentFile(pq($p)->attr("href"));//单页内容
    $images = $imagesnow->find('#gdt a');//抓取图片页列表
    foreach($images as $image)
    {
        echo '<a href="'.pq($image,$imagesnow)->attr("href").'"/></br>';
        $imagebigs = phpQuery::newDocumentFile(pq($image,$imagesnow)->attr("href"));//获取单图片页地址
        echo '<img src="'.$imagebigs->find('#i3 img')->attr('src').'"></br>';//输出图片
        ob_start();
        readfile($imagebigs->find('#i3 img')->attr('src'));
        $img = ob_get_contents();
        ob_end_clean();
        $filename='img/'.now().'.jpg';
        $f=fopen($filename,'a');
        fwrite($f,$img);
        fclose($f);
    }
}
?>
精彩图集

赞助商链接