龙盟编程博客 | 无障碍搜索 | 云盘搜索神器
快速搜索
主页 > web编程 > php编程 >

PHP 用 tidy_parse_file() 函数提取 HTML 中的链接

时间:2014-06-19 16:11来源:网络整理 作者:网络 点击:
分享到:
PHP 用 tidy_parse_file() 函数提取 HTML 中的链接 **php代码**```{.php}lt;?php function dump_urls(tidy_node $node, amp;$urls = NULL) { $urls = (is_array($urls)) ? $urls : array(); if(isset($node-gt;id)) {

php代码

<?php
      function dump_urls(tidy_node $node, &$urls = NULL) {
            $urls = (is_array($urls)) ? $urls : array();

            if(isset($node->id)) {
                  if($node->id == TIDY_TAG_A) {
                        $urls[] = $node->attribute['href'];
                  }
            }

            if($node->hasChildren()) {
                  foreach($node->child as $child) {
                        dump_urls($child, $urls);
                  }
            }
                       return $urls;
      }

      $tidy = tidy_parse_file("http://www.php.net/");
      $urls = dump_urls($tidy->body());
      print_r($urls);
?>
精彩图集

赞助商链接