• 技术文章 >后端开发 >php教程

    php实现针对html标签中结束标签的检测与补全功能

    墨辰丷墨辰丷2018-06-08 17:51:16原创881
    本篇文章主要介绍php实现针对html标签中结束标签的检测与补全功能,感兴趣的朋友参考下,希望对大家有所帮助。、

    本文实例讲述了php实现html标签闭合检测与修复方法,具体如下:

    html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整

    <?php
    $str = '
    <p data="<li></li>">
      <img src="http://www.baidu.com/123123.png"/>
      <p2>
        <a>content</a>
      </p2>
        <ul>
          <li>
          </li>
        </ul>
        <p>
        content full
        </p>
        this is content</test1>
        this is content</test2>
        <test4 data="liujinjing"> This is cont
        <li></li>
        <test3 data="liujinjing"> This is content
    <p3>
    </p3>
    </p4>
    </p>
    </p>
    <p6 style="width:90px; "> this is content';
    $str_len = strlen($str);
    //记录起始标签
    $pre_data = array();
    //记录起始标签位置
    $pre_pos = array();
    $last_data = array();
    $error_data = array();
    $error_pos = array();
    $i = 0;
    //标记为 < 开始
    $start_flag = false;
    while( $i < $str_len ) {
      if($str[$i]=="<" && $str[$i+1]!='/' && $str[$i+1]!='!') {
        $i++;
        $_tmp_str = '';
        //标记为 < 开始
        $start_flag = true;
        //标记空白
        $space_flag = false;
        while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='/' && $i<$str_len){
          if($str[$i]==' ') {
            $space_flag = true;
          }
          if(!$space_flag) {
            $_tmp_str .= $str[$i];  
          }
          $i++;
        }
        $pre_data[] = $_tmp_str;
        $pre_pos[] = $i;
      } else if ($str[$i]=="<" && $str[$i+1]=='/') {
        $i += 2;
        $_tmp_str = '';
        while($str[$i]!=">" && $i<$str_len){
          $_tmp_str .= $str[$i];
          $i++;
        }
        $last_data[] = $_tmp_str;
        //查看开始标签的上一个值
        if(count($pre_data)>0) {
          $last_pre_node = getLastNode($pre_data, 1);
          if($last_pre_node == $_tmp_str) {
            //配对上, 删除对应位置的值
            array_pop($pre_data);
            array_pop($pre_pos);
            array_pop($last_data);
          } else {
          //没有配对上, 有两种情况
            //情况一: 只有闭合标签, 没有开始标签
            //情况二:只有开始标签, 没有闭合标签
            array_pop($last_data);
            $error_data[] = $_tmp_str;
            $error_pos[] = $i;
          }
        } else {
            array_pop($last_data);
            $error_data[] = $_tmp_str;
            $error_pos[] = $i;      
        }
      }else if ($str[$i]=="<" && $str[$i+1]=="!") {
        $i++;
        while($i<$str_len) {
          if($str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {
            $i++;
            break;
          } else {
            $i++;
          }
        }
        $i++;
      }else if($str[$i]=='/' && $str[$i+1]=='>') {
        //跳过自动单个闭合标签
        if($start_flag) {
          array_pop($pre_data);
          array_pop($pre_pos);
          $i+=2;
        }
      }else if($str[$i]=="/" && $str[$i+1]=="*"){
        $i++;
        while($i<$str_len) {
          if($str[$i]=="*" && $str[$i+1]=="/") {
            $i++;
            break;
          } else {
            $i++;
        }
        $i++;
      }
      }else if($str[$i]=="'"){
        $i++;
        while($str[$i]!="'" && $i<$str_len) {
          $i++;
        }
        $i++;
      } else if($str[$i]=='"'){
        $i++;
        while($str[$i]!='"' && $i<$str_len ) {
          $i++;
        }
        $i++;
      } else {
        $i++;
      }
    }
    //确定起始标签的位置
    function confirm_pre_pos($str, $pre_pos){
      $str_len = strlen($str);
      $j=$pre_pos;
      while($j < $str_len) {
        if($str[$j] == '"') {
          $j++;
          while ($j<$str_len) {
            if($str[$j]=='"') {
              $j++;
              break;
            }
            $j++;
          }
        }
        else if($str[$j] == "'") {
          $j++;
          while ($j<$str_len) {
            if($str[$j]=="'") {
              $j++;
              break;
            }
            $j++;
          }
        }
        else if($str[$j]==">") {
          $j++;
          while ($j<$str_len) {
            if($str[$j]=="<") {
              //退回到原有内容位置
              $j--;
              break;
            }
            $j++;
          }
          break;
        } 
        else {
          $j++;
        }
      }
      return $j;
    }
    //确定起始标签的位置
    function confirm_err_pos($str, $err_pos){
      $j=$err_pos;
      $j--;
      while($j > 0) {
        if($str[$j] == '"') {
          $j--;
          while ($j<$str_len) {
            if($str[$j]=='"') {
              $j--;
              break;
            }
            $j--;
          }
        }
        else if($str[$j] == "'") {
          $j--;
          while ($j<$str_len) {
            if($str[$j]=="'") {
              $j--;
              break;
            }
            $j--;
          }
        }
        else if($str[$j]==">") {
          $j++;
          break;
        } 
        else {
          $j--;
        }
      }
      return $j;
    }
    //获取数组的倒数第num个值
    function getLastNode(array $arr, $num){
      $len = count($arr);
      if($len > $num) {
        return $arr[$len-$num];
      } else {
        return $arr[0];
      }
    }
    //整理数据, 主要是向后看, 进一步进行检查
    function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){
      $rem_key_array = array();
      $rem_i_array = array();
      //获取需要删除的值
      foreach($error_data as $key=>$value){
        $count = count($pre_data);
        for($i=($count-1) ; $i>=0; $i--) {
          if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
            $rem_key_array[] = $key;
            $rem_i_array[] = $i;
            break;
          }
        }
      }
      //删除起始标签相应的值
      foreach($rem_key_array as $_item) {
        unset($error_pos[$_item]);
        unset($error_data[$_item]);
      }
      //删除结束标签相应的值
      foreach($rem_i_array as $_item) {
        unset($pre_data[$_item]);
        unset($pre_pos[$_item]);
      }
    }
    //整理数据, 闭合标签
    function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
      $move_log = array();
      //只有闭合标签的数据
      foreach ($error_data as $key => $value) {
        // code...
        $_tmp_move_count = 0;
        foreach ($move_log as $pos_key => $move_value) {
          // code...
          if($error_pos[$key]>=$pos_key) {
            $_tmp_move_count += $move_value;
          }
        }
        $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);
        $str = $data['str'];
        $move_log[$data['pos']] = $data['move_count'];
      }
      //只有起始标签的数据
      foreach ($pre_data as $key => $value) {
        // code...
        $_tmp_move_count = 0;
        foreach ($move_log as $pos_key => $move_value) {
          // code...
          if($pre_pos[$key]>=$pos_key) {
            $_tmp_move_count += $move_value;
          }
        }
        $data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true);
        $str = $data['str'];
        $move_log[$data['pos']] = $data['move_count'];
      }
      return $str;
    }
    //插入数据, $type 表示插入数据的方式
    function insert_data($str, $insert_data, $pos, $type) {
      $len = strlen($str);
      //起始标签类型
      if($type==true) {
        $move_count = strlen($insert_data)+3;
        $pos = confirm_pre_pos($str, $pos);
        $pre_str = substr($str, 0, $pos);
        $end_str = substr($str, $pos);
        $mid_str = "</" . $insert_data . ">";
      //闭合标签类型
      } else {
        $pos = confirm_err_pos($str, $pos);
        $move_count = strlen($insert_data) + 2;
        $pre_str = substr($str, 0, $pos);
        $end_str = substr($str, $pos);
        $mid_str = "<" . $insert_data . ">";
      }
      $str = $pre_str.$mid_str.$end_str;
      return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count);
    }
    sort_data($pre_data, $pre_pos, $error_data, $error_pos);
    $new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos);
    echo $new_str;
    // print_r($pre_data);
    // print_r($pre_pos);
    // print_r($error_data);
    // print_r($error_pos);
    // echo strlen($str);
    // foreach($pre_pos as $value){
    //   $value = confirm_pre_pos($str, $value);
    //   for($i=$value-5; $i<=$value; $i++) {
    //     echo $str[$i];
    //   }
    //   echo "\n";
    // }
    // foreach($error_pos as $value){
    //   for($i=$value-5; $i<=$value; $i++) {
    //     echo $str[$i];
    //   }
    //   echo "\n";
    // }
    ?>

    总结:以上就是本篇文的全部内容,希望能对大家的学习有所帮助。

    相关推荐:

    PHP 实现的将图片转换为ASCII码

    php程序中获取汉字拼音的首字母的方法

    PHP+Mysql+jQuery统计当前在线用户数

    以上就是php实现针对html标签中结束标签的检测与补全功能的详细内容,更多请关注php中文网其它相关文章!

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    上一篇:PHP实现针对指定后缀文件的批量上传功能 下一篇:php实例分析了php中类常量的概念
    Web大前端开发直播班

    相关文章推荐

    • php反序列化实例详解之字符串逃逸• 一文带你PHP利用phpmailer实现邮件发送功能• 什么是PHPUnit?在PHP项目中怎么使用?• 模板引擎SMARTY_PHP• [转一篇比较老的文章]编写自己的php扩展函数_PHP

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网