首页建站经验 php实现html标签闭合检测与修复方法

php实现html标签闭合检测与修复方法

本文实例讲述了php实现html标签闭合检测与修复方法。分享给大家供大家参考。具体如下:html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html…

本文实例讲述了php实现html标签闭合检测与修复方法。分享给大家供大家参考。具体如下:

html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整

<?php

$str = '

content

content full

this is content

this is content

This is cont

  • This is content

    this is content';

    $str_len = strlen($str);

    //记录起始标签

    $pre_data = array();

    //记录起始标签位置

    $pre_pos = array();

    $last_data = array();

    $error_data = array();

    $error_pos = array();

    $i = 0;

    //标记为 < 开始

    $start_flag = false;

    while( $i < $str_len ) {

    if($str[$i]=="<" && $str[$i+1]!='/' && $str[$i+1]!='!') {

    $i++;

    $_tmp_str = '';

    //标记为 < 开始

    $start_flag = true;

    //标记空白

    $space_flag = false;

    while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='/' && $i<$str_len){

    if($str[$i]==' ') {

    $space_flag = true;

    }

    if(!$space_flag) {

    $_tmp_str .= $str[$i];

    }

    $i++;

    }

    $pre_data[] = $_tmp_str;

    $pre_pos[] = $i;

    } else if ($str[$i]=="<" && $str[$i+1]=='/') {

    $i += 2;

    $_tmp_str = '';

    while($str[$i]!=">" && $i<$str_len){

    $_tmp_str .= $str[$i];

    $i++;

    }

    $last_data[] = $_tmp_str;

    //查看开始标签的上一个值

    if(count($pre_data)>0) {

    $last_pre_node = getLastNode($pre_data, 1);

    if($last_pre_node == $_tmp_str) {

    //配对上, 删除对应位置的值

    array_pop($pre_data);

    array_pop($pre_pos);

    array_pop($last_data);

    } else {

    //没有配对上, 有两种情况

    //情况一: 只有闭合标签, 没有开始标签

    //情况二:只有开始标签, 没有闭合标签

    array_pop($last_data);

    $error_data[] = $_tmp_str;

    $error_pos[] = $i;

    }

    } else {

    array_pop($last_data);

    $error_data[] = $_tmp_str;

    $error_pos[] = $i;

    }

    }else if ($str[$i]=="<" && $str[$i+1]=="!") {

    $i++;

    while($i<$str_len) {

    if($str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {

    $i++;

    break;

    } else {

    $i++;

    }

    }

    $i++;

    }else if($str[$i]=='/' && $str[$i+1]=='>') {

    //跳过自动单个闭合标签

    if($start_flag) {

    array_pop($pre_data);

    array_pop($pre_pos);

    $i+=2;

    }

    }else if($str[$i]=="/" && $str[$i+1]=="*"){

    $i++;

    while($i<$str_len) {

    if($str[$i]=="*" && $str[$i+1]=="/") {

    $i++;

    break;

    } else {

    $i++;

    }

    $i++;

    }

    }else if($str[$i]=="'"){

    $i++;

    while($str[$i]!="'" && $i<$str_len) {

    $i++;

    }

    $i++;

    } else if($str[$i]=='"'){

    $i++;

    while($str[$i]!='"' && $i<$str_len ) {

    $i++;

    }

    $i++;

    } else {

    $i++;

    }

    }

    //确定起始标签的位置

    function confirm_pre_pos($str, $pre_pos){

    $str_len = strlen($str);

    $j=$pre_pos;

    while($j < $str_len) {

    if($str[$j] == '"') {

    $j++;

    while ($j<$str_len) {

    if($str[$j]=='"') {

    $j++;

    break;

    }

    $j++;

    }

    }

    else if($str[$j] == "'") {

    $j++;

    while ($j<$str_len) {

    if($str[$j]=="'") {

    $j++;

    break;

    }

    $j++;

    }

    }

    else if($str[$j]==">") {

    $j++;

    while ($j<$str_len) {

    if($str[$j]=="<") {

    //退回到原有内容位置

    $j--;

    break;

    }

    $j++;

    }

    break;

    }

    else {

    $j++;

    }

    }

    return $j;

    }

    //确定起始标签的位置

    function confirm_err_pos($str, $err_pos){

    $j=$err_pos;

    $j--;

    while($j > 0) {

    if($str[$j] == '"') {

    $j--;

    while ($j<$str_len) {

    if($str[$j]=='"') {

    $j--;

    break;

    }

    $j--;

    }

    }

    else if($str[$j] == "'") {

    $j--;

    while ($j<$str_len) {

    if($str[$j]=="'") {

    $j--;

    break;

    }

    $j--;

    }

    }

    else if($str[$j]==">") {

    $j++;

    break;

    }

    else {

    $j--;

    }

    }

    return $j;

    }

    //获取数组的倒数第num个值

    function getLastNode(array $arr, $num){

    $len = count($arr);

    if($len > $num) {

    return $arr[$len-$num];

    } else {

    return $arr[0];

    }

    }

    //整理数据, 主要是向后看, 进一步进行检查

    function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){

    $rem_key_array = array();

    $rem_i_array = array();

    //获取需要删除的值

    foreach($error_data as $key=>$value){

    $count = count($pre_data);

    for($i=($count-1) ; $i>=0; $i--) {

    if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {

    $rem_key_array[] = $key;

    $rem_i_array[] = $i;

    break;

    }

    }

    }

    //删除起始标签相应的值

    foreach($rem_key_array as $_item) {

    unset($error_pos[$_item]);

    unset($error_data[$_item]);

    }
    //删除结束标签相应的值

    foreach($rem_i_array as $_item) {

    unset($pre_data[$_item]);

    unset($pre_pos[$_item]);

    }

    }

    //整理数据, 闭合标签

    function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){

    $move_log = array();

    //只有闭合标签的数据

    foreach ($error_data as $key => $value) {

    // code...

    $_tmp_move_count = 0;

    foreach ($move_log as $pos_key => $move_value) {

    // code...

    if($error_pos[$key]>=$pos_key) {

    $_tmp_move_count += $move_value;

    }

    }

    $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);

    $str = $data['str'];

    $move_log[$data['pos']] = $data['move_count'];

    }

    //只有起始标签的数据

    foreach ($pre_data as $key => $value) {

    // code...

    $_tmp_move_count = 0;

    foreach ($move_log as $pos_key => $move_value) {

    // code...

    if($pre_pos[$key]>=$pos_key) {

    $_tmp_move_count += $move_value;

    }

    }

    $data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true);

    $str = $data['str'];

    $move_log[$data['pos']] = $data['move_count'];

    }

    return $str;

    }

    //插入数据, $type 表示插入数据的方式

    function insert_data($str, $insert_data, $pos, $type) {

    $len = strlen($str);

    //起始标签类型

    if($type==true) {

    $move_count = strlen($insert_data)+3;

    $pos = confirm_pre_pos($str, $pos);

    $pre_str = substr($str, 0, $pos);

    $end_str = substr($str, $pos);

    $mid_str = "";

    //闭合标签类型

    } else {

    $pos = confirm_err_pos($str, $pos);

    $move_count = strlen($insert_data) + 2;

    $pre_str = substr($str, 0, $pos);

    $end_str = substr($str, $pos);

    $mid_str = "<" . $insert_data . ">";

    }

    $str = $pre_str.$mid_str.$end_str;

    return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count);

    }

    sort_data($pre_data, $pre_pos, $error_data, $error_pos);

    $new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos);

    echo $new_str;

    // print_r($pre_data);

    // print_r($pre_pos);

    // print_r($error_data);

    // print_r($error_pos);

    // echo strlen($str);

    // foreach($pre_pos as $value){

    // $value = confirm_pre_pos($str, $value);

    // for($i=$value-5; $i<=$value; $i++) {

    // echo $str[$i];

    // }

    // echo "/n";

    // }

    // foreach($error_pos as $value){

    // for($i=$value-5; $i<=$value; $i++) {

    // echo $str[$i];

    // }

    // echo "/n";

    // }

    ?>

    希望本文所述对大家的php程序设计有所帮助。

    本文来自网络,不代表1号站长-站长学院|资讯交流平台立场。转载请注明出处: https://www.1cn.cc/jianzhan/jingyan/17832.html
    上一篇php实现的简易扫雷游戏实例
    下一篇 php随机获取金山词霸每日一句的方法
    admin

    作者: admin

    这里可以再内容模板定义一些文字和说明,也可以调用对应作者的简介!或者做一些网站的描述之类的文字或者HTML!

    为您推荐

    评论列表()

      联系我们

      联系我们

      0898-88888888

      在线咨询: QQ交谈

      邮箱: email@wangzhan.com

      工作时间:周一至周五,9:00-17:30,节假日休息

      关注微信
      微信扫一扫关注我们

      微信扫一扫关注我们

      关注微博
      返回顶部