欢迎访问 如意编程网!

如意编程网

当前位置: 首页 > 前端技术 > HTML >内容正文

HTML

C#内容格式刷html 转成txt

发布时间:2022/11/16 HTML 12 老码农
如意编程网 收集整理的这篇文章主要介绍了 C#内容格式刷html 转成txt 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

/// <summary>

        /// 内容格式刷

        /// </summary>

        /// <param name="strHtml">要格式的文本</param>

        /// <returns></returns>

        public static string HtmlToTxt(string strHtml)

        {

            string[] aryReg ={

            @"<script[^>]*?>.*?</script>",

            @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",

            @"([\r\n])[\s]+",

            @"&(quot|#34);",

            @"&(amp|#38);",

            @"&(lt|#60);",

            @"&(gt|#62);", 

            @"&(nbsp|#160);", 

            @"&(iexcl|#161);",

            @"&(cent|#162);",

            @"&(pound|#163);",

            @"&(copy|#169);",

            @"&#(\d+);",

            @"-->",

            @"<!--.*\n"

            };

 

            string newReg = aryReg[0];

            string strOutput = strHtml;

            for (int i = 0; i < aryReg.Length; i++)

            {

                Regex regex = new Regex(aryReg[i], RegexOptions.IgnoreCase);

                strOutput = regex.Replace(strOutput, string.Empty);

            }

 

            strOutput.Replace("<", "");

            strOutput.Replace(">", "");

            strOutput.Replace("\r\n", "");

 

 

            return strOutput;

        }

 

总结

以上是如意编程网为你收集整理的C#内容格式刷html 转成txt的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得如意编程网网站内容还不错,欢迎将如意编程网推荐给好友。