在ASP.NET中移除字串中的HTML標籤
在ASP.NET中,移除字串中的HTML標籤可以透過以下幾種方法實現:
儘管正規表示式替換方法存在一些局限性,但它仍然可以可靠地去除字串中的HTML標籤:
尋找並取代"1*(>|$)".
將字串規範化,將"[srn] "替換為單一空格。
去除結果字串的首尾空格。
範例:
輸入 = "
" cleaned = Regex.Replace(輸入, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned); // 輸出: "Hello"
注意: 當遇到屬性值中包含">"的HTML/XML時,此方法有其限制。
考慮使用成熟的HTML解析函式庫,例如:
這些函式庫提供了全面且可自訂的HTML解析和清理功能。
範例 (使用HTMLAgilityPack):
using HtmlAgilityPack; …… HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(輸入); Console.WriteLine(doc.DocumentNode.InnerText); // 輸出: "Hello"
以上是如何有效地從 ASP.NET 中的字串中刪除 HTML 標籤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!