Java去除富文本编辑器中的格式标签
生活随笔
收集整理的這篇文章主要介紹了
Java去除富文本编辑器中的格式标签
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Java去除富文本編輯器中的格式標簽
由于業務功能需要,檢查站內信的標題和內容是否含有中文。測試中遇到了一個小問題,導致結果出現了預料之外的結果。
如下圖:實際文本內容中是沒有中文的,但是判斷結果卻是含有中文的,到底是為什么呢?
原來是后端在接收富文本編輯器中的內容時,不僅僅有我們看到的內容,還會連同格式、圖片等標簽一同接收,而這些標簽之中是有可能出現中文的,比如字體樣式(楷體、宋體),圖片資源路徑(src)。
content: "<p><span style=\"font-family: 'arial black', sans-serif; font-size: 18pt;\">Hello LiHua:</span></p>\n<p style=\"padding-left: 40px;\"><span style=\"color: #333333; font-family: 'arial black', sans-serif; font-size: 14pt; font-variant-numeric: normal; font-variant-east-asian: normal; line-height: 21px; background-color: #ffffff;\">Long time no see , How are you?</span></p>\n<p style=\"padding-left: 40px;\"><span style=\"color: #333333; font-family: 'arial black', sans-serif; font-size: 14pt; font-variant-numeric: normal; font-variant-east-asian: normal; line-height: 21px; background-color: #ffffff;\">Best Regards , zero<img src=\"圖片\" alt=\"\" /></span></p>"所以我們如果想判斷用戶真實輸入的內容是否包含中文,需要先去除這些HTML標簽。
后面看到了一篇文章:https://blog.csdn.net/qq_35750547/article/details/80544561,實際操作了一下,確實很管用,如下是我的代碼:
// 去除內容中HTML標簽里的校驗 req.setContent(req.getContent().replaceAll("<[.[^<]]*>", "")); boolean isContainChinese = TextUtils.isContainChinese(req.getTitle()) || TextUtils.isContainChinese(req.getContent());這樣問題就順利解決啦!!
總結
以上是生活随笔為你收集整理的Java去除富文本编辑器中的格式标签的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: protues 学习
- 下一篇: 常见免费邮箱 SMTP 服务地址及端口