使用ABAP正则表达式解析HTML标签
需求就是我用ABAP的某個(gè)函數(shù)從數(shù)據(jù)庫(kù)讀取一個(gè)字符串出來(lái),該字符串的內(nèi)容是一個(gè)網(wǎng)頁(yè)。
網(wǎng)頁(yè)的form里包含了很多隱藏的input field。我的任務(wù)是解析出name為svyValueGuid的input field的值:FA163EEF573D1ED89E89C7FE5E7C4715
最簡(jiǎn)單粗暴的做法是:利用ABAP的FIND FIRST OCCURRENCE關(guān)鍵字首先找到svyValueGuid的偏移量,然后從這個(gè)偏移量出發(fā),再找到第一個(gè)>的偏移量,這樣問(wèn)題就化簡(jiǎn)為在子串type=“hidden” value=“FA163EEF573D1ED89E89C7FE5E7C4715”,這樣問(wèn)題就簡(jiǎn)單多了。但是這種辦法比較笨重,代碼很冗余。
有沒(méi)有更快捷的辦法呢?那就是使用ABAP regular expression,即正則表達(dá)式。
請(qǐng)看下列的測(cè)試代碼:
REPORT ztest_interface.DATA: lv_input TYPE string,reg_pattern TYPE string.lv_input = `<body>` &&`<div class="Title">Jerry's Programming Skill survey</div>` &&`<form action="Survey.htm?sap-client=001">` &&`<input name="svyApplicationId" type="hidden" value="CRM_SURVEY_ACTIVITY">` &&`<input name="svyValueGuid" type="hidden" value="FA163EEF573D1ED89E89C7FE5E7C4715">` &&`<input name="SurveyId" type="hidden" value="JERRY_TEST">` &&`<div Id="" class="Section1">` && `</form></body>`.reg_pattern = '.*svyValueGuid(?:.*)value="(.*)">.*SurveyId.*'.TRY.DATA(lo_regex) = NEW cl_abap_regex( pattern = reg_pattern ).DATA(lo_matcher) = lo_regex->create_matcher( EXPORTING text = lv_input ).IF lo_matcher->match( ) <> abap_true.WRITE:/ 'fail in input scan!'.RETURN.ENDIF.DATA(lt_reg_match_result) = lo_matcher->find_all( ).READ TABLE lt_reg_match_result ASSIGNING FIELD-SYMBOL(<match>) INDEX 1.READ TABLE <match>-submatches ASSIGNING FIELD-SYMBOL(<sub>) INDEX 1.data(lv_sub) = lv_input+<sub>-offset(<sub>-length).WRITE:/ 'result: ', lv_sub.CATCH cx_root INTO DATA(cx_root).WRITE:/ cx_root->get_text( ).RETURN.ENDTRY.執(zhí)行結(jié)果:
解決問(wèn)題的核心思路是這個(gè)正則表達(dá)式:*.svyValueGuid(?:.)value="(.)">.SurveyId.
通過(guò)捕獲分組操作符,一對(duì)小括號(hào),將32位的GUID值進(jìn)行捕獲。這種解法比FIND FIRST OCCURANCE的代碼量要少。
要獲取更多Jerry的原創(chuàng)技術(shù)文章,請(qǐng)關(guān)注公眾號(hào)"汪子熙"或者掃描下面二維碼:
總結(jié)
以上是生活随笔為你收集整理的使用ABAP正则表达式解析HTML标签的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 利用ABAP调试模式修改SE16里数据库
- 下一篇: 绝地求生腾讯代理了吗