當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

在SAP HANA Express Edition里进行文本分析

發(fā)布時間：2023/12/19 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了在SAP HANA Express Edition里进行文本分析小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

這個練習會使用SAP HANA Express Edition的文本語義分析引擎對JSON格式的documents進行語義分析。

首先創(chuàng)建一個column table，對其index開啟fuzzy text search(模糊搜索)功能。

上述描述的操作可以用下面的SQL語句來完成：

create column table food_analysis (name nvarchar(64),description text FAST PREPROCESS ON FUZZY SEARCH INDEX ON );

其中description字段開啟了模糊搜索功能。

將存儲于名為doc_store的document store collection里的json key-value鍵值對拷貝到剛剛創(chuàng)建的數(shù)據庫表里：

insert into food_analysis with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

執(zhí)行上述的sql語句，確保數(shù)據全部拷貝到數(shù)據庫表food_analysis中：

使用下列的sql語句對description字段進行模糊搜索：

select name, score() as similarity, TO_VARCHAR(description) from food_analysis where contains(description, 'nuts', fuzzy(0.5,'textsearch=compare')) order by similarity desc

執(zhí)行結果：

HANA Express Edition里的linguistic 文本分析步驟也比較簡單。

首先還是創(chuàng)建一個數(shù)據庫表：

create column table food_sentiment (name nvarchar(64) primary key,description nvarchar(2048) );

將document store里的json數(shù)據拷貝到數(shù)據庫表里：

insert into food_sentiment with doc_store as (select "name", "description" from food_collection) select doc_store."name" as name, doc_store."description" as description from doc_store;

針對description字段創(chuàng)建一個新的index：

CREATE FULLTEXT INDEX FOOD_SENTIMENT_INDEX ON "FOOD_SENTIMENT" ("DESCRIPTION") CONFIGURATION 'GRAMMATICAL_ROLE_ANALYSIS' LANGUAGE DETECTION ('EN') SEARCH ONLY OFF FAST PREPROCESS OFF TEXT MINING OFF TOKEN SEPARATORS '' TEXT ANALYSIS ON;

上述SQL語句會自動創(chuàng)建一個名為$TA_FOOD_SENTIMENT_INDEX的文本分析表：
該表里的內容：

由此可以發(fā)現(xiàn)，之前我們導入到數(shù)據庫表里的英文句子，被HANA text engine拆解成單詞，并且每個單詞的詞性也自動被HANA解析出來了。

要獲取更多Jerry的原創(chuàng)文章，請關注公眾號"汪子熙":

總結

以上是生活随笔為你收集整理的在SAP HANA Express Edition里进行文本分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

在SAP HANA Express Edition里进行文本分析

總結