Quora cqa问题抓取
生活随笔
收集整理的這篇文章主要介紹了
Quora cqa问题抓取
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
quora是一個(gè)比較知名的社區(qū)問(wèn)答網(wǎng)站,對(duì)于目前比較流行的cqa問(wèn)題,通過(guò)quora提供的搜索工具來(lái)找到相似的問(wèn)題進(jìn)而抽取答案。
事實(shí)上,quora的搜索大致是根據(jù)關(guān)鍵詞匹配的。
public class SolveAnswerPage {public List<String> solve(String s){List<String> res = new ArrayList<String>();Document doc = Jsoup.parse(s);Elements answers = doc.select("div.pagedlist_item");System.out.println(answers.size());for(Element answer : answers){res.add(answer.text());System.out.println(answer.text());}return res;} }
1.首先通過(guò)給定問(wèn)題的相似問(wèn)題搜索頁(yè)面,得到排名前面的問(wèn)題的url鏈接列表
2.根據(jù)第一步的url列表,抓取相應(yīng)問(wèn)題頁(yè)面的answer,并返回抓取結(jié)果
總結(jié)
以上是生活随笔為你收集整理的Quora cqa问题抓取的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Asp.net 企业建站CMS
- 下一篇: My Seventeenth Page