漂亮的html页面源码_爬虫数据分析之html
生活随笔
收集整理的這篇文章主要介紹了
漂亮的html页面源码_爬虫数据分析之html
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、 html
html 不是一種編程語言,而是一種標記語言,是制作網頁所必須的,你在瀏覽器里看到的每一個頁面,不論簡單還是復雜,都是用html編寫的,包括你現在看到的這篇文章。
用html寫一個簡單的頁面,是非常容易的,你也可以,將下面這段內容復制到一個文本文件中,另存為 test.html,然后雙擊文件,瀏覽器就會打開它
<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><title>這是一個例子</title></head><body><div><p>這是一段文字</p></div></body> </html>瀏覽器里,會顯示一個簡單的頁面,內容只有一句話“這是一段文字”,上面的這段內容,就是所謂的網頁源碼。
2、 如何查看網頁源碼
以谷歌瀏覽器為例,在打開的網頁上空白區域單擊右鍵,就會出現一個下拉菜單,其中一個菜單便是“顯示網頁源代碼”
點擊這個菜單,你就可以查看到網頁的源碼了。
如果你仔細觀察,網頁的樣子幾乎一樣,最常見的標簽如下
<html> <head> <title> <body> <div> <a>
不管是什么標簽,他們都成對的出現,有一個<div>,必有一個</div> 與之相對應,我們想要的數據,就放在這些標簽之中。
你想寫一個爬蟲,首先你得知道,你想要的內容在哪里,他們在哪些標簽中,弄清楚這些,你才能寫程序去這些標簽中提取你想要的內容。
總結
以上是生活随笔為你收集整理的漂亮的html页面源码_爬虫数据分析之html的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java shiro security_
- 下一篇: python2d 平滑插值处理_pyth