python网页结构分析_Python爬虫基础之网页组成解析
當我們用瀏覽器訪問網站時,每個網頁的大不相同,你是否想過它為什么會呈現多種不同的樣式呢?就讓我們一起了解一下網頁的基本組成、結構和節點等內容吧!
網頁的組成
網頁可以分為三大部分——HTML、CSS和JavaScript。如果把網頁比作一個人的話,HTML相當于骨架,JavaScript相當于肌肉,CSS相當于皮膚,三者結合起來才能形成一個完善的網頁。下面我們先來介紹一下這三部分的內容:
HTML:HTML是用來描述網頁的一種語言,其全稱叫做Hyper Text Markup Language,即超文本標記語言。網頁包括文字、按鈕、圖片和視頻等各種復雜的元素,其基礎架構就是HTML。不同類型的元素通過不同類型的標簽來表示,如圖片使用img表示,視頻使用video表示,段落用p標簽表示,它們之間的布局又常通過布局標簽div嵌套組合而成,各種標簽通過不同的排列和嵌套才形成了網頁的框架。在Chrome瀏覽器中打開百度,右擊選擇‘檢查’項,打開開發者模式,這時在Element選項卡中即可看到網站的源代碼:
這就是HTML,整個網頁就是由各種標簽嵌套組合而成的。這些標簽定義的節點元素相互嵌套和組合形成了復雜的層次關系,就形成了網頁的架構。
2.CSS:HTML定義了網頁的結構,但是只有HTML頁面的布局并不美觀,可能只是簡單的節點元素的排列,為了讓網頁看起來更好看一些,這里借助了CSS。
CSS,全稱叫做Cascading Style Sheets,即層疊樣式表。“層疊”是指當在HTML中引用了數個樣式文件,并且樣式發生沖突時,瀏覽器能依據層疊順序處理。“樣式”指網頁中文字大小、顏色、元素間距、排列等格式。
CSS是目前唯一的網頁頁面排版樣式標準,有了它的幫助,頁面才會變得更為美觀,下圖就是CSS:
這就是多個CSS樣式。我們以第一個為例,大括號前面是一個CSS選擇器。此選擇器的意思是首先選中id為head_wrapper的節點。大括號內部寫的就是一條條樣式規則,例如position指定了這個元素布局方式為相對布局,height指定元素的高度為38.2%占滿父元素其他的意思是一樣可以看出來的。也就是說我們將位置、寬度、高度等樣式配置統一寫成這樣的形式,然后用大括號括起來,接著在開頭再加上CSS選擇器,這就代表這個樣式對CSS選擇器選中的元素生效,元素就會根據此樣式來展示了。
在網頁中,一般會統一定義整個網頁的樣式規則,并寫入CSS文件中(其后綴為css)。在HTML中,只需要用link標簽即可引入寫好的CSS文件,這樣整個頁面就會變得美觀、優雅。
3.JavaScript:簡稱JS,是一種腳本語言。HTML和CSS配合使用,提供給用戶的只是一種靜態信息,缺乏交互性。我們在網頁里可能會看到一些交互和動畫效果,如下載條、提示框、輪播圖等,這通常就是JavaScript的功勞。它的出現使得用戶與信息之間不只是一種瀏覽與顯示的關系,而是實現了一種實時、動態、交互的頁面功能。
JavaScript通常也是以單獨的文件形式加載的,后綴為js,在HTML中通過script標簽即可引入,例如:
綜上所述,HTML定義了網頁的內容和結構,CSS描述了網頁的布局,JavaScript定義了網頁的行為。
上文就是關于Python爬蟲基礎之網頁組成解析的主要內容,想了解更多關于Python的知識請關注php中文網瀏覽更多相關信息!
以上就是Python爬蟲基礎之網頁組成解析的詳細內容,更多請關注php中文網其它相關文章!
本文轉載于:快資訊,如有侵犯,請聯系a@php.cn刪除
總結
以上是生活随笔為你收集整理的python网页结构分析_Python爬虫基础之网页组成解析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue中自定义指令、组件化、生命周期、节
- 下一篇: 初识java中数组、数组在内存中、越界异