汉字笔画数据_把所有汉字叠起来会怎样?
本文基于對此話題的知乎回答補充而成:
https://www.zhihu.com/question/394175264/answer/1221223455
背景介紹
「把所有漢字疊寫起來會怎么樣呢?」這個問題源于知乎網友 @閉眼唱歌 腦洞大開的起名方式:
來源:怎樣看待 papi 醬因為孩子隨父姓被某些網友辱罵?-?知乎(https://www.zhihu.com/question/394004713/answer/1215083944)雖然看起來非常無厘頭,但對理解中文字體設計是有一些幫助的。
首先介紹中文字體設計中的兩個概念:字身框和字面框。字身框是漢字字形最外側的方框,在金屬活字時代指的是鉛字鉛塊的尺寸,在數字化時代指的是漢字字符形最外面的邊界框,其默認高度與字號相同。字面框是一個字體中漢字筆畫實際可以覆蓋到的空間,在相同字號下,能夠間接觀察出整套字體每個字的視覺大小和默認字間距。然而在數字化時代,有的中文字體僅將字面框作為一種邊界參考線,不少尖銳的筆畫往往會突破設計師設定的字面框,有時候甚至會突破字身框。
來源:字型設計自己來——中文字型設計的第一課 - justfont(https://blog.justfont.com/2012/12/hanzi-type-design-1/)一般來說,把所有漢字疊加起來,即使字面框有可能會被填滿,但字身框內無論如何都還會留有一點空間,否則排版時所有的漢字都有可能會連在一起,沒有「呼吸的感覺」(笑)。
實驗報告——整體疊加
中文字庫常用的 GB2312 字符集一共有 6763 個漢字,而 Unicode 13.0 里面的漢字已經積累到了 92856 個[1],全部拿來疊加比較麻煩且意義不大。經過實驗,使用幾千個漢字和幾百個漢字來疊加效果差別很小(只要控制好透明度什么的)。所以,下面的實驗我們都是從 GB2312 中隨機挑選一個子集來疊加,實際使用的字數我們標注在了括號里。
首先從最基本的宋體和黑體開始。為了突出對比,我們各選擇了兩種風格的字體:方正筑紫老明朝和華文黑體字面較小、結構緊湊;而報宋和微軟雅黑字面較大、結構寬松。前者代表了比較傳統的漢字審美,可以使文本更有精氣神。后者則主要出于使用場景的考量,無論是為了報紙印刷設計的報宋,還是為了屏幕顯示設計的雅黑,較為夸張的字面可以大幅提升易讀性。
接著我們來看思源系列的情況。思源宋體和黑體是 Adobe 和 Google 聯合推出的一款泛中日韓現代字體。它們各有 7 個字重,因此也可以有更多發現。此外,思源字體本身就提供了字面大小的信息(OpenType BASE 表中的 icft 和 icfb 條目)[2],我們這里也標記了出來。下圖紅色為宋體,黑色為黑體。很明顯,從細到粗,字面率逐漸增大,到了 Heavy 字重幾乎與字面框只留下了一條縫隙,可以想象排版結果將有強烈的視覺沖擊力。這種隨著字重的增加,不斷擴大的文字的方式,也頗似西文字體中,同一套字體家族隨著字重增加而加大 x 高度的做法。另一方面,如果縱向對比,可以看到相同字重的宋體和黑體有著幾乎一致的字面框大小,而這正是中文字體設計中跨越字體風格(宋 / 黑)時需要考慮的要點之一。
除了分析字面率,疊加實驗還可以幫助我們理解筆畫的分布。上面的幾張圖都不是一片均勻的黑色,而是有濃淡分布的。顯然,黑色較深的地方對應著筆畫的集中分布。我們可以看出來,大多數字體中左側都有明顯的一豎,右側下面則有一橫,而且右下角有一處格外明顯的黑色區域;有些字體的右側還有一些橫豎筆畫構成的「格子紋樣」。加上根據 6763 個漢字的數據統計,我們由此可以得出以下幾個結論:
漢字中左右(左中右)結構的字的數量占據絕對統治地位
左側的形旁大多以一豎作為主筆(如:亻彳犭扌忄礻衤钅饣讠丬)
半包圍、全包圍結構的字也較多,且筆畫大都位于接近字面框四個邊緣的位置
漢字筆畫中,橫和豎的比例較高,造成了字面框中部的「格子」紋理
我們還能看到,方正筑紫老明朝、微軟雅黑和思源宋體、黑體都有較為明顯的筆畫界線,而漢儀報宋和華文黑體的整體筆畫分布規律則相對模糊。后面這兩個歷史比較久遠的字體都是在前數字化時代設計出來的,沒辦法很方便地「Ctrl+C、Ctrl+V」,只能依靠多位設計師手工繪制出所有字形,即使相同部件也存在一定的差別,相對數字化字體來說,整體筆畫分布的規律性便顯得較弱了。當然,這樣也賦予了每個字形不盡相同的特質,有著區別于數字化時代字體的獨特風味,反而得到一些人的青睞。
中文常用的排版字體還有仿宋和楷體。下圖測試了方正的基礎四款字體,盡管我們常常將「宋黑仿楷」并稱,然而光從字面率來看它們未必能很好地搭配起來。如果要設計一款跨越宋、黑、仿、楷的超級中文字體家族,顯然在字面率的統一上還要多做一些研究和基礎設定。另外從形狀來看,圖中的宋體和黑體的疊加結果基本呈現為一個正方形,而仿宋的疊加結果則是長方形,而楷體是一個不規則的多邊形,說明測試的仿宋和楷體的真實字面框并不是方的。
實際上,這一規律早在七十年代就被日本的字體研究者佐藤敬之輔發現了。他對宋體和楷體也做了一些疊加的實驗,和我們的疊加圖類似,宋體疊加后是一個方框,而楷體則是一個類似?的不規則形狀。
來源:《漢字》(下),佐藤敬之輔
楷體脫胎于書法,帶有強烈的手寫感。這個像 Q 的小尾巴一樣的突出部分,也正是源于傳統書法美學中捺要舒展的要求。便于雕刻的仿宋有接近楷體的筆畫特征和類似的筆畫傾角,不過整體字面已經變得方正起來。再往后,宋體和黑體伴隨著現代字體技術的成熟逐漸成為主流,筆形規整統一、字面較大的特征一直延續到了今天。
這里,我們把幾款流行的刻本字體疊加起來,便可以清晰地看出上文所述印刷字體的演變史。
實驗報告——更多的疊加
漢字根據結構大致可以分為上下、左右、包圍、獨體。據此,我們還分別對這四種結構的漢字進行了單獨的疊加,有一些有趣的發現:
草字頭(艸)、木字旁(木)、三點水(氵)、走之底(?)這幾個偏旁部首可謂是獨占鰲頭,因為字數的優勢,在結果中一眼就能分辨出來;
對于上下、左右、包圍結構的字,形旁和聲旁應當控制一定的距離,并且在整個字體里面保持統一。這也印證了謝培元和徐學成等前輩提出的第二中心線理論[3];
獨體字和上下結構的字中,都能明顯看到一條筆直的中軸線。這或許與漢字的豎排傳統和對稱審美有關[4]。
接下來看看最近特別流行的書法字體。總體來說書法字體的實際字面率都較低。隸書字形較扁,楷書比較端正,草書、行書則充滿了曲線的味道。而作為創意字體的尚巍手書,疊加起來看也出現我們上面提到過的「Q」形狀,可見中文字體即使看起來充滿創意,也得遵循一定的規律。
漢字還有相當數量的衍生文字,在中國少數民族地區和泛東亞文化圈都被廣泛使用。包括日文平假名、片假名(網友評論:平假名像個球 2333):
諺文音節、注音符號(可以看出思源宋體的設計明顯有問題):
以及西夏文、契丹小字和女書:
這些文字總體上保留了漢字的一些特征,但又有所不同。比如女書整體造型呈橄欖形,完全不同于漢字的方塊造型[5]。西夏文和漢字類似,存在大量肉眼可見的左右結構的字,但和漢字相比,左右部分的大小基本相同,結構更加對稱,變化也不如漢字豐富(不過 Noto 這個西夏文字體被噴得很慘[6])。
最后,知乎網友?@韓泳思 提到了點陣字體的問題,所以我們也來玩一玩:
以上三個字體分別是 16×15 像素的 GNU Unifont、9×9?丁卯點陣體、7×7?丁卯點陣體。由于點陣字體本身的限制,它們在整個字身框中都故意留出了一像素的縫隙,以防止密排時文字連在一起??梢钥吹?#xff0c;在 Unifont 中左上角和右上角仍留有一些空白;而在「小至極限」的丁卯點陣點里面,設計師就不得不充分利用除了預留空間外每一個能用的像素,因而最終疊加出了一個幾乎實心的黑塊。
參考文獻:[1]?2019 “State of the Unification” Report?https://blogs.adobe.com/CCJKType/2019/07/2019-sotu.html[2]?Baseline tags?https://docs.microsoft.com/en-us/typography/opentype/otspec160/baselinetags[3]?厲致謙?漢字設計中的度量標準(二)[4]?蔣勛 漢字書法之美:舞動行草 https://books.google.com.sg/books?id=8Rq9AAAAQBAJ&pg=PA235#v=onepage&q&f=false[5]?Noto Sans Nushu?https://github.com/LisaHuang2017/noto-sans-nushu[6]?https://twitter.com/BabelStone/status/1106903314690686986
—?過往內容?—
他們如何創造字體?
??????????????|藏區街頭文字實錄
海報字體氣突蘇!
如何在《動物森友會》中設計字體?
征稿啟動|3typezine 一周年,邀你再續字體故事
TypeScrolls?#01?漢字設計中的度量標準(一)
TypeScrolls?#02?漢字設計中的度量標準(二)
TypeScrolls?#03?漢字設計中的度量標準(三)
西文字體設計高階課冷靜??招生中(仍可報名)中文字體設計高階課火熱?招生中(試聽福利)丁卯點陣體開放試用:小至極限的像素風格字體
總結
以上是生活随笔為你收集整理的汉字笔画数据_把所有汉字叠起来会怎样?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机中出现“你需要计算机管理员提供的权
- 下一篇: 利用json-lib实现将json字符串