数据优化 | CnOpenData中国工业企业专利及引用被引用数据
中國工業企業專利及引用被引用數據
一、數據簡介
?? 國家統計局構建了1998-2013年所有規模以上工業企業的數據,包括全部國有企業和年主營業務收入500 萬元及以上的非國有工業企業。可以說,這些企業是中國經濟中最重要的一群企業。然而,目前利用專利數據研究公司創新活動的論文主要集中在上市公司層面,而忽視了工業企業這一較大規模的企業的專利信息,這可能是因為中國工業企業數據庫中大量不完全統一的企業名稱導致的。
??為此,CnOpenData團隊參考科學的數據匹配與處理方法(寇宗來、劉學悅:《中國企業的專利行為:特征事實以及來自創新政策的影響》,《經濟研究》,2020年第3期)將中國工業企業與中國專利創新數據進行了細致匹配,形成了中國工業企業專利及引用被引用數據庫。本數據匹配時主要依據企業名稱來完成數據處理,即?業企業的企業名稱與專利數據中的專利權?(專利公布則為申請?)之間進?匹配。為了最?化數據可?范圍,減少數據中存在的噪音,CnOpenData團隊同時對?業企業和專利數據中的公司名稱進行了加工處理。我們考慮到股份有限公司、有限責任公司、集團公司等的不同,在匹配工作進行前刪去“集團”、“有限責任公司” 、“股份有限公司” , “有限公司”、“加?? ”、“ ??”、“?”、 “省 ”、“市”、“ 縣” 、“州”、“鎮”、“鄉”、“村”等字樣,通過上述匹配過程可以獲得更準確的匹配結果。此外,由于本團隊持有數據量的優勢,本數據的匹配數據量相較于參考文獻更多。
??需要注意的是,雖然中國工業企業數據本身截止到2013年,但我們仍然選擇將中國工業企業數據與截止到2021年的所有專利數據進行了匹配,這主要是因為專利的被引數據存在一定的滯后性,匹配到較新的年度可以保證專利被引數據相對完整。
??在結構上,本數據分為專利數量申請表、專利質量申請表、專利詳情表。專利數量統計表和質量統計表,分別以專利申請和專利授權為依據再進行劃分,專利質量統計表還按專利類型細分為發明、實用新型、外觀設計三個模塊。專利引用及被引信息體現于專利詳情表部分,分為發明申請、發明授權、實用新型、外觀設計四個模塊,各模塊包含基礎信息表、引用表、被引用表、事務表四張表格(需要注意的是,外觀設計無引用表)。
二、時間區間
1985-2021
三、字段展示
工業企業專利數量統計表
工業企業專利質量統計表
工業企業專利詳情表
四、數據結構展示
五、樣本數據
因表格眾多,本頁僅做專利申請數量/發明專利申請質量/發明申請專利詳情展示,其他版塊詳見各模塊分支頁面進行查看。
工業企業專利申請數量統計表
工業企業專利申請質量統計表
工業企業發明申請專利基礎信息表
工業企業發明申請專利引用表
工業企業發明申請專利被引用表
工業企業發明申請專利事務表
六、參考文獻
- 寇宗來、劉學悅:《中國企業的專利行為:特征事實以及來自創新政策的影響》,《經濟研究》,2020年第3期。
- 聶輝華、江艇、楊汝岱:《中國工業企業數據庫的使用現狀和潛在問題》,《世界經濟》,2012年第5期。
- Josh L , Amit S . The Use and Misuse of Patent Data: Issues for Finance and BeyondJ. The Review of Financial Studies, 2021(6):6.
七、數據更新頻率
年度更新
八、數據來源網站
https://www.cnopendata.com/data/m/patent/industrial-patent.html
總結
以上是生活随笔為你收集整理的数据优化 | CnOpenData中国工业企业专利及引用被引用数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sqlserver导入sql文件的方式
- 下一篇: 电容的原理与应用(补充中)