上市公司年报可读性:财务报告可读性管理层讨论与分析可读性(2001-2021年)
數(shù)據(jù)來源:自主整理
時間跨度:2001-2021年
區(qū)域范圍:滬深A股
指標說明:
可讀性是文本分析的重要維度。上市公司的年報文本可讀性,既可以直接作為解釋變量,來分析一系列企業(yè)行為,如李春濤老師發(fā)表在《金融研究》上的論文《年報可讀性與企業(yè)創(chuàng)新》,以此來分析企業(yè)的創(chuàng)新行為。另一方面,可讀性也可以用來作為企業(yè)信息披露質(zhì)量的代理指標。
但是,當前研究更多的使用單一維度來度量年報可讀性。誠如李春濤老師所言:
現(xiàn)有衡量中文年報可讀性的指標忽視了年報自身特有的文本屬性,即信息披露本身會包含大量的會計財務術語,而且忽視了企業(yè)規(guī)模和復雜度導致的年報信息披露量的差異性。
據(jù)此,Shin, Donghyuk, et al. (2020) 使用基于word2vec神經(jīng)網(wǎng)絡語言模型,構(gòu)建了一個文本可讀性指數(shù)。其原理是假設文本中句子相互獨立,并考慮句中詞匯的前后搭配順序,將文本中各個句子生成概率乘積的對數(shù)似然的均值,作為此文本的可讀性度量。
其計算公式為:
其中,Ps表示句子s生成的概率,N表示構(gòu)成文本的句子數(shù)。其值越高,表示文本中詞對搭配順序在語料中出現(xiàn)的頻率越高,文本越容易被理解,文本可讀性越高;反之,則表示詞對在語料中出現(xiàn)的頻率越低,文本越不容易被理解,文本可讀性越差.
考慮到研究需求,共有兩份數(shù)據(jù):
上市公司財務報告可讀性?(年報可讀性),2001-2021年數(shù)據(jù),因為上市公司會公布季報和年報,所以是季度數(shù)據(jù)。一個上市公司一年有四個值,分別是3、6、9、12月。
上市公司管理層討論可讀性?(MD&A) ,2001-2021年數(shù)據(jù),管理層討論通常是一年一次,所以是年度數(shù)據(jù)。
參考文獻:
[1]會芹,施先旺.年報文本信息可讀性與股價崩盤風險[J].投資研究,2022,41(07):129-148.
[2]朱丹,李靜柔,李世新.年度報告的可讀性水平、過往業(yè)績與分析師預測[J].審計與經(jīng)濟研究,2021,36(05):77-85.
[3]逯東,宋昕倍,龔祎.控股股東股權(quán)質(zhì)押與年報文本信息可讀性[J].財貿(mào)研究,2020,31(05):77-96.
[4]王海芳,姜道平,許瑩.數(shù)字化轉(zhuǎn)型能否提高信息披露質(zhì)量?——基于年報可讀性的研究[J].管理現(xiàn)代化,2022,42(02):58-65.
[5]丁亞楠,王建新.“渾水摸魚”還是“自證清白”:經(jīng)濟政策不確定性與信息披露——基于年報可讀性的探究[J].外國經(jīng)濟與管理,2021,43(11):70-85.
[6]阮睿,孫宇辰,唐悅,聶輝華.資本市場開放能否提高企業(yè)信息披露質(zhì)量?——基于“滬港通”和年報文本挖掘的分析[J].金融研究,2021(02):188-206.
字段說明:
security_code[證券代碼]:以上海證券交易所和深圳證券交易所公布的證券代碼為準。
security_name[證券簡稱]:以上海證券交易所和深圳證券交易所公布的公司最新證券簡稱為準。
rep_period[報告期間]:報告對應會計期間截止日期,格式為“YYYY-MM-DD”。
rep_type[報告類型]:文本數(shù)據(jù)源類型。
readability[可讀性]:報告文本中句子的條件生成概率的對數(shù)均值。其值越高,表示文本中詞對搭配順序在語料中出現(xiàn)的頻率越高,文本可讀性越高;反之,則表示詞對在語料中出現(xiàn)的頻率越低,文本可讀性越差。
樣例數(shù)據(jù):
?
?
下載鏈接:https://download.csdn.net/download/li514006030/87459071
?
總結(jié)
以上是生活随笔為你收集整理的上市公司年报可读性:财务报告可读性管理层讨论与分析可读性(2001-2021年)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 巨杉TechDay回顾 | 技术人的夏天
- 下一篇: 公寓信息管理系统