文本分析:吉利不裁员不降薪背后的真相是什么
??之前推薦了一些數(shù)據(jù)入門(mén)的資料,這里不妨以一個(gè)小小的案例講解如何進(jìn)行簡(jiǎn)單的文本分析。主要的步驟包括以下:
我們可以借知乎了解一下最近沸沸揚(yáng)揚(yáng)的吉利事件,了解一下偉大的民族汽車(chē)品牌、買(mǎi)車(chē)就是愛(ài)國(guó)的浙江吉利控股。當(dāng)然純粹技術(shù)分享,卑微的號(hào)沒(méi)啥流量,求資本家放過(guò)。
首先是爬蟲(chóng),打開(kāi)該問(wèn)題網(wǎng)頁(yè)后找到真正和服務(wù)器端交流的鏈接。然后用requests自動(dòng)把內(nèi)容搞下來(lái),結(jié)果存入csv中如圖所示:
這里主要爬取了以下問(wèn)題:
吉利汽車(chē)不裁員的內(nèi)幕曝光后,大家怎么看待民營(yíng)汽車(chē)巨頭?
如何評(píng)價(jià)吉利汽車(chē)的單休、軍訓(xùn)、裁員套餐?
如何看待吉利對(duì)外宣稱(chēng)不裁員不降薪,卻疑似內(nèi)部裁員 20%?
接著,可以借用分詞工具jieba進(jìn)行分詞,分詞前和分詞后的效果如圖所示
分完詞,可以稍加調(diào)整一下詞庫(kù)和停用詞,就是想顯示的詞加到詞庫(kù)里,不想看見(jiàn)的詞加到停用詞里。
按照頻率高低畫(huà)出高頻詞匯。可以看到出現(xiàn)了一些奇怪的詞,如藍(lán)海、培訓(xùn)、變相、仲裁、20、C、賠償?shù)取_@些高頻詞匯稍稍了解就可以知道事情真相。原來(lái)是:吉利總裁高調(diào)宣稱(chēng)不裁員不降薪,原來(lái)吉利是不直接裁員,而是搞了個(gè)“藍(lán)海”計(jì)劃“變相”裁員,這個(gè)計(jì)劃是給20%的人績(jī)效打‘C’去勞動(dòng)培訓(xùn),從而拒絕勞動(dòng)法規(guī)定的賠償,因此很多同事得到通知后要去仲裁。這樣我們就可以通過(guò)找到高頻詞匯了解主流民意了
最后,用wordcloud畫(huà)出詞云來(lái)==。
詞云可以顯示出更多的詞來(lái),例如勞動(dòng)法、惡心、強(qiáng)制、法律、管理等。也可以把字的輪廓顯示如下,哈哈。
最后不妨用馬克思的一段話作為總結(jié):
只有當(dāng)他和自己的雇主疏遠(yuǎn)了的時(shí)候,當(dāng)他明顯地看出了雇主僅僅是由于私人利益、僅僅由于追求利潤(rùn)才和他發(fā)生聯(lián)系的時(shí)候,當(dāng)那種連最小的考驗(yàn)也經(jīng)不起的虛偽的善意完全消失了的時(shí)候,也只是在這個(gè)時(shí)候,工人才開(kāi)始認(rèn)清自己的地位和利益,開(kāi)始獨(dú)立地發(fā)展起來(lái),只是在這個(gè)時(shí)候,他才不再在思想上、感情上和要求上像奴隸一樣地跟著資產(chǎn)階級(jí)走。
聯(lián)系方式
公眾號(hào)搜索:YueTan
總結(jié)
以上是生活随笔為你收集整理的文本分析:吉利不裁员不降薪背后的真相是什么的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Pycharm+PyQt5环境配置
- 下一篇: Springmvc接收json数据的4种