数据分析|爬取14455个基金,千万别被人当成韭菜给割了
2021 年初的幾個交易日,基金頻繁登上熱搜榜,新發行的幾個基金也是直接在發行當日就售罄,基金發行市場一片火熱。
投資固然沒錯,但是跟風的背后自己會不會成為一棵嫩韭菜,文中你可能會找到部分答案。
ok,下面直接開始分析過程:
一、基金數據爬取
爬蟲部分的核心代碼比較簡單,今天主要說一下流程就行,基金數據的爬取選擇了天天基金網,首頁長這樣的:
?
可以看到,對于基金類型:偏股、股票、混合、債券和指數都分的一清二楚,采集字段的時候將每個基金所有的收益率情況拿下來。
ok,那就直接用官網定的標簽去爬,采集上圖圈出的數據字段。
第二步就是每個基金的詳細持倉情況,看圖:
?
主要包括基金的成立時間、規模、基金經理以及每個季度的詳細持倉情況。
限于篇幅,主要代碼如下:
?
爬取完成后,數據是這樣的:
?
很多人學習python,不知道從何學起。
很多人學習python,掌握了基本語法過后,不知道在哪里尋找案例上手。
很多已經做案例的人,卻不知道如何去學習更加高深的知識。
那么針對這三類人,我給大家提供一個好的學習平臺,免費領取視頻教程,電子書籍,以及課程的源代碼!
QQ群:721195303
?
二、基金數據分析
對于五種類型的基金數據,下面主要對股票型基金和混合型基金做對比分析。首先,股票型基金共?1459?個,混合型基金共?4208?個,后面分析和排序的依據均是針對“近一年收益率”這個指標進行的:
1、收益率分布
1459?個股票型基金中1160個近一年收益率不為空;4208個混合型基金中3060個近一年收益率不為空,針對其進行分析:
- 股票型基金近一年?收益率>0?的有?1119?個,占比?96.5%;整體近一年平均收益率為?47.8%
- 混合型基金近一年?收益率>0?的有?3047?個,占比?99.6%;整體近一年平均收益率為?48.9%
如下圖:
?
再來看下整體的收益率分布情況:
?
?
股票型基金的收益率主要分布在?20%-70%?之間,30%-60%?的居多;混合型基金的收益率主要分布在?10%-80%?之間,除?10%-20%?之外,其他主要區間分布較均勻
因此,混合型基金的收益率較穩定,99.6% 的基金近一年都是盈利的,且整體平均收益率為 48.9%
2、資產規模分布
對于資產規模,小一是這樣理解的:大資產的基金在收益穩定的同時也會出現船大難掉頭的情況,小規模的資金收益波動會較大,但也可以及時規避風險。
因為基金較多,本節只選取近一年收益率的?Top300?的基金分析其資產規模。
另外,資產規模均是截止到?2020-12-31?日的資金資產規模。
一起看圖:
?
?
股票型基金的資產規模集中在?0.1億元-15億元?區間,其中,大于100億元?的基金有?7個,占比為 2.3%;混合型基金的資產規模集中在?0.02億元-17億元?區間,其中,大于100億元?的基金也有?7個
因此,不論是股票型還是混合型,10 億元以下規模的基金占比?55%以上,占比較高
3、干貨!收益率前10!
股票型基金近一年收益率的最高是?180.3%,Top10?的平均收益是?142.3%
?
混合型基金近一年收益率的最高是?157.3%,Top10?的平均收益是?144.9%
?
可以看到,前10 收益率的基金差距比較明顯,其中股票型基金差距達到?57.8%。
從圖中看,混合型基金的近一年收益率與資產規模有關,排名前5?的似乎是個不錯的選擇
供參考:
?
4、買老基 or 買新基?
買老基金好還是新基金好?
想必這個問題對于大家的幫助更大,這一步小一篩選了收益率較高的?前50名?基金進行分析,畢竟抄作業也要抄好學生的作業
繪制其上市時間的分布散點圖,如下:
?
可以發現,近一年收益率較高的前50個股票型基金上市時間集中在2014-2019年,對應的混合型則集中在2015-2019年
沒有想到的是,2020 年整體收益率前50的基金中 上市時間在2019年的只有3個
也就是從數據上可以發現:新成立的基金收益率普遍跑不過老基金。
5、干貨!基金經理選誰?
對于基金經理的數據我有找過相關資料,明星經理似乎不太能對得上本節的結論
但是從數據來看,又沒有問題,所以還是辯證的去看比較合適
買基金要看對基金經理,所以這一步是分析基金經理
同樣的,我們取收益率較高的?前50名?基金進行分析,根據基金經理?持有基金的平均收益率?為標準,選取排名?前15?的經理,如下圖:
?
?
股票型基金經理的平均收益集中在?110%-120%?之間,而混合型基金經理的平均收益集中在?120%-130%?之間
像混合型基金經理?羅世峰、趙詣?平均收益率可以達到?150%+,遙遙領先其他基金經理,妥妥的基金一哥
6、干貨!重倉哪些?
再來說一個大家更感興趣的內容:基金持倉情況
每一個基金的前 10 大持倉股都可以作為該基金的代表,這個毋庸置疑,所以在爬蟲部分我們也就直接爬了前十大持倉數據。
ok,在上一節的范圍上我們繼續縮減,取近一年收益率排名?前30?的股票型基金和混合型基金
每個基金都有前 10 大持倉股,所以對應的就有?300?個持倉股代表,篩選?持倉股累計占比排名前 30 個?持倉股作為重點觀察對象,如圖:
?
需要說明的是,加粗表示同時出現在股票型基金和混合型基金中。
可以看到,前 15 持倉股基本兩邊都有持有,且占比很高,主要涉及方向:喝酒+吃藥+開車
個人覺得這份清單相當有分量,2020 年下半年的行情主要就是?白酒飲料板塊、新能源板塊和醫療板塊
7、抄作業!明星經理的持倉
最后,我們繼續抄作業,抄優等生的優秀作業
上面分析了明星基金經理,也分析了收益率較高基金的持倉情況,下面結合這兩者來一個綜合
選擇股票型明星基金經理 5 人,分別是:李游、孫迪、何肖頡、盧純青和王偉
選擇混合型明星基金經理 5 人,分別是:趙詣、羅世鋒、何肖頡、劉彬和曲揚
對應的選擇他們管理的基金,過濾近一年收益率在?120%?以下的,如下圖:
?
其中:標紅的表示收益率?低于 120%,對應的基金?不屬于我們要抄的最優秀作業
選取 7 個股票型基金和 14 個混合型基金進行再次分析:
?
股票型基金的明星經理在 2020 年末已經?不再繼續看好?白酒飲料和醫藥,比較關注?新能源+科技
而混合型基金的明星經理?則是?一如既往的穩健,依舊是?白酒飲料+醫藥+新能源
因此:
- 穩健點的,可以繼續選擇混合型基金,繼續:喝酒+吃藥+新能源
- 激進點的,可以主要關注:新能源細分,次要關注:科技
- 防守的:白酒+醫藥
在這里還是要推薦下我自己建的Python學習群:721195303,群里都是學Python的,如果你想學或者正在學習Python ,歡迎你加入,大家都是軟件開發黨,不定期分享干貨(只有Python軟件開發相關的),包括我自己整理的一份2021最新的Python進階資料和零基礎教學,歡迎進階中和對Python感興趣的小伙伴加入!
總結
以上是生活随笔為你收集整理的数据分析|爬取14455个基金,千万别被人当成韭菜给割了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机外联管理办法,外联部管理制度
- 下一篇: springboot+redis主从复制