深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案
生活随笔
收集整理的這篇文章主要介紹了
深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
在實際工作中,你是否遇到過這樣一個問題或痛點:無論是通過哪種方式獲取的標注數據,數據標注質量可能不過關,存在一些錯誤?亦或者是數據標注的標準不統一、存在一些歧義?特別是badcase反饋回來,發現訓練集標注的居然和badcase一樣?如下圖所示,QuickDraw、MNIST和Amazon Reviews數據集中就存在錯誤標注。
為了快速迭代,大家是不是常常直接人工去清洗這些“臟數據”?但數據規模上來了咋整?有沒有一種方法能夠自動找出哪些錯誤標注的樣本呢?基于此,本文嘗試提供一種可能的解決方案——置信學習。
本文的組織架構是:
總結
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(八十)-脏数据如何处理?置信学习解决方案的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习核心技术精讲100篇(七十九)-
- 下一篇: tableau可视化函数使用案例(四十六