做这个AI项目面试通过率达95%
01
京東AI項目實戰教學
項目一
京東智能對話系統項目
項目簡介:智能客服機器人已經成為了客服系統的重要組成部分,幫助人工客服提升工作效率,為企業降低人工成本。作為智能客服的行業先驅,京東多年來致力打造全鏈路的客服機器人,最大化提升商家的接待效率和用戶體驗。目前智能機器人的對話生成策略已經在“京小智”、“京東JIMI“等智能客服機器廣泛應用,在用戶購買商品的售前以及售后環節,為數千萬用戶以及數十萬商家進行服務,為商家降本增效,為用戶提升購物客服體驗。
項目二
京東智能營銷文本生成項目
項目簡介:在京東零售場景,數百萬的寫作達人每天為商品創作賣點突出、風格多樣的營銷文案以促進用戶下單,同時達人也會賺取傭金。但達人創業也會導致創作成本高、量產性差、質量參差不齊的問題。目前京東AI營銷文案的人工審核通過率超過95%,并覆蓋了全品類的商品。模型已成功應用于京東APP-發現好貨,對話機器人京小智和搭配購等場景。
項目三
京東同類商品競價搜索項目
項目簡介:當商家上架或選擇新品時,往往需要更全面了解產品性能參數等指標對比,為便于幫助商戶的決策,京東提供了一款同類商品搜索功能產品;給定一個商品,它可以根據商品相關的信息去自動找到網上的同類商品。這里的一個難點在于,每一個商品在網上的標題、描述都有一些區別,所以定位到同一個商品本身具有一定的挑戰。
《京東NLP企業項目實戰訓練營》
專注于培養行業TOP10%的NLP工程師
對課程有意向的同學
二維碼咨詢
????????????
02?
課程大綱
課程覆蓋了從經典的機器學習、文本處理技術、序列模型、深度學習、預訓練模型、知識圖譜、圖神經網絡所有必要的技術,30+項目案例幫助你在實戰中學習成長。5個月時間博導級大咖全程輔導答疑、幫你告別疑難困惑。
?第一部分:機器學習基礎篇
第1章:自然語言處理概述 什么是自然語言處理及現狀和前景 自然語言處理應用 自然語言處理經典任務及技 | 第2章:數據結構與算法基礎 時間復雜度、空間復雜度 斐波那契數列的時間和空間復雜度 動態規劃算法 經典的DP問題 |
第3章:機器學習基礎 - 邏輯回歸 分類問題以及邏輯回歸重要性 邏輯回歸的條件概率 最大似然估計 構建邏輯回歸的目標函數 優化與梯度下降法 隨機梯度下降法 | 第4章:機器學習基礎 - 模型的泛化 理解什么是過擬合 如何防止過擬合現象 L1與L2正則 交叉驗證 L1正則與拉普拉斯分布 L2正則與高斯分布 |
?第二部分:文本處理篇
第5章:分詞、詞的標準化、過濾 文本分析流程 中英文的分詞 最大匹配算法 基于語言模型的分詞 Stemming和Lemmazation 停用詞的使用 拼寫糾錯問題 編輯距離的實現 暴力搜索法 基于后驗概率的糾錯 | 第6章:文本的表示 單詞的獨熱編碼表示 句子的獨熱編碼表示 tf-idf表示 句子相似度比較 獨熱編碼下的單詞語義相似度 從獨熱編碼到詞向量 詞向量的可視化、句子向量 |
第7章:【項目作業】豆瓣電影評分預測 數據描述以及任務 中文分詞 獨熱編碼、tf-idf 分布式表示與Word2Vec BERT向量 句子向量 | 第8章:詞向量技術 獨熱編碼表示的優缺點 獨熱編碼與分布式表示的比較 靜態詞向量與動態詞向量 學習詞向量 - 分布式假設 SkipGram與CBOW SkipGram模型的目標 負采樣(Negative Sampling) 基于矩陣分解的詞向量學習 基于Glove的詞向量學習 在非歐式空間中的詞向量學習 |
第9章:【項目作業】智能客服問答系統 問答系統和應用場景 問答系統搭建流程 文本的向量化表示 FastText 倒排表技術 問答系統中的召回、排序 | 第10章:語言模型 語言模型的必要性 馬爾科夫假設 Unigram語言模型 Bigram、Trigram語言模型 語言模型的評估 語言模型的平滑技術 |
?第三部分:自然語言處理與深度學習
第11章:深度學習基礎 理解神經網絡 各類常見的激活函數 理解多層神經網絡 反向傳播算法 神經網絡中的過擬合 淺層模型與深層模型對比 深度學習中的層次表示 | 第12章:Pytorch的使用 環境安裝 Pytorch與Numpy的語法比較 Pytorch中的Autograd用法 Pytorch的Forward函數 |
第13章:RNN與LSTM 從HMM到RNN模型 RNN中的梯度問題 解決梯度爆炸問題 梯度消失與LSTM LSTM到GRU 雙向LSTM模型 基于LSTM的生成 練習:利用Pytorch實現RNN/LSTM | 第14章:Seq2Seq模型與注意力機制 Seq2Seq模型 Greedy Decoding Beam Search 長依賴所存在的問題 注意力機制 注意力機制的不同實現 |
第15章:【項目實戰】京東智能營銷文案生成 構建Seq2Seq模型 Beam Search的改造 模型調優 Length Normalization Coverage Normalization 評估標準 Rouge Pointer-Generator Network PGN與Seq2Seq的融合 | 第16章:動態詞向量與ELMo技術 基于上下文的詞向量技術 圖像識別中的層次表示 文本領域中的層次表示 深度BI-LSTM ELMo模型簡介及優缺點 ELMo的訓練與測試 |
第17章:自注意力機制與Transformer 基于LSTM模型的缺點 Transformer結構概覽 理解自注意力機制 位置信息的編碼 理解Encoder與Decoder區別 理解Transformer的訓練和預測 Transformer的缺點 | 第18章:BERT與ALBERT 自編碼器介紹 Transformer Encoder Masked LM BERT模型及其不同訓練方式 ALBERT |
第19章:【項目實戰】京東智能客服系統項目 對話系統的分類方法 檢索方式與生成方式 對話系統架構 意圖識別分類器 閑聊引擎的搭建 Transformer與BERT的使用 | 第20章:GPT與XLNet Transformer Encoder回顧 GPT-1,GPT-2,GPT-3 ELMo的缺點 語言模型下同時考慮上下文 Permutation LM 雙流自注意力機制 Transformer-XL |
?第四部分、信息抽取
第21章:命名實體識別與實體消歧 信息抽取的應用和關鍵技術 命名實體識別 NER識別常用技術 實體消歧技術 實體消歧常用技術 實體統一技術 指代消解 | 第22章:關系抽取 關系抽取的應用 基于規則的方法 基于監督學習方法 Bootstrap方法 Distant Supervision方法 |
第23章:依存文法分析 從語法分析到依存文法分析 依存文法分析的應用 使用依存文法分析 基于圖算法的依存文法分析 基于Transtion-based的依存文法分析 其他依存文法分析方法論 | 第24章:知識圖譜 知識圖譜以及重要性 知識圖譜中的實體和關系 利用非結構化數據構造知識圖譜 知識圖譜的設計 |
第25章:【項目實戰】京東同類商品競價搜索項目 Entity Linking介紹 Entity Linking技術概覽 從商品描述、商品標題中抽取關鍵實體 搭建商品知識圖譜 基于GNN學習商品的詞嵌入 商品的ranking以及相似度計算 |
?第五部分:圖神經網絡以及其他前沿主題
第26章:模型的壓縮 模型壓縮的必要性 常見的模型壓縮算法總覽 基于矩陣分解的壓縮技術 從BERT到ALBERT的壓縮 基于貝葉斯模型的壓縮技術 模型的量化 模型的蒸餾方法 | 第27章:圖神經網絡 卷積神經網絡的回顧 圖神經網絡發展歷程 圖卷積神經網絡(GCN) GAT詳解 |
《京東NLP企業項目實戰訓練營》
專注于培養行業TOP10%的NLP工程師
對課程有意向的同學
二維碼咨詢
????????????
03?
教學體系
課程采用項目式教學(PBL)教學方式,同時參考了美國頂級院校的教學培養體系。日常的教學授課通過8大維度,保障每位學員學習效果。
?01?項目講解&實戰幫助
訓練營最終的目的是幫助學員完成項目,理解項目中包含核心知識技能,訓練營中會花大量的時間幫助學員理解項目以及所涉及到的實戰講解。
▲節選往期部分課程安排
?02最佳工業實戰
來自京東智聯云等業界專家來講述工業界的最佳工程實戰,如AI模型的部署、代碼編寫、模型的調參以及debug等技術。
▲源自京東智聯云AI某模塊架構圖
?03專業的論文解讀
作為AI工程師,閱讀論文能力是必須要的。在課程里,我們會安排經典英文文章供學員閱讀,之后由老師幫助解讀。? ?
????
▲節選往期部分論文安排
?04代碼解讀&實戰
對于核心的模型如BERT,XLNet都會精心安排代碼解讀和實戰課,幫助學員深入理解其細節并有能力去實現。
▲BERT模型代碼實戰講解
?05行業案例分享
訓練營過程中會邀請合作的專家來分享行業案例以及技術解決方案,如知識圖譜的搭建、保險領域的客服系統等。
▲專家分享
《Google YouTube 基于深度學習的視頻推薦》
嘉賓簡介:曾博士
計算機視覺,機器學習領域專家
先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 會議等發表超過30篇論文
?06日常社群答疑
為了幫助解決學員遇到的問題,專業助教會提供全天社群答疑服務。我們的助教均來來自于一線AI公司和國內外名校,扎實的理論和工業界應用也是我們選拔助教老師的重要標準,拒絕空談理論。
▲社群內老師專業的解答
?07日常作業&講解
為了鞏固對一些核心知識點,學員除了大項目,也需要完成日常的小作業。之后助教會給出詳細的解答。
▲課程學習中的小作業
?08學員畢業去向
04?
課程適合哪些學員吶?
大學生:
計算機或者信息領域相關的本科/研究/博士生,畢業后希望從事AI相關的工作;
希望在真實工業場景中磨煉技術,提升職場競爭力;
畢業之后希望申請國內外名校的碩士或者博士。
在職人士:
具備良好的工程研發背景,希望從事AI相關的項目或者工作;
從事AI工作,希望進一步提升NLP實戰經驗;
從事NLP工作,希望深入了解模型機理;
AI developer, 希望突破技術瓶頸, 了解NLP前沿信息。?
入學標準
1.理工科專業相關本科生,碩士生或博士生或者IT領域的在職人士;
2.具備很強的動手能力、熟練使用Python編程;
3.具備良好的英文文獻閱讀能力,至少達到CET-4級水平。
《京東NLP企業項目實戰訓練營》
專注于培養行業TOP10%的NLP工程師
對課程有意向的同學
二維碼咨詢
????????????
總結
以上是生活随笔為你收集整理的做这个AI项目面试通过率达95%的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 历史转折中的伟人
- 下一篇: lia人是什么意思_69年属鸡人终身灾难