Apache Kafka流+机器学习(Spark,TensorFlow,H2O.ai)
我于2017年5月開始在Confluent工作,擔任技術傳播者,專注于圍繞開源框架Apache Kafka的主題。 我認為機器學習是當今最熱門的流行語之一,因為它可以在任何行業中增加巨大的商業價值。 因此,您還會從我這里收到有關Apache Kafka(消息傳遞),Kafka Connect(集成),Kafka Streams(流處理),Confluent在Kafka之上的其他開源插件(Schema Registry,Replicator,Auto Balancer,等等。)。 我將解釋在實際生產場景中如何將所有這些用于機器學習和其他大數據技術。
如果您想知道為什么對在大數據世界中遷移(返回)開源以便進行消息傳遞,集成和流處理感到非常興奮,請閱讀本文檔。
在下面的博客文章中,我想分享一次代表Confluent的會議演講的第一張幻燈片:位于德國萊比錫的軟件體系結構用戶組組織了為期2天的活動,以討論實踐中的大數據 。
Apache Kafka流+機器學習/深度學習
這是幻燈片的摘要:
大數據和機器學習是當今許多行業創新的關鍵。 大量的歷史數據存儲在Hadoop,Spark或其他群集中并進行分析,以找到模式和見解,例如用于預測性維護,欺詐檢測或交叉銷售。
本部分的第一部分將說明如何利用R,Python和Scala利用開源機器學習/深度學習框架(如Apache Spark , TensorFlow或H2O.ai) 來構建分析模型 。
第二部分討論如何在自己的實時流應用程序或微服務中利用這些內置的分析模型。 它說明了如何利用Apache Kafka集群和Kafka Streams而不是構建自己的流處理集群。 該課程側重于現場演示,并講授以高度可擴展和高效的方式執行分析模型的經驗教訓。
最后一部分解釋了Apache Kafka如何幫助從手動構建和部署分析模型轉變為實時不斷地在線改進模型 。
幻燈片:如何建立分析模型并將其部署到實時處理
這是幻燈片平臺:
來自KaiW?hner的 Apache Kafka流+機器學習/深度學習
接下來的幾周將發布更多具有更多詳細信息的博客文章和特定的代碼示例。 我還將對此幻燈片平臺進行網絡記錄,并將其發布到Youtube上。
翻譯自: https://www.javacodegeeks.com/2017/05/apache-kafka-streams-machine-learning-spark-tensorflow-h2o-ai.html
總結
以上是生活随笔為你收集整理的Apache Kafka流+机器学习(Spark,TensorFlow,H2O.ai)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信成为对方监护人怎么取消
- 下一篇: 恰字组词语 恰字组词语有哪些