java的函数库_Dagli首页、文档和下载 - Java 机器学习函数库
Dagli 是 LinkedIn 開源的用于 Java(和其他 JVM 語言)的機器學習函數庫,其開發團隊表示通過它可輕松編寫不易出錯、可讀、可修改、可維護且易于部署的模型管道,而不會引起技術債。Dagli 充分利用了現代多核的 CPU 和功能日益強大的 GPU,可以對真實世界模型進行有效的單機訓練。
下面是一個文本分類器的介紹性示例,此文本分類器以管道的形式實現,使用梯度增強決策樹模型 (XGBoost) 的主動學習以及高維 ngram 集作為邏輯回歸分類器中的特征:
Placeholder text = new Placeholder<>();
Placeholder label = new Placeholder<>();
Tokens tokens = new Tokens().withInput(text);
NgramVector unigramFeatures = new NgramVector().withMaxSize(1).withInput(tokens);
Producer leafFeatures = new XGBoostClassification<>()
.withFeaturesInput(unigramFeatures)
.withLabelInput(label)
.asLeafFeatures();
NgramVector ngramFeatures = new NgramVector().withMaxSize(3).withInput(tokens);
LiblinearClassification prediction = new LiblinearClassification()
.withFeaturesInput().fromVectors(ngramFeatures, leafFeatures)
.withLabelInput(label);
DAG2x1.Prepared> trainedModel =
DAG.withPlaceholders(text, label).withOutput(prediction).prepare(textList, labelList);
LabelType predictedLabel = trainedModel.apply("Some text for which to predict a label", null);
// trainedModel now can be serialized and later loaded on a server, in a CLI app, in a Hive UDF...
總結
以上是生活随笔為你收集整理的java的函数库_Dagli首页、文档和下载 - Java 机器学习函数库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阈值Java_亲测有效!一种完美动态阈值
- 下一篇: java中if条件结构_Java的控制结