亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark mllib如何實現基于卡方校驗的特征選擇

發布時間:2021-12-16 14:42:12 來源:億速云 閱讀:134 作者:小新 欄目:云計算

這篇文章給大家分享的是有關spark mllib如何實現基于卡方校驗的特征選擇的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

運行代碼如下

package spark.FeatureExtractionAndTransformation

import org.apache.spark.mllib.feature.ChiSqSelector
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.util.MLUtils
import org.apache.spark.{SparkConf, SparkContext}

/**
  * 基于卡方校驗的特征選擇
  * 卡方校驗:
  * 在分類資料統計推斷中一般用于檢驗一個樣本是否符合預期的一個分布.
  * 是統計樣本的實際值與理論推斷值之間的偏離程度.
  * 卡方值越小,越趨于符合
  *
  * Created by eric on 16-7-24.
  */
object FeatureSelection {
  val conf = new SparkConf()                                     //創建環境變量
    .setMaster("local")                                             //設置本地化處理
    .setAppName("TF_IDF")                              //設定名稱
  val sc = new SparkContext(conf)

  def main(args: Array[String]) {
    val data = MLUtils.loadLibSVMFile(sc, "/home/eric/IdeaProjects/wordCount/src/main/spark/FeatureExtractionAndTransformation/fs.txt")
    val discretizedData = data.map { lp => //創建數據處理空間
      LabeledPoint(lp.label, Vectors.dense(lp.features.toArray.map {x => x/2}))
    }

    val selector = new ChiSqSelector(2)//創建選擇2個特性的卡方校驗
    val transformer = selector.fit(discretizedData)//創建訓練模型

    val filteredData = discretizedData.map { lp =>  //過濾前兩個特性
      LabeledPoint(lp.label, transformer.transform(lp.features))
    }
    filteredData.foreach(println)

//    (0.0,[1.0,0.5])
//    (1.0,[0.0,0.0])
//    (0.0,[1.5,1.5])
//    (1.0,[0.5,0.0])
//    (1.0,[2.0,1.0])
  }
}

fs.txt

0 1:2 2:1 3:0 4:1
1 1:0 2:0 3:1 4:0
0 1:3 2:3 3:2 4:2
1 1:1 2:0 3:4 4:3
1 1:4 2:2 3:3 4:1

結果如下

spark mllib如何實現基于卡方校驗的特征選擇

感謝各位的閱讀!關于“spark mllib如何實現基于卡方校驗的特征選擇”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

肇东市| 武胜县| 珠海市| 磴口县| 莲花县| 界首市| 沂源县| 多伦县| 宜兰县| 赫章县| 上栗县| 乌鲁木齐县| 油尖旺区| 灵川县| 化州市| 河西区| 吉水县| 彰化市| 临漳县| 合江县| 大宁县| 溧阳市| 通许县| 曲松县| 寻甸| 耿马| 浮山县| 汾西县| 玛纳斯县| 志丹县| 堆龙德庆县| 石柱| 云阳县| 泸州市| 漯河市| 四平市| 马边| 宿州市| 疏勒县| 汉寿县| 来安县|