亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python協同過濾程序的示例分析

發布時間:2021-07-22 09:58:18 來源:億速云 閱讀:106 作者:小新 欄目:開發技術

小編給大家分享一下python協同過濾程序的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

具體介紹如下。

關于協同過濾的一個最經典的例子就是看電影,有時候不知道哪一部電影是我們喜歡的或者評分比較高的,那么通常的做法就是問問周圍的朋友,看看最近有什么好的電影推薦。在問的時候,都習慣于問跟自己口味差不多的朋友,這就是協同過濾的核心思想。

這個程序完全是為了應付大數據分析與計算的課程作業所寫的一個小程序,先上程序,一共55行。不在意細節的話,55行的程序已經表現出了協同過濾的特性了。就是對每一個用戶找4個最接近的用戶,然后進行推薦,在選擇推薦的時候是直接做的在4個用戶中選擇該用戶item沒包括的,當然這里沒限制推薦數量,個人覺得如果要提高推薦準確率的畫,起碼,1,要對流行的item進行處理。2,將相鄰的四個用戶的item進行排序,從多到少的進行推薦。程序所用的數據是movielens上的(http://grouplens.org/datasets/movielens)。相似度的計算也很簡單,直接用了交集和差集的比值。好吧,上程序

#coding utf-8
import os
import sys
import re

f1=open("/home/alber/data_base/bigdata/movielens_train_result.txt",'r')  #讀取train文件,已經處理成每一行代表一位用戶的item,項之間用空格。
f2=open("/home/alber/data_base/bigdata/movielens_train_result3.txt",'a')
txt=f1.readlines()
contxt=[]
f1.close()
userdic={}
for line in txt:
  line_clean=" ".join(line.split())
  position=line_clean.index(",")
  ID=line_clean[0:position]
  item=line_clean[position+1:]
  userdic.setdefault(ID,item)
  if len(item)>=5:           #對觀影量少于5的用戶不計入相似性計算的范圍
    contxt.append(item)
for key in userdic.keys():        #計算每位用戶的4個最相似用戶
  ID_num=key
  value=userdic[key]
   user_item=value.split(' ')
   Sim_user=[]
   for lines in contxt:
     lines_clean=lines.split(' ')
     intersection=list(set(lines_clean).intersection(set(user_item)))
     lenth_intersection=len(intersection)
     difference=list(set(lines_clean).difference(set(user_item)))
     lenth_difference=len(difference)
     if lenth_difference!=0:                     
       Similarity=float(lenth_intersection)/lenth_difference          #交集除以差集作為相似性的判斷條件
       Sim_user.append(Similarity)
     else:
       Sim_user.append("0")
   Sim_user_copy=Sim_user[:]
   Sim_user_copy.sort()
   Sim_best=Sim_user_copy[-4:]
   position1=Sim_user.index(Sim_best[3])
   position2=Sim_user.index(Sim_best[2])
   position3=Sim_user.index(Sim_best[1])
   position4=Sim_user.index(Sim_best[0])
   if position1!=0 and position2!=0 and position3!=0 and position4!=0:
     recommender=userdic[str(position1)]+" "+userdic[str(position2)]+" "+userdic[str(position3)]+" "+userdic[str(position4)] #將4位用戶的看過的電影作為推薦 
  else:
    recommender="none"   
  reco_list=recommender.split(' ')
  recomm=[]
  for good in reco_list:
    if good not in user_item:
      recomm.append(good)
    else:
      pass
  f2.write((" ".join(recomm)+"\n"))
f2.close()

以上是“python協同過濾程序的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

通河县| 聂荣县| 阜南县| 宝坻区| 得荣县| 宜君县| 平远县| 商河县| 沂水县| 喀喇沁旗| 龙泉市| 康保县| 轮台县| 隆回县| 连山| 龙海市| 奎屯市| 翼城县| 新化县| 汤原县| 且末县| 新宁县| 丰宁| 商洛市| 昆山市| 钟山县| 高陵县| 勐海县| 抚顺县| 屯昌县| 定远县| 扎兰屯市| 黑河市| 西城区| 凤城市| 铁岭县| 阿克苏市| 印江| 大姚县| 溧阳市| 额敏县|