您好,登錄后才能下訂單哦!
集算器不僅有大數據計算,還有詩和遠方。最近看到不少寫詩機器人的新聞,于是嘗試用集算器簡單地實現一個。這個實現真的很簡單,簡單到只有10幾行代碼,請看實現步驟:
1下載字典和詩詞
從網上找一個用于分詞的字典文件,里面記錄著每個中文詞匯的詞性。我從GitHub上找了一個,稍微處理之后保存到集文件dict.btx。
下載宋詞三百首的txt文件,去掉空格和換行,以及其它文字以外的字符,得到一個長字符串。
2訓練
對上一步得到的長字符串進行分詞,結果保存到集文件作為模板,實現代碼如下:
A | B | C | |
1 | =file("dict.btx").import@bi().keys(WORD).index() | ||
2 | =create(WORD,LEN,T) | ||
3 | 宋詞三百首宴山亭趙佶北行見杏花裁剪冰綃,輕疊數…… | ||
4 | =len(A3) | >i=1 | |
5 | for (i<=A4) | >word3=A2.find(mid(A3,i,3) ), word2=A2.find( mid(A3,i,2) ), word1=A2.find( mid(A3,i,1) ) | |
6 | if (word3!=null) | >A2.insert(0, word3.(WORD),3,word3.(T)), i=i+3 | |
7 | else if (word2!=null) | >A2.insert(0, word2.(WORD),2,word2.(T)), i=i+2 | |
8 | else if (word1!=null) | >A2.insert(0, word1.(WORD),1,word1.(T)), i=i+1 | |
9 | else | >i=i+1 | |
10 | =file("宋詞模型.txt").export@t(A2) |
A1讀取字典文件,并且建立索引;
A2定義模板記錄的數據結構,三個字段表示:詞、長度、詞性;
A5到A9是循環處理,對A3進行分詞,這里最長只處理三個字組成的詞;
A10把結果保存;
這一步得到一個模板,內容是《宋詞三百首》里所有文字的分詞,以及這些分詞的詞性。
3創作
創作的原理是找一首宋詞作為目標,得到它的每個分詞,根據分詞的長度和詞性,從上一步的模板里隨機找一個詞進行替換。這里選擇的是《水調歌頭·明月幾時有》,來看代碼:
A | B | C | |
1 | =file("宋詞模型.txt").import@t() | ||
2 | =file("dict.btx").import@bi().keys(WORD).index() | ||
3 | 明月幾時有,把酒問青天。不知天上宮闕,今夕是何年。我欲乘風歸去。惟恐瓊樓玉宇,高處不勝寒,起舞弄清影,何似在人間。 | ||
4 | =len(A3) | >str="", i=1, words=null | |
5 | for (i<=A4) | >word3=A2.find(mid(A3,i,3) ),word2=A2.find( mid(A3,i,2) ), word1=A2.find( mid(A3,i,1) ) | |
6 | if (word3!=null) | >words=A1.select(LEN==3&& T==word3.(T) ), i=i+3, str=str+words(1+rand(words.len())).(WORD) | |
7 | else if (word2!=null) | >words=A1.select(LEN==2&& T==word2.(T) ), i=i+2, str=str+words(1+rand(words.len())).(WORD) | |
8 | else if (word1!=null) | >words=A1.select(LEN==1&& T==word1.(T) ), i=i+1, str=str+words(1+rand(words.len())).(WORD) | |
9 | else | >str=str+mid(A3,i,1), i=i+1 | |
10 | >output(str) |
運行結果如下,這些“作品”雖然存在語法錯誤,但還是有模有樣的,總比我自己寫的要好很多。
晚秋無奈送,佇立鷓鴣天。已成西下黃葉,春寒疏何處。我又花下離別。酒醒陽關蕭蕭,如許悲歡霜,初見年少影,誰曾在斜陽。
春寒何在喧,不解煙雨任。梳洗江上西風,明月憐此地。誰先水聲惹起。相思洛陽曉色,幾許不成魂,不應相迎競,他未為梢頭。
而今幾度寄,相認問青天。催發江上蓬壺,黃昏發何處。別未御街可惜。輕吹江南那堪,先斷閑來閑,相逢拘束影,任又在舊事。
昨夜無處應,不知闌珊處。映帶樓上王孫,如今來有時。任更點點飄香。垂涎池塘秋千,到處望斷天,酒醒衰草影,我尤把天涯。
選擇一首發到朋友圈,居然得到不少點贊。
實現原理是同詞性替換,根據這個還可以實現寫唐詩的功能。如果對模板文件進一步調整,根據韻律和平仄優化詞性,效果會更好。這就是屬于人工智能的人工勞動了,需要專業知識和辛苦付出,不是一下可以達成的。
感興趣的同學可以下載附件。
15368090470002ffa.rar
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。