基于交叉熵與困惑度的LDA-SVM主題研究

摘要:目前對(duì)于中文影視劇本的分類主要借助人工經(jīng)驗(yàn),具有成本高、效率低等特點(diǎn).當(dāng)前沒(méi)有針對(duì)中文影視劇本主題自動(dòng)分類的相關(guān)研究,本文將對(duì)主題提取進(jìn)行研究,傳統(tǒng)主題生成模型借助于文檔和段落、段落和語(yǔ)句、語(yǔ)句和詞的相似性,而忽略了文本語(yǔ)句與語(yǔ)句之間的相似性.首先,采用ISOMAP方法降低樣本集的向量空間維度;其次,提出交叉熵結(jié)合困惑度的算法模型,進(jìn)而確定LDA需要提取的最優(yōu)主題數(shù)目;最后,通過(guò)劇本-主題的方式,利用LDA算法挖掘劇本的隱含主題詞,同時(shí)利用SVM對(duì)主題詞做出進(jìn)一步的分類.

關(guān)鍵詞:
  • 中文影視劇本  
  • isomap降維  
  • lda  
  • 交叉熵  
  • 困惑度  
  • svm  
作者:
薛佳奇; 楊凡
單位:
西安建筑科技大學(xué)信息與控制工程學(xué)院; 西安710055; 西安建筑科技大學(xué)理學(xué)院; 西安710055
刊名:
智能計(jì)算機(jī)與應(yīng)用

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

智能計(jì)算機(jī)與應(yīng)用雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國(guó)內(nèi)刊號(hào)為:23-1573/TN。堅(jiān)持指導(dǎo)性與實(shí)用性相結(jié)合的原則,創(chuàng)辦于2011年,雜志在全國(guó)同類期刊中發(fā)行數(shù)量名列前茅。

主站蜘蛛池模板: 在线免费观看污网站| 小次郎收藏最新地址| 国产在线资源站| 久久精品夜色国产亚洲av| 国产成人亚洲欧美电影| 末成年ASS浓精PICS| 日本三级网站在线观看| 久久香蕉国产线看精品| 国产乱子伦在线观看| 我想看一级毛片免费的| 综合偷自拍亚洲乱中文字幕| 一级毛片成人免费看免费不卡| 公和熄小婷乱中文字幕| 天啪天天久久天天综合啪| 欧美日韩亚洲视频| 欧美视频亚洲色图| 久久久久国产一区二区三区| 国产aⅴ激情无码久久久无码 | 夜夜高潮夜夜爽国产伦精品| 欧美黄色一级在线| 日韩毛片基地一区二区三区| 九九视频在线观看6| 四虎影视8848a四虎在线播放| 女人全身裸无遮挡图片| 欧美激情二区三区| 黄色毛片在线看| 一级片一级毛片| 亚洲日本韩国在线| 国产呦系列呦交| 小雪你好紧好烫好爽| 欧美视频www| 荫蒂添的好舒服视频| a级男女仿爱免费视频| 久热香蕉精品视频在线播放| 四虎成人永久地址| 国产精品蜜臂在线观看| 日韩午夜小视频| 激情综合婷婷色五月蜜桃| 精品91自产拍在线| а天堂中文最新版在线| 国产成人十八黄网片|