自然語言及語音處理項(xiàng)目式教程 實(shí)訓(xùn)指導(dǎo) 實(shí)訓(xùn)12 游客目的地聚類分析_第1頁
自然語言及語音處理項(xiàng)目式教程 實(shí)訓(xùn)指導(dǎo) 實(shí)訓(xùn)12 游客目的地聚類分析_第2頁
自然語言及語音處理項(xiàng)目式教程 實(shí)訓(xùn)指導(dǎo) 實(shí)訓(xùn)12 游客目的地聚類分析_第3頁
自然語言及語音處理項(xiàng)目式教程 實(shí)訓(xùn)指導(dǎo) 實(shí)訓(xùn)12 游客目的地聚類分析_第4頁
自然語言及語音處理項(xiàng)目式教程 實(shí)訓(xùn)指導(dǎo) 實(shí)訓(xùn)12 游客目的地聚類分析_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《自然語言處理技術(shù)》所示。表STYLEREF1\s3SEQ表\*ARABIC\s13景區(qū)和酒店編號(hào)的篩選結(jié)果景區(qū)編號(hào)酒店編號(hào)高層次A39、A23、A06高層次H37、H06、H11中層次A12、A34、A01中層次H10、H41、H35低層次A42、A04、A27低層次H17、H50、H43景區(qū)和酒店特征聚類使用K-Means聚類算法對(duì)數(shù)據(jù)預(yù)處理后的景區(qū)/酒店進(jìn)行聚類,步驟如下。創(chuàng)建、訓(xùn)練K-Means模型。通過輪廓系數(shù)法進(jìn)行K值的選取。其中,將K值的尋優(yōu)范圍定為3~9,通過調(diào)用metrics模塊中的silhouette_score函數(shù),計(jì)算輪廓系數(shù),尋找最佳K值。這里需要注意的是,在進(jìn)行聚類時(shí)從3類開始的,而在返回的K值索引是從0開始,因此索引加上3才能得到真實(shí)的K值。使用K-Means聚類的算法提取特征詞,即進(jìn)行聚類特色分析。實(shí)現(xiàn)K-Means文本聚類需要計(jì)算TF-IDF,如REF_Ref137115708\h代碼314REF_Ref132317150\h所示。該代碼中定義了transform和train兩個(gè)函數(shù)。transform函數(shù)用于計(jì)算TF-IDF矩陣,而train函數(shù)用于訓(xùn)練K-Means模型,train函數(shù)可以選擇是否輸出聚類主題和是否返回聚類模型。代碼STYLEREF1\s3SEQ代碼\*ARABIC\s114基于TF-IDF的K-Means文本聚類importosimportpandasaspdfromsklearn.feature_extraction.textimportTfidfVectorizerimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansimportsklearnimportre#計(jì)算TF-ITFdeftransform(dataset):"""參數(shù):dataset:數(shù)據(jù)集返回值:X:計(jì)算得到的TF-IDF矩陣vectorizer:使用的TfidfVectorizer對(duì)象"""vectorizer=TfidfVectorizer(max_df=0.5,min_df=2,use_idf=True)X=vectorizer.fit_transform(dataset)returnX,vectorizer#訓(xùn)練K-Means模型deftrain(X,vectorizer,true_k,showLable=False,choice_k=False):"""參數(shù):X:TF-IDF矩陣vectorizer:使用的TfidfVectorizer對(duì)象true_k:聚類的簇?cái)?shù)showLable:是否輸出聚類主題choice_k:是否返回聚類模型返回值:如果choice_k為True,返回訓(xùn)練好的K-Means模型"""#聚類km=KMeans(n_clusters=true_k,init='k-means++',max_iter=300,n_init=1,verbose=False,random_state=250)km.fit(X)#是否輸出聚類主題ifshowLable:order_centroids=km.cluster_centers_.argsort()[:,::-1]terms=vectorizer.get_feature_names()foriinrange(true_k):print("主題%d:"%(i+1),end='')forindinorder_centroids[i,:10]:print('%s'%terms[ind],end='')print()#是否返回聚類模型ifchoice_k==True:returnkmREF_Ref137115708\h代碼314REF_Ref132317150\h中使用了sklearn.cluster庫中的KMeans函數(shù)構(gòu)建K-Means模型,KMeans函數(shù)的常用參數(shù)說明如REF_Ref137115793\h表34REF_Ref133335900\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s14KMeans函數(shù)的常用參數(shù)說明參數(shù)名稱參數(shù)說明n_clusters接收int,表示聚類的數(shù)量,即最終要形成的簇?cái)?shù)(K值)。默認(rèn)為8init接收{(diào)'k-means++','random'},表示初始質(zhì)心的選擇方法。其中,'k-means++'是一種加速收斂的方法,'random'為隨機(jī)選擇。默認(rèn)為'k-means++'max_iter接收int,表示算法的最大迭代次數(shù)。默認(rèn)為300n_init接收int,表示用不同質(zhì)心種子運(yùn)行算法的次數(shù)。默認(rèn)為10verbose接收int,表示是否輸出詳細(xì)的調(diào)試信息。默認(rèn)為0random_state接收int,表示用于生成隨機(jī)數(shù)的種子,指定random_state可以確保每次運(yùn)行時(shí)結(jié)果的一致性。默認(rèn)為None指定簇的個(gè)數(shù)K,如REF_Ref137115717\h代碼315REF_Ref132317233\h所示。其中,自定義的k_determin的函數(shù)通過輪廓系數(shù)法確定最佳的聚類簇?cái)?shù)。k_determin函數(shù)接受一個(gè)數(shù)據(jù)集作為輸入,并根據(jù)聚類結(jié)果的輪廓系數(shù)來選擇最佳的簇?cái)?shù)。在給定的代碼中,聚類簇?cái)?shù)的范圍為3~10。對(duì)于每個(gè)聚類簇?cái)?shù),首先使用transform函數(shù)計(jì)算數(shù)據(jù)集的TF-IDF矩陣,并使用train函數(shù)訓(xùn)練K-Means模型;然后計(jì)算輪廓系數(shù)并將其添加到列表S中;最后,找到具有最大輪廓系數(shù)的聚類簇?cái)?shù),并使用該簇?cái)?shù)重新訓(xùn)練K-Means模型。此外,k_determin函數(shù)還可以根據(jù)參數(shù)showS來決定是否繪制簇?cái)?shù)與輪廓系數(shù)之間的關(guān)系圖。代碼STYLEREF1\s3SEQ代碼\*ARABIC\s115指定簇的個(gè)數(shù)K#指定簇的個(gè)數(shù)K——使用輪廓系數(shù)法defk_determin(dataset,showS=False):"""參數(shù):dataset:數(shù)據(jù)集showS:是否展示輪廓系數(shù)圖"""X,vectorizer=transform(dataset)S=[]#聚類的數(shù)量在3~10之間foriinrange(3,10):km=train(X,vectorizer,true_k=i,choice_k=True)#返回簇標(biāo)簽labels=km.labels_#調(diào)用字模塊metrics中的silhouette_score函數(shù),計(jì)算輪廓系數(shù)S.append(sklearn.metrics.silhouette_score(X,labels,metric='euclidean'))#按輪廓系數(shù)尋找最佳k值max_k=S.index(max(S))print('最優(yōu)K值',max_k+3)#使用最佳K值進(jìn)行聚類train(X,vectorizer,true_k=max_k+3,showLable=True)ifshowS:#展示輪廓系數(shù)#中文和負(fù)號(hào)的正常顯示plt.rcParams['font.sans-serif']=['MicrosoftYaHei']plt.rcParams['axes.unicode_minus']=False#設(shè)置繪圖風(fēng)格plt.style.use('ggplot')#繪制K的個(gè)數(shù)與輪廓系數(shù)的關(guān)系plt.plot(range(3,10),S,'b*-')plt.xlabel('簇的個(gè)數(shù)')plt.ylabel('輪廓系數(shù)')#顯示圖形plt.show()輪廓系數(shù)(SilhouetteCoefficient)是一種衡量聚類效果的指標(biāo),可以用于評(píng)估聚類結(jié)果的緊密性和分離性。REF_Ref137115717\h代碼315REF_Ref132317233\h中使用sklearn庫中的silhouette_score函數(shù)計(jì)算所有點(diǎn)的平均輪廓系數(shù),silhouette_score函數(shù)的常用參數(shù)說明如REF_Ref137115804\h表35REF_Ref132317265\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s15silhouette_score函數(shù)的常用參數(shù)說明參數(shù)名稱參數(shù)說明X接收矩陣,表示輸入的特征矩陣,如TF-IDF矩陣。無默認(rèn)值labels接收list或numpy數(shù)組,表示數(shù)據(jù)點(diǎn)的聚類標(biāo)簽。無默認(rèn)值metric接收str,表示用于計(jì)算點(diǎn)之間距離的度量方法,可選的度量方法包括'manhattan'、'cosine'等,默認(rèn)為'euclidean'加載與提取評(píng)論,如REF_Ref137115723\h代碼316REF_Ref132317294\h所示。代碼中包含兩個(gè)函數(shù):loadDataSet和fileCut。loadDataSet函數(shù)用于從指定的文件中加載數(shù)據(jù)集。它逐行讀取文件,并根據(jù)給定的fileType參數(shù)(默認(rèn)為float)來解析每一行的數(shù)據(jù)。數(shù)據(jù)被存儲(chǔ)在一個(gè)名為dataMat的列表中,該列表最后被返回。fileCut函數(shù)用于從輸入的Excel文件(file_name)中提取評(píng)論內(nèi)容,并將其寫入一個(gè)新的文件(writeFile)。代碼STYLEREF1\s3SEQ代碼\*ARABIC\s116加載與提取評(píng)論#加載預(yù)處理后的數(shù)據(jù)defloadDataSet(fileName,fileType='float'):dataMat=[]#打開文件fr=open(fileName,encoding='utf-8')#逐行讀取文件forlineinfr.readlines():#讀取的數(shù)據(jù)類型為striffileType=='str':curLine=line.strip().split('\t')else:#讀取的數(shù)據(jù)類型為floatcurLine=map(float,line.strip().split('\t'))ifcurLine!=['']:dataMat.append(curLine)#返回?cái)?shù)據(jù)returndataMat#把預(yù)處理后樣本文件中的評(píng)論內(nèi)容提取出來,并寫入新文件deffileCut(file_name,writeFile):#讀取Excel文件view=pd.read_excel(file_name)#打開寫文件frW=open(writeFile,'w',encoding='utf-8')#逐行處理Excel文件中的評(píng)論內(nèi)容foriinrange(len(view)):#正則表達(dá)式匹配中文內(nèi)容content_regx='\'([\u4e00-\u9fa5]*)\''a=re.findall(content_regx,view['評(píng)論內(nèi)容'][i])#把匹配到的中文內(nèi)容寫入新文件forjina:frW.write(j)frW.write('\t')#寫完一條評(píng)論后換行frW.write('\n')#關(guān)閉文件frW.close()景區(qū)與酒店評(píng)論聚類,如REF_Ref137115729\h代碼317REF_Ref132317325\h所示,通過自定義k_means函數(shù)對(duì)給定的景區(qū)和酒店評(píng)論數(shù)據(jù)執(zhí)行K-Means聚類。首先,對(duì)景區(qū)和酒店數(shù)據(jù)分別進(jìn)行處理,在處理過程中,需要檢查分詞后的文件是否存在,若不存在,則進(jìn)行分詞,并將分詞后的數(shù)據(jù)加載到數(shù)據(jù)集中。然后,將數(shù)據(jù)集中的數(shù)據(jù)類型轉(zhuǎn)換為字符串,并使用輪廓系數(shù)法確定聚類簇的數(shù)量。最后,調(diào)用k_determin函數(shù)執(zhí)行聚類。在主函數(shù)中,指定預(yù)處理后數(shù)據(jù)的存儲(chǔ)位置和切分評(píng)論內(nèi)容后的存儲(chǔ)位置,并提供景區(qū)和酒店的名稱列表后,調(diào)用k_means函數(shù)進(jìn)行聚類。代碼STYLEREF1\s3SEQ代碼\*ARABIC\s117景區(qū)與酒店評(píng)論聚類#定義K-Means聚類函數(shù)defk_means(data_dir,save_dir,spot_name,hotel_name):#確定景區(qū)的類個(gè)數(shù)foriinrange(len(spot_name)):#文件名file_name=spot_name[i]+'景區(qū)2.xlsx'#分詞后的文件名cutword_name=spot_name[i]+'cutword.txt'print("")print(spot_name[i]+'K-Means聚類結(jié)果')#文件路徑拼接data_file_path=os.path.join(data_dir,file_name)cut_word_path=os.path.join(save_dir,cutword_name)#分詞-去掉停用詞,先確實(shí)是否已經(jīng)存在分詞文件,沒有則進(jìn)行分詞ifos.path.exists(cut_word_path)==False:fileCut(data_file_path,cut_word_path)#加載分詞之后的數(shù)據(jù)dataset=loadDataSet(cut_word_path,fileType='str')#數(shù)據(jù)類型轉(zhuǎn)化forjinrange(len(dataset)):dataset[j]=str(dataset[j])#確定聚類的個(gè)數(shù)k_determin(dataset)#確定酒店的聚類數(shù)量foriinrange(len(hotel_name)):#文件名file_name=hotel_name[i]+'酒店2.xlsx'#分詞后的文件名cutword_name=hotel_name[i]+'cutword.txt'print("")print(hotel_name[i]+'K-Means聚類結(jié)果')#文件路徑拼接data_file_path=os.path.join(data_dir,file_name)cut_word_path=os.path.join(save_dir,cutword_name)#分詞-去掉停用詞,先確實(shí)是否已經(jīng)存在分詞文件,沒有則進(jìn)行分詞ifos.path.exists(cut_word_path)==False:fileCut(data_file_path,cut_word_path)#加載分詞之后的數(shù)據(jù)dataset=loadDataSet(cut_word_path,fileType='str')#數(shù)據(jù)類型轉(zhuǎn)化forjinrange(len(dataset)):dataset[j]=str(dataset[j])#確定聚類的個(gè)數(shù)k_determin(dataset)if__name__=='__main__':data_dir='../tmp/已拆分?jǐn)?shù)據(jù)'#預(yù)處理后數(shù)據(jù)的存儲(chǔ)位置save_dir='../tmp/已拆分評(píng)論內(nèi)容'#切分評(píng)論內(nèi)容后的存儲(chǔ)位置#高中低選擇的酒店和景區(qū)spot_name=['A39','A23','A06','A12','A34','A01','A41','A04','A27']hotel_name=['H37','H06','H11','H10','H41','H35','H17','H50','H43']#使用K-Means模型進(jìn)行聚類k_means(data_dir,save_dir,spot_name,hotel_name)運(yùn)行景區(qū)和酒店特征聚類代碼后,選擇酒店和景區(qū)部分聚類結(jié)果進(jìn)行展示,具體為景區(qū)A23、A34、A04,以及酒店H06、H35、H43進(jìn)行展示?!瑼23K-Means聚類結(jié)果最優(yōu)K值9主題1:嶺南一去建筑古典江南很大名園公園私家園內(nèi)主題2:蘇州園林老人很漂亮游玩小孩環(huán)境優(yōu)美景點(diǎn)味道綠樹成蔭值得一看主題3:拍照好去處景色私家園林好找花園景致取景虧了秀麗主題4:景色門票景點(diǎn)票價(jià)小貴漂亮建筑小時(shí)沒什么不值主題5:取票便宜很大園區(qū)一去環(huán)境下次舒服風(fēng)景如畫售票處主題6:感覺園子好玩挺大景色很漂亮下次天氣喜歡不值主題7:風(fēng)景清凈好玩喜歡小貴舒服很美園內(nèi)宜人取票主題8:古色古香景色令人短信私家園林小橋流水散步環(huán)境好去處荷花主題9:環(huán)境優(yōu)雅門票一去好玩景色空氣家人便宜清靜……A34K-Means聚類結(jié)果最優(yōu)K值5主題1:開心孩子小孩東西門票取票玩得刺激身份證感覺主題2:挺好玩還好臺(tái)風(fēng)下雨算高價(jià)錢恐龍海螺門票平時(shí)主題3:好玩喜歡刺激下次便宜環(huán)境干凈孩子恐龍危機(jī)景色主題4:小朋友不用玩玩非常適合排隊(duì)大人大熊光頭挺好玩還行主題5:游樂晚上景色開心東西刺激玩得夜場(chǎng)偏少工作人員……A04K-Means聚類結(jié)果最優(yōu)K值9主題1:刺激過山車挺好玩取票下次便宜好多夜場(chǎng)喜歡人太多主題2:身份證入園取票不用買票就行了好玩排隊(duì)訂票入場(chǎng)主題3:感覺好玩刺激總體排隊(duì)東西真的喜歡挺好玩人太多主題4:排隊(duì)人太多小時(shí)不用過山車太久好玩刺激節(jié)假日好久主題5:還好排隊(duì)人太多晚上沒開愉快好多裝扮雄鷹好玩主題6:晚上好玩白天刺激沒什么開放萬圣節(jié)排隊(duì)游樂好多主題7:開心玩得好玩孩子刺激下次小孩取票女朋友過山車主題8:萬圣節(jié)鬼屋氣氛嚇人人太多恐怖好玩排隊(duì)氛圍工作人員主題9:好玩刺激下次景色過山車水上樂園還會(huì)很美人太多……H06K-Means聚類結(jié)果最優(yōu)K值7主題1:入住感受游樂得體離開挺不錯(cuò)很棒打掃衛(wèi)生游泳小時(shí)主題2:干凈衛(wèi)生整潔溫泉房間舒適環(huán)境下次早餐真的主題3:早餐溫泉孩子親子環(huán)境優(yōu)美喜歡泡溫泉工作人員度假味道主題4:下次小朋友還會(huì)喜歡開心環(huán)境小孩早餐兒童大人主題5:房間服務(wù)員溫泉孩子流溪河主動(dòng)晚上早餐喜歡入住主題6:感覺總體溫泉賓至如歸機(jī)會(huì)孩子入住早餐房間感受主題7:環(huán)境溫泉舒服早餐房間舒適水質(zhì)安靜住宿度假……H35K-Means聚類結(jié)果最優(yōu)K值9主題1:不好總體顏色布局女性好像好吃好好好找安靜主題2:前臺(tái)小姐姐房間舒服干凈哥哥漂亮禮貌很漂亮第一次主題3:寬敞舒服干凈衛(wèi)生舒適房間顏色女性好像好吃主題4:衛(wèi)生干凈房間下次交通安靜環(huán)境整潔前臺(tái)第二次主題5:這家每次第幾次溫馨顏色小時(shí)女性好像好吃好好主題6:舒服房間很大環(huán)境好找感覺整潔干凈很棒寬敞主題7:舒適房間干凈很棒環(huán)境安靜溫馨環(huán)境衛(wèi)生通風(fēng)地理位置主題8:房間干凈環(huán)境下次停車場(chǎng)感覺喜歡入住位置安靜主題9:客房干凈床墊服務(wù)員衛(wèi)生舒服前臺(tái)環(huán)境女性好像……H43K-Means聚類結(jié)果最優(yōu)K值9主題1:景觀小蠻感覺交通陳舊珠江老牌超級(jí)停車安靜主題2:衛(wèi)生干凈位置酒店設(shè)施交通一點(diǎn)陳舊這家絕佳禮貌主題3:早餐地段位置下次珠江停車場(chǎng)靠近游泳池小蠻自助主題4:位置裝修珠江小蠻出行景觀空調(diào)稍微合適總體主題5:泳池入住出差寬敞裝修房間珠江早餐旅行環(huán)境優(yōu)美主題6:房間江景景色太舊無敵小蠻味道珠江窗戶工作人員主題7:前臺(tái)地理位置舒服服務(wù)員辦理客服小蠻五星小姐姐不怎么樣主題8:老舊風(fēng)景硬件珠江位置景觀無敵小蠻江景安排主題9:環(huán)境位置珠江早餐小蠻空調(diào)風(fēng)景還來下次晚上聚類結(jié)果分析針對(duì)9個(gè)景區(qū)和9個(gè)酒店進(jìn)行的特色聚類挖掘結(jié)果,由于其挖掘結(jié)果內(nèi)容篇幅較大,所以此處僅展現(xiàn)綜合評(píng)價(jià)為高、中、低3個(gè)層次中各一個(gè)景區(qū)和酒店的分析結(jié)果。其中,景區(qū)選擇A23(高層次)、A34(中層次)和A04(低層次);酒店選擇H06(高層次)、H35(中層次)、H43(低層次)。景區(qū)A23的特色聚類結(jié)果如REF_Ref137115831\h表36REF_Ref132621278\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s16景區(qū)A23的特色聚類結(jié)果主題聚類結(jié)果主題1嶺南一去建筑古典江南很大名園公園私家園內(nèi)主題2蘇州園林老人很漂亮游玩小孩環(huán)境優(yōu)美景點(diǎn)味道綠樹成蔭值得一看主題3拍照好去處景色私家園林好找花園景致取景虧了秀麗主題4景色門票景點(diǎn)票價(jià)小貴漂亮建筑小時(shí)沒什么不值主題5取票便宜很大園區(qū)一去環(huán)境下次舒服風(fēng)景如畫售票處主題6感覺園子好玩挺大景色很漂亮下次天氣喜歡不值主題7風(fēng)景清凈好玩喜歡小貴舒服很美園內(nèi)宜人取票主題8古色古香景色令人短信私家園林小橋流水散步環(huán)境好去處荷花主題9環(huán)境優(yōu)雅門票一去好玩景色空氣家人便宜清靜根據(jù)A23景區(qū)的聚類結(jié)果,提取特征詞中體現(xiàn)特色的關(guān)鍵詞,如“蘇州園林”“古色古香”“舒服”“清凈”等,同時(shí)對(duì)比原評(píng)論進(jìn)行分析,得到A23景區(qū)特色與亮點(diǎn)是:古典園林、占地較大、風(fēng)景優(yōu)美,值得一去。景區(qū)A34的特色聚類結(jié)果如REF_Ref137115837\h表37REF_Ref132621297\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s17景區(qū)A34的特色聚類結(jié)果主題聚類結(jié)果主題1開心孩子小孩東西門票取票玩得刺激身份證感覺主題2挺好玩還好臺(tái)風(fēng)下雨算高價(jià)錢恐龍海螺門票平時(shí)主題3好玩喜歡刺激下次便宜環(huán)境干凈孩子恐龍危機(jī)景色主題4小朋友不用玩玩非常適合排隊(duì)大人大熊光頭挺好玩還行主題5游樂晚上景色開心東西刺激玩得夜場(chǎng)偏少工作人員根據(jù)A34景區(qū)的聚類結(jié)果,提取特征詞中體現(xiàn)特色的關(guān)鍵詞,如“小孩子”“大人”“刺激”“門票”“便宜”等,同時(shí)對(duì)比原評(píng)論進(jìn)行分析,得到A34景區(qū)特色與亮點(diǎn)是:機(jī)動(dòng)游戲樂園、項(xiàng)目刺激、大人和小孩均適合,但人較多影響游玩體驗(yàn)。景區(qū)A04的特色聚類結(jié)果如REF_Ref137115840\h表38REF_Ref132621305\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s18景區(qū)A04的特色聚類結(jié)果主題聚類結(jié)果主題1刺激過山車挺好玩取票下次便宜好多夜場(chǎng)喜歡人太多主題2身份證入園取票不用買票就行了好玩排隊(duì)訂票入場(chǎng)主題3感覺好玩刺激總體排隊(duì)東西真的喜歡挺好玩人太多主題4排隊(duì)人太多小時(shí)不用過山車太久好玩刺激節(jié)假日好久主題5還好排隊(duì)人太多晚上沒開愉快好多裝扮雄鷹好玩主題6晚上好玩白天刺激沒什么開放萬圣節(jié)排隊(duì)游樂好多主題7開心玩得好玩孩子刺激下次小孩取票女朋友過山車主題8萬圣節(jié)鬼屋氣氛嚇人人太多恐怖好玩排隊(duì)氛圍工作人員主題9好玩刺激下次景色過山車水上樂園還會(huì)很美人太多根據(jù)A04景區(qū)的聚類結(jié)果,提取特征詞中體現(xiàn)特色的關(guān)鍵詞,如“取票”“人太多”“排隊(duì)”“萬圣節(jié)”等,同時(shí)對(duì)比原評(píng)論進(jìn)行分析,得到A04景區(qū)特色與亮點(diǎn)是:可以憑身份證直接取票入園、項(xiàng)目好玩刺激、整體項(xiàng)目以夜場(chǎng)為主,總體不錯(cuò),但節(jié)假日人多需要排隊(duì)。酒店H06的特色聚類結(jié)果如REF_Ref137115844\h表39REF_Ref132621313\h所示。表STYLEREF1\s3SEQ表\*ARABIC\s19酒店H06的特色聚類結(jié)果屬性名稱示例主題1入住感受游樂得體離開挺不錯(cuò)很棒打掃衛(wèi)生游泳小時(shí)主題2干凈衛(wèi)生整潔溫泉房間舒適環(huán)境下次早餐真的主題3早餐溫泉孩子親子環(huán)境優(yōu)美喜歡泡溫泉工作人員度假味道主題4下次小朋友還會(huì)喜歡開心環(huán)境小孩早餐兒童大人主題5房間服務(wù)員溫泉孩子流溪河主動(dòng)晚上早餐喜歡入住主題6感覺總體溫泉賓至如歸機(jī)會(huì)孩子入住早餐房間感受主題7環(huán)境溫泉舒服早餐房間舒適水質(zhì)安靜住宿度假根據(jù)H06酒店的聚類結(jié)果,提取特征詞中體現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論