In diesem Artikel wird hauptsächlich die Lösung für den Python-Benutzerkommentar-Tag-Abgleich vorgestellt, die einen bestimmten Referenzwert hat.
Wir haben Benutzerkommentare beobachtet und festgestellt: Attributwörter Sie erscheinen oft zusammen mit emotionale Wörter, da Benutzer bei der Beschreibung von Attributen normalerweise Emotionen ausdrücken und Attribute Objekte des emotionalen Ausdrucks sind. Es wurde auch festgestellt, dass Attributwörter und Wörter mit besonderen Emotionen grundsätzlich Substantive oder Adjektive (formale Prädikate) sind.
Das Flussdiagramm des Algorithmus lautet wie folgt:
Die Kommentardaten lauten wie folgt:
Der Code lautet wie folgt:
#encoding=utf-8 ############################# # # 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 # # @author:licl # ############################## fdata = open('JD_DFB_comments_out.txt','r') Output = open('Pattern_Result.txt','a') try: data = fdata.readlines() listline = [] for line in data: listline = line.replace(" ","/") listline = listline.split("/") i = 1 while i < len(listline): if listline[i] != "名词": i = i+2 else: new_list = ["","",""] new_list[0] = listline[i-1] a = i-1 i = i+2 while i < len(listline): if listline[i] == "标点": i = i+2 break else: if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太': new_list[1] = listline[i-1] if listline[i] == "形容词" or listline[i] == "形谓词": new_list[1] += listline[i-1] b = i-1 t = (b-a)/2 new_list[2] = str(t) for line in new_list: Output.write(line + " ") Output.write("\n") break else: i = i+2 except: print "‘文件不存在'或者‘文件无法打开'" finally: fdata.close() Output.close()
Verwandte Empfehlungen:
Beispielerklärung des Python-Benutzerverwaltungssystems
Das obige ist der detaillierte Inhalt vonLösung für den Abgleich von Python-Benutzerkommentar-Tags. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!