Python-Grundlagen-Tutorial, Projekt 4, Nachrichtenaggregation-Python-Tutorial-php.cn

Python-Grundlagen-Tutorial, Projekt 4, Nachrichtenaggregation

不言

Freigeben： 2018-04-03 09:17:34

Original

1826 Leute haben es durchsucht

Dieser Artikel stellt hauptsächlich die Nachrichtenaggregation des Python Basic Tutorial Project 4 im Detail vor. Interessierte Freunde können sich auf das Buch „Python Basic Tutorial“ beziehen. Die vierte Übung ist die Nachrichtenaggregation . Eine Art von Anwendung, die heutzutage selten ist, zumindest habe ich sie noch nie genutzt, wird auch Usenet genannt. Die Hauptfunktion dieses Programms besteht darin, Informationen aus bestimmten Quellen (hier Usenet-Newsgroups) zu sammeln und diese Informationen dann in bestimmten Zieldateien zu speichern (hier werden zwei Formen verwendet: Nur-Text- und HTML-Dateien). Die Verwendung dieses Programms ähnelt in gewisser Weise dem aktuellen Blog-Abonnement-Tool oder RSS-Abonnenten.

Gehen Sie zuerst den Code durch und analysieren Sie ihn dann einzeln:

from nntplib import NNTP
from time import strftime,time,localtime
from email import message_from_string
from urllib import urlopen
import textwrap
import re
day = 24*60*60
def wrap(string,max=70):
    &#39;&#39;&#39;
    &#39;&#39;&#39;
    return &#39;\n&#39;.join(textwrap.wrap(string)) + &#39;\n&#39;
class NewsAgent:
    &#39;&#39;&#39;
    &#39;&#39;&#39;
    def __init__(self):
        self.sources = []
        self.destinations = []
    def addSource(self,source):
        self.sources.append(source)
    def addDestination(self,dest):
        self.destinations.append(dest)
    def distribute(self):
        items = []
        for source in self.sources:
            items.extend(source.getItems())
        for dest in self.destinations:
            dest.receiveItems(items)
class NewsItem:
    def __init__(self,title,body):
        self.title = title
        self.body = body
class NNTPSource:
    def __init__(self,servername,group,window):
        self.servername = servername
        self.group = group
        self.window = window
    def getItems(self):
        start = localtime(time() - self.window*day)
        date = strftime(&#39;%y%m%d&#39;,start)
        hour = strftime(&#39;%H%M%S&#39;,start)
        server = NNTP(self.servername)
        ids = server.newnews(self.group,date,hour)[1]
        for id in ids:
            lines = server.article(id)[3]
            message = message_from_string(&#39;\n&#39;.join(lines))
            title = message[&#39;subject&#39;]
            body = message.get_payload()
            if message.is_multipart():
                body = body[0]
            yield NewsItem(title,body)
        server.quit()
class SimpleWebSource:
    def __init__(self,url,titlePattern,bodyPattern):
        self.url = url
        self.titlePattern = re.compile(titlePattern)
        self.bodyPattern = re.compile(bodyPattern)
    def getItems(self):
        text = urlopen(self.url).read()
        titles = self.titlePattern.findall(text)
        bodies = self.bodyPattern.findall(text)
        for title.body in zip(titles,bodies):
            yield NewsItem(title,wrap(body))
class PlainDestination:
    def receiveItems(self,items):
        for item in items:
            print item.title
            print &#39;-&#39;*len(item.title)
            print item.body
class HTMLDestination:
    def __init__(self,filename):
        self.filename = filename
    def receiveItems(self,items):
        out = open(self.filename,&#39;w&#39;)
        print >> out,&#39;&#39;&#39;
        <html>
        <head>
         <title>Today&#39;s News</title>
        </head>
        <body>
        <h1>Today&#39;s News</hi>
        &#39;&#39;&#39;
        print >> out, &#39;<ul>&#39;
        id = 0
        for item in items:
            id += 1
            print >> out, &#39;<li><a href="#" rel="external nofollow" >%s</a></li>&#39; % (id,item.title)
        print >> out, &#39;</ul>&#39;
        id = 0
        for item in items:
            id += 1
            print >> out, &#39;<h2><a name="%i">%s</a></h2>&#39; % (id,item.title)
            print >> out, &#39;<pre class="brush:php;toolbar:false">%s

' % item.body print >> out, ''' ''' def runDefaultSetup(): agent = NewsAgent() bbc_url = 'http://news.bbc.co.uk/text_only.stm' bbc_title = r'(?s)a href="[^" rel="external nofollow" ]*">\s*\s*(.*?)\s*' bbc_body = r'(?s)\s*
\s*(.*?)\s*<' bbc = SimpleWebSource(bbc_url, bbc_title, bbc_body) agent.addSource(bbc) clpa_server = 'news2.neva.ru' clpa_group = 'alt.sex.telephone' clpa_window = 1 clpa = NNTPSource(clpa_server,clpa_group,clpa_window) agent.addSource(clpa) agent.addDestination(PlainDestination()) agent.addDestination(HTMLDestination('news.html')) agent.distribute() if __name__ == '__main__': runDefaultSetup()

Nach dem Login kopieren

Dieses Programm sollte Zuerst wird die Analyse als Ganzes analysiert. Der Schlüsselteil ist NewsAgent. Seine Funktion besteht darin, die Nachrichtenquelle zu speichern, die Zieladresse zu speichern und dann den Quellserver (NNTPSource und SimpleWebSource) und die Klasse zum Schreiben von Nachrichten (PlainDestination und HTMLDestination) aufzurufen. jeweils. Hier ist also ersichtlich, dass NNTPSource speziell zum Abrufen von Informationen über den Newsserver und SimpleWebSource zum Abrufen von Daten über eine URL verwendet wird. Die Funktionen von PlainDestination und HTMLDestination sind offensichtlich. Ersteres wird zum Ausgeben des erhaltenen Inhalts an das Terminal verwendet, und letzteres wird zum Schreiben von Daten in die HTML-Datei verwendet.

Mit diesen Analysen schauen wir uns den Inhalt des Hauptprogramms an. Das Hauptprogramm dient dem Hinzufügen von Informationsquellen und der Ausgabe von Zieladressen zu NewsAgent.

Dies ist zwar ein einfaches Programm, aber dieses Programm verwendet Layering.

Das obige ist der detaillierte Inhalt vonPython-Grundlagen-Tutorial, Projekt 4, Nachrichtenaggregation. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!