Die Jagd nach RSS-Feeds
Nachdem mir letztens meine Tiny Tiny RSS abgeraucht ist, und sie inzwischen lauffähig in nen trendy Container gewandert ist musste die vorherigen Feeds wieder zusammengesucht werden.
Warum muss ich das ganze wieder machen, ratet mal wessen Backup der Datenbank anderthalb Jahre alt ist. Aber nachdem meine Defintion von wichtigen Daten ist:
Wichtige Daten haben ein Backup.
hab ich mit mir selbst kein Mitleid. Dabei ist bewusst geworden, dass sich Feeds nach ihrer Auffindbarkeit beurteilen lassen. Manche Betreiber stellen sie sichtbar zur Verfügung oder zumindenst ohne den Seitenquelltext zu bemühen. Dazu gehören unter anderen Open-Source Sofwareprojekte, Newsseiten und Blogs. Sie wollen die Inhalte einfach zur Verfügung stellen und behalten das archaische Format hoch.
Die zweite Kategorie sind die Seiten, die den Feed im Quelltext versteckt haben, meistens im html-header, aber immer noch gut auffindbar. Meistens sieht der Block wie folgt aus:
<html>
<head>
...
<link rel="alternate" type="application/atom+xml" href="https://triantium.ddns.net/feed.xml">
<link rel="alternate" type="application/json" href="https://triantium.ddns.net/feed.json">
...
</head>
<body>...
</body>
<html>
Und ja ich gehöre wohl auch zu der Sorte ^^. Sie sind noch relativ schnell auffzufinden. Ich gehe dazu wie folgt vor:
- Öffnen der gewünschten Seite im Webbrowser (in meinem Fall Firefox)
- Anzeigen des Quelltextes mit CTRL + U
- Aufrufen der Suchmaske mit CTRL + F
- suche "alternate" und hoffe was zu finden.
- suche "rss" und hoffe was zu finden.
- suche "atom" und hoffe was zu finden.
- verwirrtes dreinschauen und alternativen überlegen
Der letze Punkt bekommt irgendwann seinen eigenen Blogeintrag. Wie ihr seht ist da schon etwas mehr Arbeit auf eurer Seite nötig als nur klickbaren Links zu folgen. Aber wenigstens sind sie da, egal ob sie von einem CMS oder was auch immer generiert worden sind. Mit der Methode habe ich bei den meisten Seiten, die irgendeine Art der Nachrichtendarbietung haben noch Erfolg.
Eine Erleichterung ist es manchmal wenn mann die vorkonfigurierten Feeds der diversen CMS kennt. Selbst wenn der Link nirgendwo auftaucht.
CMS | Einsatz | URL | Kommentar |
Publii | Fancy-JS-Hipster | https://{domain}/feed.xml | |
Wordpress | Das Jedermanns-CMS | https://{domain}/feed/ | |
Open2C | Kommunen in Bayern | https://{domain}/export/rss.php?id=1 | id=1 sind die Pressemitteilungen, die anderen hab ich noch nie gesehen, dass sie benutzt werden. |
Django CMS Community | Landesfeuerwehrverband | keine Ahnung |
Die Situation mit Django CMS ist mir selbst ein Rätsel, warum sie die Feeds nur in der bezahlten Version anbieten, in der kostenlosen aber nur die Sitemap enthalten ist. Vermutlich ist es die Sitemap zur SEO wesentlich wichtiger als die Nutzer ihres Endprodukts auf dem laufenden zu halten. Naja vielleicht hab ich mal Lust mich in python reinzufrimmel und es ihnen als PR unterzujubeln. Dann müssen natürlich nur noch alle Seiten updaten, die ich abbonieren will... Ich glaub da net dran.
Das war erst mal der erste Schlag, es gibt noch ein paar andere Dienstleister, die ihren eigenen Eintrag verdient haben. Aber jetzt erstmal weiter mit dem zusammensuchen meiner Lieblingsfeeds.