symlink.ch
Wissen Vernetzt - deutsche News für die Welt
 
symlink.ch
FAQ
Mission
Über uns
Richtlinien

Moderation
Einstellungen
Story einsenden

Suchen & Index
Ruhmeshalle
Statistiken
Umfragen

Redaktion
Themen
Partner
Planet

XML | RDF | RSS
PDA | WAP | IRC
Symbar für Opera
Symbar für Mozilla

Freunde
Benutzergruppen
LUG Switzerland
LUG Vorarlberg
LUGen in DE
SIUG
CCCZH
Organisationen
Wilhelm Tux
FSF Europe
Events
LinuxDay Dornbirn
BBA Schweiz
CoSin in Bremgarten AG
VCFe in München
Menschen
maol
Flupp
Ventilator
dawn
gumbo
krümelmonster
XTaran
maradong
tuxedo

 
Verwirrung von Adress-Suchrobotern
Veröffentlicht durch bit am Freitag 18. Mai, 09:44
Aus der gegen-spam Abteilung
Internet Wpoison ist ein kleines Perlscript, welches Roboter auf der Suche nach E-Mail Adressen gehoerig verwirrt. Eine tolle Idee um gegen Spam anzukaempfen!

Auf http://www.monkeys.com/wpoison/ findet man die Anleitung und das Script selbst. Es wird am besten auf allen Webseiten eingebunden.

Der Trick ist simpel: Das Script generiert eine Anzahl random E-Mail Adressen und mehrere Links zu sich selbst zurueck. In den Haedern ist die Option NOINDEX und NOFOLLOW gestzt - eine "richtige" Suchmaschine wie Google oder Altavista beruecksichtigen diese Tags und lassen die Seite links liegen.

Suchroboter von E-Mail Adresssammlern sind ueblicherweise darauf getrimmt, alle Seiten einer Website zu scannen. Sie fallen mit diesem Script in einen Endlosloop und fuellen ihre Datenbank mit unzaehligen ungueltigen Adressen.

Ein Muster des Outputs findet Ihr unter http://www.rubis.ch/guestbook.cgi.

Polen als Vorbild in Sachen OSS | Druckausgabe | neuer Linux-Wurm flickt Lion-Löcher  >

 

 
symlink.ch Login
Login:

Passwort:

extrahierte Links
  • http://www.monkeys.com/wpoison /
  • Google
  • Altavista
  • http://www.rubis.ch/guestbook. cgi
  • Wpoison
  • Mehr zu Internet
  • Auch von bit
  • Diese Diskussion wurde archiviert. Es können keine neuen Kommentare abgegeben werden.
    Gute Idee, die üblichen Schächen (Score:1)
    Von maol (maol.symlink.ch) am Friday 18. May, 10:30 MET (#1)
    (User #1 Info) http://www.maol.ch/
    Denn was macht der Postmaster einer Domain, die zufälligerweise von wpoison ausgewählt wurde, wenn er immer mehr Spam erhält? Und was macht der User, der das Pech hat, dass seine Emailadresse zufälligerweise von wpoison verwendet wurde?

    Auch wenn Username und Domain zufällig generiert werden, schützt das nicht vor Realworld Adressen.

    --
    the dorkest dork is a dork that dorks "dork"

    Re:Gute Idee, die üblichen Schächen (Score:0)
    Von Anonymer Feigling am Friday 18. May, 12:51 MET (#4)
    Theorie: Du hast recht.

    Praxis: Natürlich besteht das Risiko, aber es ist doch kaum grösser als jenes, sonst irgendwie indexiert zu werden. Ausserdem wird oft Spam einfach an eine gültige Domain versandt, die wohl direkt im WHOIS geholt wurde. Ich erhielt auch schon Mails an "inof@[meinedomain]", obwohl ich keinen User "info" definiert habe.

    Fazit: Es herrscht Krieg im Bereich "Spam". Dabei sind "Kollateralschäden" garantiert. Das Bestreben, sie zu minimieren, ist alles, was bleibt.

    Dazu ein Vorschlag: Ausschlusslisten erstellen oder gleich Domainnamen aus ORBS/MBL-Liste verwenden.

    PS: Bin gerade zu faul, ein Account zu eröffnen. Deshalb "Anonymer Feigling" (müsste heissen "Anonymes Faultier"
    Re: Gute Idee, die üblichen Schwächen (Score:2, Interessant)
    Von XTaran (symlink at deuxchevaux dot org) am Friday 08. June, 02:04 MET (#6)
    (User #129 Info) http://abe.home.pages.de/

    Nur ein paar nächtliche Gedanken: Heute habe ich bei einem ln -s User die e-Mail-Adresse root@localhost gesehen. Finde ich eigentlich auch 'ne nette Idee, gegen Spammer vorzugehen.

    Man könnte in so einem Skript auch e-Mail-Adressen àla root@$REMOTE_HOST oder postmaster@$REMOTE_ADDR ausgeben lassen, das trifft dann nur jemanden auf dem Rechner, der die Adressen sammelt und im günstigsten Fall sogar jemanden, der was gegen den Spammer tut. (Vorausgesetzt, alle Proxies dazwischen erkennen die dynamische Seite. :-).

    Wer sich etwas mehr Mühe machen möchte, macht einen Lookup, wem der Netblock von $REMOTE_ADDR gehört und bindet abuse@<netblock-owner> als Adresse ein. *eg*. Einfach-Variante davon (PERL Syntax): ($email = $REMOTE_HOST) =~ s/^.*\.([-\w]+\.[-\w]{2,3})$/abuse\@$1/;

    ... nur so'ne Idee. :-)


    -- 
    Einer der Gnutella-Klone heißt Gnutoka, und ich frag mich, wann Gnusspli rauskommt...
    Auch ne Falle für Suchmaschinen? (Score:0)
    Von Anonymer Feigling am Friday 18. May, 11:43 MET (#2)
    Da frage ich mich natürlich, was passiert, wenn
    so ein harmloser Crawler von Google in so eine
    Wpoison Falle gerät...

    Grey


    Re:Auch ne Falle für Suchmaschinen? (Score:1)
    Von maol (maol.symlink.ch) am Friday 18. May, 12:18 MET (#3)
    (User #1 Info) http://www.maol.ch/
    Und ich frage mich, ob Du den Artikel richtig gelesen hast: Google wird ausdrücklich erwähnt, und es wird gesagt, dass sie wegen den NOFOLLOW und NOINDEX Tags nicht auf diese Seite gerät.

    --
    the dorkest dork is a dork that dorks "dork"

    Probleme und Alternativen (Score:1)
    Von XTaran (symlink at deuxchevaux dot org) am Friday 18. May, 16:39 MET (#5)
    (User #129 Info) http://abe.home.pages.de/

    Irgendwie erinnert mich das an Teergrubing, insbesondere, weil der Spam-Roboter (falls er nicht parallel geschrieben ist) dort festgehalten wird.

    Allerdings verursacht diese Art von Anti-Spammer-methiden dasselbe Problem wie Fake-eMail-Adressen im Usenet: Traffic. Und den wollen wir ja eigentlich auch nicht. Von den restlichen (teils auch schon genannten) Problemen wie genervten Posthamstern -äh- Postmastern mal ganz abgesehen.

    Meine Lösung gegen unintelligente eMail-Adressen-Sammeltools im Web ist, sämtliche Klammeraffen (und evtl. auch Punkte) in eMail-Adressen durch &#064; zu ersetzen, da dies das Adressensammeln eher verhindert als Traffic mit ungültigen Adressen erzeugt. Ich glaube nicht, daß viele Spammer-Tools auf sowas achten. Auch wenn es vielleicht nicht ganz standard-konform ist (so tief bin ich in SGML nicht drin), es funktioniert in allen Browsern in denen ich es getestet habe (NN, Opera, Konqueror, Lynx, w3m, links), auch mit mailto:-Links.

    Unter http://fsinfo.cs.uni-sb.de/~abe/download/#scramblehtml findet sich ein Programm, das HTML auf diese Weise für Menschen und billige Web-Roboter praktisch unlesbar macht, in dem es alle Zeichen in Text und alle URLs durch ihre numerischen Entities ersetzt. Aktuell bin ich grade dabei, eine Variante zu schreiben, die speziell eMail-Adressen "vercodiert", sollte dann auch dort zu finden sein.


    -- 
    Einer der Gnutella-Klone heißt Gnutoka, und ich frag mich, wann Gnusspli rauskommt...

    Linux User Group Schweiz
    Durchsuche symlink.ch:  

    Never be led astray onto the path of virtue.
    trash.net

    Anfang | Story einsenden | ältere Features | alte Umfragen | FAQ | Autoren | Einstellungen