symlink.ch
Wissen Vernetzt - deutsche News für die Welt
 
symlink.ch
FAQ
Mission
Über uns
Richtlinien

Moderation
Einstellungen
Story einsenden

Suchen & Index
Ruhmeshalle
Statistiken
Umfragen

Redaktion
Themen
Partner
Planet

XML | RDF | RSS
PDA | WAP | IRC
Symbar für Opera
Symbar für Mozilla

Freunde
Benutzergruppen
LUG Switzerland
LUG Vorarlberg
LUGen in DE
SIUG
CCCZH
Organisationen
Wilhelm Tux
FSF Europe
Events
LinuxDay Dornbirn
BBA Schweiz
CoSin in Bremgarten AG
VCFe in München
Menschen
maol
Flupp
Ventilator
dawn
gumbo
krümelmonster
XTaran
maradong
tuxedo

 
P2P-Suchmaschine unter GPL: Yacy
Veröffentlicht durch XTaran am Samstag 12. Februar 2005, 18:42
Aus der Ob-da-jetzt-Google-statt-der-RIAA-nach-Strafverfolgung-schreit? Abteilung
Internet Golem berichtet von einer neuen auf einem Peer-to-Peer-Konzept (P2P) basierenden Suchmaschine namens Yacy. Yacy ist im Quellcode verfügbar, steht unter der GPL und ist in Java 2 geschrieben.

Selbst Blacklists von Ad- und Spyware werden bei Yacy ge-share-t. Ob letzteres wirklich so gut ist?

Der DSL-Providerkrieg | Druckausgabe | Los Angeles: Einsparungen durch Open Source  >

 

 
symlink.ch Login
Login:

Passwort:

extrahierte Links
  • Golem
  • Java
  • Golem berichtet
  • Yacy
  • Mehr zu Internet
  • Auch von XTaran
  • Diese Diskussion wurde archiviert. Es können keine neuen Kommentare abgegeben werden.
    Nicht schlecht. (Score:0)
    Von Anonymer Feigling am Saturday 12. February 2005, 19:13 MEW (#1)
    Eigentlich ein geniales Prinzip, aber erstmal abwarten, wie sich das ganze entwickelt.

    Vielleicht wird das ja Googles großer Konkurrent.
    Re: Nicht schlecht. (Score:2)
    Von brummfondel am Sunday 13. February 2005, 02:55 MEW (#4)
    (User #784 Info)
    Ich seh noch nicht der Vorteil gegenüber einer zentralen Suche.

    (a) woher soll da eine Bewertung kommen? Bisher hab ich da nichts gefunden
    (b) erzeugt das massiv Traffic: wenn jede Seite, die über den Proxy besucht wird dann noch gescannt wird, kommt da schon was zusammen. Und wenn ich dann dank Suchergebnis von einem anderen Peer eine Seite besuche, scanne ich die dann auch? Das ergibt ja dann eine ganz neue Dimension von DDos!

    --
    ok> boot net - install
    Re: Nicht schlecht. (Score:0)
    Von Anonymer Feigling am Sunday 13. February 2005, 10:32 MEW (#6)
    (a) Wozu brauchst Du unbedingt Bewertungen, kannst Du nicht selbst entscheiden?

    (b) Über die Technik hab ich keine Ahnung, sollte aber so konzipiert sein, das es keiner Attacke nahe kommt.

    (c) Der Vorteil sollte ein vollkommen unzensiertes Suchergebnis sein, das noch nicht mal Google liefert.
    Re: Nicht schlecht. (Score:2)
    Von brummfondel am Sunday 13. February 2005, 11:21 MEW (#7)
    (User #784 Info)
    (a) Weil eine Relevanz-Bewertung extrem hilfreich ist. Sonst bring eine Suche nach "Auto" erstmal alle Autoverkaufsangebote statt irgendwelcher Infos zum Auto.

    (b) will ich hoffen, meine Tests haben jedenfalls schwer gescannt

    (c) sofern eine Seite jemals besucht wurde

    --
    ok> boot net - install
    Re: Nicht schlecht. (Score:1)
    Von Allo am Sunday 13. February 2005, 12:01 MEW (#11)
    (User #1379 Info)
    a)
    Besseres Ranking kommt noch(Vorschläge im Forum)
    b)
    Wenn YaCy (später) komplett auf DHT basis funktioniert, wird der Traffic nochmal weniger werden(und gezielter)...
    c)
    Dafür laufen im Moment einige Crawler, da die Proxy Methode dazu führen würde dass nur Seiten gefunden werden die besucht werden und nur Seiten besucht die gefunden werden.
    Obwohl ein schlauer Webmaster YaCy installiert und seine Seite ercrawlen lässt.

    Allo(Mitentwickler)
    Re: Nicht schlecht. (Score:1, Lustig)
    Von Anonymer Feigling am Sunday 13. February 2005, 12:55 MEW (#15)
    es sollte einen Button geben
    NTLFM - [n]erv[t]oetende[L]inkfarm[m]elden"
    bei 1000 Meldungen von unterschiedlichen
    Personen wirds gebanned :)

    Re: Nicht schlecht. (Score:2, Informativ)
    Von Allo am Sunday 13. February 2005, 11:58 MEW (#10)
    (User #1379 Info)
    a) Erst mal normales Rankin, Bewertungsfunktion sind geplant
    (b) Es gibt wenig mehr Traffic.
    Wer den Proxy verwendet hat beim indizieren nicht mehr Traffic weil nur indiziert wird was du sowieso besuchst.
    Und die Suchen sind nicht so viel an Traffic.

    Ich benutze hier YaCy mit ISDN und merke keine Verlangsamung.

    Allo(Mitentwickler)
    Schade (Score:0)
    Von Anonymer Feigling am Saturday 12. February 2005, 23:52 MEW (#2)
    Das die leute Java für sowas benutzen müssen, so einen lahmen Speicherfresser will ich mir nicht antun. Ausserdem finde ich es nicht toll das die Software über den integrierten Proxy Server Informationen über mein Surfverhalten sammelt. Ok, die Daten sind laut der Beschreibung auf der Webseite nicht mehr zu einer Person zurückverfolgbar, aber gefallen tut mir die Idee hinter der Software gar nicht.
    Re: Schade (Score:2, Tiefsinnig)
    Von Anonymer Feigling am Sunday 13. February 2005, 01:28 MEW (#3)

    Die Mär von Java als "lahmer Speicherfresser" wird wohl nie aussterben ... obwohl die Performance der Hotspot-VM inzwischen problemlos mit compiliertem Code vergleichbar ist (im Server-Bereich kann man durch Profiling und Recompiling noch mehr an Performance rausholen, als mit compiliertem Code möglich ist) und die Performance-Probleme der GUI seit SWT eigentlich auch der Vergangenheit angehören.

    Aber wie dem auch sei -- ich begrüße es, dass solche Tools in Java geschrieben sind und dadurch praktisch problemlos zwischen einzelnen Plattformen übertragbar sind. Der Erfolg eines P2P-Konzepts hängt nunmal davon ab, wie viele Leute es benutzen, und wenn die Nutzerschaft nicht auf die Linux-Geeks beschränkt ist, kann das der Verbreitung nur zuträglich sein.

    Und zur Informationssammlung via Proxy-Server: Genau das ist doch der Sinn und der Vorteil einer P2P-Suchmaschine! Genau das ist es, was Google nicht kann, und was es möglicherweise erlaubt, den traditionellen Suchmaschinen-Ansatz zu schlagen. Webseiten sind von Menschen für Menschen gemacht, deshalb ist die menschliche Beurteilung einer Seite immer noch die beste Aussage über ihre Relevanz. Google benutzt ein indirektes Mass für die menschliche Beurteilung (Linkpopularität, aka. PageRank) -- mit einem P2P-Ansatz wird es endlich möglich, diese menschliche Beurteilung direkt zu erfassen. Genau da kann man besser werden als Google.

    Außerdem steht noch folgendes auf der ersten Seite: "Built-in caching http proxy, but usage of the proxy is not a requisite." Die Privatsphären-Fanatiker können also einfach die Peter-Lustig-Methode verwenden: "Ihr wisst ja: Abschalten."

    Ich werde mir das Projekt auf jeden Fall mal ansehen.

    Liebe Grüße, Felix.


    Re: Schade (Score:2)
    Von asuzuki am Sunday 13. February 2005, 19:30 MEW (#18)
    (User #422 Info) http://n.ethz.ch/student/asuzuki
    Dem kann ich nur beipflichten. Ich hab den ganzen "Java ist langsam" Mist sowas von satt...
    Re: Schade (Score:1)
    Von Allo am Sunday 13. February 2005, 11:55 MEW (#9)
    (User #1379 Info)
    Es muss java sein, damit es überall läuft.
    Es läuft übrigens ziemlich gut auch auf älteren Computern.

    Dein Surfverhalten ist auch gesichert:
    -man kann nicvht eifnach Links von dir abrufen, man kann nur auf Stichwörter hin welche finden.
    -Du speicherst Wörter von anderen
    -Andere speichern Wörter von dir
    -Die Wörter wandern per distributen Hastable zu den Peers deren Hash dem Wordhash ähnlich ist.

    Allo(Mitentwickler)
    aua (Score:2)
    Von Obri am Sunday 13. February 2005, 09:35 MEW (#5)
    (User #466 Info) http://www.aubry.li
    Ich frage mich was die sich gedacht haben in
    DATA/SETTINGS/httpProxy.conf
    ist das Admin Passwort Base64 encoded gespeichert, md5 würde zum decoden wesentlich mehr CPU Leistung benötigen...

    Naja und meine JRE Collection musste ich wieder um eine weitere JRE erweitern weil yacy natürlich nicht mit den hier schon installierten JRE versionen läuft
    Java ist einfach cool.

    --
    Bahnübergänge sind die härtesten Drogen der Welt.
    Ein Zug und du bist weg!
    Re: aua (Score:1)
    Von Allo am Sunday 13. February 2005, 11:52 MEW (#8)
    (User #1379 Info)
    Wer lokalen Zugriff hat, der kann das Passwort auch löschen, oder einfach so mal was an den Daten ändern.

    Kann man aber trotzdem mal als Anregung aufnehmen.

    Allo(Mitentwickler)
    Re: aua (Score:2)
    Von Obri am Sunday 13. February 2005, 12:18 MEW (#13)
    (User #466 Info) http://www.aubry.li
    Klar kann jeder mit schreibberechtigung auf das File das Passwort ändern, was mich mehr stört, ist das jeder der die Datei lesen kann auch das Passwort rausfinden kann. Das file hat im tar Archiv die berechtigungen auf -rw-r--r-- (644) gesetzt, d.H. es kann eigentlich jeder die Datei lesen.
    --
    Bahnübergänge sind die härtesten Drogen der Welt.
    Ein Zug und du bist weg!
    Re: aua (Score:1)
    Von Allo am Sunday 13. February 2005, 12:27 MEW (#14)
    (User #1379 Info)
    Die Datei ist im tar gar nicht drin... die wird erst erzeugt. Aber es stimmt md5 wär geschickter. Allo
    Re: aua (Score:1)
    Von Orbiter am Sunday 13. February 2005, 13:28 MEW (#16)
    (User #1474 Info) http://www.yacy.net
    Das Passwort ist http-konform erst md5- und dann base64-Kodiert. genau in der Form wie es in den Settings steht wird es auch vom Browser an den YaCy-Server geschickt. Man kann hier also nicht mehr Sicherheit erzeugen. Dein Passwort ist aber trotzdem relativ sicher, wenn du YaCy nur lokal administrierst - dann geht das http-authenticate ja auch nur lokal im Netz herum, und kann nicht abgehört werden. Beim Administrieren von ausserhalb muss man aufpassen. Es ist ja auch möglich, ein https davorzusetzten (nicht mit YaCy, sondern mit anderen Tools), dann bist du wieder ganz sicher.
    Re: aua (Score:2)
    Von Obri am Sunday 13. February 2005, 14:39 MEW (#17)
    (User #466 Info) http://www.aubry.li
    Ich sehe da nichts von md5 $ grep adminAccountBase64 httpProxy.conf | cut -d= -f2 | base64 -d admin:passwort $ Du meinst ja sowieso etwas anderes, darüber das einer das Passwort mitsniffen kann habe ich mich nicht beschwert, dafür kann auch YaCy nichts. Mir ist nur aufgefallen dass das Passwort im Configfile von YaCy mit Base64 "verschleiert" ist, wenn man sich schon die Mühe macht das Passwort zu verstecken dann sollte man es so machen das man das Passwort nicht so einfach wieder zurückbekommt.
    --
    Bahnübergänge sind die härtesten Drogen der Welt.
    Ein Zug und du bist weg!
    YaCY Links: (Score:2, Informativ)
    Von Allo am Sunday 13. February 2005, 12:03 MEW (#12)
    (User #1379 Info)
    Hier noch ein paar Links:
    www.yacy-suche.de.vu (deutsche Seite)
    www.yacy-forum.de (Forum)
    www.suma-lab.de:8080 (Demo)

    http://suma-ev.de/downloads/yacy-haz.pdf (Artikel in der HAZ)

    Allo(Mitentwickler)
    robot.txt (Score:2)
    Von brummfondel am Tuesday 15. February 2005, 14:12 MEW (#19)
    (User #784 Info)
    Die robot.txt scheint ihn aber nicht zu interessieren - und er ist damit voll in meinen Bot-Trap reingerannt.

    --
    ok> boot net - install

    Linux User Group Schweiz
    Durchsuche symlink.ch:  

    Never be led astray onto the path of virtue.
    trash.net

    Anfang | Story einsenden | ältere Features | alte Umfragen | FAQ | Autoren | Einstellungen