Open Source web tools written in Java
Κάποιες χρήσιμες λίστες εργαλείων για μανιακούς συλλέκτες του διαδικτύου (universal mirrors, όπως τους λέει ο Τάσος..).
Το Spidering Hacks είναι ένας εξαιρετικά χρήσιμος τσελεμεντές για αυτοματισμούς διαδικτυακού καβατζώματος με Perl, ψάχνοντας όμως για αντίστοιχα εργαλεία σε Java, βρήκα τα παρακάτω, στο Manageability.org, το άπαιχτο blog του Carlos Perez:
- Screen Scraping Tools Written in Java
- Open Source Web Crawlers Written in Java
- Open Source Full Text Search Engines Written In Java
- Open Source Personal Proxy Servers Written In Java
ΥΓ: Άντε και καβατζώσαμε το μισό δίκτυο, μετά τι θα το κάνουμε; Δεν έχω ιδέα, αλλά ελπίζω να μάθω μέχρι το καλοκαίρι, πριν γεμίσουν οι δίσκοι: ένα από τα μαθήματα του μεταπτυχιακού μου έχει ως θέμα το data mining..