14 Millionen historische Bilder auf Flickr

Image from page 24 of  Evidence as to man s place in nature   1863    Flickr   Photo Sharing

Kalev Leetaru von der Georgetown University realisierte eine Kooperation des Internet Archive und des Bilderdienstes Flickr. Zusammen sollen zwei Millionen ausgewählte, urheberrechtsfreie Bücher mit insgesamt mehr als 600 Millionen Seiten und 14 Millionen Illustrationen gescannt werden und bei Flickr erscheinen. Das Durchstöbern wird sich lohnen!

Historische Bildaufnahmen oder Zeichnungen sind ein ungemein spannender Fundus für geschichtlich Begeisterte. Das Projekt „The Internet Archive“ setzt hier an und erstellt ein riesiges Online-Archiv, das den Wandel der Zeit in bis zu 500 Jahre alten Bildern visualisiert. Aktuell hat man mehr als 2,6 Millionen Illustrationen und Bilder ins Netz geladen. Es steht also noch viel Arbeit an, denn eine staubfreie Online-Bibliothek ist nicht nur für Allergiker und Amathophobiker interessant. Da ein spezielles Werkzeug sämtliche Texte der Bücher erfasst und damit automatisch Tags zu den Bildern generiert, entsteht eine voll durchsuchbare Datenbank. Binnen weniger Sekunden kann man so also einen schönen, einzigartigen und vielleicht auch einprägsamen Blick auf die Vergangenheit werfen.

In einem Blogbeitrag heißt es dazu: “Weil wir die Bücher mit OCR erfassen, konnten wir etwa 500 Wörter vor und nach jedem Bild anfügen. Sie können sich die Sammlung also nicht nur ansehen und durchklicken, sondern zu jedem Bild etwas lesen. Stellen Sie sich eine Volltext-Suche für Bilder vor!”

Die OCR-Software des Internet Archive ist eigentlich für die Digitalisierung von Texten zuständig. Sie verfügt über ein eigenes Modul, um Bilder von der Erfassung auszuschließen. Hier setzt Leetaru mit einem neuen Tool an: Es macht solche Auslassungen ausfindig, sucht in den Original-Scans nach dem ausgelassenen Bereich und speichert ihn als JPEG-Datei. Diese werden zu Flickr hochgeladen, sollten aber angesichts einiger irrtümlich hochgeladener Leerstellen vielleicht doch noch einmal gesichtet werden.

Der BBC gegenüber erklärte der Forscher, die Sammlung ermögliche Besuchern eine Zeitreise: “Tippen sie mal “telephone” ein, und Sie werden feststellen, dass alle frühen Bilder des Telefons Geschäftsleute zeigen – überwiegend Männer. Später wandelt es sich in ein Werkzeug, um Familien zu verbinden. Eine interessante Bildfolge bietet auch die Eisenbahn, auf Englisch ‘railroad’: In den ersten Bildern geht es um Fortschritt und Verändern der Welt, später wird sie Teil des Alltags.”

Den genutzten Code wollen Leetaru und das Internet Archive später auch Partnern zur Verfügung stellen, die dann zusätzliche Bilder beitragen können. Die Sammlung ist auf Flickr jedermann zugänglich. Flickr gehört bekanntlich zu Yahoo. Es ist wohl nicht zufällig auch Sponsor von Leetarus Lehrstuhl.

Tipp: Wie gut kennst du dich mit der europäischen Technologie-Geschichte aus? Überprüfe dein Wissen – mit 15 Fragen auf silicon.de.

Tags :Quellen:The Internet ArchiveVia:Mit Material von Florian Kalenda, ZDNet.de

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Advertising