Volltextrecherche im Internet Archive mit Open Library

Open Library ist „ein Projekt zur kollaborativen Erstellung einer auf einer bibliographischen Datenbank basierenden Online-Bibliothek. Selbsterklärtes Ziel der Open Library ist es, eine eigene Webseite für jedes bislang veröffentlichte Buch zu schaffen. In vielen Fällen wird dabei über den bibliographischen Nachweis hinaus auch der Zugang zum Digitalisat des jeweiligen Buchtitels mit hinterlegtem Volltext ermöglicht.“ (Wikipedia: Open Library)

Als Teilprojekt des Internet Archive eignet sich Open Library dabei auch für die Suche in den dort enthaltenen Beständen. Unter der Rubrik „Digitale Medien“ kann nun auch über den Karlsruher Virtuellen Katalog (KVK) im Internet Archive gesucht werden (Klaus Graf in Archivalia).

In einem früheren Beitrag habe ich bereits vorgestellt, wie mit dem Site:-Operator per Google-Suche auf die Volltexte im Internet Archive zugegriffen werden kann. Wikisource liefert hier eine gut durchdachte Variante:

site:archive.org/stream/ filetype:txt *
(Das Sternchen * im Eingabefeld muss dann nur 
durch den gewünschten Suchbegriff ersetzt 
und die Suche gestartet werden.)

Klaus Graf macht in Archivalia auf die Volltextsuche der Open Library aufmerksam. Diese möchte ich anhand des Suchbegriffs „Allmende“ vorstellen und lasse nach diesem suchen. Es erscheint eine Trefferliste mit der Kurzfassung der bibliographischen Angaben jedes gefundenen Werkes:

AllmendeA

 

 

 

 

 

 

 

 

 

Im folgenden verwende ich „Beiträge zur kenntnis der allmendverfassung“ von „Ahron Eliasberg“ als Beispiel. Mit einem Mausklick auf den Namen des Werkes oder Autors gelangt man zu den jeweiligen Datensätzen der Open Library. Unter den bibliographischen Angaben der Suchtreffer werden ausgewählte Fundstellen mit dem hervorgehobenen Suchbegriff angezeigt. Zwar erscheint über der Liste die Anzahl aller ermittelten Treffer, aber leider keine Anzahl der Treffer innerhalb eines bestimmten Werkes. Die hier angezeigten Fundstellen sind nicht vollständig, erst die Funktion „snippets in situ“ zeigt die einzelnen Treffer im Originalkontext:

AllmendeB

 

 

 

 

 

 

 

 

„beitrgezurkennt00eliagoog“ ist der Identifier des Items im Internet Archive, mit dem die Links zu den Metadaten und in diesem Fall zum Volltext gebildet werden:

https://archive.org/details/beitrgezurkennt00eliagoog

Der „Read“-Button mit dem Buchsymbol führt direkt zum Online-Reader des Internet Archive. Auf der Leiste zum Blättern erscheinen nun Lesezeichen für die Fundstellen im geöffneten Volltext:

AllmendeC

 

 

 

 

 

 

 

 

 

 

Mit den Lesezeichen lassen sich nicht nur die einzelnen Seiten mit den Fundstellen gezielt aufrufen, sondern sie ermöglichen eine Vorschau auf die jeweilige Seite, die aber nicht vollständig ist.

Blättert man durch die Seiten im Volltext, werden die gefundenen Wörter farbig unterlegt angezeigt. Durch die hier vorgestellten Funktionen ist diese Suche zur Orientierung überaus praktisch, doch nach wie vor gilt Klaus Grafs Kommentar:

Jedes beim Internet Archive hochgeladene Buch erhält eine OCR, die bei Frakturschriften nach wie vor unbrauchbar ist und bei Antiquaschriften in der Regel auch nicht besonders gut. Dieser E-Text wird häufig von der Google-Websuche erfasst.

Für dieses Problem gibt es in Wikisource ein paar Suchtipps. Nach einigen Probeläufen halte ich die Suche mit dem Site:-Operator von Google nach wie vor für ergiebiger.


Ähnliche Beiträge

Die Stadtbibliothek Birmingham wird morgen eröffnet

Das folgende Foto aus dem Jahr 2010 zeigt die alte Central Library in Birmingham. Der hier 2012 veröffentlichte Kurzfilm “The Very Last Plea From My Heart” war als eine Reminiszenz an das alte Gebäude gedacht. Das 2010 im Blog veröffentlichte Video bot damals einen Vorgeschmack auf die neue Einrichtung, welche morgen eröffnet wird.

Andreas Mittrowann berichtete aktuell auf Globolibro sehr ausführlich über den Neubau der Kommunalbibliothek der Stadt mit der zweitgrößten Einwohnerzahl Großbritanniens. Sie wird morgen offiziell eröffnet und damit die größte öffentliche kommunale Bibliothek Europas sein. Das folgende Video mit dem Titel „First look at Birmingham’s new £188m ‚bling‘ library“ aus dem britischen Guardian gibt Auskunft über den Neubau der Central Library Birmingham. Es kommen auch der Direktor und die Kreativarchitektin zu Wort. Der Zuschauer erhält einen ersten Einblick vom Inneren und Äußeren des Gebäudes.

„Not everybody approves of the new library ethos, summarised as being „from collection to connection“. Some remain aghast at the encroachment of the technological revolution, which is not only reshaping the world but reconfiguring the public library along with it. Whether 19th-century library pioneers would recognise these 21st-century buildings may be questionable – but once inside they would feel at home. Even today, the world inside the library has changed less than the world outside.“ Ken Worpole (publiziert in Contemporary Library Architecture)

 

 


Ähnliche Beiträge

The Internet Archive im Film

Im Internet Archive werden Internetdokumente langzeitarchiviert, um auch die Geschichte des Internets und dessen Inhalte zu erhalten. Das Archive ist derzeit die weltgrößte Online-Bibliothek der Welt. In ihr sind 10 Petabytes Informationen (Bücher,Texte, Webseiten, Filme, Audios, Live-Musik, Fernsehsendungen) gespeichert. Um das Erreichen des 10-Petabyte-Meilensteins zu feiern, wurde dieses Video im Oktober 2012 während der „Books in Browsers Conference“ und der „10 Petabyte Celebration“ produziert.

Im ersten Teil des Videos sind Brewster Kahle, Gründer des Internet Archives und seine Kollegen, Robert Miller (Bücher) und Alexis Rossi (Websammlung) zu sehen. Sie erklären ihre Mission, universellen Zugang zum Wissen der Welt zu bieten. Das Video beinhaltet auch eine Tour durch das Hauptquartier des Internet Archives in San Francisco, das Scan-Zentrum für Bücher und die Buchaufbewahrung in Richmond, Karlifornien.

Internet Archive from Deepspeed media on Vimeo.

Directed by Jonathan Minard
Cinematography by John Behrens, Alexander Porter, and Fearghal O'dea
Project supported by Eyebeam


Ähnliche Beiträge