PDFlib TET PDF IFilter – Enterprise PDF Search for Windows

TET PDF IFilter extrahiert Text und Metadaten aus PDF-Dokumenten, um sie Retrieval-Produkten unter Windows zugänglich zu machen. Damit haben Sie die Möglichkeit, die PDF-Dokumente auf Ihrem Desktop-Computer, dem Enterprise-Server oder im Web zu durchsuchen. TET PDF IFilter basiert auf dem patentierten Entwicklungswerkzeug PDFlib Text Extraction Toolkit (TET), mit dem sich Text zuverlässig aus PDF-Dokumenten extrahieren lässt. TET PDF IFilter ist eine stabile Implementierung der Microsoft IFilter-Schnittstelle zur Voll­textindizierung und arbeitet mit allen Produkten zur Textabfrage zusammen, die die IFilter-Schnittstelle unterstützen, z.B. SharePoint oder SQL Server. Diese Produkte verwenden für jedes Dateiformat, z.B. HTML, ein anderes formatspezifisches Filterprogramm, das IFilter genannt wird. TET PDF IFilter ist ein solches Filterprogramm für PDF-Dokumente. Die Benutzerschnittstelle zum Durchsuchen der Dokumente kann Windows Explorer, ein Web- oder Datenbank-Frontend, ein Abfrageskript oder eine selbst ent­wickelte Anwendung sein. Alternativ zur interaktiven Suche mittels Benutzeroberfläche lassen sich Anfragen über eine Programmierschnittstelle absetzen.

Patentierte TET-Technologie

PDFlib TET, das die Grundlage von TET PDF IFilter bildet, wurde erstmals 2002 veröffentlicht und bewährt sich weltweit in Server- und Desktop-Systemen. TET extrahiert nicht nur PDF-Seiteninhalte und Metadaten als Rohtext, sondern liefert den Dokumentinhalt alternativ auch im XML-Format. TET ist auch als kostenloses Plugin für Adobe Acrobat verfügbar; mit diesem Plugin können Sie die hervorragende Textextraktion von TET interaktiv testen und evaluieren.

Besondere Vorteile

TET PDF IFilter bietet folgende Vorteile:

  • Unterstützt westlichen, chinesischen, japanischen und koreanischen (CJK-)Text, sowie von rechts nach links laufende Sprachen wie Arabisch und Hebräisch.
  • Indiziert auch geschützte Dokumente und extrahiert Text sogar aus PDFs, bei denen Acrobat scheitert
  • Unterstützt Unicode-Nachbearbeitung durch Folding, Decomposition und Normalisierung
  • Leistung: thread-sicher, schnell und stabil, 32- und 64-Bit
  • Automatische Erkennung von Sprache und Schriftsystem

Unternehmensweite Suche in PDF-Dokumenten

TET PDF IFilter ist in thread-sicheren nativen 32- und 64-Bit-Versionen verfügbar. Unternehmensweite Lösun­gen zur Textsuche lassen sich in Kombination mit folgenden Produkten implementieren:

  • Microsoft Office SharePoint Server 2013 und frühere Versionen
  • Microsoft Search Server
  • Microsoft SQL Server
  • Microsoft Exchange Server
  • Mirosoft Site Server

TET PDF IFilter ist mit allen Produkten von Microsoft und anderen Herstellern einsetzbar, die die IFilter-Schnittstelle unterstützen.

Desktop-Suche in PDF-Dokumenten

TET PDF IFilter lässt sich auch zur Suche nach PDF-Dokumen­ten auf dem Desktop-Computer einsetzen, zum Beispiel mit Windows Search, das in Windows integriert ist. TET PDF IFilter ist für den nicht-kommerziellen Einsatz auf Desktop-Systemen kostenlos verfügbar und bietet damit eine bequeme Basis zum Testen und Evaluieren.


PDFlib TET PDF IFilter – Enterprise PDF Search for Windows

Produced by PDFlib GmbH

TET PDF IFilter extracts text and metadata from PDF documents and makes it available to search and retrieval software on Windows. This allows PDF documents to be searched on the local desktop, a corporate server, or the Web. TET PDF IFilter is based on the patented PDFlib Text and Image Extraction Toolkit (TET), which is an established developer product for reliably extracting text from PDF documents.

TET PDF IFilter is a robust implementation of Microsoft’s IFilter indexing interface. It works with all search and retrieval products which support the IFilter interface, e.g. SharePoint and SQL Server. Such products use format-specific filter programs – called IFilters – for particular file formats, e.g. HTML. TET PDF IFilter is such a program, aimed at PDF documents. The user interface for searching the documents may be the Windows Explorer, a Web or database frontend, a query script, or a custom application. As an alternative to interactive searches, queries can also be submitted programmatically without any user interface.

Based on patented TET technology

PDFlib TET, the basis of TET PDF IFilter, was first released in 2002, and has been used by customers worldwide in server and desktop environments. As an alternative to extracting PDF page contents and metadata as raw text, TET can supply the document contents in XML format. TET is also available as a free plugin for Adobe Acrobat; this plugin allows interactive test and evaluation of TET’s superior text and image extraction.

Unique advantages

TET PDF IFilter offers the following advantages:

  • Supports Western text, Chinese, Japanese, and Korean (CJK) text and right-to-left languages such as Arabic and Hebrew
  • Indexes protected documents and extracts text even from PDFs where Acrobat fails
  • Supports Unicode folding, decomposition, and normalization
  • Deployment: thread-safe, fast and robust, 32- and 64-bit versions
  • Automatic script and language detection for improved search

Enterprise PDF search

TET PDF IFilter is available in fully thread-safe native 32- and 64-bit versions. You can implement enterprise PDF search solutions with TET PDF IFilter and the following products:

  • Microsoft SharePoint Server 2013 and earlier
  • Microsoft Search Server
  • Microsoft SQL Server
  • Microsoft Exchange Server
  • Mirosoft Site Server

TET PDF IFilter can be used with all other Microsoft and third-party products which support the IFilter interface.

Desktop PDF search

TET PDF IFilter can also be used to implement desktop PDF search, e.g. with Windows Search, which is integrated in Windows.

TET PDF IFilter is freely available for non-commercial use on desktop operating systems, which provides a convenient basis for test and evaluation.

© 2019 Assosiation for Digital Document Standards e.V. | Privacy Policy | Imprint