Zurück zum Glossar

Entity-Extraktion ist die Aufgabe, benannte Entitäten (Personen, Firmen, Orte, Produkte, Konzepte) in unstrukturiertem Text zu identifizieren — typischerweise mit einem Sprachmodell oder spezialisierten NLP-Pipeline.

Warum es zählt

Entity-Extraktion macht aus Prosa strukturierte Daten. Ein Nachrichtenartikel mit 'Sundar Pichai kündigte an…' wird zu einer (Person, Pichai)-Entität, verknüpft mit (Firma, Google) — nutzbar für Suche, Empfehlung, Alerts und Graph-Aufbau.

State of the Art ist heute LLM-basiert: ein einzelner GPT-4-Klasse-Aufruf extrahiert Entitäten plus Typen plus Beziehungen mit vernünftiger Treffsicherheit. Spezialisierte Tools (spaCy, Stanford NLP) bleiben schneller und billiger für hochvolumige Pipelines.

Wie Pith reinpasst

Pith extrahiert Entitäten aus jedem zusammengefassten Bookmark — Personen, Firmen, Frameworks. Diese speisen den Auto-Tag-Service (Match gegen Mandantennamen und Aliasse), die Entities-Oberfläche und das Clustering der Topic Map.

Siehe auch

Zuletzt geprüft: 10. Mai 2026 · Lizenziert CC BY 4.0 · frei zitierbar unter Namensnennung von Pith.