Home
contactCopy Online-Hilfe Prev Page Prev Page
ContactCopy Hilfe
Überblick
Bestätigung & Export
Einstellungen
Einstellungen: Microsoft Dynamics CRM
Einstellungen: Textersetzung
Kontaktdatenerkennung & -zerlegung (Parser)
Falsche Kontaktdatenzerlegung melden

Regeln für Textersetzung


Die Regeln für Textersetzung ermöglichen es Ihnen, den Quelltext vor der Zerlegung durch den Parser anhand von Regeln zu modifizieren.

Situation für den Einsatz von Regeln für Textersetzung

  • wenn Sie Strings entfernen möchten
    Beispiel:
    der Text "Straßenkarte anzeigen" ist auf einer Website in die Kontaktinformationen eingebettet und muss mitmarkiert werden.
    Erstellen Sie eine Regel, die diesen String entfernt, sodass der Parser nicht versucht ihn als Kontaktinformation zu interpretieren.

  • wenn Sie Strings ersetzen möchten, um die Schreibung von Elementen zu vereinheitlichen
    Beispiel:
    die abgekürzte Schreibweise "Str." soll immer durch die Schreibweise "Straße" ersetzt werden

  • wenn bei der automatischen Zerlegung von Kontaktinformationen Elemente fälschlicherweise als Kontaktfelder erkannt werden
    Beispiel:
    das Strukturierungselement "Empfänger" wird als Teil eines Firmennamens erkannt.
    Erstellen Sie eine Regel, die den String "Empfänger" löscht (durch einen leeren String ersetzt).

  • um der automatischen Kontaktdatenzerlegung von ContactCopy die Zuordnung von Elementen zu erleichtern
    Beispiel:
    Der Abstand zwischen Vor- und Nachname sind Trennzeichen vorhanden.
    Erstellen Sie eine Regel, die diese Trennzeichen entfernt (durch einen leeren String ersetzt).

  • um Strukturierungselemnte zu ersetzten. Strukturelemente, die der Parser nicht erkennt, ersetzen Sie durch Standard-Strukturelemente ersetzen, die der Parser als Hinweis für die Bedeutung eines Elementes nutzen kann.
    Beispiel:
    In den Kontaktdaten befindet sich das Strukturierungslement "Herkunftsland:"
    Erstellen Sie eine Regel, "Herkunftsland:" durch "Land:" ersetzt.

  • um fehlende oder implizite Information zu ergänzen.
    Beispiel:
    in einer Adressquelle haben Telefonnummern keine Vorwahlen
    Erstellen Sie eine Regel, die nach dem Bezeichner "Tel: [Telefonnummer] durch "Tel: [Vorwahl] [Telefonnummer]" ersetzt.

Eine Regel für Textersetzung besteht aus

  • Voraussetzungen, unter denen sie angewendet wird (optional)
  • Ersetzungsvorschriften, bestehend aus
    • Suchmuster (Regular Expression oder String)
    • Ersetzung
    • Suchoptionen ("Groß-/Kleinschreibung beachten", "nur ganze Wörter")

Voraussetzungen

Wenn Sie Strings nur beim Kopieren aus bestimmten Anwendungen oder von bestimmten Websites ersetzen oder löschen möchten, können Sie die Anwendung einer Regel auf diese Quellen einschränken.

Voraussetzungen für die Anwendung von Regeln können sich auf folgende Angaben zur Datenquelle beziehen:
  • Quelltext
  • Quellfenster
  • Quell-URL (beim Kopieren aus einem Browser-Fenster)

Modifikationen

Suchmuster können gewöhnliche Strings oder sogenannte Reguläre Ausdrücke sein.

Mit den Buttons Export bzw. Import können Sie eine Liste von Suchmustern- und Ersetzungsstrings in eine Textdatei exportieren bzw. aus einer Textdatei importieren. Das verwendete Dateiformat ist dabei jeweils eine Textdatei mit zwei Werten pro Zeile, die durch ein TAB-Zeichen (ASCII-Code 9) getrennt sind:

    Suchstring1<Tab>Ersetzungsstring1
    Suchstring2<Tab>Ersetzungsstring2
etc.

Hinweis: Der Ersetzungsstring ist optional. Bei Zeilen ohne Tabulator-Zeichen wird jeweils nur der Suchstring importiert.

Die Regeln werden in der Reihenfolge angewendet, in der sie in der Liste angeführt sind. Mit Nach oben bzw. Nach unten können Sie die Priorität einer Regel (also die Reihenfolge, in der sie angewendet wird) anpassen.

Reguläre Ausdrücke

Zusätzlich zu gewöhnlichen Strings erlaubt ContactCopy Reguläre Ausdrücke (Regular Expressions) als Suchmuster.
ContactCopy unterstützt Regular Expressions nach der Perl-Syntax.

Details zu Perl Regular Expressions finden Sie auf folgenden Seiten:

Wenn das Suchmuster ein Regulärer Ausdruck ist, kann der Ersetzungsstring die Ersetzungs-Variablen $1, $2, $3, .... enthalten, die den 1., 2., 3., ... geklammerten Ausdruck im Suchstring enthalten. Siehe Beispiel 3 weiter unten.

Beispiele für den Einsatz von Regeln für Textersetzung

Beispiel 1:

Problem:
"Ph_Mobile" wird zur Kennzeichnung von Mobiltelefonnummern verwendet. ContactCopy erkennt diese Kennzeichnung nicht, und ordnet die Telefonnummer nicht dem Feld für Mobiltelefonnummern zu.

Ursprünglicher Text:
Ph_Mobile 012 4567890
Text nach Anwendung der Regel:
Phone 012 4567890

Lösung:
Erstellen Sie eine Regel, die Ph_Mobile durch Mobile Phone, ersetzt. ContactCopy erkennt diese Standard-Strukturierungselement, und ordnet den Wert dem Feld für "Mobiltelefonnummer" zu.



Beispiel 2:

Problem:
Beim Kopieren von Adressdaten aus einem Online-Verzeichnis muss ein Link mit dem Text (Show address on map) mitmarkiert werden. ContactCopy soll diesen Text ignorieren statt ihn bei den "Unbekannten Elementen" anzuzeigen.

Ursprünglicher Text:
11 West 53rd street, New York NY 10019  (Show address on map)  Website: www.moma.org
Text nach Anwendung der Regeln:
11 West 53rd street, New York NY 10019    Website: www.moma.org

Lösung:
Erstellen Sie eine Regel, die den String (Show address on map) durch einen leeren String ersetzt (also den String entfernt).


Beispiel 3:

Problem:
In einem Adressverzeichnis auf http://www.abc.com sind alle Telefonnummern ohne Vorwahl angegeben. ContactCopy erkennt nur Telefonnummern mit Vorwahl.
Als Vorwahl soll immer (012) verwendet werden.

Ursprünglicher Text:
Phone 456 7890
Text nach Anwendung der Regel:
Phone (012) 456 7890

Lösung:
Die Vorwahl (012) soll zwischen dem String Phone und der Telefonnummer eingefügt werden.
Erstellen Sie eine Regel, die das Suchmuster
Phone (\d\d\d) (\d\d\d\d) (Regulärer Ausdruck)
ersetzt durch
Phone (012) $1 $2 (Ersetzungsstring mit Teilstrings, die von der Regular Expression erkannt wurden)

Hinweise:
    \d erkennt jeweils eine Ziffer
    $1 und $2 werden durch den String ersetzt, der mit dem ersten und zweiten geklammerten Strings im Suchmuster, also (\d\d\d) und (\d\d\d\d), übereinstimmen.

Hinweis:
Diese Regel sollte NUR angewendet werden wenn Daten von der Website "http://www.abc.com" kopiert werden. Auf anderen Websites, auf denen die Vorwahlen bereits vorhanden sind, könnte sie falsche Ergebnisse erzeugen. Wählen Sie deshalb als Voraussetzung der Regel "Quell-Url beginnt mit http://www.abc.com"