FAQ - Häufig gestellte Fragen
Alle Antworten zu FlowCraftDB – transparent, verständlich, praxisnah
Grundlagen & Funktionsweise
FlowCraftDB besteht aus zwei eng verzahnten Komponenten: einer regelbasierten Datenaufbereitung und einer modernen Produktdatenbasis für große, komplexe Sortimente.
Teil A: Datenaufbereitung & Automatisierung
Schritt 1: Eingang beliebiger Lieferantendaten
FlowCraftDB nimmt Produktdaten in nahezu jedem Format entgegen: Excel/CSV, XML/BMECat, APIs, Lieferantenportale. Die Daten können unvollständig, uneinheitlich benannt oder strukturell chaotisch sein – das Format ist nicht entscheidend.
Schritt 2: Agentic Scraping & Lieferanten-Workflows
Neben klassischen Dateien kann FlowCraftDB auch Lieferantenportale automatisiert auslesen. Dabei werden Zugangsdaten sicher hinterlegt, durchlaufen spezialisierte Agenten definierte Workflows und extrahieren relevante Produktinformationen gezielt.
Schritt 3: Mapping auf den Golden Record
Alle eingehenden Informationen werden auf einen kundenspezifischen Golden Record gemappt. Der Golden Record definiert: Felder & Attributstruktur, Einheiten, Formate und Standards, Validierungs- und Qualitätsregeln, Prioritäten & Pflichtfelder.
Schritt 4: Kontextgewinnung & regelbasierte Anreicherung
Fehlende Informationen werden – sofern möglich – regelbasiert ergänzt. Dabei wird Kontext aus definierten, prüfbaren Quellen gewonnen, erfolgt keine freie Interpretation und werden nur belegbare Informationen genutzt.
Schritt 5: Validierung, QA-Gates & Confidence Score
Alle Felder durchlaufen: Validierungs- und Plausibilitätsprüfungen, QA-Gates pro Feldtyp, Confidence-Scoring. Zu unsicher → Feld wird abgelehnt. Keine Quelle → kein Wert.
Teil B: Zentrale Datenbasis für große Sortimente
Schritt 6: Moderne Produktdatenbasis
Optional kann FlowCraftDB nicht nur aufbereiten, sondern auch als zentrale Produktdatenbasis dienen. Diese ist ausgelegt für große, sortimentsreiche Kataloge mit vielen Attributen & Varianten.
Schritt 7: Vektorisierung & Kontextverständnis
Produktdaten werden zusätzlich vektorisiert abgelegt. Das ermöglicht: kontextbasierte Abfragen, semantisches Verständnis von Produkten, den Einsatz von RAG-Systemen.
Schritt 8: Transparente Jobs & Freigabe
Jede Datenzeile ist ein JobEntry. Alle Felder sind einsehbar, prüfbar und editierbar. Freigabe erfolgt vor Export oder System-Sync. Es gibt keine automatische Produktanlage ohne Kontrolle.
Schritt 9: Übergabe an Zielsysteme
Nach Freigabe werden die Daten per API oder per Export (Excel / CSV / XML / BMECat) an ERP-, PIM-, Shop- oder Marktplatzsysteme übergeben.
FlowCraftDB erfindet keine Produktdaten.
Alle Informationen stammen aus definierten, prüfbaren Quellen – priorisiert nach euren Regeln und validiert gegen euren Golden Record.
Schritt 1: Vertrauenswürdige Lieferantenquellen (Standard)
Für jeden Lieferanten wird eine vertrauenswürdige Hauptquelle definiert, z. B.: Lieferantenportal, Offizielle Hersteller-Website, Vereinbarte Produktdaten-Domain. Diese Quelle hat höchste Priorität – insbesondere für technische Daten.
Schritt 2: Interne Aufbereitung & Kontextbereinigung
Der gefundene Kontext wird intern bereinigt, normalisiert und auf euren Golden Record gemappt. Erst danach wird er an spezialisierte Agenten übergeben.
Schritt 3: Erweiterte Web-Suche (nur wenn nötig)
Reicht der Kontext nicht aus, sucht FlowCraftDB gezielt weiter. Alle zusätzlichen Quellen durchlaufen Identitäts-Checks, Plausibilitäts- und Konsistenzprüfungen.
Schritt 4: Prioritäten & Wahrheit bei technischen Daten
Für technische Attribute gilt eine klare Hierarchie: Lieferantenportal / Herstellerquelle → Bestätigte Sekundärquellen → Keine Quelle = kein Wert. Es gibt keine Interpretation, kein Raten, kein „könnte passen“.
Schritt 5: Validierung, Confidence Score & Kontrolle
Jedes Feld erhält einen Confidence Score. Unterhalb des definierten Thresholds → automatisch abgelehnt. Keine ausreichenden Daten → Feld bleibt leer. Keine Quelle → keine Erfindung.
FlowCraftDB erfindet keine Produktdaten.
Wenn Informationen fehlen oder nicht eindeutig belegbar sind, bleiben Felder leer oder werden bewusst abgelehnt.
Schritt 1: Bewertung der verfügbaren Daten
Für jedes Feld wird geprüft: Gibt es belastbaren Kontext? Reicht dieser Kontext aus, um das Feld korrekt zu befüllen? Entspricht der Wert den Regeln des Golden Records?
Schritt 2: Erweiterung nur dort, wo sinnvoll
Wenn für ein Feld zu wenig Kontext vorhanden ist, wird gezielt zusätzlicher Kontext gesucht – nur über eindeutige Identifikatoren (z. B. EAN, Hersteller, Supplier-PID) und nur mit anschließender Identitäts- und Plausibilitätsprüfung.
Schritt 3: Unterschiedliche Feldtypen, unterschiedliche Regeln
FlowCraftDB unterscheidet klar zwischen harten Feldern (z. B. technische Daten, Maße, Normen) und weichen Feldern (z. B. Marketingtexte). Für harte Felder gilt: keine Quelle → kein Wert.
Schritt 4: Leere Felder sind ein bewusstes Ergebnis
Wenn kein belastbarer Kontext gefunden wird, bleibt das Feld leer, wird sichtbar als „nicht befüllt“ und fließt nicht in den Export oder die System-Synchronisation ein. Leere Felder sind kein Fehler, sondern ein kontrolliertes Ergebnis.
Durch klare Prioritäten, Validierungsregeln und Plausibilitätsprüfungen – nicht durch Interpretation.
Schritt 1: Klare Quellen-Hierarchie
Für technische Daten gilt eine feste Reihenfolge: Lieferantenportal / Herstellerquelle → Bestätigte Sekundärquellen → Keine Quelle = kein Wert. Diese Hierarchie ist regelbasiert und transparent.
Schritt 2: Plausibilitäts- und Konsistenzprüfungen
Gefundene Werte werden automatisch geprüft: Einheiten (mm vs. cm, kg vs. g), Wertebereiche, Konsistenz zu ähnlichen Produkten, Widersprüche zwischen Quellen.
Schritt 3: Keine Interpretation technischer Daten
FlowCraftDB mittelt keine Werte, schätzt nichts und ergänzt nichts ohne Beleg. Technische Daten sind Fakten, keine Annahmen.
Schritt 4: Feldweise Absicherung
Jedes technische Feld hat eine dokumentierte Quelle, unterliegt Validierungsregeln und erhält einen Confidence Score. Nur freigegebene Felder gelten als „First-Time-Right“.
Unsicherheit wird nicht verborgen, sondern sichtbar gemacht.
Schritt 1: Confidence Score pro Feld
Jedes einzelne Feld erhält einen Confidence Score auf Basis von: Qualität des Kontexts, Anzahl und Konsistenz der Quellen, Regel- und Plausibilitätsprüfungen.
Schritt 2: Klare Schwellenwerte
Für jedes Feld ist definiert, ab welchem Score es akzeptiert oder abgelehnt wird. Unterschreitet ein Feld den Threshold, wird es automatisch abgelehnt und bleibt sichtbar, aber nicht freigegeben.
Schritt 3: Keine stillen Entscheidungen
Es gibt keine automatischen „Graubereiche“, keine stillen Korrekturen und keine verdeckten Annahmen. Jede Unsicherheit ist transparent nachvollziehbar.
Ja. Immer. Kein Datensatz verlässt FlowCraftDB ohne eure Freigabe.
Schritt 1: Jobs statt direkter Produktanlage
Jede Datenzeile wird zunächst als JobEntry verarbeitet – nicht sofort als Produkt angelegt.
Schritt 2: Übersichtliche Job-Struktur
Alle JobEntries werden gruppiert in: Neue Produkte, Bestehende Produkte, Fehlende Produkte, Fehler / nicht confident genug.
Schritt 3: Prüfung & Eingriff
Im Job-View könnt ihr einzelne Felder prüfen, Werte anpassen, Felder freigeben oder ablehnen und Entscheidungen bewusst treffen.
Schritt 4: Erst dann Export oder Sync
Erst nach Freigabe erfolgt Export (Excel / CSV / XML / BMECat) oder Synchronisation in ERP / PIM / Shop.
Ja. Pro Feld. Vollständig nachvollziehbar.
Schritt 1: Evidenz pro Feld
Für jedes befüllte Feld speichert FlowCraftDB: verwendete Quelle(n), relevante Text- oder Datenpassagen, Art der Kontexterschließung.
Schritt 2: Transparenz statt Black Box
Ihr seht: woher ein Wert stammt, warum genau dieser Wert gewählt wurde, warum andere Werte ggf. verworfen wurden.
Schritt 3: Audit- & revisionsfähig
Diese Evidenz ist im Job sichtbar, prüfbar vor Export und nachvollziehbar auch zu einem späteren Zeitpunkt.
Einsatzbereiche & Anforderungen
FlowCraftDB entfaltet seinen größten Mehrwert bei großen und wachsenden Sortimenten – überall dort, wo manuelle Datenpflege nicht mehr skaliert.
Sortimentsgröße
Typische Einsatzszenarien starten ab: ≈ 50.000 SKUs, 5+ Lieferanten, regelmäßig neue oder wechselnde Sortimente. Je mehr Produkte, Attribute, Varianten und Lieferanten beteiligt sind, desto stärker wirkt die Automatisierung.
Branchenunabhängig einsetzbar
FlowCraftDB ist nicht auf eine Branche beschränkt. Entscheidend ist nicht das Produkt, sondern: die Menge an Produktdaten, die Heterogenität der Lieferantenformate, die Anforderungen an Qualität, Standardisierung und Geschwindigkeit.
Sehr wenig. FlowCraftDB benötigt nur einen Lieferantenbezug und einen eindeutigen Identifier.
Mindestanforderungen
Zum Start reichen in der Regel: Lieferantenname und ein eindeutiger Produkt-Identifier, z. B. Supplier-PID (Artikelnummer) oder Internationale PID (EAN / GTIN). Weitere Felder sind optional, aber nicht notwendig.
Warum das ausreicht
Auf Basis dieser Informationen kann FlowCraftDB das Produkt eindeutig identifizieren, gezielt Kontext aus definierten Quellen sammeln, fehlende Informationen regelbasiert erschließen und Daten gegen den Golden Record validieren.
Keine Vorab-Datenbereinigung nötig
FlowCraftDB ist darauf ausgelegt, mit chaotischen Excel-Dateien, uneinheitlichen Spalten und lückenhaften Daten umzugehen – die Bereinigung und Standardisierung erfolgt im System.
FlowCraftDB ist auf hohe Datenmengen und parallele Verarbeitung ausgelegt.
Skalierbare Verarbeitung
Die Verarbeitung erfolgt über eine skalierbare Datenpipeline, die parallel arbeitet, horizontal skaliert und sich an Datenmenge und Komplexität anpasst. Mehrere Verarbeitungseinheiten laufen gleichzeitig und bearbeiten Produkte unabhängig voneinander.
Abhängig von Komplexität & Suchstrategie
Die tatsächliche Verarbeitungsdauer hängt u. a. ab von: Anzahl der zu befüllenden Felder, Komplexität der Validierungsregeln, Suchstrategie und Quellenlage, Anteil technischer Daten vs. Textanreicherung.
Typische Größenordnungen
Als grobe Orientierung: mehrere hundert Produkte werden parallel verarbeitet, auch fünf- bis sechsstellige Sortimente lassen sich innerhalb kurzer Zeiträume (Stunden) vollständig aufbereiten.
Transparenz statt Warten
Während der Verarbeitung ist jederzeit sichtbar: welche Jobs laufen, welche abgeschlossen sind, wo es Rückfragen oder Ablehnungen gibt. Es gibt keinen „Blindlauf“ im Hintergrund.
Integration & Workflow
Ja. FlowCraftDB ist API-first aufgebaut und lässt sich flexibel in bestehende Systemlandschaften integrieren.
API-first & systemoffen
Die gesamte FlowCraftDB-Applikation ist API-first konzipiert, vollständig schnittstellenfähig und unabhängig von Zielsystemen oder Datenformaten. Alle Funktionen, die in der Oberfläche verfügbar sind, können auch per API angesteuert werden.
Flexible Übergabe der Daten
Aufbereitete Daten können wahlweise per direkter Schnittstelle (API) oder per Datenexport übergeben werden. Unterstützte Exportformate: Excel (XLS/XLSX), CSV, XML, BMECat.
Standards & Zielsysteme
FlowCraftDB kann mit gängigen ERP-Systemen, PIM-/MDM-Systemen und Shop- und Marktplatzplattformen arbeiten – unabhängig davon, ob diese moderne APIs oder klassische Importmechanismen nutzen.
Die Einführungsdauer hängt vom Umfang der Lösung ab – nicht von starren Projektphasen.
Option 1: Datenaufbereitung (ohne Datenbasis)
Für eine schlanke Nutzung als reine Datenaufbereitungs-Lösung: ca. 4–6 Wochen bis produktivem Einsatz. In dieser Phase erfolgen: Definition des Golden Records, Einrichtung der Lieferanten & Quellen, Training und Instruktion der Agenten, Aufbau der Validierungs- und QA-Regeln.
Option 2: Datenaufbereitung + zentrale Datenbasis
Wenn FlowCraftDB zusätzlich als zentrale Produktdatenbasis eingesetzt wird: bis zu ca. 3 Monate, abhängig von Umfang und Komplexität. Zusätzlich enthalten: Aufbau des Datenmodells, Varianten- und Attributlogiken, Kategorie- und Klassifikationsservices, Anbindung von Zielsystemen.
Datenmigration (optional)
Bestehende Produktdaten können parallel migriert werden. Dabei werden Daten über ETL-Pipelines transformiert, auf ein modernes, konsistentes Datenmodell überführt und von erfahrenen Data- & Engineering-Teams begleitet.
Ja – in einem kontrollierten Demo-Setup.
Demo statt unkontrollierter Selbsttests
FlowCraftDB bietet einen Demo-Upload, bei dem reale Lieferantendaten verarbeitet werden, der komplette Workflow sichtbar ist und Ergebnisse nachvollziehbar erklärt werden. Da Produktdatenaufbereitung stark konfigurations- und regelabhängig ist, erfolgt der Demo-Upload begleitet.
Warum kein anonymer Self-Service?
Ein valider Test erfordert: definierte Quellen, einen klaren Golden Record, passende Regeln & Agenten-Instruktionen. Diese Voraussetzungen werden im Demo-Termin gemeinsam geschaffen.
Wirtschaftlichkeit & Vertrauen
Der Preis richtet sich nach Leistungsumfang und Nutzung – nicht nach starren Paketpreisen.
Zwei Kostenbestandteile
Einmalige Investition
Setup & Konfiguration, Golden Record & Regelwerk, Agenten-Training, System- & Prozessanpassung
Laufende Investition
Datenverarbeitung, Betrieb & Skalierung, Weiterentwicklung & Wartung, Nutzung der Services (z. B. Anreicherung, Validierung)
Warum keine Fixpreise?
Produktdaten unterscheiden sich stark in: Menge, Struktur, Komplexität, Qualitätsanforderungen. Ein Pauschalpreis würde entweder zu teuer für einfache Szenarien oder unzureichend für komplexe Anforderungen sein.
Transparenz von Anfang an
Klare Leistungsdefinition, nachvollziehbare Kostenstruktur, frühe Größenindikatoren im Erstgespräch. Ziel ist immer: Mehrwert vor Kosten.
Weil saubere Produktdaten die Grundlage für Wachstum sind.
Der Kernnutzen
FlowCraftDB ersetzt wochen- oder monatelange manuelle Datenaufbereitung, standardisiert Produktdaten nachhaltig und schafft eine verlässliche, skalierbare Datenbasis. Ohne diese Basis lassen sich weder Prozesse optimieren noch Automatisierung sinnvoll umsetzen.
Konkreter Mehrwert
Deutlich kürzere Time-to-Market, schnellere Lieferanten-Onboardings, weniger manuelle Datenpflege, höhere Datenqualität über alle Kanäle, Skalierung ohne zusätzlichen Personalaufwand.
Für wen FlowCraftDB besonders sinnvoll ist
Wachsende Sortimente, viele Lieferanten, steigende Kanal- und Marktplatzanforderungen, begrenzte Ressourcen in Datenpflege & IT.