Eyecatcher Datasupport
Datasupport Sign
Charts Title
Data Support

Datenfusionen

„Der Fragebogen ist zu lang“

Kennen Sie das? Die zu untersuchenden Themen und Teilaspekte sind so umfangreich, dass Ihre Befragung zu lang wird. Natürliche Folgen: die Abbruchquote steigt und die Antwortqualität sinkt. Sie möchten oder können aber auf die Informationen nicht verzichten. Die einzig realistische Möglichkeit, die Nebenwirkungen der langen Befragung zu verringern, besteht darin, die Befragung in zwei Teil-Befragungen aufzuteilen. Sie benötigen am Ende aber einen zusammenhängen Datenbestand. Wir helfen Ihnen bei dieser diffizilen Aufgabe mit Know-how und den passenden Algorithmen.

Datenfusion als Lösungsoption

Je nach Fragestellung kann die Lösung ein Zusammenführen der Befragungen mittels Datenfusion sein, wobei zu jedem Fall aus der ersten Befragung (Empfänger) ein „Statistischer Zwilling“ (größtmögliche Ähnlichkeit in entscheidenden Fragen/Nearest Neighbour) in der zweiten Befragung (Spender) zugeordnet wird und so ein vollständiger Datensatz entsteht.

Mathematisch-statistisches Vorgehen

Zunächst werden die Verbindungsvariablen festgelegt, wobei entweder alle Variablen gleich oder gewichtet in die Berechnung der Ähnlichkeit einfließen. Nun wird für jeden Empfänger und jeden Spender ein Ähnlichkeitswert berechnet, wobei bei metrischen Fragen eine geringe Abweichung auch nur eine geringe Verschlechterung der Ähnlichkeit bewirkt. Bei nominalen Verbindungsvariablen gibt es nur die Zustände „gleich“ oder „nicht gleich“. Es kann für eine oder mehr Verbindungvariablen auch Gleichheit zwingend verlangt werden. Der Gesamt-Ähnlichkeitswert ermittelt sich so aus den Abweichungen aller Verbindungvariablen. Abschließend wird nun die optimale Zuordnung ermittelt, das heißt die Zuordnung, die insgesamt über die gesamte Stichprobe zu den geringstmöglichen Abweichungen führt.

Dieser Prozess kann noch beeinflusst werden, indem ein minimaler Ähnlichkeitswert festgesetzt wird, bei geringerer Ähnlichkeit findet dann keine Zuordnung statt, auch wenn dies dazu führen sollte, dass nicht allen Empfängern ein Spender zugeordnet werden kann. Weiter kann vorgegeben werden, ob ein größeres Gewicht auf bestmögliche Ähnlichkeit (Mehrfachverwendung eines Spenders) oder Erhalt der Repräsentativität der Spenderstichprobe (gleichmäßige Verwendung der Spender) gelegt wird. Bei gleicher Ähnlichkeit findet eine zufällige Zuordnung statt.

Wir helfen Ihnen

Wenn Sie grundsätzliche Fragen zur Datenfusion, zu Möglichkeiten, aber auch zu Grenzen dieses interessanten Verfahrens haben, stehen Ihnen unsere Experten gern für ein beratendes Gespräch zur Verfügung.


x
Kontakt

Martin Klein
Tel.: +49 40 25 17 13 - 18
E-Mail:

Norbert Schroeder
Tel.: +49 40 25 17 13 - 19
E-Mail: