EnricoPalazzo schrieb:
Ist das nicht ziemlich willkürlich. Mir gehts wie gesagt um eine Gleichgewichtung der beiden Indikatoren. Mit dem Index möchte ich dann das oberste Quartil der Verteilung identifizieren und jene Staaten, die in diesem Quartil liegen in meine Fallauswahl aufnehmen.
Leider ist dein Problem inhärent willkürlich. Zur Anschauung mal ein Beispiel:
Ein paar Kinder sammeln Äpfel mit Birnen und wollen bestimmen, wer am erfolgreichsten ist. Ist eine Birne genauso viel Wert wie ein Apfel? Bei Äpfel und Birnen macht es vielleicht Sinn die Anzahl zu addieren und als Metrik zu verwenden.
Aber was passiert, wenn die Kinder jetzt Äpfel und Himbeeren pflücken? Ist ein Apfel eine Himbeere wert? Sicher nicht, sind aber 10 Himbeeren zu einem Apfel gerechtfertigt, oder soll stattdessen besser das Gewicht als Maß berücksichtig werden? Eine eindeutige Antwort gibt es nicht. Wie eine solche Bewertung aussieht muss
im Einzelfall definiert werden. Für Himbeeren und Kürbisse brauchst du eventuell ein anderes Maß.
Genauso sieht es aus, wenn du BIP und Wachstum vergleichen willst. Die Werte sind prinzipiell unvereinbar, um sie dennoch zu vereinen benötigst du ein entsprechendes Metrik.
Und hier kommen wir zu den verschiedenen Verfahren, die ich im letzten Post angerissen habe.
EnricoPalazzo schrieb:
Ich berechne für die 27 Staaten den Mittelwert und die Standardabweichung für beiden Indikatoren. Die generelle Bedeutung dieser Maßzahlen ist mir bewusst, allerdings weiß ich nicht welche Bedeutung sie für die Indexbildung haben
[..]
Hier stockts bei mir auch. Was ist denn der (betragsmäßig) größte Wert?
Welche mathematische Funktion am besten geeignet ist, hängt sehr stark von der Verteilung der Zahlen ab. Stammen alle Werte aus einem "ähnlichem" Wertebereich, sind andere Verfahren sinnvoll als bei stark streuenden.
Ein kleines Beispiel zur einer Normaliserung:
Gegeben sind Werte A:{14,12,6,3,-7,-16}
und Werte B:{24,260,1,44,58,18}
Der betragsmäßig größte Wert in A ist 16 =|-16| und 260 in B.
Dividiert durch diese Werte ergibt (gerundet)
A:{0.875, 0.75, 0.375, 0.1875, -0.4375, -1}
B:{0.0923, 1, 0.004, 0.169, 0.223, 0.07}
Der Vorteil dieses Verfahren ist, dass die beide Wertebereiche jetzt im gleichen Intervall [1..-1] definiert sind. Addierst du A und B kannst du sie danach sortieren und kennst das "beste" Wertepaar. Das ist in diesen Fall das zweite Wertepaar (12,260).
Ich hoffe, dass die Idee dahinter klarer geworden ist. Die Standardabweichung arbeitet ahnlich, du kannst aber genauso gut die Werte logarithmisch skalieren, hängt alles von Einzelfall und den Werten ab, was besser geeignet ist.
Ich glaube, dass oben vorgestellte Normaliserungsverfahren für den Vergleich von BIP und Wachstum geeignet seien sollte.
Wichtig ist, dass du in deiner Arbeit angibst, wie dein Index berechnet wird. Am besten mit einer kurzen Begründung.
Gruß
Hasentod