EnricoPalazzo
Guest
Hallo zusammen,
tut mir leid, dass ich das "Hilfe-Forum" mal wieder wörtlich nehme und hier Fragen aus ganz anderen Themengebieten als PC, Computer-Spiele und Multi-Media stelle.
Ich weiß, dass hier eine Reihe von Leuten mit guten Mathematikkenntnissen mitlesen und da mir hier schon mit Fragen zur Relativitätstheorie weitergeholfen wurde, kann ich mir vorstellen, dass mir auch nun jemand helfen kann.
Es geht allerdings diesmal um Statistik. Ich habe bereits in speziellen Statistik - Foren nachgefragt, dort aber nach über einer Woche immer noch keine Antwort erhalten.
Ich habe einige Probleme beim Lesen einer Studie.
Es geht vornehmlich darum, dass ich die Bedeutung mancher Abkürzungen und Begriffe nicht verstehe.
Da ich nicht weiß inwieweit ihr meine Fragen ohne Kontext beantworten könnt werd ich erstmal erläutern worum es geht.
Ich beschäftige mich mit quantitativen Studien aus dem Bereich Politikwissenschaft, hauptsächlich Krisen- und Konfliktforschung.
Dabei werden Regressionsmodelle eingesetzt um Korrelationen zwischen bestimmten Ereignissen (z.B. Bürgerkriege) und anderen politischen, sozialen und/oder wirtschaftlichen Faktoren herauszufinden.
Die abhängige Variable wäre also beispielsweise Bürgerkrieg und mögliche unabhängige Variablen wären wirtschaftliche Rezession (operationalisiert als Rückgang des BIP um x-Prozent), multiethnische Bevölkerung (operationalisiert als mindestens x ethnische Gruppen mit einer Bevölkerungsgrößer > x) usw.
Das Forschungsdesign ist in meinem speziellen Fall ein so genanntes Case/Control Design.
Die Methode besteht in der Analyse einer Gruppe von Fällen, die das untersuchte Phänomen aufweisen (Problemset) und der Analyse einer weiteren Gruppe von Fällen, die das untersuchte Phänomen nicht aufweisen (Kontrollgruppe). Bei beiden Gruppen wird ermittelt, ob die Fälle in der Vergangenheit potentiellen Risikofaktoren (unabhängigen Variablen) ausgesetzt waren. Findet sich ein signifikanter Unterschied zwischen beiden Gruppen, kann man davon ausgehen, dass eine Korrelation zwischen Risikofaktor und dem untersuchten Phänomen vorliegt.
Dann folgt eine sukzessive Regressionsanalyse um ein Modell zu entwickeln, bestehend aus einer beliebigen Anzahl von unabhängigen Variablen, welches die einzelnen Fälle am besten klassifiziert.
Man will eine Variablenkombination mit möglichst hoher Sensitivität (positive Fälle werden als solche richtig klassifiziert) und Spezifität (negative Fälle werden als solche richtig qualifiziert) ermitteln. Es sollte also jene Kombination von Variablen gefunden werden, die am besten in der Lage ist, Problem- und Kontrollfälle eindeutig als solche zu klassifizieren.
Nun ist in diesen Studien immer wieder von einem so genannten Grenzwert (threshold) die Rede welcher angepasst wird und Einfluss auf die Qualität des Modells hat.
Kann mir jemand erklären was es mit diesem Grenzwert auf sich hat, d. h. wie er festgelegt wird und welchen Einfluss er hat.
Hier noch ein Bild aus einer der Studien mit den Daten zum Grenzwert.

Wichtig wäre mir zu wissen, was der Grenzwert bedeutet und wofür c steht.
Gruß EP
tut mir leid, dass ich das "Hilfe-Forum" mal wieder wörtlich nehme und hier Fragen aus ganz anderen Themengebieten als PC, Computer-Spiele und Multi-Media stelle.
Ich weiß, dass hier eine Reihe von Leuten mit guten Mathematikkenntnissen mitlesen und da mir hier schon mit Fragen zur Relativitätstheorie weitergeholfen wurde, kann ich mir vorstellen, dass mir auch nun jemand helfen kann.
Es geht allerdings diesmal um Statistik. Ich habe bereits in speziellen Statistik - Foren nachgefragt, dort aber nach über einer Woche immer noch keine Antwort erhalten.
Ich habe einige Probleme beim Lesen einer Studie.
Es geht vornehmlich darum, dass ich die Bedeutung mancher Abkürzungen und Begriffe nicht verstehe.
Da ich nicht weiß inwieweit ihr meine Fragen ohne Kontext beantworten könnt werd ich erstmal erläutern worum es geht.
Ich beschäftige mich mit quantitativen Studien aus dem Bereich Politikwissenschaft, hauptsächlich Krisen- und Konfliktforschung.
Dabei werden Regressionsmodelle eingesetzt um Korrelationen zwischen bestimmten Ereignissen (z.B. Bürgerkriege) und anderen politischen, sozialen und/oder wirtschaftlichen Faktoren herauszufinden.
Die abhängige Variable wäre also beispielsweise Bürgerkrieg und mögliche unabhängige Variablen wären wirtschaftliche Rezession (operationalisiert als Rückgang des BIP um x-Prozent), multiethnische Bevölkerung (operationalisiert als mindestens x ethnische Gruppen mit einer Bevölkerungsgrößer > x) usw.
Das Forschungsdesign ist in meinem speziellen Fall ein so genanntes Case/Control Design.
Die Methode besteht in der Analyse einer Gruppe von Fällen, die das untersuchte Phänomen aufweisen (Problemset) und der Analyse einer weiteren Gruppe von Fällen, die das untersuchte Phänomen nicht aufweisen (Kontrollgruppe). Bei beiden Gruppen wird ermittelt, ob die Fälle in der Vergangenheit potentiellen Risikofaktoren (unabhängigen Variablen) ausgesetzt waren. Findet sich ein signifikanter Unterschied zwischen beiden Gruppen, kann man davon ausgehen, dass eine Korrelation zwischen Risikofaktor und dem untersuchten Phänomen vorliegt.
Dann folgt eine sukzessive Regressionsanalyse um ein Modell zu entwickeln, bestehend aus einer beliebigen Anzahl von unabhängigen Variablen, welches die einzelnen Fälle am besten klassifiziert.
Man will eine Variablenkombination mit möglichst hoher Sensitivität (positive Fälle werden als solche richtig klassifiziert) und Spezifität (negative Fälle werden als solche richtig qualifiziert) ermitteln. Es sollte also jene Kombination von Variablen gefunden werden, die am besten in der Lage ist, Problem- und Kontrollfälle eindeutig als solche zu klassifizieren.
Nun ist in diesen Studien immer wieder von einem so genannten Grenzwert (threshold) die Rede welcher angepasst wird und Einfluss auf die Qualität des Modells hat.
Kann mir jemand erklären was es mit diesem Grenzwert auf sich hat, d. h. wie er festgelegt wird und welchen Einfluss er hat.
Hier noch ein Bild aus einer der Studien mit den Daten zum Grenzwert.

Wichtig wäre mir zu wissen, was der Grenzwert bedeutet und wofür c steht.
Gruß EP


