• Herzlich Willkommen!

    Nach der Schließung von inDiablo.de wurden die Inhalte und eure Accounts in dieses Forum konvertiert. Ihr könnt euch hier mit eurem alten Account weiterhin einloggen, müsst euch dafür allerdings über die "Passwort vergessen" Funktion ein neues Passwort setzen lassen.

    Solltet ihr keinen Zugriff mehr auf die mit eurem Account verknüpfte Emailadresse haben, so könnt ihr euch unter Angabe eures Accountnamens, eurer alten Emailadresse sowie eurer gewünschten neuen Emailadresse an einen Administrator wenden.

Regressionsanalyse mit Case-Control Design.

  • Ersteller Ersteller EnricoPalazzo
  • Erstellt am Erstellt am

EnricoPalazzo

Guest
Hallo zusammen,

tut mir leid, dass ich das "Hilfe-Forum" mal wieder wörtlich nehme und hier Fragen aus ganz anderen Themengebieten als PC, Computer-Spiele und Multi-Media stelle.

Ich weiß, dass hier eine Reihe von Leuten mit guten Mathematikkenntnissen mitlesen und da mir hier schon mit Fragen zur Relativitätstheorie weitergeholfen wurde, kann ich mir vorstellen, dass mir auch nun jemand helfen kann.

Es geht allerdings diesmal um Statistik. Ich habe bereits in speziellen Statistik - Foren nachgefragt, dort aber nach über einer Woche immer noch keine Antwort erhalten.

Ich habe einige Probleme beim Lesen einer Studie.

Es geht vornehmlich darum, dass ich die Bedeutung mancher Abkürzungen und Begriffe nicht verstehe.

Da ich nicht weiß inwieweit ihr meine Fragen ohne Kontext beantworten könnt werd ich erstmal erläutern worum es geht.

Ich beschäftige mich mit quantitativen Studien aus dem Bereich Politikwissenschaft, hauptsächlich Krisen- und Konfliktforschung.

Dabei werden Regressionsmodelle eingesetzt um Korrelationen zwischen bestimmten Ereignissen (z.B. Bürgerkriege) und anderen politischen, sozialen und/oder wirtschaftlichen Faktoren herauszufinden.

Die abhängige Variable wäre also beispielsweise Bürgerkrieg und mögliche unabhängige Variablen wären wirtschaftliche Rezession (operationalisiert als Rückgang des BIP um x-Prozent), multiethnische Bevölkerung (operationalisiert als mindestens x ethnische Gruppen mit einer Bevölkerungsgrößer > x) usw.

Das Forschungsdesign ist in meinem speziellen Fall ein so genanntes Case/Control Design.
Die Methode besteht in der Analyse einer Gruppe von Fällen, die das untersuchte Phänomen aufweisen (Problemset) und der Analyse einer weiteren Gruppe von Fällen, die das untersuchte Phänomen nicht aufweisen (Kontrollgruppe). Bei beiden Gruppen wird ermittelt, ob die Fälle in der Vergangenheit potentiellen Risikofaktoren (unabhängigen Variablen) ausgesetzt waren. Findet sich ein signifikanter Unterschied zwischen beiden Gruppen, kann man davon ausgehen, dass eine Korrelation zwischen Risikofaktor und dem untersuchten Phänomen vorliegt.

Dann folgt eine sukzessive Regressionsanalyse um ein Modell zu entwickeln, bestehend aus einer beliebigen Anzahl von unabhängigen Variablen, welches die einzelnen Fälle am besten klassifiziert.

Man will eine Variablenkombination mit möglichst hoher Sensitivität (positive Fälle werden als solche richtig klassifiziert) und Spezifität (negative Fälle werden als solche richtig qualifiziert) ermitteln. Es sollte also jene Kombination von Variablen gefunden werden, die am besten in der Lage ist, Problem- und Kontrollfälle eindeutig als solche zu klassifizieren.

Nun ist in diesen Studien immer wieder von einem so genannten Grenzwert (threshold) die Rede welcher angepasst wird und Einfluss auf die Qualität des Modells hat.

Kann mir jemand erklären was es mit diesem Grenzwert auf sich hat, d. h. wie er festgelegt wird und welchen Einfluss er hat.

Hier noch ein Bild aus einer der Studien mit den Daten zum Grenzwert.





Wichtig wäre mir zu wissen, was der Grenzwert bedeutet und wofür c steht.

Gruß EP
 
Moin,

nach kurzem Einlesen kann ich nur sagen, dass das ein ziemlich kompliziertes Thema ist und wohl von kaum einem hier so en passant beantwortet werden kann. Da sind definitiv Kenntnisse in der Regressionsanalyse erforderlich.

Schau mal hier

Seite 232. Keine Ahnung, ob dir das weiterhilft, aber dort wird von Toleranz gesprochen, die sich im Wertebereich von 0,00 bis 1,00 bewegt, was in deinem Beispiel ja auch so ist. Vielleicht hat es mit deinen Fragen aber auch überhaupt nichts zu tun, also lass dich da nicht verwirren. Von Regressionsanalyse habe ich nämlich keine Ahnung :)

lg
 
Also da würd ich dir raten, mal per PM Kontakt mit ColonelWicked aufzunehmen, der Studiert Mathe mit Fachgebiet Statistik (glaub ich) und schreibt gerade Diplomarbeit, sollte also jede Menge Zeit für dich haben ;)
 
@jennysn Danke für die Mühe, ich glaube jedoch, dass Toleranz und Grenzwert nicht das gleiche sind. Bin auch grad dabei mein Statistikwissen wieder aufzufrischen, nur dauert das halt da ich bei Adam und Eva anfangen muss, obwohls mir eigentlich nur um die Interpretation der Ergebnisse geht.

@Schlemmer Danke für den Tip, PM ist raus:cool:
 
Meine Güte ist das lang her, leider hab ich davon mittlerweile keine Ahnung mehr.
Hab mir jetzt mal den Wiki-Artikel durchgelesen, aber der lässt eigentlich keine Rückschlüsse darauf zu was dort eine Grenze bzw. ein Grenzwert sein könnte, man nimmt.
Ausserdem wird keine Konstante (c) angegeben die man einfach so aus allem herausbekommen könnte.
Daher denk ich, da wird noch was anderes als die reine Regressionsanalyse verwendet. Das müsste dann aber im beistehenden Text zu finden sein, eventuell einfach zur Untersuchung der Nullhypothese oder sowas.

Tut mir leid, hätt dir gern mehr geholfen, aber ich hab auch keine Zeit mich in die notwendige Literatur einzulesen :/

Ich könnte dir das Forum hier noch nahe legen, gelegentlich wird einem dort geholfen (gelegentlich, selten, fast nie).
 
Zurück
Oben