Saturday 11 March 2017

Xtprobit Feste Effekte In Stata Forex

Ich habe ein Panel-Datensatz mit einer Stichprobe von 800 Gruppen, die jeweils zwischen 200-500 Beobachtungen. Die Daten sehen folgendermaßen aus: Die abhängige Variable ist binomial: closegp30f30. Die unabhängigen Variablen sind kontinuierliche Wachstumsraten. Eine Beispielzusammenfassung von einem dieser ist: Ich möchte diese experimentelle Regression ausführen: Wenn ich jedoch mehr als etwa 5 Variablen hinzufüge, konvergiert die Regression nie und ich scheine in einer Schleife von gesicherten Iterationen stecken zu bleiben Haben auch wieder diese Regression mit allen Debugging-Informationen aktiviert, das ist eine Menge von Informationen, sondern kann die Antwort auf, warum es nicht konvergieren kann. Beachten Sie, dass ich hier auf die standardisierten Werte der unabhängigen Variablen zurückging, aber das hatte genau die gleiche Wirkung (aus irgendeinem Grund hoffte ich, dass es mein Problem lösen würde). Meine wichtigsten Fragen sind: Warum ist es nicht konvergieren Wie kann ich diese Situation lösen Update: Multicollinearity-Checks Auch dies scheint nicht ein Problem zu sein. Update 2: mit Gradientenoption und geänderten Grenzwerten: Ich weiß nicht, ob dies hilft, aber wenn ich xtdata indepvars, i (tickerid) fe löschen, gefolgt von einem logit depvar indepvar (was normalerweise gut funktioniert), scheint das Logit zu stecken auch. Ich glaube also, dass es etwas mit festen Effekten und Paneldaten zu tun hat. Macht das Sinn, wie schon erwähnt schon schwierig. Ohne Wirkung. Ich verstehe immer noch nicht, warum dies geschieht. Ist es meine Daten Wie kann ich feststellen, welche Variable dies verursacht Kann ich es umwandeln, um das Problem zu lösen Möchten Sie, dass ich es wieder mit schwierig auf und posten Sie die neue Protokolldatei Die Regression ist bei Iteration 34 jetzt und die Steigung ist noch 2111.886 ndash Tom Mar 30 13 am 22:42 Eine kurze Antwort ist, dass komplizierte Modelle sind oft schwer zu passen Sie sollten versuchen, ein viel einfacheres Modell zuerst. Vielleicht gibt es Probleme wegen der hohen Korrelationen zwischen Prädiktoren. Manchmal mit Hilfe der schwierigen Option hilft. Der Versuch, ein einfacheres Modell zuerst zu versuchen, ist zweifach. Wenn Sie nicht ein einfacheres Modell zu passen, kann ein komplizierteres Modell noch weniger wahrscheinlich zu passen. Genauer gesagt, kann es möglich sein, zu identifizieren, welche Prädiktoren problematisch sind: wie Sie sie hinzufügen, die Dinge nachweisbar stall. Manchmal versuchen Menschen, die Wachstumsraten mit einer signaturerhaltenden Transformation zu transformieren, wie beispielsweise dem Cube-Root oder einer inversen hyperbolischen Funktion. Dies wird vorgeschlagen, weil Ihre Sample-Prädiktor ist enorm schief mit sehr hoher Kurtosis, da Ausreißer von sehr hohen Wachstumsraten. Das könnte ernsthaft problematisch sein. Auch eine grobe Vermutung ist, dass, obwohl Ihre Antwort 0,1 ist, scheint es von der gleichen Art wie die anderen: hat Ihr dichotomise etwas wie (Wertschwelle) Wenn ja, haben Sie die meisten Informationen in der ursprünglichen Antwort verworfen haben, und Sie versuchen, das durch Rauschen und Ausreißer zu erklären. Das ist ein sehr pessimistisches Lesen, aber es scheint völlig im Einklang mit dem, was Sie uns erzählen. Haben Sie vorherige Erfahrung passende Modelle mit ähnlichen Daten, oder gibt es Literatur, die darauf hindeutet, dass sie arbeiten antwortete ich weniger Variablen wie g1, g3, g10, g15 es funktioniert. Aber, wenn ich anfange, mehr als ungefähr 5 hinzuzufügen, es doesn39t konvergieren. Wie hilft mir das, dass ich alle Variablen aufnehmen und ihre Bedeutung sehen muss. Ich habe meine ursprüngliche Frage mit einer multicollinearity Überprüfung aktualisiert: dieses scheint nicht, das Problem zu sein. Ich habe auch versucht die schwierige Option, aber es hat nicht geholfen. Ndash Tom Mar 30 13 at 21:55 Als Reaktion auf Ihr Update: Ich habe die abhängige Variable dichotomisieren. Es ist eins, wenn die zukünftige Wachstumsrate positiv ist und Null, wenn es negativ oder Null ist. Meine Gründe dafür sind geerdet, weil ich es nicht mehr wissen muss als dieses Aufwärts - oder Abwärtsverhalten, und es erlaubt mir, ein logistisches Modell mit Laxer-Annahmen als OLS-Regressionen zu verwenden. Meine anfänglichen Ergebnisse scheinen dies zu bestätigen, da die Vorhersagen, die durch die OLS-Regression vorgenommen werden, viel häufiger ungültig sind (selbst wenn sie nur das Zeichen des Wachstums betrachten) als die Vorhersagen, die durch die feste Effekte-logistische Regression gemacht wurden. Ndash Tom Mar 31 13 um 15: 07Announcement 29 Jul 2014, 08:54 Hallo Matthias, ein paar Fragen und Kommentare von mir. Zuerst erwähnen Sie, dass Ihre abhängige Variable Anzahl der Unfälle ist, aber du bist mit binären Probit-Modelle. Anzahl der Unfälle scheint wie eine Zählvariable für mich nicht binär, wie ist dies möglich Nun in Bezug auf Ihre erste Frage, sagt xtset Stata, was die Ebene 1 und Ebene 2-Variablen für alle xt verwandten Befehle sind. Sie müssen es nur verwenden, wenn Sie definieren wollen, was diese beiden Variablen sind. Wenn sie sich nicht während der Analyse ändern, müssen Sie es nur einmal aufrufen. Ihre zweite Frage ist unmöglich zu beantworten, ohne die Daten zu kennen. Having said that, es ist etwas, das testable ist aber nicht bei der Verwendung von xtprobit, da es nicht eine Fixed-Effect-Schätzung. Sie müssten dafür xtlogit verwenden, Fixeffekte und Zufallseffektschätzungen ausführen und dann einen Hausman-Spezifikationstest mit dem hausman-Befehl durchführen. Unabhängig davon, was das Ergebnis des Hausman-Tests ist, finde ich es immer nützlich, sowohl feste und zufällige Effekte Schätzungen zu tun und vergleichen Sie die Koeffizienten zu sehen, wie viel von einer Bias die Regressoren auf die zufällige Effekte Schätzung verursachen können, unter der Annahme, dass feste Effekte ist Angemessen ist. Ich hoffe, das hilft, 29 Juli 2014, 10:09 Dank für Ihre sofortige Antwort. Anzahl der Unfälle ist in meiner Regression eine Dummy-Variable (1 mindestens ein Unfall, 0 kein Unfall) mit xtlogit ist ein guter Punkt, da es die feste Effekte Option ermöglicht. Ich verstehe immer noch nicht Ihr zweites Argument: quotxtset idofpolicyholder yearquot sollte Stata sagen, dass ich Panel-Daten verwenden, und dass Jahr ist die Zeit variabel. Das ist, wie ich die Hilfe-Option zu interpretieren. Also alles, was ich tun müssen, ist die Anpassung der Daten zuerst, dann benutze ich den Befehl xtset idofpolicyholder Jahr zu erzählen, dass ich bin mit Panel-Daten, dann laufe ich die xtlogit Regression so ziemlich die gleiche Weise wie ich mit meiner bivariate probit xtlogit Anzahl der Unfälle Typeofcoverage Geschlecht-Motorenergiegarage ageoftpolicyholder ageofthecar kilometerstrevelledperyear. (Weitere Kontrollvariablen), re (die Differenz ist meiner Meinung nach, dass ich eine der beiden abhängigen Variablen der bivariate probit und fügen Sie es als eine unabhängige Variable in der xtlogit Modell zB typeofcoverage Ich führe es zweimal (einmal mit der Ich bin mit dem Hausman-Test, um herauszufinden, ob die Fixed-Effekte-Spezifikation oder die Random-Effekte-Spezifikation besser zu meiner Regression, Recht Im Hinblick auf die Robustheit meines Modells, würde ich weiter testen, für Heteroskedastizität (zB Breusch-Pagan-Test) und serielle Korrelation (Breusch-Godfrey-Test) Haben Sie Dank für Ihre Geduld mit meiner fleckige empirisches Wissen 29. Juli 2014 zustimmen, 10.52 ein Problem entsteht, wenn ein bivariate Modell das wahre Modell ist, wenn einschließlich eines Die Antwortgrößen als erklärende Variable in der anderen Gleichung: die der Endogenität. Beachten Sie, dass, wenn die Fehler der beiden Gleichungen im bivaraten Modell korreliert werden, die Antwortvariable einer der Gleichungen auch mit den Fehlern der anderen korreliert Gleichung, also die Quelle für das Endogenitätsproblem. Im vorausgesetzt (erraten), das youre dies zu tun, weil es keine bivariate xtlogit Befehl ist, weil in der anderen Diskussion metioned ich, dass der Benutzer Befehl cmp (SSC) wird eine bivariate Probit mit zufälligen Effekten zu tun, und wie für feste Effekte zu berücksichtigen Dummy, indem Variablen. Sie können verwenden, um zu sehen, wenn die Fehler in Gleichungen korreliert sind und wenn sie sind, dass ein klarer Hinweis, dass Sie nicht eine Antwort-Variable aus einer Gleichung in der anderen sein sollte. Sie können jedoch immer die beiden Gleichungen getrennt ausführen, ohne die Antwortvariablen als erklärende Variablen einzuschließen. Führen Sie cmp auf jedem von ihnen mit zufälligen Effekten und cmp für die bivariate Probit mit zufälligen Effekten. Dann können Sie Koeffizienten (oder marginale Effekte, was auch immer Sie bevorzugen) von beiden Methoden in beiden Gleichungen vergleichen, sowie festzustellen, ob es Korrelation über Fehler beider Gleichungen auf jeder Ebene (die Gruppierungsebene oder das Jahr) gibt. Wenn Sie feste Effekte mit dem bivariate probit machen wollen, können Sie immer noch cmp mit der Gruppe Dummies, wie ich in der anderen Diskussion erklärt. So können Sie die einzelnen Probit-Gleichungen mit den Gruppen-Dummies und die bivariate Probit mit den Gruppen-Dummies in jeder Gleichung, alle mit cmp abschätzen. Und vergleichen. Ich weiß nicht, wie die Hausman-Test dann durchzuführen, aber es gibt Ihnen einen direkten Vergleich der gemeinsamen Koeffizienten in beiden Schätzungen, zufällige und feste Effekte. Nach dem Lesen beider Diskussionen glaube ich, dass dies der beste Weg für Sie ist. Es kann die Lernkurve, wie man cmp verwenden. Aber sobald Sie es tun, können Sie einzelne Gleichungen und bivariate Modelle, sowie zufällige Effekte, feste Effekte oder gepoolt (Population gemittelt) Modelle (dh eine Schätzung von nur einer Konstanten in der Gleichung, also weder feste noch zufällige Effekte zu schätzen ). In Bezug auf BP-Test oder BG-Test. Mit binären Variablen ist es nicht so direkt wie mit kontinuierlichen Antwort Variablen, so würde ich versuchen, zu viel für jetzt tun. Eine andere Sache zum Nachdenken ist, dass mit vier Jahren von Daten (Sie erwähnten 2008 - 2011 in der anderen Diskussion), es gibt nicht viel Dimension, um die Zeitreihe zu erfassen serielle Korrelation, und wenn die Heteroskedastizität in den Daten ist wegen der Unterschiede bei Die Insuree-Ebene, hätten Sie es bereits mit den zufälligen oder festen Effekten gefangen genommen. 29. Juli 2014, 13.44 hhanks für weitere Informationen: Ich glaube, ich verstanden, wie eine cmp biprobit zu implementieren: Nach helpquot zu quotcmp ich den folgenden Befehl benötigen: (. Accidentsperyear..explanatory Variablen) (1) cmp (typeofcoverage erklärend. Variablen), ind (cmpoprobit cmpoprobit) nolr tech (DFP) Im Folgenden finden Sie meine biprobit Schätzung sehen. Wie Sie sehen, es ist recht umfangreich (2) biprobit accidentsperyear typeofcoveragedummy kmtravelledperyeartsd ageofinsuree sexofinsuree initialcarvalue agecar garagedummy noclaimsbonusd1 noclaimsbonusd5 noclaimsbonusd7 noclaimsbonusd10 noclaimsbonusd20 noclaimsbonusd30 noclaimsbonusd40 noclaimsbonusd50 noclaimsbonusd56 noclaimsbonusd57 noclaimsbonusd58 noclaimsbonusd59 noclaimsbonusd61 noclaimsbonusd62 noclaimsbonusd63 noclaimsbonusd64 noclaimsbonusd65 noclaimsbonusd66 noclaimsbonusd67 noclaimsbonusd68 noclaimsbonusd69 noclaimsbonusd71 noclaimsbonusd72 noclaimsbonusd73 noclaimsbonusd74 noclaimsbonusd75 noclaimsbonusd76 noclaimsbonusd77 noclaimsbonusd78 noclaimsbonusd79 noclaimsbonusd81 noclaimsbonusd82 noclaimsbonusd83 noclaimsbonusd84 noclaimsbonusd85 noclaimsbonusd86 noclaimsbonusd87 noclaimsbonusd88 noclaimsbonusd89 typeofcard0 typeofcard10 typeofcard11 typeofcard12 typeofcard13 typeofcard14 typeofcard15 typeofcard16 typeofcard17 typeofcard18 typeofcard19 typeofcard20 typeofcard21 typeofcard22 typeofcard23 typeofcard24 typeofcard25 typeofcard26 typeofcard27 typeofcard28 typeofcard29 typeofcard30 typeofcard31 typeofcard32 typeofcard33 typeofcard34 regionalclassd1 regionalclassd2 regionalclassd3 regionalclassd4 regionalclassd5 regionalclassd6 regionalclassd7 regionalclassd8 regionalclassd9, robust nolog Accidentsperyear und typeofcoverage sind meine beiden abhängigen Variablen Meine unabhängige Variablen sind: kmtravelledperyeartsd ageofinsuree sexofinsuree initialcarvalue agecar garagedummy Zusätzlich habe ich drei ordinale Variablen: noclaimsbonus, typeofcar und regionalclass I Enthalten (n-1) Dummies für diese drei Variablen. Wenn ich bin, dass viele Variablen in der cmp-Befehl (1), es funktioniert nicht. Es funktioniert nur, wenn ich zum Beispiel nur zwei unabhängige Variablen z. (3) cmp (accidentsperyear kmtravelledperyeartsd ageofinsuree) (typeofcoverage kmtravelledperyeartsd ageofinsuree), ind (cmpoprobit cmpoprobit) (3) arbeitet. Wenn ich Sie richtig verstanden habe, muss ich die Dummies für die verschiedenen Polidyholder (in meinem Fall 140 Dummyvariablen) einschließen. Muss ich noch alle Erklärungsvariablen aus (2) enthalten oder kann ich einige der unabhängigen Variablen aus der Gleichung ( 2) Ich habe nur Angst, dass es nicht mit, dass viele Variablen wie in der normalen bivariate probit Modell arbeiten. Hast du eine Ahnung, wie es weitergehen soll 30 Jul 2014, 08:43 Was meinst du damit, dass cmp nicht funktioniert? Sie sind richtig zu befürchten, dass es möglicherweise nicht funktionieren, aber wenn die Daten richtig ist, sollte es konvergieren (schließlich) und geben Sie Ergebnisse. Wie für Ihre Syntax von cmp. Es ist nicht gut. Sie zeigen an, dass die beiden Gleichungen geordnete Probit sind, und sie sind nicht, sie sind einfache Probit. So dass Sie ind (cmpprobit cmpprobit) benötigen. Dies kann sein, warum seine nicht funktioniert. Ich schlage vor, Sie versuchen, ohne Tech (dfp) zuerst. Wenn es nicht konvergieren, können Sie Diff-Option zuerst hinzufügen und sehen, wie es geht. Und wenn es noch nicht konvergieren dann starten Sie mit der Optimierung Techniken mit der tech () - Option spielen. Für feste Effekte ja, fügen Sie einfach die Dummy-Variablen für die Versicherten, um die Menge der erklärenden Variablen. Sie können sie mit biprobit und cmp schätzen. Und vergleichen. Für die zufälligen Effekte und nach Ihrem Beispiel: Denken Sie daran, dass es die kategorische Variable nicht die Dummies für den Versicherten, die in die Definition der einzelnen Gleichung gehen. Diese Schätzung kann einige Zeit dauern und schwierig konvergieren. Wenn dies geschieht, die erste Sache ist, versuchen Sie es mit der diff-Option, und wenn das noch nicht scheinen konvergieren dann können Sie mit den Techniken zu spielen, und verwenden Sie die Tech (dfp) Sie hatte zuvor. Aber vielleicht konvergiert es gut. Nur lassen Sie wissen, dass es zeitintensiv sein kann, und dann kann es auch nicht sein. Jetzt einige Tipp für die Einfachheit. Wenn ich so viele erklärende Variablen habe und sie in verschiedenen Regressionen verwenden möchte, definiere ich globale Makros mit ihnen. In Ihrem Fall würde ich tun, ich erinnere mich nicht, was wir die Dummies für die Versicherten in der anderen Post, aber bemerken, dass ich mit der Wildcard, um alle von ihnen. Nun haben Sie in x1 alle Variablen für die einfachen und zufälligen Effekte Schätzungen, und in x2 haben Sie die Variablen für feste Auswirkungen Erklärung. Sie können gehen und tun 31 Jul 2014, 15:37 Hallo Alfonso, wieder, vielen Dank für Ihre Hilfe. Ich schätze das sehr. Ihre Befehle mit den globalen Makros und die Ware, wenn auch viele Dummies perfekt funktionieren. Leider funktioniert nur einer der Regressionen (die festen Effekte bivariate probit mit dem Befehl cmp) (aber nur manchmal). Nach der Anpassung aller Erklärungsvariablen habe ich noch 532 Beobachtungen. Seit wir vier Jahre haben, verlässt man uns mit 133 Personen. Ich habe versucht, Ihre Daten: biprobit accidentsperyear typeofcoveragedummy x1, robust nolog Ergebnis: es nicht konvergiert (nicht konkav) Auch nach der Attrappen für noclaimsbonus, typeofcar Weglassen und regionalclass Plain bivariate Probits biprobit accidentsperyear typeofcoveragedummy x1, robust nolog Ergebnis: Modellanpassung nicht konvergiert (Nicht konkav) cmp (accidentsperyear x1) (typeofcoveragedummy x1), vce (robust) ind (cmpprobit cmpprobit) Ergebnis: errormessage2 pops up. Feste Effekte bivariate Probits biprobit accidentsperyear typeofcoveragedummy x2, robust nolog cmp (accidentsperyear x2) (typeofcoveragedummy x2), VCE (robuste) ind (cmpprobit cmpprobit) Ergebnis: die cmp-Spezifikation funktioniert, aber nur manchmal, und manchmal errormessage1 erscheint Zufallseffekte Bivariate probit cmp (accidentsperyear x1 insureecypaintvariable (typeofcoveragedummy x1 insureecategoricalvariable, vce (robust) ind (cmpprobit cmpprobit) Ergebnis: Ich habe nicht laufen diese ein so weit. Ich glaube, dass quotinsureecategoricalvariablequot und quotinsureeDumquot das gleiche ist. Wenn Sie eine spontane Idee, was sein könnte Das Problem zögern Sie nicht, einen Vorschlag zu machen, in der Zwischenzeit werde ich fortsetzen, das Problem mit optionalen Befehlen wie dem Diff-Befehl zum Beispiel fortzusetzen. Mit freundlichen Grüßen Matthias PS: Wenn die Informationen, die ich zur Verfügung gestellt ein wenig verwirrend ist, zögern Sie nicht zu fragen Um es zu klären. Eine Konvergenz, oder Nicht-Konvergenz in diesem Fall ist ein heikles Thema. Manchmal ist es wegen der Daten Miss-Spezifikation, andere wegen der Modell-Fehl-Spezifikation, noch andere, weil die Götter sind gegen Sie . In Ihrem Fall scheint es, dass eine Variable (kmtravelledperyear) das Ergebnis perfekt vorhersagt, so dass keine Schätzung möglich ist. Dies bedeutet, dass alles, was Sie brauchen, um das Ergebnis vorherzusagen ist zu wissen, ob kmtravelledperyear größer als 5. Sorry, aber ich kann Ihnen nicht weiter helfen.


No comments:

Post a Comment