Stata ersetzen Sie "" mit den fehlenden Werten
Ich habe eine große Stata dataset. In einigen Variablen, die die Daten codiert wurde mit " "
(Raum) statt, als mit fehlenden Werten.
Gibt es eine Möglichkeit, um eine Schleife durch jedes element des Datensatzes und ersetzen Sie es mit dem richtigen Wert?
Brauche ich so etwas wie
for variable in all_variables:
for sample in all_samples_of_variable:
if sample == ' ' :
replace sample with missing value
- Bitte geben Sie ein Beispiel für die input-Daten und der gewünschten Ausgabe.
- Sie Lesen konnten diese in pandas mit
read_stata
, Aufrufreplace
für diese Werte und die Ausgabe wiederto_stata
- Stata halten die Daten in einer numerischen und label-format. Können die to_stata Befehl halten Sie die stata-Etiketten ?
- weiß nicht, müsste man probieren, ich habe keine Erfahrung mit stata-Dateien
- warum diese Frage wurde unten gestimmt, so viel?
- Ich habe nicht downvote, aber viele Leute hier-Objekt zu (1) Fragen ohne Versuch einer echten code (2) erscheinen zu ignorieren, Kommentare und Antworten (z.B. Sie antwortete nicht auf die Anfrage von @Tichodroma). Kriterien für die downvoting sind (a) nicht zeigen, jede Forschung-Anstrengung (b) unklar ist oder nicht sinnvoll.
- Zwei Stimmen zu schließen angegeben "unklar, was Sie fordern".
Du musst angemeldet sein, um einen Kommentar abzugeben.
Scheint es einige Verwirrung über Begriffe hier. Die Frage ist, explizit zu Stata, aber der code sieht etwas aus wie Stata. In Stata eine leere Zeichenfolge
""
gilt als eine fehlende saite. Ein string der nur ein Leerzeichen ist nicht eine leere Zeichenfolge; es ist nicht oft informativ, aber das ist ein menschliches Problem.Beachten Sie, dass dieses problem kann nur entstehen, für string-Variablen, so müssen Sie die Arbeit auf diese nur. Nehmen Sie beim Wort, dass Räume immer bedeuten, fehlt, dann
-- oder fast gleichbedeutend verwenden