Wie kann ich Rang Beobachtungen innerhalb der Gruppen in Stata?

Habe ich einige Daten in Stata, die Aussehen wie die ersten zwei Spalten von:

group_id   var_to_rank  desired_rank
____________________________________

1           10          1
1           20          2
1           30          3
1           40          4
2           10          1
2           20          2
2           20          2
2           30          3

Ich würde gerne eine Rang von jeder Beobachtung innerhalb der Gruppe (group_id) nach einer Variablen (var_to_rank). In der Regel wird für diesen Zweck verwendet habe ich:

gen id = _n

Aber einige meiner Beobachtungen (group_id = 2, in meinem kleinen Beispiel) die gleichen Werte haben ranking-variable und dieser Ansatz funktioniert nicht.

Habe ich auch schon versucht mit:

egen rank

Befehl mit verschiedenen Optionen, aber nicht meinen Rang-Variablen zu schauen, wie desired_rank.

Konnte Sie mir eine Lösung zu diesem problem?

InformationsquelleAutor radek | 2011-05-18

stata

4

Ich würde sagen, diese Frage stellte der falsche Weg-Runde für das beste Verständnis. Das Ziel ist die Gruppierung von Beobachtungen, die mit dem niedrigsten Wert all zugewiesen wird, eine Klasse 1, die nächste niedrigsten werden alle zugeordneten 2 und so weiter. Dies ist nicht das ranking in den meisten Sinne, dass ich gesehen habe, diskutiert, aber Stata ist egen, rank() wird erhalten Sie einen Teil des Weges.

Aber den direkten Weg, welcher bereits in der Statalist thread zitiert elewhere in diesem thread (hier starten) ist einfacher im Geist als jede Lösung, die zitiert wird:
```
bysort group_id (var_to_rank): gen desired_rank = sum(var_to_rank != var_to_rank[_n-1]) 
```
Einmal Daten sortiert auf var_to_rank dann, wenn sich Werte unterscheiden sich von vorhergehenden Werten am Anfang von jedem block der eindeutigen Werte einem Wert von 1 ist das Ergebnis var_to_rank != var_to_rank[_n-1]; sonst 0 ist das Ergebnis. Fazit diese 1en und 0EN kumulativ gibt die gewünschte variable. Die Präfix-Befehl bysort funktioniert die Sortierung erforderlich und sorgt dafür, dass all dies geschieht getrennt in den Gruppen definiert durch group_id. Keine Notwendigkeit für egen (ein Befehl, dass viele Menschen, die nur verwenden Stata gelegentlich finden oft bizarren).

Erklärung des Interesses: Die Statalist thread zitiert, zeigt, dass, wenn aufgefordert, eine ähnliche Frage auch ich glaube nicht an diese Lösung in einem.

Vielen Dank. Ausgezeichnete oneliner. Auch ich war nicht sicher über die genaue Bezeichnung der Frage, aber beschlossen zu gehen mit 'Rang' gegen 'Gruppe', da war die Reihenfolge hier wichtig. Fühlen Sie sich frei, um die Anpassung der Frage-und/oder-Titel wenn Sie besseren Vorschlag.

InformationsquelleAutor Nick Cox
7

Folgendes funktioniert bei mir:
```
bysort group_id: egen desired_rank=rank(var_to_rank)
```
Dank der chl. Ich habe versucht, es so gut. Wäre es möglich, jedoch um 1, 2, 3 Reihen anstelle von 1, 2.5, 4?
Sicher: bysort group_id: egen desired_rank=rank(var_to_rank), unique geben 1 2 3 4 für Gruppe 2, und austauschen unique durch track geben Sie 1 2 2 4.
Als Sie sagte, 'unique' - option gibt mir '1,2,3,4' und mein Ziel ist es, '1,2,2,3'.
Tut egen desired_rank=group(var_to_rank) produzieren, was Sie suchen? (aber ich würde nicht nennen dieses ranking.)
Das tut es tatsächlich. Aber es funktioniert für den ganzen Datensatz nur da ich es nicht verwenden mit bysort :/

InformationsquelleAutor chl
5

Stolperte über eine solche Lösung auf dem Statalist:
```
bysort group_id (var_to_rank) : gen rank = var_to_rank != var_to_rank[_n-1]
by group_id : replace rank = sum(rank)
```
Scheint, heraus zu Sortieren das Problem.

InformationsquelleAutor radek
3

@radek: Sie werden sicherlich bekommen es aussortiert, in der Zwischenzeit ... aber das hätte eine einfache (wenn auch nicht sehr elegante) Lösung:
```
bysort group_id:   egen desired_rank_HELP =rank(var_to_rank), field
egen desired_rank      =group(grup_id desired_rank_HELP)
drop desired_rank_HELP
```
Danke. Nicht denken über die Verwendung egen group diese Weise.

InformationsquelleAutor sam
0

Weg, zu viel Arbeit. Einfach und elegant. Versuchen Sie diese ein.

gen desired_rank=int(var_to_rank/10)

Sicher, das funktioniert aus dem einfachen Zahlenbeispiel gegeben, aber es ist offensichtlich nicht eine Lösung im Allgemeinen, also das verfehlt den Punkt.
(In der Tat, zum Beispiel, die int() ist redundant.)

InformationsquelleAutor Lazy
0

diesen Befehl ausprobieren, es funktioniert für mich so gut: egen newid=group(oldid)

Sicher, das funktioniert aus dem einfachen Zahlenbeispiel gegeben, aber es ist keine Lösung, im Allgemeinen, also das verfehlt den Punkt. Ändern Sie den ersten Wert auf 5, zum Beispiel, und dann die erste Reihe für die zweite Gruppe wird nicht mehr sein 1. Problem-ranking innerhalb - Gruppen.

InformationsquelleAutor bontey

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.