ob der string beginnt und endet mit dem gleichen Wort

Ich versuche zu überprüfen ob der string beginnt und endet mit dem gleichen Wort. zBearth.

s=raw_input();
m=re.search(r"^(earth).*(earth)$",s)
if m is not None:
    print "found"

mein problem ist, wenn der string nur aus einem Wort besteht zB: earth

Derzeit habe ich hart codiert in diesem Fall durch

if m is not None or s=='earth':
    print "found"

Gibt es eine andere Möglichkeit, dies zu tun?

EDIT:

Wörter in einem string durch Leerzeichen voneinander getrennt. Suche nach einer regex-Lösung

some examples:

"Erde ist Erde" ,"Erde", --> valid

"earthearth", "eartheeearth", "Erde Erde mars" --> invalid

sind Sie auf der Suche nach einem bestimmten Wort (earth) oder jeder anderen zufälligen Wort
es kann ein beliebiges Wort sein. vorzugsweise eine Lösung mit regulären Ausdruck, aber auch andere einfache Lösungen sind auch willkommen 🙂
Warte, meinst du (1) wenn Sie diesen code ausführen, werden Sie wissen, was Wort, das Sie suchen, und Sie überprüfen möchten, dass die Zeichenfolge beginnt und endet mit bestimmten Wort, oder (2) es gibt kein bestimmtes Wort, Sie wollen einfach nur, um zu sehen, wenn das erste und das Letzte Wort in der Zeichenfolge gleich sind, was auch immer das Wort sein kann?
Was über so etwas wie eabce? es beginnt und endet mit dem gleichen Buchstaben e.
sorry für die Verwirrung, ich meine, (2) es gibt kein spezifisches Wort, das ich Suche. das Wort 'Erde', zum Beispiel
fügen Sie einige bessere Beispiele.
Wenn Sie sagen, "Wort", was trennt die Worte, oder sind Sie gerade im Gespräch über die Charaktere? In anderen Worten (sorry für das Wortspiel), deutlich, dass die Zeichenfolge "foo bar foo" sollte true zurückgeben, ja? Aber was ist mit dem string "foobar foo"? Sollte true zurückgeben, oder nicht?
Buchstaben machen word..also Buchstaben !=Wort
ich habe die Frage bearbeitet
Da das, was Sie wirklich wollen, ist, wenn ein Satz beginnt und endet mit dem gleichen Wort -, müssen Sie zuerst zu definieren, was ein Wort ist. Einfach mit \w, die matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_] wird nicht funktionieren, weil die meisten Ihrer Sätze wird scheitern, diese zu überprüfen; da es kaum beginnen und enden mit einer Präposition. Betrachten Sie zum Beispiel diesen Satz, sollte dieses match? The Earth is not completely round, just like other planets that look like Earth.
wenn "earth" gilt dann "earthearth" sollte auch gültig sein. Geben Sie Ihre Anforderungen klar.

InformationsquelleAutor Ajax | 2013-06-30

python regex

4

Können Sie Rückverweis innerhalb von regex
```
^(\w+\b)(.*\b\1$|$)
```
Diese würde mit einem string nur, wenn es
- beginnt und endet mit der gleichen Wort
- hat ein einziges Wort
- Das wird nicht funktionieren, auf der "Erde" string.
- Richtig, aber mit regex im Allgemeinen für diesen Fall scheint wie ein overkill 🙂
- seine Frage ist find whether the string starts and ends with the same word.. ich denke mal er will mit einer Zeichenfolge überein mit jedem Wort, das nicht nur earth
- ends with the same word- 'earth'. 🙂
- er sagt, z.B.: die Erde..also es kann ein beliebiges Wort sein
- dein Zitat ist ein misquote...kann man nicht einfach abschneiden, das Ende eines Satzes ändern Sie die Bedeutung.
- Das sind zwei misquotes. Willst du gehen für ein 3.?
- das ist etwas, was wir klären sollten, mit op
- ich arbeite an meinen regex-Fähigkeiten, so war auf der Suche nach einem regulären Ausdruck als Antwort. 🙂
- hoffe, der Kommentar des op hilft..er braucht die 2. option..:P
- ich denke, die oben genannten regex ist das, was du suchst 😛
- korrigieren Sie mich, wenn falsch - Sie prüfen, ob ein einzelnes Wort überprüfen Sie dann, ob der zweite Teil ist leer von |$ oder das erste Wort entspricht, mit der letzten mit \1$ . warum funktioniert das nicht: r"^(\w+\b).*(\b\1$|$)" ?
InformationsquelleAutor Anirudha

Verwenden Sie die str.startswith und str.endswith Methoden statt.

>>> 'earth'.startswith('earth')
True
>>> 'earth'.endswith('earth')
True

Können Sie einfach kombinieren Sie in einer einzigen Funktion:

def startsandendswith(main_str):
    return main_str.startswith(check_str) and main_str.endswith(check_str)

Und jetzt können wir es nennen:

>>> startsandendswith('earth', 'earth')
True

Wenn, jedoch, wenn der code übereinstimmt Worte und nicht Teil eines Wortes, ist es vielleicht einfacher zu split die Zeichenfolge, und dann überprüfen, wenn das erste und das Letzte Wort die Zeichenfolge, die Sie überprüfen möchten:

def startsandendswith(main_str, check_str):
    if not main_str:  # guard against empty strings
        return False
    words = main_str.split(' ')  # use main_str.split() to split on any whitespace
    return words[0] == words[-1] == check_str

Läuft es:

>>> startsandendswith('earth', 'earth')
True
>>> startsandendswith('earth is earth', 'earth')
True
>>> startsandendswith('earthis earth', 'earth')
False

die Antwort, so wie es da steht ist falsch
könnten Sie das erklären? Die OP hat nicht explizit gesagt, nichts über die Worte nach getrennt werden (und die OP ' s regex nicht umgehen, entweder).
schauen Sie sich die Kommentare in Frage

InformationsquelleAutor Volatility

3

Können Sie str.startswith und str.endswith:
```
>>> strs = "earthfooearth"
>>> strs.startswith('earth') and strs.endswith("earth")
True
>>> strs = "earth"
>>> strs.startswith('earth') and strs.endswith("earth")
True
```
Update:

Wenn die Wörter durch Leerzeichen getrennt sind und die start-und end-Zeichenfolge nicht bekannt ist, dann verwenden Sie str.split und str.rsplit:
```
>>> strs = "foo bar foo"
>>> strs.split(None, 1)[0] == strs.rsplit(None, 1)[-1]
True
# single word
>>> strs = "foo"
>>> strs.split(None, 1)[0] == strs.rsplit(None, 1)[-1]
True
>>> strs = "foo bar ffoo"
>>> strs.split(None, 1)[0] == strs.rsplit(None, 1)[-1]
False
```
- +1 für die effizientere split(None, 1) und rsplit(None, 1) nicht erwähnt, die von vielen anderen split-basierte Antworten. Ihre ersten code hätte ein etwas besseres Beispiel, wenn es gefolgt PEP 8, obwohl. 🙂
- Pflege zu erklären, downvote, so dass ich verbessern kann, meine Antwort.
- wie funktioniert str.split(None, X) funktioniert?
- @Ant help(str.split)
InformationsquelleAutor Ashwini Chaudhary
3

Hier:
```
X = words.split()
X[:1] == X[-1:]
```
Das aufschneiden macht es die Arbeit für leere Zeichenfolgen zu, und erweitern Sie schön auf eine beliebige Anzahl von Wörtern. Wenn words kann nicht leer sein, verwenden Sie
```
X[0] == X[-1]
```
- Einfache, aber weniger effizient als die Verwendung split(None, 1) und rsplit(None, 1).
- Wahr. Aber die Effizienz war nicht eine explizite Anforderung, also IMHO einfacher ist besser.
- Es hängt wirklich vom Kontext ab: wenn ich sehe X = words.split() am Anfang einer längeren Funktion, es sagt mir, ich muss daran erinnern, dass alle Worte sind wichtig, und wird wahrscheinlich verwendet werden. Wenn die beiden Zeilen, die Sie schreiben, sind die letzten, die in einer Funktion und die Funktion wird nicht aufgerufen wiederholt, dann OK.
- es gibt immer del X ... (Ja, ich bin nicht ernst. Ich sehe Ihren Punkt)
InformationsquelleAutor Elazar
1

Gut, wenn Sie unbedingt wollen, regex, können Sie Gebrauch machen von lookarounds, da Sie nicht verbrauchen Zeichen.
```
>>>import re
>>>s1 = 'earth is earth'
>>>s2 = 'earth'
>>>m = re.search(r"^(?=(earth)).*(earth)$",s1)
>>>m.group(1)
'earth'
>>>m.group(2)
'earth'
>>>m = re.search(r"^(?=(earth)).*(earth)$",s2)
>>>m.group(1)
'earth'
>>>m.group(2)
'earth'
```
Für eine beliebige Zeichenfolge, könnten Sie vielleicht diese:
```
^(?=([A-Za-z]+)).*(\1)$
```
Ich gehe davon aus, dass Wörter als nur Buchstaben. Wenn Sie meine Worte als in nicht-Leerzeichen, dann können Sie gehen für \S statt [A-Za-z].

EDIT: Okay, es scheint es gibt mehr zu es. Was ich denke könnte passen ist:
```
^(?=(earth\b)).*((?:^|\s)\1)$
```
Für die Arbeit der Erde. Für jedes Wort gespeichert in einer variable namens word;
```
>>> word = 'earth' # Makes it so you can change it anytime
>>> pattern = re.compile('^(?=(' + word + '\b)).*((?:^|\s)\1)$')
>>> m.search(pattern, s)
```
Akzeptiert:
```
earth is earth
earth
```
Ablehnt:
```
earthearth
eartheearth
earthis earth
```
Und danach entpacken Sie das aufgenommene Gruppen oder überprüfen, ob die Gruppe leer sind oder nicht.

Das bit ich Hinzugefügt ist (?:^|\s) die prüft, ob das Wort, das Sie suchen, ist der einzige, der in der 'Satz' ist, oder ob das Wort in einem Satz.

InformationsquelleAutor Jerry

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.