Extrahieren rootdomains aus URL-string in Google Sheets
Hallo, ich bin versucht zu extrahieren, die rootdomain aus URL-string in Google Sheets. Ich weiß, wie man die domain und ich habe die Formel zu entfernen www.
aber jetzt weiß ich es nicht strip subdomain Präfixe wie 'mysite'.site.com; wo mysite
ist nicht ausgezogen aus dem domain-Namen.
Frage: Wie kann ich abrufen, die domain.com
rootdomain, wo die domain string-Kontakte (alphanumerische Zeichen, dann 1 Punkt, dann alphanumerische Zeichen (und nichts mehr)
Formel, die bisher in der Google Sheets:
=REGEXREPLACE(REGEXREPLACE(D3923;"(http(s)?://)?(www\.)?";"");"/.*";"")
Vielleicht kann dies vereinfacht werden ...
Testfälle
https://www.domain.com/=> domain.com
https://domain.com/=> domain.com
http://www.domain.nl/=> domain.com
http://domain.de/=> domain.com
http://www.domain.co.uk/=> domain.co.uk
http://domain.co.au/=> domain.co.au
sub.domain.org/=> sub.domain.com
sub.domain.org => sub.domain.com
domain.com => domain.com
http://www.domain.nl?par=1 => domain.com
https://www.domain.nl/test/?par=1 => domain.com
http2://sub2.startpagina.nl/test/?par=1 => domain.com
Du musst angemeldet sein, um einen Kommentar abzugeben.
Derzeit mit:
=trim(REGEXEXTRACT(REGEXREPLACE(REGEXREPLACE(A2;"https?://";"");"^(w{3}\.)?";"")&"/";"([^/?]+)"))
Scheint gut zu funktionieren
Aktualisiert:7-7-2016
(danke für all die Hilfe!)
=REGEXEXTRACT("."&B1&"/","\.([^.]+\.[^./?]+)(?:/|\?)")
https://moneytis.com/
undhttp://sumome.com/
Ich denke, dass die meisten zuverlässige Möglichkeit ist zu prüfen, über TLD-Liste, weil von TLDs wie co.uk, gov.Großbritannien und so weiter.
Können Sie definieren diese Funktionen in Extras -> Skript-editor
Bekommen second-level-Domain von A1 verwenden Sie es wie diese
Erhalten Sie die volle Domäne der A1 nur tun