Warum war das Leerzeichen nicht gewählt für C++14-stellige Separatoren?

Als von C++14, Dank n3781 (die in sich selbst keine Antwort auf diese Frage) vielleicht schreiben wir einen code wie den folgenden:

const int x = 1'234; //one thousand two hundred and thirty four

Ziel ist die Verbesserung der code wie dieser:

const int y = 100000000;

und machen es besser lesbar.

Den Unterstrich (_) Charakter war bereits im C++11, die durch benutzerdefinierte Literale, und das Komma (,) hat die Lokalisation Probleme — viele Europäische Länder verblüffend^† verwenden Sie diese als Dezimaltrennzeichen und Konflikte mit dem Komma-operator, obwohl ich Frage mich, was die real-world-code könnte möglicherweise gebrochen worden, indem z.B. 1,234,567.

Sowieso eine bessere Lösung zu sein scheint, die dem Raum Charakter:

const int z = 1 000 000;

Diese angrenzenden numerischen literalen Token können verkettet werden, indem der Präprozessor nur so sind string-Literale:

const char x[5] = "a" "bc" "d";

Statt, wir bekommen das Apostroph ('), die nicht von jedem system schreiben, ich bin mir dessen bewusst, als eine Ziffer separator.

Gibt es einen Grund, dass der Apostroph gewählt wurde statt eines einfachen Raum?

_{^† Es ist unverständlich, da alle diese Sprachen, die im text an, pflegen Sie die Vorstellung von einem Komma, "zerreißen" einem sonst atomaren Satz mit einem Punkt funktionieren "kündigen" der Satz — für mich zumindest, dies ist ganz Analog zu einem Komma "auseinander bricht" den ganzzahligen Teil einer Zahl und einem Punkt "beenden" ist es bereit für die Bruch-Eingang.}

In Bezug auf das Komma, ist das nicht das Problem der Komma-operator, sondern als Lokalisierungs-Probleme?
Da schlage ich vor in der Frage, obwohl dies mag wahr sein, kann ich mir nicht vorstellen, dass es eine real-world-code, der tatsächlich gebrochen wurde, durch solch einen Konflikt. Wer schreibt 1,000,000 und könnte erwarten, etwas anderes als die Verkettung derjenigen, Literale, in der Realität? Der nächste, den ich bekommen kann, ist foo()*3, 4, 5 aber ich denke, erfordern Klammern um den ersten Ausdruck zumutbar ist. Weil es albern code in den ersten Platz.
Ah, ich vergaß ein paar Worte. Ich hab meine für die Hälfte-Satz kurz-Adresse der Komma-operator.
Ich so oft zu hören, dass "whitespace ist egal!" oder "wird ignoriert!" - wäre schön wenn das ein bißchen wahrer!
Ich nehme an, niemand ändern soll die Bedeutung von int a[] = {123,000,000}. Für das Komma versus Zeitraum Unterscheidung, beachten Sie, dass diese vor kurzem standardisiert - sowohl in text und zahlen.
Autsch, das ist ein gutes Beispiel. re ", das kürzlich standardisierte" was meinst du? Ich bin mir nicht bewusst jede Sprache, die sich verändert hat in den letzten Speicher, und sicherlich nicht erst seit 1998.
Ich meinte eigentlich Ihre Verwendung in der Sprache geschrieben, die zufällig im 19.Jahrhundert.
Richtig, das ist, warum ich bin verwirrt, als die Relevanz der Tatsache, dass, weil der 19th Jahrhundert, etwas älter als C++.
Der Kommentar wurde in Bezug auf die Fußnote und nicht-englischen Sprachen. Die Frist war bereits im Einsatz als Gruppen-Trennzeichen in Datumsangaben, z.B. IV.I.MMXV heute ist.
Ich interpretiere das anders als du. Diese Fristen betragen in der Abgrenzung der drei unterschiedlichen Bereichen (als der Zeitraum, in Englisch 123.45 grenzt integral und fractional); dies ist eine andere Funktion hat als das gedient, Tausender-Trennzeichen, die rein ästhetische, sondern als semantische im Einsatz. Als solche, Ihre würde-werden Gegenbeispiel ist nur ein weiteres Beispiel, warum das moderne Englisch Komma als Tausender-Trennzeichen sinnvoll ist (über die Verwendung einer Frist für die selbe Sache) und hat getan, da vor dem 19. 🙂
Es gibt keinen "Sinn" davon. Dezimal-Trennzeichen ist sicherlich nicht vollständig zum Stillstand gekommen ist; mit einem Komma würde wahrscheinlich die meisten "vernünftigen". Aber diese sind rein Schriftsatz-Konventionen, die im Laufe der Zeit entwickelt, unterschiedlich in den verschiedenen "locales", und als MSalters Punkte heraus, nur standardisierte vor kurzem.
Der 1800er ist wohl kaum "vor kurzem", obwohl ich zugeben, dass solche Dinge relativ sind.
Neben der technischen Punkte, die Sie sagen, dass das Apostroph ('), [ist] nicht von jedem system schreiben, ich bin mir dessen bewusst, als eine Ziffer separator. Es ist ein Land, mit dem Apostroph als digit separator: Schweiz. Ich habe auch gesehen, dass es in Fällen, in denen der Autor liebt es mehr oder ein Punkt/Komma würde zu Verwirrung führen, da Sie International unterschiedlich verwendet.
Wenn das macht Sie fühlen sich besser, ich bin Europäer und Dank der vielen Produkte, die hergestellt in den usa (Taschenrechner, etc.) mit Komma für dezimal-Werte ist - glücklicherweise - sehr langsam Herausfallen Geschmack. Ich würde sagen, 0.99 ist jetzt allgemein verwendet als 0,99; mit Kommas als Trennzeichen für Tausender ist unbekannt, obwohl, wie durch Punkte, die wir gerade nicht trennen lassen (wahrscheinlich, weil 1,234 und 1.234 beides bedeutet Dezimalzahlen heute)
Bezüglich der Verwendung des Kommas als Trennzeichen, könnte man überlegen, was (1,200) bedeutet -- es könnte bedeuten, 1200 oder 200, je nachdem, was Sie wollen, es zu Lesen, wenn das Komma verwendet, als Tausendertrennzeichen. Wieder, wie @AndreasBonini schreibt, dass es nicht verwendet werden, die oft in Europa.
Es tut sich etwas 😉
Ich hätte gedacht, das Problem mit dem Komma wäre die Mehrdeutigkeit im Falle von int foo(int);int foo(int,int); foo(1,000);
Gut, wir brauchen nur ein Unicode-Zeichen, das bedeutet insbesondere Ziffer Gruppierung.
Und einen entsprechenden Alternativen-Token-Repräsentation (digraph)! 😀
Für den Datensatz, der Apostroph ist standard digit separator notation auf Rechenmaschinen. (Verweis)
Nicht alle von Ihnen. Es gibt keine "standard".
Das ist der erste, den ich gesehen habe, ohne Apostrophe, und Google-Bilder-Suche scheint zu zeigen, die überwiegende Mehrheit der Verwendung. Zumindest ist es verantwortlich, die als gemeinsame Verwendung in solchen Maschinen, wenn wir vermeiden wollen wählerisch Wörter wie "standard".
Aus einem cursor Suche auf adding machine es sieht mehr aus wie halbe/halbe, nicht "die überwiegende Mehrheit".
Lettland zu verwendet ein Apostroph als Tausendertrennzeichen - oder zumindest so getan haben, als ich noch in der Schule. 😛 Es ist nicht etwas, die Sie Häufig verwenden.
Es ist eine große Beitrag auf der UX-Website, entnommen aus Wikipedia, zeigt, dass die Nutzung von Separatoren für verschiedene Länder. Wie es oft der Fall mit der Internationalisierung, es gibt mehr Varianten, als man erwarten würde, und es ist ziemlich viel Durcheinander! 🙂
Kommas kann geringer sein, Separatoren in Englisch geschrieben, aber algebraische Ausdrücke dots sind oft Optional platziert lediglich zu klären, die Grenzen zwischen dem Token, in der Erwägung, dass das Komma verwendet wird, trennen zwei unterschiedliche Elemente in einem paar. Betrachten a·sin(A) das ist das gleiche wie a(sin(A)), in der Erwägung, dass v = (2,3) ist sehr Verschieden von v = (2(3)). Trotzdem, logischen Ressourcen, um Präzedenzfall zu wählen zwischen Lokalisierungen nie wirklich geben uns die richtige Antwort.
Wahr genug.
In Bezug auf real-world-code mit Komma-operator zwischen den zahlen: Eigen::Matrix3f m; m << 1,2,3,4,5,6,7,8,9;. Siehe Eigen ist Komma-Initialisierung.
Aber das ist eigentlich eine verkettete Reihe von Funktionsaufrufen (jeweils mit einem Eigen Typ auf der LHS) und könnte definiert werden, um Vorrang vor einer "single" literal gefunden in einem Teilausdruck auf seine eigenen. Logisch die beiden unterschieden werden konnte, aber, zugegeben, es ist sonst nicht eindeutig, und die parsing-Phase können nicht wollen, zu haben, um zu arbeiten, aus.

InformationsquelleAutor Lightness Races in Orbit | 2015-01-04

c++c++14 digit language-lawyer

35

Es ist eine frühere Papier, n3499, die uns sagen, dass, obwohl Bjarne selbst vorgeschlagen Leerzeichen als Trennzeichen:
Während dieser Ansatz steht im Einklang mit einem gemeinsamen typeographic Stil, es leidet unter einigen Kompatibilitätsproblemen.
- Es entspricht nicht der syntax für einen pp-Zahl, und würde minimal-erfordern die Erweiterung, die syntax.
- Noch wichtiger ist, gibt es einige syntaktische Mehrdeutigkeit, wenn eine Hexadezimalziffer im Bereich [a-f] folgt ein Leerzeichen. Der Präprozessor würde nicht wissen, ob Sie symbol-substitution-Beginn nach den Raum.
- Würde es wahrscheinlich machen-editing-tools, die greifen "die Wörter" weniger zuverlässig.
Ich denke, das folgende Beispiel ist das größte problem festgestellt:
```
const int x = 0x123 a;
```
obwohl meiner Meinung nach diese Begründung ist ziemlich schwach. Ich kann immer noch nicht glauben, eine real-world-Beispiel, um Sie zu brechen.

Den "Bearbeitungs-tools" Begründung ist sogar noch schlimmer, da 1'234 Pausen grundsätzlich jede syntax-highlighter, die der Menschheit bekannt (z.B. das von Markdown in der obigen Frage selbst!) und aktuelle Versionen der besagten Textmarker viel schwieriger zu implementieren.

Immer noch, für besser oder schlechter, das ist die Begründung, dass führte zu der Annahme Apostrophe statt.
- Ich denke, das Beispiel wäre besser mit const int x = 0x123 a45;. Beachten Sie, dass im Gegensatz zu den string-Fall a45 ist nicht noch ein literal.
- Wenn ich Präsident der Erde, wäre es der Fall, dass eine "wörtliche" umfassen würde, die einen Raum in seiner Produktion, Herstellung 0x123 a45 eine einzige, wenn auch-multi-token-literal. Können Sie denken Sie an ein Szenario, in dem a45 interpretiert als Teil eines integer-literal, die hier nicht erwünscht? Es gibt keinen Betreiber oder alles, bevor es so was sonst noch könnte es jemals sein?
- #define abc + 1, const int x = 0x123 abc;
- Makros werden erweitert, in phase 4, und die string-Literale werden verkettet in phase-6. Ich würde erwarten, dass "zahlenliteral Verkettung", um auch in der phase 6, so dass das Verhalten von deinem Beispiel-code und nicht etwas zu zerbrechen.
- Ich bin mir nicht sicher, ob es einfach ist. Zulassen makro-Ersatz müsste man analysieren abc als id, aber dann müsstest du angeben, eine Art Verkettung von einem pp-Zahl und id, das ist...seltsam. Außerdem gibt es anscheinend auch erhebliche Bedenken mit dem brechen von Objective-C.
- Ich habe manchmal Dinge wie x und q als temporäre "metaprogramming" von Makros (undef ' ed sofort nach Gebrauch), wenn es nötig war, um zu definieren, Daten-Tabellen, die kombiniert verschiedenen bit-Werte verschoben. Ich glaube nicht, dass ich verwendet habe, a-f, in solcher Mode, aber ich glaube nicht, dass ich ganz bewusst vermied Sie, so ist es plausibel, dass ein Programmierer benutzen könnte, metaprogramming Makros, die mit diesen Zeichen beginnen, wodurch Mehrdeutigkeit.
- Es wäre nicht zweideutig, und Ihre Makros würde noch funktionieren, da Makros werden erweitert, früh.
- Ich dachte an Situationen, in denen Makros zu erweitern, um Dinge wie <<6) | (uint64)(, und man könnte produzieren einige Tabellen mit Dingen wie V(12 x 12 y 5 z). Solche Makros könnte mehrdeutig sein, wenn Sie enthalten Buchstaben von a-f, oder wenn Sie eine leere erscheinen konnte zwischen den Zeichen der 0x Präfix.
- Das ist schrecklicher code, und ich würde lieber haben wir nicht optimieren für Sie ;p
- Ich sehe immer noch einige Bedeutung zu T. C. s argument. Es könnte die Erstellung von extreme Verwirrung mit vorhandenen Makros. Betrachten Sie das neue makro Regel, die wir hinzufügen müssten: "nicht schreiben, Makros, deren name enthält nur [0-9A-Fa-f], denn die können brechen beliebigen hex-zahlen, die Leerzeichen verwendet." Während technisch rückwärts vergleichbar, da die alten Codes nicht mit dieser Schreibweise, es ist etwas sehr unplesant darüber. Vor allem, da DEADBEEF ist wahrscheinlich nicht unangemessen makro name heute. In dem gegenwärtigen system, die zumindest DEADBEEF kann niemals eine Zahl ohne 0x
- Können Sie erklären, wie genau es funktionieren, wenn es #define'd Dinge wie GOOD (als etwas willkürlich), BAD (als etwas willkürlich), und irgendwo da unten ist eine Zahl, die 0xBAD BAD? (bitte nicht Sinn der Großschreibung - es könnte jeder sein)
- Das Konstrukt ist nicht für den "code" als solche, sondern für Daten-Tabellen, die müssen Ihren Wohnsitz in ROM. Eine Wahl zwischen dem schreiben (und zu pflegen), ein separates Dienstprogramm zum konvertieren einige andere format der Daten-Tabelle in C Konstanten Deklarationen oder (ab)mit dem Präprozessor, kann es die Vorteile zu halten, alles in einem tool-Kette. In jedem Fall, ein solcher code vorhanden ist, und damit der standard nicht geändert werden sollte, in einer solchen Art und Weise, wie in verändern Ihre Bedeutung.
- LOL beiseite, Alisdair Meredith in einem seiner Vorträge auf CppCon 2014, sagte, dass Leerzeichen als separator wurde abgelehnt, der Grund.
- Wieder, die Makros sind erstmals erweitert. Nichts würde sich ändern. Nichts wäre mehr verwirrend, als es ohnehin schon ist, indem er ein makro. Wenn Sie wissen, dass das makro vorhanden ist und was es expandiert, dann verstehen Sie das Programm; wenn nicht, dann sind Sie schon verwirrt heute! Ich denke, meine gesamte Gegenargument Scharniere auf dieser. Ich werde nicht behaupten, dass es ein ausreichend counter-argument, aber es ist einem trotzdem! Ich hoffe nur, dass habe ich ihn auch her angemessen. Menschen reden immer über veränderte Bedeutung, aber ich sehe nicht ein (Forts.)
- (Forts.), außer in der array-Initialisierung / Funktion args Fälle, die sind sehr überzeugend.
- kein Scherz, macht mich zu sehen die Attraktivität des LISP, speziell für Sprache-Forschung.
InformationsquelleAutor Lightness Races in Orbit
16

Der offensichtliche Grund für die Verwendung von white space ist, dass eine neue Zeile ist auch
ein Leerzeichen ist, und dass C++ behandelt alle weißen Raum identisch. Und aus
hand, ich kenne keine Sprache, die akzeptiert beliebige Leerzeichen
als Trennzeichen.

Vermutlich Unicode-0xA0 (non-breaking space) verwendet werden könnte,—es ist
die am meisten verbreitete Lösung, wenn Satz. Ich sehe zwei Probleme mit
jedoch: Erstens, er ist nicht in der basic-Zeichensatz, und zweitens,
es ist optisch nicht unterscheidungskräftig; Sie kann nicht sehen, dass es nicht ein Raum von
schauen Sie einfach nur auf den text in einem normalen editor.

Darüber hinaus, gibt es nicht viele Möglichkeiten. Sie können nicht das Komma verwenden, da
das ist bereits eine juristische token (und so etwas wie 1,234 ist derzeit
Rechtsanwälte C++, mit der Bedeutung 234). Und in einem Kontext, wo Sie auftreten könnten
in der juristischen code, z.B. a[1,234]. Ich kann zwar nicht Recht vorstellen, jede echte
code tatsächlich mit diesem, ist es eine grundlegende Regel, dass keine rechtlichen Programm,
unabhängig davon, wie absurd, sollte lautlos ändern Semantik.

Ähnliche überlegungen bedeuten, dass _ können nicht verwendet werden; wenn es einen
#define _234 * 2, dann a[1_234] würden leise Veränderung der Bedeutung von
die code.

Kann ich nicht sagen, ich bin besonders zufrieden mit der Wahl von ', aber es
hat den Vorteil, dass Sie verwendet in kontinental-Europa, zumindest in
einige Arten von Texten. (Ich glaube mich zu erinnern gesehen zu haben, es in Deutsch für die
Beispiel, obwohl in typischen running text, Deutsch, wie die meisten anderen
Sprachen, verwenden Sie einen Punkt oder ein non breaking space. Aber vielleicht war es auch
Schweizer Deutsch.) Das problem mit ' Analyse; die Reihenfolge '1' ist
schon juristisch ist '123'. So etwas wie 1'234 könnte ein 1,
gefolgt von dem start einer Zeichenkonstante; ich bin nicht sicher, wie weit Sie
zu look-ahead, um die Entscheidung zu treffen. Es gibt keine Folge von gesetzlichen
C++, in welche eine Integrale Konstante sein kann, gefolgt von einem Zeichen,
Konstante, es gibt also kein problem mit dem brechen legal code, aber es bedeutet,
das lexikalische Scannen wird plötzlich sehr Kontext abhängig.

(Mit Bezug auf dein Kommentar: es gibt keine Logik in der Auswahl eines
Dezimalstellen oder Tausender-Trennzeichen. Dezimal-Trennzeichen, zum Beispiel, ist
sicherlich nicht eine Vollbremsung. Sie sind nur willkürliche Konventionen.)
- "eine neue Linie wird auch white space". Sorry, wenn ich albern hören, aber warum ist das so? 🙂
- C definiert die "Leerräume" werden "... Leerzeichen, horizontaler Tabulator, neue-Zeile, vertikaler Tabulator und Seitenvorschub", und das ist ganz konventionell.
- Ich nicht kaufen, das Komma-problem Beispiel. Warum würde jemand schreiben 1,234? Dass der jeweils gültigen bedeutet nicht, dass seine nützlich. MSalters' Beispiel eines array-Initialisierung war ziemlich gut, obwohl. Für still changing Semantik generell, aber dort ist Präzedenzfall dafür, wo das Dienstprogramm erheblich übersteige den ist use-cases (auto als das offensichtlichste Beispiel).
- Oder sogar void f(int); void f(int, int); f(12,345);
- Das ist ein guter zu -.-
- Re a[1_234] leise geändert, wieder keine, da Makros bereits verarbeitet zwei Phasen der übersetzung vor die Bühne führt, dass die string-Verkettung (wo ich erwarten würde, das wörtlich "Verkettung", um auch stattfinden).
- Schließlich stellte ich eine gewisse Logik, warum ein Dezimaltrennzeichen, das macht mehr Sinn als eine Periode.
- Wie ist '123' legal?
- Es ist ein multi-character literal. Nicht sehr nützlich, weil es die Implementierung-definiert Art.
- Denn C++ ist nicht zeilenorientiert. Eine neue Linie spielt genau die gleiche Rolle wie alle anderen weißen Raum in der Sprache.
- Neu ist die definition des white space als konventionelle, das ist teilweise wahr. Aber es gibt gewisse verbindende Merkmale: keine Leerzeichen benötigen keine Tinte. Noch wichtiger ist, Sie können austauschbar verwendet werden, und wiederholt werden kann, ohne Wirkung.
- Nicht nur ist es legal mit der Implementierung definierte Semantik, aber auch wenn Sie es nicht waren, dann wäre dies mehr als wahrscheinlich, eine semantische Beschränkung, und noch gültig ist syntax, das ist der Schlüssel, vor allem bei der Diskussion syntax-highlighting Probleme.
- Re Gründe, warum ein Zeitraum, sinnvoll, wie eine decimal-separator: die einzigen Kommentare, die ich finden kann im Hinblick auf die Wirkung, dass das Dezimaltrennzeichen ist wirklich ein separator. Was spricht gegen eine Vollbremsung, da ein Punkt (oder Zeitraum) ist ein terminator, nicht separator. (Aber es ist völlig irrelevant, so oder so, da sind wir Umgang mit mathematischen convensions, nicht textlichen Interpunktion.)
InformationsquelleAutor James Kanze
10

Vom wiki, haben wir ein schönes Beispiel:
```
auto floating_point_literal = 0.000'015'3;
```
Hier haben wir die . operator und dann, wenn ein anderer Betreiber würde erfüllt werden, meine Augen würde warten, bis etwas sichtbar ist, wie ein Komma oder etwas, das nicht ein Leerzeichen.

So ein Apostroph funktioniert hier wesentlich besser als ein Leerzeichen machen würde.

Mit Leerzeichen wäre es
```
auto floating_point_literal = 0.000 015 3;
```
die fühlt sich nicht mehr so Recht, wie der Fall mit der Apostrophe.

In dem gleichen Geist der Albert Renshaw Antwort, ich denke, dass das Apostroph ist klarer als der Raum der Leichtigkeit Rennen im Orbit schlägt.
```
type a = 1'000'000'000'000'000'544'445'555;
type a = 1 000 000 000 000 000 544 445 555;
```
Raum ist für viele Dinge verwendet, wie die Saiten Verkettung der OP erwähnt, im Gegensatz zu dem Apostroph, der in diesem Fall macht es klar, für jemanden, der verwendet wird, trennen Sie die Ziffern.

Wenn die Zeilen-code werden viele, ich denke, dass dies die Lesbarkeit verbessern, aber ich bezweifle, dass ist der Grund, warum Sie es wählen.

Über die Räume, die es vielleicht lohnt sich ein Blick auf das C Frage, die sagt:

Die Sprache nicht erlauben int i = 10 000; (ein integer-literal ist ein token, das dazwischenliegende Leerzeichen, spaltet es sich in zwei Token), aber es gibt in der Regel wenig bis gar keine Kosten, die entstehen, indem man die Initialisierung als ein Ausdruck, der eine Berechnung von literalen:

int i = 10 * 1000; /* ten thousand */
- Oft ist die lange Nummer, die Sie gerade zum Ausdruck bringt nicht in allen Nullen, in diesem Fall Ihre 10*1000 Beispiel nicht funktioniert.
- dies ist ein Beispiel eingefügt werden aus der Antwort, die ich verlinkte. Denken Sie, ich sollte es ändern?
- Sie sind, nehme ich an, bewusst das Datum der Veröffentlichung (genauer gesagt, den Monat und den Tag, nicht so viel wie das Jahr) an, dass das Papier, auf Leerzeichen überlasten, richtig?
- Ja, nicht so modern, werde ich die edit @BenjaminLindley.
- Die Modernität war es nicht bedenklich. Untersuchen Sie ein bißchen vorsichtig. Wenn das Datum hat keine Bedeutung in Ihrem Teil der Welt, google es.
- Eure Meinungen zur Lesbarkeit sind keineswegs universell; der Apostroph sieht geradezu bizarre die meisten der Weltbevölkerung. Und sicherlich werden alle wissenschaftlichen Dokumente verwenden Sie Leerzeichen als Trennzeichen auf die gebrochene Seite, und die meisten verwenden Sie als Trennzeichen auf das ganze Seite zu.
InformationsquelleAutor gsamaras
9

Es ist wahr, ich sehe keine praktische Bedeutung zu:
```
if (a == 1 1 1 1 1) ...
```
also Ziffern könnten zusammengeführt werden, ohne wirkliche Zweideutigkeit
aber was ist mit einer hexadezimalen Zahl?
```
0 x 1 a B 2 3
```
Gibt es keine Möglichkeit, eindeutig machen von ein Tippfehler dabei (normalerweise sollte eine Fehlermeldung angezeigt werden)
- Naja, einfach. Es wäre Gültiger code nun statt eines Fehlers. Ein Tippfehler kann immer noch dazu führen, gültig code, und es gibt absolut keinen Weg, dies zu verhindern, wenn Ihre "Sprache" besteht aus mehr als einem Wort.
InformationsquelleAutor hlide
5

Ich würde davon ausgehen, es ist, weil, während das schreiben von code, wenn Sie erreichen das Ende einer "Zeile" (die Breite des Bildschirms) einen automatischen Zeilenumbruch (oder "Wort-wickeln Sie") Auftritt. Dies würde bewirken, dass der int-Wert zu bekommen, in zwei Hälften geteilt, die eine Hälfte würde in der ersten Zeile, die zweite Hälfte auf den zweiten... so es bleibt alles zusammen im Falle eines word-wrap.
- Ich bin nicht auf der C++ - design Ausschuss, sondern von dem, was ich sammeln, Bedenken wie diese, in der Regel nicht Faktor in der Entscheidungsfindung.
- Ich glaube nicht, dass dies ist das Grund, aber es ist interessant, dass ich nicht bedacht hatte. Offen für mehr Ideen, mehr Antworten von Leuten 🙂
- Außerdem ist es wohl auch verhindert, dass code-Compiler aus dem weglassen Ihrer numerischen-Pausen. Räume bekommen würde beraubt, diese verlassen werden konnte. Aber das ist nur eine dumme Möglichkeit, dass jemand würde sich dafür interessieren, haha.
- Ich verfolge das nicht?
InformationsquelleAutor Albert Renshaw

float floating_point_literal = 0.0000153;   /* C, C++*/

auto floating_point_literal = 0.0000153;    //C++11

auto floating_point_literal = 0.000'015'3;  //C++14

Kommentieren tut nicht weh:

/*  0. 0000 1530 */ 
float floating_point_literal = 0.00001530;

Binär-strings kann hart sein, zu analysieren:

long bytecode = 0b1111011010011001; /* gcc , clang */  

long bytecode = 0b1111'0110'1001'1001;  //C++14
//0b 1111 0110 1001 1001  would be better, really.
//It is how humans think.

Einem makro für die Prüfung:

#define B(W,X,Y,Z)    (0b##W##X##Y##Z)
#define HEX(W,X,Y,Z)  (0x##W##X##Y##Z)
#define OCT(O)        (0##O)



long z = B(1001, 1001, 1020, 1032 ); 

//result :  long z = (0b1001100110201032);

 long h = OCT( 35); 

//result :  long h  = (035); //35_oct => 29_dec

 long h = HEX( FF, A6, 3B, D0 ); 

//result :  long h  = (0xFFA6BD0);

Dies beantwortet nicht die Frage.
Ach ja, Kommentar tut weh. Ein problem ist, dass der Kommentar falsch sein könnte, jetzt oder in der Zukunft. Das andere ist, dass repetititititititition erschwert die Lesbarkeit und ist fehleranfällig.
In diesem Fall ist eine falsche Kommentar ist ziemlich trivial zu erkennen (der Kommentar keinen Sinn, es nur neu formatiert die Informationen unten).
Sicher, in diesem Fall ist es leicht zu erkennen. Wenn Sie Ihre Aufmerksamkeit abzulenken ein bisschen, um zu versuchen, dies zu tun.

InformationsquelleAutor Chris Reid

-1

Es hat damit zu tun, wie die Sprache wird analysiert. Es wäre schwierig gewesen, für die compiler-Autoren zu umschreiben, Ihre Produkte zu akzeptieren Leerzeichen getrennte Literale.

Auch, ich glaube nicht, Trenn-stellig mit Leerzeichen, ist sehr verbreitet. Ich habe gesehen, es ist immer nicht-whitespace-Zeichen, sogar in verschiedenen Ländern.
- Hatten Sie ändern Ihre Parser sowieso.
- Ich fürchte, Sie verstehen nicht. Whitespace hat schon eine Bedeutung in der Sprache. Eine, fundamentale. Ändern 12'345'678 (Ziffer Separatoren) in die binäre form ist ungefähr das gleiche wie ohne Ziffer Separatoren. Es nimmt die gleiche Menge an Aufwand für den compiler-Autor. In der Erwägung, dass die Neudefinition der tokenisierung-system selbst wäre schwierig gewesen. Plus Leerzeichen getrennte zahlen, hässlich zu sein.
- Ich kann Ihnen versichern, ich verstehe. Die "tokenisierung-system" hätte nicht sein müssen "neu definiert". Denken Sie zum Beispiel string-Literale verketten, die bereits ganz gut funktioniert.
- Whitespace hat nur eine "grundsätzliche" Bedeutung insofern, als es verhindert, dass zwei aufeinanderfolgende Zeichen, die Teil des gleichen token. Wie der OP erwähnt, könnte dies trivial Schlitz in dem "join benachbarten string-Literale" Präprozessor übergeben. Die (Haupt -) parser würde auch nie sehen.
- Ich fürchte, Sie overmystify den tokenizer. Sie können entweder tun, wie getan wird, für string-Literale, für die Verkettung geschieht in der übersetzung phase 6, also in der phase 6, ["foobar"] ["frob"] wird ["foobarfrob]. Oder der Segmentierer erweitert werden konnte, zu absorbieren Räume: decimal_literal ::= [1-9][0-9]+[uU]?(l|L|ll|LL)? wird decimal_literal ::= [1-9][ 0-9]+[uU]?(l|L|ll|LL)?, in welchem Fall die wörtliche muß normalisiert werden später. Es ist im Grunde die gleiche Betriebsart wie für '. Nicht sicher, was Sie wirklich wollen, um zu sagen 😐
InformationsquelleAutor iPherian

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.