Fragen zu sizeof()

Programmiersprachen, APIs, Bibliotheken, Open Source Engines, Debugging, Quellcode Fehler und alles was mit praktischer Programmierung zu tun hat.

Fragen zu sizeof()

Beitragvon starcow » 30.07.2017, 23:05

Guten Abend Miteinander! :-)

Ich bin gerade dabei wieder etwas intensiver in die C / C++ Programmierung einzusteigen und mache deswegen ein paar Auffrischungs-Uebungen. :)

Jetzt bin ich auf etwas gestossen, was mir nicht so recht einleuchtet:

Code: Ansicht erweitern :: Alles auswählen

const char buffer1[] = "Hallo";
cout << sizeof(buffer1) << endl;

const char* buffer2 = "Hallo";
cout << sizeof(buffer2) << endl;


Wieso ergibt das nicht zweimal das selbe Resultat?
Also ich meine, bei buffer2 gibt er allem Anschein nach die Grösse des char-pointers zurück.
Aber ich frage mich: wieso?

buffer1, ohne die Index-Klammern, steht doch einfach für die Adresse des ersten Elementes.
Und buffer2 ist ebenfalls die Speicher-Adresse des erstes Elementes des Char-Arrays.

Also: buffer1 == &buffer1[0]
und: buffer2 == &buffer2[0]

sizeof() kriegt also in beiden Fällen einfach die Adresse des ersten Elementes übermittelt.
Demnach müsste sizeof() doch auch zweimal den selben Wert ausgeben.

Wie kann ich denn den genutzten Speicher ermitteln, wenn ich einen Pointer auf ein Array habe, wie im zweiten Fall?
Streng genommen braucht Methode eins doch mehr Speicher (ab vier Buchstaben), da der String sich nun zweimal im Stack befindet. Einmal als const char-Array "Hallo" und einmal in Form des arrays buffer[].
Folglich müsste doch die Methode
Code: Ansicht erweitern :: Alles auswählen

const char* buffer = "Hallo";

Eine Spur eleganter sein.

Gruss starcow
Freelancer 3D- und 2D-Grafik
mischaschaub.com
Benutzeravatar
starcow
Establishment
 
Beiträge: 187
Registriert: 23.04.2003, 17:42

Re: Fragen zu sizeof()

Beitragvon joggel » 31.07.2017, 00:09

Wieso ergibt das nicht zweimal das selbe Resultat?
Also ich meine, bei buffer2 gibt er allem Anschein nach die Grösse des char-pointers zurück.
Aber ich frage mich: wieso?


Ich glaube, bei sizeof(buffer2) wird die Größe des Zeigers vom Typ char, und das ist eben nur 1Byte (ist doch so, oder?), zurück gegeben.
Bei dem ersten sizeof(buffer1), wird da die Größe des Arrays angegeben (mutmaße ich jetzt mal, ohne das ausprobiert zu haben), und die Größe ist zum Programmstart bekannt, oder vlt macht das gleich der Comnpiler beim übersetzen, das er ein array mit fixer größe von "Hallo" (reserviert).

Ich habe es selber nicht getestet, aber wenn ich mir das so anschaue, und das da anscheinend unterschiedliche Ergebnisse raus kommen, würde ich das so erklären.
Ja...ich denke es ist so.
:)
...
Benutzeravatar
joggel
Establishment
 
Beiträge: 1178
Registriert: 06.11.2007, 19:06
Wohnort: Dresden

Re: Fragen zu sizeof()

Beitragvon Krishty » 31.07.2017, 00:27

In C++ sind char * (Zeiger auf Buchstabe) und char [6] (Array aus sechs Buchstaben) eben unterschiedliche Typen. char [] (Array aus unbekannter Menge Buchstaben) gibt es auch noch.

char-Arrays konvertieren in sehr vielen Fällen implizit zu Zeigern, und deshalb kann man sie oft gleich verwenden – z.B. bei Funktionsaufrufen. sizeof ist aber kein solcher Fall, und es bekommt nicht einfach die Adresse des ersten Buchstabens. Es ist auch kein Funktionsaufruf (du kannst es ohne Klammern schreiben, also sizeof buffer2, um den Unterschied hervorzuheben) sondern ein Ausdruck, der vom Compiler während des Übersetzens ausgewertet wird.

Die Verwechslungsgefahr ist durch diese einfache Konvertierung umso größer (und das nötige Wissen, solche Situationen zu erkennen, umfangreicher). Ist einfach eine scheiß Extraregel.

Was die Leistung angeht, ist die Sache noch komplexer:

char x[] = "Hello";
  1. reserviert Platz für sechs Buchstaben
    • entweder reserviert es zusätzlich sechs Buchstaben in der EXE und füllt sie beim Kompilieren mit Hello\0, und kopiert von da in den neu reservierten Platz
    • oder es schreibt die Befehle, Hello\0 in den reservierten Platz zu schreiben, direkt in die CPU-Befehlskette
  2. wird möglicherweise (unter Visual C++ immer) bei jedem Aufruf wiederholt
  3. hat den String garantiert in irgendeiner Form doppelt im Speicher

char * x = "Hello";
  1. reserviert Platz für sechs Buchstaben in der EXE und füllt sie beim Kompilieren
  2. legt eine lokale Variable vom Typ char * (Zeiger auf Buchstabe) an (die aber üblicherweise wegoptimiert, also direkt durch die Adresse des Strings ersetzt wird)
  3. füllt sie mit der Adresse aus 1.
  4. nur 1. & 2. werden pro Aufruf wiederholt (ab einer gewissen Länge ist das schneller, als den String immer neu zu schreiben)
  5. hat den String nur einmal im Speicher

static char const x[] = "Hello";
  • verhält weitgehend wie char * x = "Hello";

Die Unterschiede sind nur wichtig, wenn man auf Größe/Cache-Lokalität optimiert und können Anfängern total egal sein.
seziert Ace Combat, Driver, und S.T.A.L.K.E.R.   —   rendert Sterne
Benutzeravatar
Krishty
Establishment
 
Beiträge: 6040
Registriert: 26.02.2009, 12:18
Benutzertext: state is the enemy

Re: Fragen zu sizeof()

Beitragvon Helmut » 31.07.2017, 16:49

Krishty hat geschrieben:char [] (Array aus unbekannter Menge Buchstaben) gibt es auch noch.

Wobei noch anzumerken ist, dass char[] immer seine Bedeutung wechselt, je nachdem wo man es benutzt.

char var[] = {'a', 'b'};
in einem Namespace oder einer Funktion ist das selbe wie
char var[2] = {'a', 'b'};


void bla(char var[])
in einer Parameterliste ist das selbe wie
void bla(char* var)

und
struct foo { char var[]; };
in einer Struktur ist (auf vielen Compilern) das selbe wie
struct foo { char var[0]; };.

(Macht allerdings nur als letztes Element der Struktur Sinn.)
Helmut
Establishment
 
Beiträge: 226
Registriert: 11.07.2002, 15:49
Wohnort: Bonn

Re: Fragen zu sizeof()

Beitragvon Krishty » 31.07.2017, 17:05

Helmut hat geschrieben:char var[] = {'a', 'b'};
in einem Namespace oder einer Funktion ist das selbe wie
char var[2] = {'a', 'b'};
An der Stelle ist char [] aber kein Typ, ebenso wenig wie auto es wäre :)
seziert Ace Combat, Driver, und S.T.A.L.K.E.R.   —   rendert Sterne
Benutzeravatar
Krishty
Establishment
 
Beiträge: 6040
Registriert: 26.02.2009, 12:18
Benutzertext: state is the enemy

Re: Fragen zu sizeof()

Beitragvon Helmut » 01.08.2017, 10:27

Ach ja, was ist es denn dann? :)
Helmut
Establishment
 
Beiträge: 226
Registriert: 11.07.2002, 15:49
Wohnort: Bonn

Re: Fragen zu sizeof()

Beitragvon dot » 01.08.2017, 11:03

Helmut hat geschrieben:Ach ja, was ist es denn dann? :)

char ist ein typ, [] ist ein operator.
Benutzeravatar
dot
Michael Kenzel
Establishment
 
Beiträge: 1591
Registriert: 06.03.2004, 19:10

Re: Fragen zu sizeof()

Beitragvon Helmut » 01.08.2017, 11:19

[] ist ein operator, aber nicht in diesem Zusammenhang. Operatoren kommen nur im Zusammenhang mit Ausdrücken vor, hier ist var aber ein Name in einer Variablendefinition und kein Ausdruck.
char var+1; wäre beispielsweise ungültig.
Helmut
Establishment
 
Beiträge: 226
Registriert: 11.07.2002, 15:49
Wohnort: Bonn

Re: Fragen zu sizeof()

Beitragvon Krishty » 01.08.2017, 11:48

Entschuldige – es ist ein Typ, aber nicht der Typ. Das hätte ich anders schreiben müssen.
C++0x Draft (weil ich nichts Neueres habe) hat geschrieben:The declared type of an array object might be an array of unknown size and therefore be incomplete at one point in a translation unit and complete later on; the array types at those two points (“array of unknown bound of T” and “array of N T”) are different types.
seziert Ace Combat, Driver, und S.T.A.L.K.E.R.   —   rendert Sterne
Benutzeravatar
Krishty
Establishment
 
Beiträge: 6040
Registriert: 26.02.2009, 12:18
Benutzertext: state is the enemy

Re: Fragen zu sizeof()

Beitragvon dot » 01.08.2017, 11:51

Helmut hat geschrieben:[] ist ein operator, aber nicht in diesem Zusammenhang. Operatoren kommen nur im Zusammenhang mit Ausdrücken vor, hier ist var aber ein Name in einer Variablendefinition und kein Ausdruck.
char var+1; wäre beispielsweise ungültig.

N4659: Working Draft, Standard for Programming Language C++. §11/2 hat geschrieben:[...] The declarators specify the names of these entities and (optionally) modify the type of the specifiers with operators such as * (pointer to) and () (function returning). [...]

Es ist in der Tat keine Expression sondern eine simple-declaration und es handelt sich auch nicht um den Subscript Operator. Aber es ist ein Operator. Wenn es deiner Meinung nach kein Operator ist, was ist es dann? Was sind denn * und () und [] und & und && und -> in Deklarationen wenn es keine Operatoren sind? Insbesondere würde mich interessieren, wie genau du erklärst, dass diese Nicht-Operator-Entitäten linksbindent oder rechtbindent sein können und eine Rangfolge haben... ;)
Benutzeravatar
dot
Michael Kenzel
Establishment
 
Beiträge: 1591
Registriert: 06.03.2004, 19:10

Re: Fragen zu sizeof()

Beitragvon Helmut » 01.08.2017, 13:03

Gut, hast gewonnen :)
Ich wusste nicht, dass die Token auch im Zusammenhang mit Deklarationen Operatoren genannt werden. Sie haben natürlich auch Assoziativität, eine Reihenfolge und können geklammert werden, aber der semantische Unterschied ist ja doch erheblich, vor allem bei & und &&, sodass ich die Deklarationsoperatoren nicht Operatoren genannt hätte. In dieser Liste werden sie übrigens auch nicht als solche erwähnt.

Aber an meiner ursprünglichen Aussage, dass char[] ein Typ ist, halte ich fest. Ob nun incomplete oder nicht :)
Helmut
Establishment
 
Beiträge: 226
Registriert: 11.07.2002, 15:49
Wohnort: Bonn

Re: Fragen zu sizeof()

Beitragvon starcow » 03.08.2017, 12:53

Erstmal vielen Dank für eure Antworten! :-)
Die Sache scheint ja nicht gerade trivial zu sein.

joggel hat geschrieben:Ich glaube, bei sizeof(buffer2) wird die Größe des Zeigers vom Typ char, und das ist eben nur 1Byte (ist doch so, oder?), zurück gegeben.


Soviel ich weiss, ist bei jeder 32-Bit Anwendung die Grösse eines Pointers stets 4Byte. Weil nur mit 4 Byte der entsprechende Adressraum abgebildet werden kann.
Es deckt sich jedenfalls mit der Ausgabe aus meinem Programm.

Krishty hat geschrieben:In C++ sind char * (Zeiger auf Buchstabe) und char [6] (Array aus sechs Buchstaben) eben unterschiedliche Typen. char [] (Array aus unbekannter Menge Buchstaben) gibt es auch noch.

Wie sieht es den bei C aus? Sind da die Typen char*, char[], char[6] vom gleichen Typ?

Ist es also unter C++ gar nicht möglich die Grösse eines Array zu ermitteln, wenn man "nur" einen Zeiger auf das erste Element hat?

Code: Ansicht erweitern :: Alles auswählen

char* buffer = "Hallo";


Gruss starcow
Freelancer 3D- und 2D-Grafik
mischaschaub.com
Benutzeravatar
starcow
Establishment
 
Beiträge: 187
Registriert: 23.04.2003, 17:42

Re: Fragen zu sizeof()

Beitragvon Helmut » 03.08.2017, 13:30

starcow hat geschrieben:Wie sieht es den bei C aus? Sind da die Typen char*, char[], char[6] vom gleichen Typ?

Alles was in diesem Thread erwähnt wurde gilt für C und C++.
Es ist nur so, dass in C++ die Probleme, die hier diskutiert wurden, eher seltener auftreten, da man üblicherweise std::string für Strings und std::vector für Arrays nutzt. Aber ich denke es ist trotzdem sinnvoll die genauen Unterschiede zu kennen.
Helmut
Establishment
 
Beiträge: 226
Registriert: 11.07.2002, 15:49
Wohnort: Bonn

Re: Fragen zu sizeof()

Beitragvon joggel » 03.08.2017, 13:32

Wenn Du die länge eines char-Array ermitteln willst, dann hilft Dir strlen
Aber es gibt die auch nicht die Größe des kompletten Arrays wieder, sondern eben nur soviel zeichen es enthalten. Also bis das Zeichen '\0' auftaucht...

Wie es bei einem Array von anderen Typen aussieht, weiß ich nicht...

[Nachtrag/Edit]
Ich meinte nicht char-Array, sondern einen String.
Zuletzt geändert von joggel am 03.08.2017, 14:05, insgesamt 1-mal geändert.
...
Benutzeravatar
joggel
Establishment
 
Beiträge: 1178
Registriert: 06.11.2007, 19:06
Wohnort: Dresden

Re: Fragen zu sizeof()

Beitragvon Krishty » 03.08.2017, 13:41

starcow hat geschrieben:
Krishty hat geschrieben:In C++ sind char * (Zeiger auf Buchstabe) und char [6] (Array aus sechs Buchstaben) eben unterschiedliche Typen. char [] (Array aus unbekannter Menge Buchstaben) gibt es auch noch.

Wie sieht es den bei C aus? Sind da die Typen char*, char[], char[6] vom gleichen Typ?

Ist es also unter C++ gar nicht möglich die Grösse eines Array zu ermitteln, wenn man "nur" einen Zeiger auf das erste Element hat?
Unter C ist es genauso; ebenfalls unterschiedliche Typen.

Die Länge eines Arrays kannst du via sizeof array / sizeof array[0] ermitteln. Beachte, dass bei char-Arrays die abschließende Null mitgezählt wird!

joggel hat geschrieben:Ich glaube, bei sizeof(buffer2) wird die Größe des Zeigers vom Typ char, und das ist eben nur 1Byte (ist doch so, oder?), zurück gegeben.

Bild

Wie Starcow schreibt, ist die Zeigergröße auf 32-Bit-Systemen 4 Bytes und auf 64-Bit-Systemen 8 B …
seziert Ace Combat, Driver, und S.T.A.L.K.E.R.   —   rendert Sterne
Benutzeravatar
Krishty
Establishment
 
Beiträge: 6040
Registriert: 26.02.2009, 12:18
Benutzertext: state is the enemy

Nächste

Zurück zu Programmiersprachen, Quelltext und Bibliotheken

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste