Kurs:Internet und Verschluesselung/World Wide Web/Technischer Ablauf beim Aufruf einer Website/script

Aus Wikiversity
Two Internet hosts connected via two routers and the corresponding layers used at each hop. The application on each host executes read and write operations as if the processes were directly connected to each other by some kind of data pipe. Every other detail of the communication is hidden from each process. The underlying mechanisms that transmit data between the host computers are located in the lower protocol layers.
Dieser Vortrag beschäftigt sich mit der Frage, was passiert, wenn man eine Internetseite bei einem Browser aufruft. Dieser Vorgang wird zunächst technisch dargestellt, wobei wichtige Bestandteile des World Wide Webs, welche schon in vorigen Referaten geklärt wurden, miteinander in Zusammenhang gebracht werden. Damit ein einfacher Seitenaufruf beschrieben werden kann, geht man von folgender Grundannahme aus: Im Rechnernetz befinden sich zwei mit dem Internet verbundene Rechner: der Client und der Server. Der Client nutzt einen vom Server angebotenen Dienst (Service). Auf dem Client läuft ein Browser (z.B. Google Chrome, Safari, Internet Explorer, usw.), während auf dem Server ein Webserver-Software (z.B. Apache, IIS, u.a.) läuft.

Zu Beginn gibt der Anwender eine URL in die Adresszeile des Web-Browsers ein. Die URL (Uniform Ressource Locator) ist eine Art von URI (Uniform Ressource Identifier), welcher auch als URN (Uniform Resource Name) bezeichnet werden kann. Der URN gibt den Namen einer Ressource an und URL deren Adresse (Lage) im Netz. Ein URI identifiziert eine Ressource entweder durch seiner Lage, oder ihrem Name oder beiden. URLs waren ursprünglich die einzige Art von URIs, weshalb der Begriff URL oft gleichbedeutend mit URI verwendet wird.

Durch URL kennt man nur die Domain-Name des WWW-Servers (Rechnername), aber keine IP-Adresse, die für die Datenübertragung im Rechnernetz notwendig ist. Dies passiert, da es für die Benutzer leichter ist, mit einer Sequenz von Buchstaben als mit Zahlen umzugehen. Mit Hilfe vom DNS-Servers wird die URL-Domain in die zugehörige IP-Adresse umgewandelt. Man kann sagen, dass die Domain und die IP-Adresse den Name bzw. die Postleitzahl einer Strasse (Ressource) sind

Nachdem die IP-Adresse erhalten wurde, versucht der Internetbrowser als Erstes sich mit dem Server in Verbindung zu setzen. Der Verbindungsaufbau läuft nach dem Dreiweg-Handshake ab: Der Client schickt ein SYN-Paket, das vom Server empfangen wird. Dieser analysiert den Inhalt von diesem Paket und stimmt dem Verbindungsaufbau durch dem Senden eines SYN/ACK-Pakets zu. Der Client bestätigt den Erhalt dieses Pakets und schickt dem Server zuletzt ein ACK-Paket zu. Es wird dann eine Client-Server-Verbindung gebildet, die beim HTTP 1.1 bis zum Ende der Darstellung der Website genutzt wird.

Durch Port 80 sendet der Browser ein HTTP GET request (Anfrage) an den Webserver, in dem er eine Ressource (der Inhalt der Webseite) fördert. Ein GET-Request ist eine Aufforderung eines Clienten an einen Server, um bestimmte Daten über einen Protokoll (in unserem Fall http) zu liefern. Der Server erkennt den Request und sucht die Seite in seinem Dateisystem. Eine response (Antwort) wird dem Client zurückgesendet, der die Daten in HTML-Format erhält. Der Web-Browser interpretiert die HTML-Tags und beginnt, die Seite am Bildschirm zu formatieren. Zuletzt sendet der Browser dem Webserver weitere HTTP-Request, in denen er Bilder, Java-Script- und CSS-Files fördert, mit welchen die Layout der Website fertiggestellt werden kann. Dieses Verfahren wiederholt sich bei jedem Aufruf einer Website ebenso wie bei jedem Klick auf einem Link.