Bien que ce que l’on appelle l’URL soit un mécanisme que nous utilisons à chaque seconde où nous sommes devant l’écran d’un PC en utilisant un navigateur, la vérité est que beaucoup d’entre nous ignorent presque totalement ce qu’il est et comment il fonctionne.
Tous ne savent pas que sans sa présence, trouver ce que nous cherchons dans la toile complexe qu’est internet serait une tâche impossible à réaliser.
Fondamentalement, l’URL est une adresse unique qui possède tous les éléments sur Internet, c’est-à-dire qu’il y a littéralement une URL pour chaque page, image, vidéo et document sur Internet, ce qui nous permet de les localiser facilement grâce aux informations qu’elle contient.
Chaque fois que nous visitons une page web, c’est par le biais de son URL et chaque fois que nous cliquons sur un lien qui contient la page ou le site, il nous dirige également vers une autre URL.
A quoi sert une URL ?
URL est l’abréviation de « Uniform Resource Locator », qui signifie localisateur de ressources uniformes, et sert, comme mentionné plus haut dans ces lignes, à nommer les ressources sur Internet. Pour ce faire, l’URL contient certaines informations qui seront utilisées par le navigateur pour trouver ce que nous recherchons.
En ce sens, l’URL combine le protocole ou le schéma qu’il faudra utiliser pour récupérer les données, le nom de l’ordinateur qui fournit la ressource, le répertoire ou le sous-répertoire où elle se trouve et le document auquel on accède.
Comment et pourquoi l’URL se présente-t-elle ?
Comme nous l’avons vu jusqu’à présent, l’URL nous donne la possibilité d’accéder à des sites web par le biais de ces adresses établies, c’est pourquoi il est également important que nous sachions comment naît et se forme une URL. Nous allons donc passer en revue les éléments qui composent une URL.
En termes généraux, on peut dire qu’une URL est composée de deux éléments principaux, d’une part un identifiant de protocole, et d’autre part un nom de source. L’exemple suivant en est un bon exemple.
Identifiant du protocole : https://high-tech.com
Dans ce cas, l’identifiant est https et il est utilisé pour indiquer le nom du protocole qui va être utilisé pour rechercher la source. Fondamentalement, http est un protocole de communication entre le navigateur et le serveur web.
La source high-tech.com et le format du nom de la source dépendra également de l’identifiant du protocole utilisé, qui dans la plupart des cas sera HTTP, il comprendra donc également d’autres éléments.
En ce sens, il faut dire qu’en plus de ces deux composantes principales, les URL sont complétées par d’autres éléments que l’on retrouve dans toutes les URL et qui sont indispensables pour que nous puissions accéder au site correspondant à l’adresse web vers laquelle pointe l’URL.
Nous énumérons ci-dessous le reste des éléments qui composent une URL.
Deux points : Dans toutes les URL, après l’identifiant du protocole, on trouve les deux points ( :), qui servent essentiellement de mécanisme de séparation entre le protocole et le reste de l’adresse web.
Barres obliques : dans tous les cas, une URL comprend deux barres obliques (//), qui sont placées pour séparer l’identifiant du protocole et le nom de la source, après les deux points qui suivent le http. Sa principale fonction est d’être une initiation pour le contact, c’est-à-dire qu’il notifie l’adresse internet pour réaliser le contact avec un autre serveur.
Index.html : Dans de nombreux cas, nous pouvons trouver ce que l’on appelle index.html, qui est le nom d’un fichier demandé, qui est généralement une page par défaut dans un site web particulier. Cet index.html peut également être appelé default.html.
Suffixe : Dans la plupart des cas, les adresses URL comprennent le suffixe .com, bien que l’on puisse également trouver d’autres suffixes largement utilisés comme .net .info .gob .org et d’autres, le plus courant étant .com, et cela fait référence au domaine utilisé.
Nom de domaine : Lorsque nous parlons du nom de domaine complet, nous nous référons à une adresse web complète, c’est-à-dire www.site.com, qui, dans de nombreux cas, peut se passer du www. et apparaître comme suit : tsite.com, c’est-à-dire le nom de domaine, qui se réfère rapidement à la dernière partie de l’adresse web.
Cheminement qui nous mène vers un site web
Comme nous l’avons vu, l’adresse URL est une série de caractères que nous devons taper dans le navigateur web pour nous diriger vers une page Internet, chacune de ces pages ayant une adresse URL unique et non répétable.
Chacune de ces adresses URL est équivalente à une adresse IP, qui est en fait une série de chiffres indiquant à notre PC où trouver le document que nous recherchons sur l’internet.
Les adresses URL ont été créées pour répondre au besoin de l’utilisateur de pouvoir se souvenir de ces emplacements de manière simple, car dans leur format original, elles sont vraiment difficiles à retenir en mémoire.
Grâce à ce mécanisme, au lieu de devoir se souvenir et saisir dans le navigateur une série compliquée de chiffres, il suffit de saisir un nom de domaine assurément plus simple.
Toutefois, outre cette question, l’internet pose un autre problème, à savoir l’incroyable quantité de sites web qu’il héberge. C’est pourquoi, afin d’avoir une bonne relation avec le réseau des réseaux, nous devons inclure un autre mécanisme : le DNS.
Le DNS (Domain Name Server) est le système chargé de traduire le grand nombre de demandes en adresses IP, c’est-à-dire le processus inverse, mais il peut traiter avec une extrême précision les ordinateurs qui composent l’internet.
Il convient de noter qu’une URL commence toujours par le nom de son schéma, suivi de deux points, puis se termine par le reste de l’adresse.
En outre, nous devons tenir compte du fait que les URL sont sensibles à la casse et qu’elles ne peuvent en aucun cas contenir d’espaces vides. Ces deux conditions doivent toujours être prises en compte lorsque l’on tape une adresse URL dans un navigateur.
Formats, schémas et syntaxe des URLs
Les composants les plus courants d’une URL sont les suivants :
scheme://host.domain:port/route/document
Par exemple : ../learn-informatics/interesting-article.php.
Il faut maintenant comprendre par schéma le système de classification qui est utilisé pour définir le type de manière dont les données et les ressources contenues dans l’adresse doivent être récupérées, c’est-à-dire le protocole qui doit être utilisé dans chaque cas spécifique. Dans ce cas, « http ».
Ensuite, l’hôte est positionné, pour cette adresse « www » et enfin le domaine est localisé, dans ce cas, www.sitioquedeseamosvisitar.com. Il convient de noter que la valeur du port est généralement omise, mais en règle générale, pour http, le port est 80.
Ensuite, « path » définit, comme son nom l’indique, le chemin que le navigateur doit emprunter pour se rendre dans le répertoire où est hébergé l’élément auquel nous voulons accéder sur le serveur, qu’il s’agisse d’un document, d’une image, d’une vidéo ou autre.
Si cette valeur est omise, les éléments doivent être stockés dans le répertoire principal du site, sinon ils ne peuvent pas être localisés, et donc ne sont pas accessibles.
Enfin, à la fin de la chaîne, on trouve le nom du document auquel on veut accéder. Dans ce cas, les plus courants sont html, php, asp ou similaires, mais il peut également s’agir d’extensions de fichiers d’images telles que jpg, gif, png ou autres, toujours en fonction du schéma ou du protocole avec lequel on accède à ces informations.
Quelques considérations sur les schémas d’URL
Comme nous l’avons vu plus haut, le schéma de l’URL indique le type de protocole réseau avec lequel il faut accéder aux informations ou aux documents qui se trouvent derrière l’URL.
En ce sens, les types de schémas ou de protocoles les plus courants sont les suivants :
- http : (Hypertext Transfer Protocol), le type de schéma le plus utilisé dans le réseau.
- https : (Hypertext Transfer Protocol over Secure Sockets Layer). Ce type de protocole est surtout utilisé pour assurer un niveau de sécurité plus élevé dans les communications Internet.
- ftp : (File Transfer Protocol) : Protocole de transfert de fichiers. Utilisé pour charger et télécharger des fichiers du réseau.
- mailto : Utilisé pour fournir un cadre à partir duquel les utilisateurs ont la possibilité d’envoyer facilement des e-mails à partir du web.
- file : Ce protocole est utilisé pour localiser et accéder aux ressources sur un PC ou un réseau local.
- news : Utilisé pour l’accès aux groupes de discussion.
- telnet : Ce protocole est utilisé pour accéder à d’autres PC utilisant le réseau.