Url là gì, lịch sử, cấu trúc và cách sử dụng như thế nào? Có thể nói, đây là một thuật ngữ vô cùng quen thuộc nếu bạn thường xuyên sử dụng các trình duyệt web. Hôm nay, cùng trang DINHNGHIA khám phá ngay nhé!
Nội dung bài viết
URL là gì?
URL (Uniform Resource Locator) là địa chỉ dùng để định danh cho duy nhất một tài nguyên trên Web. Mỗi URL thường sẽ dẫn chúng ta đến một tài nguyên cụ thể như một trang HTML, trang tài liệu CSS, hình ảnh,… Hoặc một tài nguyên không tồn tại nếu URL đó sai.

URL nằm ở đâu?
Vậy URL thường nằm ở đâu? Bạn sẽ dễ dàng tìm thấy URL nằm trong thanh địa chỉ ở đầu cửa sổ của trình duyệt web. Cụ thể, trên máy tính, URL sẽ luôn hiển thị trên thanh địa chỉ khi người dùng cuộn qua trang web.
Còn với trường hợp bạn truy cập Web bằng thiết bị di động thì URL vẫn nằm trên thanh địa chỉ nhưng nó sẽ biến mất khi bạn bắt đầu cuộn xuống và sẽ xuất hiện lại khi bạn thao tác cuộn lên.

Lịch sử URL
Để đảm bảo sự minh bạch và ngăn chặn việc truy cập, sử dụng bất hợp pháp thông tin người dùng. Trong chế độ trình duyệt cơ bản của Chrome, Google cho phép lưu trữ lịch sử URL của các trang bạn đã truy cập trong nhiều khoảng thời gian khác nhau.
Tuy nhiên, bạn có thể chủ động xóa bất cứ khi nào bạn muốn hoặc lưu trữ lại trong thời gian dài hơn nếu cần thiết.

Cấu trúc của URL
Một URL thông thường sẽ gồm hai phần chính là scheme và authority.

Scheme
Scheme của URL thường rất dễ xác định bằng cách quan sát dấu hai chấm. Scheme sẽ nằm sau dấu hai chấm, cho ta biết được cách thức giao tiếp giao giữa ứng dụng (trình duyệt web) và máy chủ. Sau đây là một số địa chỉ web (URL) phổ biến nhất:
- Giao thức truyền tải siêu văn bản (HTTP): Là giao thức cơ bản nhất, thể hiện hành động của các máy chủ và trình duyệt cần thực hiện để đáp ứng các lệnh nhất định.
- Giao thức HTTP an toàn (HTTPS): Thực chất là một dạng HTTP nhưng an toàn hơn vì vận hành trên một lớp bảo mật được mã hóa tốt hơn.
- Giao thức truyền tập tin (File Transfer Protocol – FTP): Được sử dụng để truyền file qua Internet.

Authority
Trong URL, Authority thường bắt đầu sau hai dấu gạch chéo, chia thành các phần nhỏ. Để dễ hiểu, chúng ta cùng nghiên cứu một ví dụ đơn giản bên dưới:

Trong ví dụ trên, toàn bộ “www.example.com” là hostname, giúp xác định địa chỉ IP. Vì vậy, muốn truy cập nhanh vào trang Web, bạn có thể sử dụng địa chỉ IP thay vì hostname. Tiếp theo là định nghĩa cho những thành phần nhỏ hơn:
Tên miền cấp cao nhất (Top-level domain):
- Trong ví dụ trên, “com” được xác định là tên miền cấp cao nhất vì chúng khá đơn giản, dễ nhớ. Hiện nay, có ba tên miền cấp cao nhất phổ biến nhất là .com., .net, .gov.
- Ngoài ra, hầu hết các quốc gia hiện nay đều có tên miền cấp cao riêng, thường là tên viết tắt của tên quốc gia đó như .us (Mỹ), .vn (Việt Nam), .ca (Canada), v.v…
- Một số tên miền cấp cao nhất đặc biệt khác (như .museum, .club, .life, .news.) được quản lý bởi các tổ chức hoặc cá nhân.
Tên miền phụ (Subdomain):
- Bao gồm những từ hoặc cụm từ đứng trước dấu chấm đầu tiên của URL, world wide web, www là loại tên miền phụ phổ biến nhất.
Thành phần bổ sung của URL
Thông thường, nằm sau phần Authority sẽ gồm ba phần bổ sung sau, cụ thể là đường dẫn, truy vấn và phân mảnh.
Đường dẫn (path)
Đường dẫn URL có cơ chế hoạt động tương tự như đường dẫn trong Windows, macOS, giúp trỏ đến đúng thư mục hoặc file trên máy tương ứng. Đường dẫn thường được bắt đầu bằng dấu gạch chéo, các thư mục và thư mục con được phân biệt bằng dấu gạch chéo.

Truy vấn (query)
Phần truy vấn của một URL bao gồm những yếu tố không thuộc thành phần cố định của cấu trúc đường dẫn. Thông thường, phần truy vấn sẽ bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn.

Tham số (parameter)
Là một chuỗi tham số bổ sung cung cấp cho máy chủ web. Chúng thường là danh sách các cặp khóa/giá trị được phân tách bằng ký hiệu &. Công dụng là giúp máy chủ thực hiện các công việc bổ sung trước khi trả lại tài nguyên.
Thường mỗi máy chủ của web sẽ có quy tắc riêng về cách đặt tham số sao cho thật tin cậy, giúp phân biệt các máy chủ web với nhau.

Liên kết neo (anchor)
Anchor nói một cách dễ hiểu thì tương tự như “bookmark” bên trong tài nguyên, giúp điều hướng đến đúng nội dung đã “được bookmark”.

Phân mảnh (fragment)
Thành phần cuối cùng của URL là phân mảnh, thường bắt đầu bằng một dấu thăng (#), giúp xác định vị trí cụ thể của trang web. 2 thành phần gồm liên kết neo, URL và phân mảnh thường được sử dụng để tạo mục lục cho trang web, giúp người xem tiện lợi hơn.

Các loại URL
Hiện nay có 2 loại URL phổ biến nhất là tuyệt đối và tương đối. Bên cạnh đó, một số URL khác với những chức năng khác nhau cũng được sử dụng khá nhiều.
URL tuyệt đối và URL tương đối
URL nằm trên thanh địa chỉ bên trên là URL tuyệt đối. Tuy nhiên, tên gọi URL tuyệt đối và URL tương đối chỉ được sử dụng để phân biệt chúng với các đối tượng URL (là những đại diện trong bộ nhớ của URL).
URL tương đối thường được sử dụng trong tài liệu, như trang HTML, so với URL tuyệt đối sẽ có một xíu khác biệt. Bởi vì trình duyệt đã có URL riêng, nó có thể sử dụng thông tin này để lắp vào các phần còn thiếu của bất kỳ URL nào bên trong tài liệu.

Một số loại URL khác
Dựa trên chức năng, có 3 loại URL khác:
- Canonical URL: Thường được chủ sở hữu trang web sử dụng giúp phân biệt nếu nội dung web bị trùng lặp.
- Callback URL: Định nghĩa điểm đến chính khi người dùng thực hiện xong quy trình trên hệ thống bên ngoài.
- Vanity URL (URL ngắn tùy chỉnh): Là địa chỉ web ảo, dễ nhớ, có thể tạo bằng cách sử dụng một số công cụ rút gọn URL của trang web như Bitly, Short.io,..

Semantic URL
Là một kỹ thuật giúp xây dựng URL dễ ghi nhớ, giúp bất kỳ ai cũng có thể dễ dàng nhập vào thanh địa chỉ và truy cập. Mặc dù URL được kết hợp từ các ký tự ngẫu nhiên nhưng nếu sử dụng semantic URL sẽ mang đến nhiều lợi thế:
- Dễ dàng thao tác hơn.
- Giúp người truy cập biết rõ họ đang xem gì, ở đâu đọc hoặc tương tác trên web nào.
- Cải thiện việc phân loại những trang được liên kết.

Sau đây là một số mẹo hữu ích mà bạn có thể tham khảo:
- Không sử dụng ký hiệu đặc biệt, ký hiệu từ các ngôn ngữ khác, ưu tiên dùng các chữ cái Latinh, với dấu gạch ngang (-).
- Cần lập kế hoạch phân cấp trang web của bạn, quy ước đặt tên,.. và tuân thủ hoàn toàn, hạn chế sự thay đổi trong quá trình xây dựng.
- Đừng để URL quá dài, tối thiểu gồm 5 từ trong tiêu đề của trang. Còn đối với độ dài tổng thể của URL thì nên giới hạn ít hơn 100 ký tự (bao gồm cả domain).
Trình rút gọn URL
Rút gọn URL là một kỹ thuật giúp thu ngắn độ dài URL nhưng vẫn hướng đến đúng trang yêu cầu. Hiện nay có rất nhiều web hỗ trợ thu gọn URL nhanh chóng, hiệu quả nhưng nhược điểm là các URL rút gọn thường ẩn phần mềm độc hại, quảng cáo, spam,..

Cách sử dụng URL
URL thường được sử dụng phổ biến trong ngôn ngữ HTML, cụ thể:
- Tạo liên kết đến các tài liệu khác bằng phần tử <a>
- Liên kết tài liệu với các tài nguyên liên quan bằng các phần tử khác nhau như <link> hoặc <script>
- Hiển thị các nội dung media như hình ảnh (phần tử <img>), video (phần tử <video>), âm thanh và nhạc (phần tử <audio>).
- Hiển thị các tài liệu HTML khác với phần tử <iframe>.
Đối với các ngôn ngữ CSS hoặc JavaScript, URL được sử dụng khá rộng rãi và đây thực sự là trái tim của web.

Xem thêm:
- Domain là gì? Cấu trúc và phân loại tên miền
- VPS là gì? Máy chủ ảo VPS hosting hoạt động như thế nào?
- Proxy là gì? Ưu nhược điểm khi sử dụng Proxy Server
Qua những thông tin bên trên, chắc chắn bạn đã hiểu được url là gì cũng như cấu trúc và cách sử dụng của chúng. Nếu bài viết bổ ích, đừng quên chia sẻ ngay để nhiều bạn bè cùng biết nhé!