Url là gì? Lịch sử, cấu trúc, cách sử dụng

Lập trìnhUrl là gì? Lịch sử, cấu trúc, cách sử dụng

Ngày đăng:

Url là gì, lịch sử, cấu trúc và cách sử dụng như thế nào? Có thể nói, đây là một thuật ngữ vô cùng quen thuộc nếu bạn thường xuyên sử dụng các trình duyệt web. Hôm nay, cùng trang DINHNGHIA khám phá ngay nhé!

URL là gì?

URL (Uniform Resource Locator) là địa chỉ dùng để định danh cho duy nhất một tài nguyên trên Web. Mỗi URL thường sẽ dẫn chúng ta đến một tài nguyên cụ thể như một trang HTML, trang tài liệu CSS, hình ảnh,… Hoặc một tài nguyên không tồn tại nếu URL đó sai.

Định nghĩa URL
Định nghĩa URL

URL nằm ở đâu?

Vậy URL thường nằm ở đâu? Bạn sẽ dễ dàng tìm thấy URL nằm trong thanh địa chỉ ở đầu cửa sổ của trình duyệt web. Cụ thể, trên máy tính, URL sẽ luôn hiển thị trên thanh địa chỉ khi người dùng cuộn qua trang web.

Còn với trường hợp bạn truy cập Web bằng thiết bị di động thì URL vẫn nằm trên thanh địa chỉ nhưng nó sẽ biến mất khi bạn bắt đầu cuộn xuống và sẽ xuất hiện lại khi bạn thao tác cuộn lên.

URL thường nằm trong thanh địa chỉ ở đầu cửa sổ của trình duyệt web
URL thường nằm trong thanh địa chỉ ở đầu cửa sổ của trình duyệt web

Lịch sử URL

Để đảm bảo sự minh bạch và ngăn chặn việc truy cập, sử dụng bất hợp pháp thông tin người dùng. Trong chế độ trình duyệt cơ bản của Chrome, Google cho phép lưu trữ lịch sử URL của các trang bạn đã truy cập trong nhiều khoảng thời gian khác nhau.

Tuy nhiên, bạn có thể chủ động xóa bất cứ khi nào bạn muốn hoặc lưu trữ lại trong thời gian dài hơn nếu cần thiết.

Bạn dễ dàng truy cập vào lịch sử trình duyệt để xem lại các URL đã truy cập
Bạn dễ dàng truy cập vào lịch sử trình duyệt để xem lại các URL đã truy cập

Cấu trúc của URL

Một URL thông thường sẽ gồm hai phần chính là scheme và authority.

Một URL đơn giản gồm hai thành phần chính là Scheme và Authority
Một URL đơn giản gồm hai thành phần chính là Scheme và Authority

Scheme

Scheme của URL thường rất dễ xác định bằng cách quan sát dấu hai chấm. Scheme sẽ nằm sau dấu hai chấm, cho ta biết được cách thức giao tiếp giao giữa ứng dụng (trình duyệt web) và máy chủ. Sau đây là một số địa chỉ web (URL) phổ biến nhất:

  • Giao thức truyền tải siêu văn bản (HTTP): Là giao thức cơ bản nhất, thể hiện hành động của các máy chủ và trình duyệt cần thực hiện để đáp ứng các lệnh nhất định.
  • Giao thức HTTP an toàn (HTTPS): Thực chất là một dạng HTTP nhưng an toàn hơn vì vận hành trên một lớp bảo mật được mã hóa tốt hơn.
  • Giao thức truyền tập tin (File Transfer Protocol – FTP): Được sử dụng để truyền file qua Internet.
Scheme của URL thường nằm ở vị trí sau dấu hai chấm
Scheme của URL thường nằm ở vị trí sau dấu hai chấm

Authority

Trong URL, Authority thường bắt đầu sau hai dấu gạch chéo, chia thành các phần nhỏ. Để dễ hiểu, chúng ta cùng nghiên cứu một ví dụ đơn giản bên dưới:

Ví dụ về các thành phần của Authority
Ví dụ về các thành phần của Authority

Trong ví dụ trên, toàn bộ “www.example.com” là hostname, giúp xác định địa chỉ IP. Vì vậy, muốn truy cập nhanh vào trang Web, bạn có thể sử dụng địa chỉ IP thay vì hostname. Tiếp theo là định nghĩa cho những thành phần nhỏ hơn:

Tên miền cấp cao nhất (Top-level domain):

  • Trong ví dụ trên, “com” được xác định là tên miền cấp cao nhất vì chúng khá đơn giản, dễ nhớ. Hiện nay, có ba tên miền cấp cao nhất phổ biến nhất là .com., .net, .gov.
  • Ngoài ra, hầu hết các quốc gia hiện nay đều có tên miền cấp cao riêng, thường là tên viết tắt của tên quốc gia đó như .us (Mỹ), .vn (Việt Nam), .ca (Canada), v.v…
  • Một số tên miền cấp cao nhất đặc biệt khác (như .museum, .club, .life, .news.) được quản lý bởi các tổ chức hoặc cá nhân.

Tên miền phụ (Subdomain):

  • Bao gồm những từ hoặc cụm từ đứng trước dấu chấm đầu tiên của URL, world wide web, www là loại tên miền phụ phổ biến nhất.

Thành phần bổ sung của URL

Thông thường, nằm sau phần Authority sẽ gồm ba phần bổ sung sau, cụ thể là đường dẫn, truy vấn và phân mảnh.

Đường dẫn (path)

Đường dẫn URL có cơ chế hoạt động tương tự như đường dẫn trong Windows, macOS, giúp trỏ đến đúng thư mục hoặc file trên máy tương ứng. Đường dẫn thường được bắt đầu bằng dấu gạch chéo, các thư mục và thư mục con được phân biệt bằng dấu gạch chéo.

Đường dẫn URL có cơ chế hoạt động tương tự như đường dẫn trong Windows, macOS
Đường dẫn URL có cơ chế hoạt động tương tự như đường dẫn trong Windows, macOS

Truy vấn (query)

Phần truy vấn của một URL bao gồm những yếu tố không thuộc thành phần cố định của cấu trúc đường dẫn. Thông thường, phần truy vấn sẽ bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn.

Phần truy vấn của URL giúp xác định những thứ không thuộc thành phần cố định
Phần truy vấn của URL giúp xác định những thứ không thuộc thành phần cố định

Tham số (parameter)

Là một chuỗi tham số bổ sung cung cấp cho máy chủ web. Chúng thường là danh sách các cặp khóa/giá trị được phân tách bằng ký hiệu &. Công dụng là giúp máy chủ thực hiện các công việc bổ sung trước khi trả lại tài nguyên.

Thường mỗi máy chủ của web sẽ có quy tắc riêng về cách đặt tham số sao cho thật tin cậy, giúp phân biệt các máy chủ web với nhau.

Tham số là một chuỗi tham số bổ sung cung cấp cho máy chủ web
Tham số là một chuỗi tham số bổ sung cung cấp cho máy chủ web

Liên kết neo (anchor)

Anchor nói một cách dễ hiểu thì tương tự như “bookmark” bên trong tài nguyên, giúp điều hướng đến đúng nội dung đã “được bookmark”.

Liên kết neo (anchor) tương tự như "bookmark" trong Chrome
Liên kết neo (anchor) tương tự như “bookmark” trong Chrome

Phân mảnh (fragment)

Thành phần cuối cùng của URL là phân mảnh, thường bắt đầu bằng một dấu thăng (#), giúp xác định vị trí cụ thể của trang web. 2 thành phần gồm liên kết neo, URL và phân mảnh thường được sử dụng để tạo mục lục cho trang web, giúp người xem tiện lợi hơn.

Thường được sử dụng để tạo mục lục cho trang web
Thường được sử dụng để tạo mục lục cho trang web

Các loại URL

Hiện nay có 2 loại URL phổ biến nhất là tuyệt đối và tương đối. Bên cạnh đó, một số URL khác với những chức năng khác nhau cũng được sử dụng khá nhiều.

URL tuyệt đối và URL tương đối

URL nằm trên thanh địa chỉ bên trên là URL tuyệt đối. Tuy nhiên, tên gọi URL tuyệt đối và URL tương đối chỉ được sử dụng để phân biệt chúng với các đối tượng URL (là những đại diện trong bộ nhớ của URL).

URL tương đối thường được sử dụng trong tài liệu, như trang HTML, so với URL tuyệt đối sẽ có một xíu khác biệt. Bởi vì trình duyệt đã có URL riêng, nó có thể sử dụng thông tin này để lắp vào các phần còn thiếu của bất kỳ URL nào bên trong tài liệu.

URL tuyệt đối và URL tương đối là 2 loại URL phổ biến
URL tuyệt đối và URL tương đối là 2 loại URL phổ biến

Một số loại URL khác

Dựa trên chức năng, có 3 loại URL khác:

  • Canonical URL: Thường được chủ sở hữu trang web sử dụng giúp phân biệt nếu nội dung web bị trùng lặp.
  • Callback URL: Định nghĩa điểm đến chính khi người dùng thực hiện xong quy trình trên hệ thống bên ngoài.
  • Vanity URL (URL ngắn tùy chỉnh): Là địa chỉ web ảo, dễ nhớ, có thể tạo bằng cách sử dụng một số công cụ rút gọn URL của trang web như Bitly, Short.io,..
3 loại URL phổ biến khác là Canonical URL, Callback URL, Vanity URL
3 loại URL phổ biến khác là Canonical URL, Callback URL, Vanity URL

Semantic URL

Là một kỹ thuật giúp xây dựng URL dễ ghi nhớ, giúp bất kỳ ai cũng có thể dễ dàng nhập vào thanh địa chỉ và truy cập. Mặc dù URL được kết hợp từ các ký tự ngẫu nhiên nhưng nếu sử dụng semantic URL sẽ mang đến nhiều lợi thế:

  • Dễ dàng thao tác hơn.
  • Giúp người truy cập biết rõ họ đang xem gì, ở đâu đọc hoặc tương tác trên web nào.
  • Cải thiện việc phân loại những trang được liên kết.
Là một kỹ thuật giúp xây dựng URL thân thiện với người dùng
Là một kỹ thuật giúp xây dựng URL thân thiện với người dùng

Sau đây là một số mẹo hữu ích mà bạn có thể tham khảo:

  • Không sử dụng ký hiệu đặc biệt, ký hiệu từ các ngôn ngữ khác, ưu tiên dùng các chữ cái Latinh, với dấu gạch ngang (-).
  • Cần lập kế hoạch phân cấp trang web của bạn, quy ước đặt tên,.. và tuân thủ hoàn toàn, hạn chế sự thay đổi trong quá trình xây dựng.
  • Đừng để URL quá dài, tối thiểu gồm 5 từ trong tiêu đề của trang. Còn đối với độ dài tổng thể của URL thì nên giới hạn ít hơn 100 ký tự (bao gồm cả domain).

Trình rút gọn URL

Rút gọn URL là một kỹ thuật giúp thu ngắn độ dài URL nhưng vẫn hướng đến đúng trang yêu cầu. Hiện nay có rất nhiều web hỗ trợ thu gọn URL nhanh chóng, hiệu quả nhưng nhược điểm là các URL rút gọn thường ẩn phần mềm độc hại, quảng cáo, spam,..

Rút gọn URL là một kỹ thuật giúp thu ngắn độ dài URL
Rút gọn URL là một kỹ thuật giúp thu ngắn độ dài URL

Cách sử dụng URL

URL thường được sử dụng phổ biến trong ngôn ngữ HTML, cụ thể:

  • Tạo liên kết đến các tài liệu khác bằng phần tử <a>
  • Liên kết tài liệu với các tài nguyên liên quan bằng các phần tử khác nhau như <link> hoặc <script>
  • Hiển thị các nội dung media như hình ảnh (phần tử <img>), video (phần tử <video>), âm thanh và nhạc (phần tử <audio>).
  • Hiển thị các tài liệu HTML khác với phần tử <iframe>.

Đối với các ngôn ngữ CSS hoặc JavaScript, URL được sử dụng khá rộng rãi và đây thực sự là trái tim của web.

URL thường được sử dụng phổ biến trong ngôn ngữ HTML
URL thường được sử dụng phổ biến trong ngôn ngữ HTML

Xem thêm:

  • Domain là gì? Cấu trúc và phân loại tên miền
  • VPS là gì? Máy chủ ảo VPS hosting hoạt động như thế nào?
  • Proxy là gì? Ưu nhược điểm khi sử dụng Proxy Server

Qua những thông tin bên trên, chắc chắn bạn đã hiểu được url là gì cũng như cấu trúc và cách sử dụng của chúng. Nếu bài viết bổ ích, đừng quên chia sẻ ngay để nhiều bạn bè cùng biết nhé!

Hãy để lại bình luận

Xem nhiều

Bài tin liên quan

1C Bằng Bao Nhiêu μC? Công thức quy đổi 1C sang μC

Trong cuộc sống hàng ngày và trong lĩnh vực...

Hội chứng Peter Pan: Hiểu về tâm lý không muốn trưởng thành

Bạn đã bao giờ gặp một người trưởng thành...