BÀI GIẢNG
NHẬP MÔN INTERNET VÀ E-LEARNING
Biªn so¹n:
Ths. NguyÔn Duy Ph−¬ng Ths. D−¬ng TrÇn §øc KS. §μo Quang chiÓu KS. Ph¹m thÞ huÕ KS. NguyÔn ThÞ Ngäc H©n
0 LỜI NÓI ĐẦU Ngày nay, Internet trở nên gần gũi và quen thuộc với hàng triệu người ở Việt Nam, đặc biệt ở khu vực thành thị, trong giới trí thức và giới trẻ. Sự tồn tại của Internet đã thay đổi cách thức làm việc, trao đổi thông tin, kể cả cách học tập, nghiên cứu của nhiều người. Trên phạm vi toàn cầu, Internet chứa một khối lượng thông tin khổng lồ phân tán ở hàng chục ngàn mạng con thuộc hàng trăm nước trên thế giới. Các dịch vụ Internet cũng ngày càng trở nên đa dạng và hữu ích hơn. Chính vì thế, sự hiểu biết về Internet và khả năng sử dụng, khai thác thông tin trên Internet cũng ngày càng trở nên quan trọng và thiết thực cho mỗi người. Để triển khai đào tạo hệ đại học từ xa qua mạng tin học- viễn thông, Học viện Công nghệ Bưu chính Viễn thông đã xây dựng một hệ thống đa dạng các bài giảng trên mạng, các bài giảng điện tử đa phương tiện, và sử dụng Internet như một trong các phương tiện chính để truyền tải và tạo môi trường dạy và học cho bậc đại học từ xa. Do đó, Internet đóng một vai trò quan trọng trong quá trình việc cung cấp học liệu, bài giảng và tổ chức hướng dẫn học tập, trao đổi qua mạng. Chính vì vậy, việc biên soạn tập sách hướng dẫn học tập môn “Nhập môn Internet và ELearning” cho các sinh viên năm thứ nhất nhằm trang bị cho sinh viên những kiến thức và kỹ năng cơ bản về Internet, cách sử dụng các dịch vụ của Internet để phục vụ cho quá trình tự học, tự nghiên cứu và trao đổi kiến thức theo hình thức giáo dục từ xa là một việc làm cần thiết. Tài liệu cũng giới thiệu các kiến thức cơ bản về E-Learning, các khái niệm, các đặc điểm, cấu trúc của hệ thống cũng như phương pháp và quy trình học E-Learning. Tài liệu có cấu trúc gồm 3 chương. Chương 1 giới thiệu tổng quan về Internet, các khái niệm, định nghĩa, kiến trúc chung của mạng Internet. Chương 2 giới thiệu về các dịch vụ trên Internet, hướng dẫn chi tiết cách sử dụng các dịch vụ. Chương cuối cùng giới thiệu tổng quan về E-Learning giúp cho sinh viên nắm được các kiến thức về công nghệ đào tạo sử dụng E-learning mà các cơ sở đào tạo hiện đang sử dụng. Cũng cần nhấn mạnh rằng, nội dung chính của tập tài liệu chỉ đề cập đến những vấn đề có liên quan thiết thực nhất đến việc khai thác, sử dụng Internet cho việc học tập trong môi trường giáo dục điện tử. Sinh viên có thể tham khảo, nghiên cứu sâu hơn về những nội dung có liên quan ở những giáo trình, tài liệu và trang Web mà cuối mỗi chương nhóm tác giả đã liệt kê. Sinh viên cũng có thể nghiên cứu những nội dung của môn học này thông qua việc sử dụng bộ bài giảng điện tử được đóng gói trong đĩa CD-ROM do Học viện Công nghệ Bưu chính viễn thông biên soạn. Mặc dù các tác giả cũng đã có nhiều cố gắng, song do nhiều lý do các thiếu sót còn tồn tài trong tập tài liệu là điều khó tránh khỏi. Nhóm tác giả xin chân thành chờ đón sự đóng góp ý kiến của các bạn đồng nghiệp, sinh viên xa gần và xin cảm ơn về điều đó để tập tài liệu ngày càng hoàn thiện hơn ở những lần xuất bản sau.
Nhóm tác giả
Chương 1: Tổng quan về Internet
0 CHƯƠNG 1: TỔNG QUAN VỀ INTERNET GIỚI THIỆU Vào những thập kỉ trước, rất ít người trong chúng ta biết về Internet. Cho tới năm 1997, khi Internet chính thức được đưa vào cung cấp cho người sử dụng ở Việt Nam, thuật ngữ Internet bắt đầu được nhiều người biết tới, và trở thành một dịch vụ truyền thông hữu ích cho nhiều người. Ngày nay, Internet trở nên gần gũi và quen thuộc với hàng triệu người ở Việt Nam, đặc biệt ở khu vực thành thị, trong giới trí thức và giới trẻ. Sự tồn tại của Internet đã thay đổi cách thức làm việc, trao đổi thông tin, kể cả cách học tập, nghiên cứu của nhiều người. Trên phạm vi toàn cầu, Internet chứa một khối lượng thông tin khổng lồ phân tán ở hàng chục ngàn mạng con thuộc hàng trăm nước trên thế giới. Các dịch vụ Internet cũng ngày càng trở nên đa dạng và hữu ích hơn. Chính vì thế, sự hiểu biết về Internet và khả năng sử dụng, khai thác thông tin trên Internet cũng ngày càng trở nên quan trọng và thiết thực cho mỗi người. Trong chương này, chúng ta sẽ cùng từng bước nghiên cứu, tìm hiểu những nội dung cơ bản nhất, cũng như ứng dụng Internet trong đời sống và công việc, đặc biệt là việc sử dụng Internet trong trao đổi thông tin, nghiên cứu và học tập. Nội dung chương này sẽ đề cập đến bao gồm •
Các kiến thức tổng quan về Internet, lịch sử phát triển
•
Cấu trúc của Internet, các giao thức trên Internet, v.v…
•
Các khái niệm và định nghĩa có liên quan đến Internet, các cách kết nối, các khái niệm về địa chỉ IP, tên miền, ...
Để nắm được nội dung của chương này một cách tốt nhất, người đọc cần có một số vốn từ tiếng Anh cũng như đã biết các thao tác sử dụng máy tính đơn giản. Cuối chương, người đọc có thể tự đánh giá những kiến thức đã thu lượm được của mình bằng cách trả lời các câu hỏi và làm một số bài tập. 1.1.
KHÁI QUÁT
1.1.1. Lịch sử phát triển Internet được hình thành từ cuối thập kỉ 60 của thế kỷ trước, từ một dự án nghiên cứu của Bộ quốc phòng Mỹ. Tháng 7 năm 1968, Cơ quan quản lý dự án nghiên cứu cấp cao của Bộ Quốc phòng Mỹ (ARPA-Advanced Research Project Agency) đã đề nghị liên kết 4 địa điểm: Viện Nghiên cứu Standford, Trường Đại học tổng hợp California ở LosAngeles, UC - Santa Barbara và Trường Đại học tổng hợp Utah. Bốn điểm trên được nối thành mạng vào năm 1969 đã đánh dấu sự ra đời của Internet ngày nay. Mạng này được biết đến dưới cái tên ARPANET. 5
Chương 1: Tổng quan về Internet
ARPANET là một mạng thử nghiệm phục vụ các nghiên cứu quốc phòng. Một trong những mục đích của nó là xây dựng một mạng máy tính có khả năng khắc phục các sự cố. Mạng máy tính này có những đặc trưng sau : •
Có thể tiếp tục hoạt động ngay khi có nhiều kết nối bị hư hỏng.
•
Phải đảm bảo các máy tính với các phần cứng khác nhau đều có thể sử dụng mạng.
•
Có khả năng tự động điều chỉnh hướng truyền thông tin, bỏ qua những phần bị hư hỏng.
•
Có đặc tính là mạng của các mạng máy tính, nghĩa là có khả năng mở rộng liên kết dễ dàng.
Ban đầu, máy tính và đường liên lạc có khả năng xử lý rất chậm, với đường dây dài thì tốc độ chuyển tín hiệu nhanh nhất là 50 kbits/giây. Số lượng máy tính nối vào mạng rất ít (chỉ 200 máy chủ vào năm 1981). ARPANET càng phát triển khi có nhiều máy nối vào - rất nhiều trong số này là từ các cơ quan của Bộ quốc phòng Mỹ hoặc những trường đại học nghiên cứu với các đầu nối vào Bộ quốc phòng. Đây là những giao điểm trên mạng. Trong khi ARPANET đang cố gắng chiếm lĩnh mạng quốc gia thì một nghiên cứu tại Trung tâm nghiên cứu Palo Alto của công ty Xerox đã phát triển một kỹ thuật được sử dụng trong mạng cục bộ là Ethernet. Theo thời gian, Ethernet trở thành một trong những chuẩn quan trọng để kết nối trong các mạng cục bộ. Cũng trong thời gian này, DARPA (đặt lại tên từ ARPA) chuyển sang hợp nhất TCP/IP (giao thức được sử dụng trong việc truyền thông trên Internet) vào phiên bản hệ điều hành UNIX của trường đại học tổng hợp California ở Berkeley. Với sự hợp nhất như vậy, những trạm làm việc độc lập sử dụng UNIX đã tạo nên một thế mạnh trên thị trường, TCP/IP cũng có thể dễ dàng tích hợp vào phần mềm hệ điều hành. TCP/IP trên Ethernet đã trở thành một cách thức thông dụng để trạm làm việc nối đến trạm khác. Trong thập kỷ 1980, máy tính cá nhân được sử dụng rộng rãi trong các công ty và trường Đại học trên thế giới. Mạng Ethernet kết nối các máy tính cá nhân (PC) trở thành phổ biến. Các nhà sản xuất phần mềm thương mại cũng đưa ra những chương trình cho phép các máy PC và máy UNIX giao tiếp cùng một ngôn ngữ trên mạng. Vào giữa thập kỷ 1980, giao thức TCP/IP được dùng trong một số kết nối khu vực-khu vực (liên khu vực) và cũng được sử dụng cho các mạng cục bộ và mạng liên khu vực. Thuật ngữ "Internet" xuất hiện lần đầu vào khoảng 1974 trong khi mạng vẫn được gọi là ARPANET. Vào thời điểm này, ARPANET (hay Internet) còn ở qui mô rất nhỏ. Mốc lịch sử quan trọng của Internet được chọn vào giữa thập kỷ 1980, khi Quỹ khoa học quốc gia Mỹ NSF (National Science Foundation) thành lập mạng liên kết các trung tâm máy tính lớn với nhau gọi là NSFNET. Mạng này chính là mạng Internet. Điểm quan trọng của NSFNET là cho phép mọi người cùng sử dụng. Trước NSFNET, chỉ các nhà khoa học, chuyên gia máy tính và nhân viên các cơ quan chính phủ được kết nối Internet. Nhiều doanh nghiệp đã chuyển từ ARPANET sang NSFNET. Chính vì vậy, sau gần 20 năm ARPANET trở nên không còn hiệu quả và đã ngừng hoạt động vào khoảng năm 1990. 6
Chương 1: Tổng quan về Internet
Ngày nay, mạng Internet phát triển mạnh mẽ hơn các phương tiện truyền thông truyền thống khác như phát thanh và truyền hình, do sự cải tiến và phát triển không ngừng. Các công nghệ đang áp dụng trên Internet giúp cho Internet trở thành mạng liên kết vô số kho thông tin toàn cầu, có dịch vụ phong phú về nội dung, hình thức. Đó cũng chính là điều thúc đẩy chúng ta nên bắt đầu ngay với hành trình khám phá thế giới mới - thế giới Internet. 800 triệu máy tính kết nối 11 triệu máy tính kết nối NSFNET thay thế ARPANET ARPANET sử dụng bộ giao thức TCP/IP ARPANET được thành lập
1969
1986
1983
1996
2004
Hình 1.1: Sơ đồ lịch sử phát triển Internet 1.1.2. Internet là gì ? Internet (Inter-network) là một mạng máy tính rất rộng lớn kết nối các mạng máy tính khác nhau nằm rải rộng khắp toàn cầu. Một mạng (Network) là một nhóm máy tính kết nối nhau, các mạng này lại liên kết với nhau bằng nhiều loại phương tiện, tốc độ truyền tin khác nhau. Do vậy có thể nói Internet là mạng của các mạng máy tính. Các mạng liên kết với nhau dựa trên bộ giao thức (như là ngôn ngữ giao tiếp) TCP/IP (Transmision Control Protocol - Internet Protocol): Giao thức điều khiển truyền dẫn- giao thức Internet. Bộ giao thức này cho phép mọi máy tính liên kết, giao tiếp với nhau theo một ngôn ngữ máy tính thống nhất giống như một ngôn ngữ quốc tế (ví dụ như Tiếng Anh) mà mọi người sử dụng để giao tiếp. Mạng Internet không chỉ cho phép chuyển tải thông tin nhanh chóng mà còn giúp cung cấp thông tin. Nó cũng là diễn đàn trao đổi và là thư viện toàn cầu đầu tiên.
1.1.2.1. Cấu trúc mạng Internet Internet là một liên mạng, tức là mạng của các mạng con. Để kết nối hai mạng con với nhau, có hai vấn đề cần giải quyết : - Vấn đề thứ nhất: Về mặt vật lý, hai mạng con chỉ có thể kết nối với nhau khi có một thiết bị có thể kết nối với cả hai mạng này. Việc kết nối đơn thuần về vật lý chưa thể làm cho hai mạng con có thể trao đổi thông tin với nhau. - Vấn đề thứ hai: Thiết bị kết nối được về mặt vật lý với hai mạng con phải hiểu được cả hai giao thức truyền tin được sử dụng trên hai mạng con này và các gói thông tin của hai mạng con sẽ được gửi qua nhau thông qua thiết bị đó. Thiết bị này được gọi là cổng nối Internet (Internet Gateway) hay Bộ định tuyến (Router). 7
Chương 1: Tổng quan về Internet
Hình 1.2: Hai mạng Net 1 và Net 2 kết nối thông qua Router R. Khi kết nối mạng đã trở nên phức tạp hơn, các Router cần phải biết về sơ đồ kiến trúc của các mạng kết nối. Ví dụ trong hình sau đây cho thấy nhiều mạng được kết nối bằng 2 Router.
Hình 1.3: 3 Mạng kết nối với nhau thông qua 2 router
Như vậy, Router R1 phải chuyển tất cả các gói thông tin đến một máy nằm ở mạng Net 2 hoặc Net 3. Với kích thước lớn như mạng Internet, việc các Router quyết định chuyển các gói thông tin cho các máy trong các mạng sẽ trở nên phức tạp hơn. Để các Router có thể thực hiện được công việc chuyển một số lớn các gói thông tin thuộc các mạng khác nhau, người ta đề ra quy tắc là: các Router chuyển các gói thông tin dựa trên địa chỉ mạng nơi đến, chứ không phải dựa trên địa chỉ của máy nhận. Như vậy, dựa trên địa chỉ mạng nên tổng số thông tin mà Router phải lưu giữ về sơ đồ kiến trúc mạng sẽ tuân theo số mạng trên Internet chứ không phải là số máy trên Internet. Trên Internet, tất cả các mạng đều có quyền bình đẳng cho dù chúng có tổ chức hay số lượng máy có sự khác nhau. Bộ giao thức TCP/IP của Internet hoạt động tuân theo quan điểm sau: tất các các mạng con trong Internet như là Ethernet, một mạng diện rộng như NSFNET Backbone hay một liên kết điểm-điểm giữa hai máy duy nhất đều được coi như là một mạng. Điều này xuất phát từ quan điểm đầu tiên khi thiết kế giao thức TCP/IP là có thể liên kết giữa các mạng có kiến trúc hoàn toàn khác nhau. Khái niệm "mạng" đối với TCP/IP bị ẩn đi phần kiến trúc vật lý của mạng. Đây chính là điểm giúp cho TCP/IP trở lên rất mạnh. Như vậy, người dùng trong Internet hình dung Internet là một mạng thống nhất và bất kỳ hai máy nào trên Internet đều được nối với nhau thông qua một mạng duy nhất. Hình sau mô tả kiến trúc tổng thể của Internet. 8
Chương 1: Tổng quan về Internet
(a) Mạng Internet dưới con mắt người sử dụng. Các máy được nối với nhau thông qua một mạng duy nhất.
Mạng vật lý
Máy chủ
Máy chủ
(b) Kiến trúc tổng quát của mạng Internet. Các R outer cung cấp các kết nối giữa các mạng. R
Hình 1.4: Kiến trúc tổng thể của Internet 9
Chương 1: Tổng quan về Internet
1.1.2.2. Giới thiệu các giao thức kết nối mạng a) Đặc điểm một số bộ giao thức kết nối mạng : ¾ NetBEUI - Bộ giao thức nhỏ, nhanh và hiệu quả được cung cấp theo các sản phẩm của hãng IBM, cũng như sự hỗ trợ của Microsoft. - Bất lợi chính của bộ giao thức này là không hỗ trợ định tuyến và sử dụng giới hạn ở mạng dựa vào Microsoft. ¾ IPX/SPX - Đây là bộ giao thức sử dụng trong mạng Novell. - Ưu thế: nhỏ, nhanh và hiệu quả trên các mạng cục bộ đồng thời hỗ trợ khả năng định tuyến. ¾ DECnet - Đây là bộ giao thức độc quyền của hãng Digtal Equipment Corpration. - DECnet định nghĩa mô tả truyền thông qua mạng cục bộ LAN, mạng MAN (mạng đô thị), WAN (mạng diện rộng). Giao thức này có khả năng hỗ trợ định tuyến. ¾ TCP/IP - Ưu thế chính của bộ giao thức này là khả năng liên kết hoạt động của nhiều loại máy tính khác nhau. - TCP/IP đã trở thành tiêu chuẩn thực tế cho kết nối liên mạng cũng như kết nối Internet toàn cầu. Hiện nay, TCP/IP được sử dụng rộng rãi trong các mạng cục bộ cũng như trên mạng Internet. Vì vậy chúng ta sẽ tìm hiểu tổng quan về bộ giao thức TCP/IP. b) TCP/IP- ( Transmission Control Protocol / Internet Protocol): Là một tập hợp các giao thức kết nối sử dụng cho việc truyền thông tin từ máy tính này sang máy tính khác và từ mạng máy tính này sang mạng máy tính khác. Một máy tính tương tác với thế giới thông qua một hoặc nhiều ứng dụng. Những ứng dụng này thực hiện các nhiệm vụ cụ thể và quản lý dữ liệu vào-ra. Nếu máy tính đó là một phần của hệ thống mạng thì một trong số các ứng dụng trên sẽ có thể giao tiếp với các ứng dụng trên các máy tính khác thuộc cùng hệ thống mạng. Bộ giao thức mạng là một hệ thống các quy định chung giúp xác định quá trình truyền dữ liệu phức tạp. Dữ liệu đi từ ứng dụng trên máy này, qua phần cứng về mạng của máy, tới bộ phận trung gian và đến nơi nhận, thông qua phần cứng của máy tính đích rồi tới ứng dụng. Các giao thức TCP/IP có vai trò xác định quá trình liên lạc trong mạng và quan trọng hơn cả là định nghĩa “hình dáng” của một đơn vị dữ liệu và những thông tin chứa trong nó để máy tính đích có thể dịch thông tin một cách chính xác. TCP/IP và các giao thức liên quan tạo ra một hệ 10
Chương 1: Tổng quan về Internet
thống hoàn chỉnh giúp quản lý quá trình dữ liệu được xử lý, chuyển và nhận trên một mạng sử dụng TCP/IP. Một hệ thống các giao thức liên quan, chẳng hạn như TCP/IP, được gọi là bộ giao thức. Thực tế của quá trình định dạng và xử lý dữ liệu bằng TCP/IP được thực hiện bằng bộ lọc của các hãng sản xuất. Ví dụ, Microsoft TCP/IP là một phần mềm cho phép Windows NT xử lý các dữ liệu được định dạng (format) theo TCP/IP và vì thế có thể hoà vào mạng TCP/IP. Tuy nhiên có sự khác biệt giữa các chuẩn TCP/IP như sau : •
Một chuẩn TCP/IP là một hệ thống các quy định quản lý việc trao đổi trên các mạng TCP/IP.
•
Bộ lọc TCP/IP là một phần mềm có chức năng cho phép một máy tính hoà vào mạng TCP/IP.
•
Mục đích của các chuẩn TCP/IP là nhằm đảm bảo tính tương thích của tất cả bộ lọc TCP/IP thuộc bất kỳ phiên bản nào hoặc của bất kỳ hãng sản xuất nào.
•
Một hệ thống giao thức như TCP/IP phải đảm bảo khả năng thực hiện những công việc sau: o Cắt thông tin thành những gói dữ liệu để có thể dễ dàng đi qua bộ phận truyền tải trung gian. o Tương tác với phần cứng của card mạng. o Xác định địa chỉ nguồn và đích: máy tính gửi thông tin đi phải có thể xác định được nơi gửi đến. Máy tính đích phải nhận ra đâu là thông tin gửi cho mình. o Định tuyến: hệ thống phải có khả năng hướng dữ liệu tới các mạng con, cho dù mạng con nguồn và đích khác nhau về mặt vật lý. o Kiểm tra lỗi, kiểm soát đường truyền và xác nhận: đối với một phương tiện truyền thông tin cậy, máy tính gửi và nhận phải xác định và có thể sửa chữa lỗi trong quá trình vận chuyển dữ liệu. o Chấp nhận dữ liệu từ ứng dụng và truyền nó tới mạng đích. Để có thể thực hiện các công việc trên, những người sáng tạo ra TCP/IP đã chia nó thành những phần riêng biệt, hoạt động độc lập với nhau. Mỗi thành phần đảm nhiệm một chức năng riêng biệt trong hệ thống mạng.
TCP/IP bao gồm bốn tầng như sau : • Tầng truy cập mạng (Network Access Layer)- Là tầng thấp nhất trong mô hình TCP/IP, bao gồm các thiết bị giao tiếp mạng và chương trình cung cấp các thông tin cần thiết để có thể hoạt động, truy cập đường truyền vật lý qua thiết bị giao tiếp mạng đó. • Tầng liên mạng (Internet Layer)- Cung cấp địa chỉ logic, độc lập với phần cứng, để dữ liệu có thể lướt qua các mạng con có cấu trúc vật lý khác nhau. Cung cấp chức năng định tuyến để giảm lưu lượng giao thông và hỗ trợ việc vận chuyển liên mạng. Thuật ngữ liên mạng được dùng 11
Chương 1: Tổng quan về Internet
để đề cập đến các mạng rộng lớn hơn, kết nối từ nhiều LAN. Tạo sự gắn kết giữa địa chỉ vật lý và địa chỉ logic. Các giao thức của tầng này bao gồm: IP (Internet Protocol), ICMP (Internet Coltrol Message Protocol), IGMP (Internet Group Message Protocol). • Tầng giao vận (Transport Layer) - Giúp kiểm soát luồng dữ liệu, kiểm tra lỗi và xác nhận các dịch vụ cho liên mạng. Tầng này đóng vai trò giao diện cho các ứng dụng mạng. Tầng này có hai giao thức chính: TCP (Transmisson Control Protocol) và UDP (User Datagram Protocol). • Tầng ứng dụng (Application Layer) - Là tầng trên cùng của mô hình TCP/IP. Cung cấp các ứng dụng để giải quyết sự cố mạng, vận chuyển file, điều khiển từ xa, và các hoạt động Internet, đồng thời hỗ trợ Giao diện Lập trình Ứng dụng (API) mạng, cho phép các chương trình được thiết kế cho một hệ điều hành nào đó có thể truy cập mạng. c) Mô hình OSI (Open Systems Interconnection): là tập hợp các đặc điểm kỹ thuật mô tả kiến trúc mạng dành cho việc kết nối các thiết bị không cùng chủng loại. Mô hình được chia thành 7 tầng. Mỗi tầng bao gồm những hoạt động, thiết bị và giao thức mạng khác nhau. Chức năng chính của bảy tầng trong mô hình OSI như sau: • Tầng vật lý (Physical Layer) Chuyển đổi dữ liệu sang các dòng xung điện, đi qua bộ phận truyền tải trung gian và giám sát quá trình truyền dữ liệu. • Tầng liên kết dữ liệu (Data Link Layer) Cung cấp giao diện cho bộ điều hợp mạng, duy trì kết nối logic cho mạng con. • Tầng mạng (Network Layer) Hỗ trợ địa chỉ logic và định tuyến. • Tầng giao vận (Transport Layer) Kiểm tra lỗi và kiểm soát việc lưu chuyển liên mạng. • Tầng phiên (Session Layer) Thiết lập các khu vực cho các ứng dụng tương tác giữa các máy tính. • Tầng trình diễn (Presentation Layer) Dịch dữ liệu sang một dạng tiêu chuẩn, quản lý việc mã hoá và nén dữ liệu. • Tầng ứng dụng (Application Layer) Cung cấp giao diện cho các ứng dụng; hỗ trợ ứng dụng gửi file, truyền thông… TCP/IP với OSI : Khi kiến trúc tiêu chuẩn OSI xuất hiện thì TCP/IP đã trên con đường phát triển. Xét một cách chặt chẽ, TCP/IP không tuân theo OSI. Tuy nhiên, hai mô hình này có những mục tiêu giống nhau và do có sự tương tác giữa các nhà thiết kế tiêu chuẩn nên hai mô hình có những điểm tương thích. Cũng chính vì thế, các thuật ngữ của OSI thường được áp dụng cho TCP/IP. Mỗi tầng trong TCP/IP có thể là một hay nhiều tầng của OSI. Mối quan hệ giữa chuẩn TCP/IP bốn tầng và mô hình OSI bảy tầng được thể hiện như ở trong hình sau. 12
Chương 1: Tổng quan về Internet
Mô hình OSI
TCP/IP
Hình 1.5: Mối quan hệ giữa OSI và TCP/IP
1.1.3. Các nhà cung cấp dịch vụ Internet • ISP (Internet Service Provider) - Nhà cung cấp dịch vụ Internet. Nhà cung cấp dịch vụ Internet cấp quyền truy cập Internet qua mạng viễn thông và các dịch vụ như: Email, Web, FTP, Telnet, Chat. ISP được cấp cổng truy cập vào Internet bởi IAP. Hiện tại ở Việt Nam có 16 ISP đăng ký cung cấp dịch vụ, trong đó có các ISP đã chính thức cung cấp dịch vụ là: Tổng Công ty Bưu chính Viễn thông Việt Nam (VNPT), Công ty đầu tư phát triển công nghệ FPT, Công ty Netnam - Viện công nghệ thông tin, Công ty điện tử viễn thông quân đội (Viettel), Công ty cổ phần dịch vụ Internet (OCI), Công ty cổ phần dịch vụ Bưu chính Viễn thông Sài Gòn (SPT), Công ty cổ phần viễn thông Hà Nội (HANOITELECOM). • IAP (Internet Access Provider) - Nhà cung cấp dịch vụ đường truyền để kết nối với Internet (còn gọi là IXP-Internet Exchange Provider). Nếu hiểu Internet như một siêu xa lộ thông tin thì IAP là nhà cung cấp phương tiện để đưa người dùng vào xa lộ. Nói cách khác IAP là kết nối người dùng trực tiếp với Internet. IAP có thể thực hiện cả chức năng của ISP nhưng ngược lại thì không. Một IAP thường phục vụ cho nhiều ISP khác nhau. Các IXP (IAP) tại Việt nam bao gồm: Tổng Công ty Bưu chính Viễn thông Việt Nam (VNPT), Công ty đầu tư phát triển công nghệ FPT, Công ty điện tử viễn thông quân đội (Viettel), Công ty viễn thông điện lực (ETC), Công ty cổ phần dịch vụ Bưu chính Viễn thông Sài Gòn (SPT), Công ty cổ phần viễn thông Hà Nội (HANOITELECOM). 13
Chương 1: Tổng quan về Internet
• ISP dùng riêng ISP dùng riêng được quyền cung cấp đầy đủ dịch vụ Internet. Điều khác nhau duy nhất giữa ISP và ISP dùng riêng là ISP dùng riêng không cung cấp dịch vụ Internet với mục đích kinh doanh. Đây là loại hình dịch vụ Internet của các cơ quan hành chính, các trường đại học hay viện nghiên cứu. • ICP (Internet Content Provider) - Nhà cung cấp dịch vụ nội dung thông tin Internet. ICP cung cấp các thông tin về: kinh tế, giáo dục, thể thao, chính trị, quân sự (thường xuyên cập nhật thông tin mới theo định kỳ) đưa lên mạng. • OSP (Online Service Provider) - Nhà cung dịch vụ ứng dụng Internet. OSP cung cấp các dịch vụ trên cơ sở ứng dụng Internet (OSP) như: mua bán qua mạng, giao dịch ngân hàng, tư vấn, đào tạo,…. • USER - Người sử dụng Internet. Người sử dụng dịch vụ Internet là tổ chức, cá nhân sử dụng dịch vụ Internet thông qua nhà cung cấp dịch vụ Internet (ISP). Người sử dụng cần thoả thuận với một ISP hay một ISP dùng riêng nào đó về các dịch vụ Internet được sử dụng và cách thức thanh toán. Hiện nay có hai cách kết nối phổ biến cho người dùng: - Kết nối trực tiếp đến đến nhà cung cấp dịch vụ qua đường điện thoại, - Kết nối thông qua mạng cục bộ đã có nối kết Internet.
Hình 1.6: Các phương thức kết nối Internet phổ biến. 14
Chương 1: Tổng quan về Internet
Mối liên quan giữa các IAP-ISP-ICP- USER được mô tả tổng quát theo sơ đồ sau:
Leased line: Kênh thuê riêng Leased line
PSTN: Mạng điện thoại công cộng Leased line
Leased line Modem
USER Hình 1.7: Mối liên quan giữa các IAP-ISP-ICP- USER
1.2.
KHÁI NIỆM VÀ ĐỊNH NGHĨA
1.2.1. Các phương thức kết nối Có nhiều phương thức kết nối một máy tính với Internet. Các phương thức này khác nhau tuỳ theo kiểu của hệ thống máy tính đang được sử dụng. ¾ Kết nối trực tiếp Trong kết nối trực tiếp, các chương trình Internet chạy trên máy tính cục bộ, và máy tính này sử dụng các giao thức TCP/IP để trao đổi dữ liệu với một máy tính khác thông qua Internet. Dạng kết nối này là một tuỳ chọn dành cho một máy tính độc lập vốn không kết nối tới Internet thông qua một nhà cung cấp dịch vụ Internet. Hiện nay, các kết nối trực tiếp ít phổ biến. ¾ Kết nối thiết bị cuối ở xa Một kết nối thiết bị cuối ở xa tới Internet sẽ trao đổi các lệnh và các dữ liệu ở định dạng văn bản ASCII với một máy tính chủ sử dụng UNIX hoặc một hệ điều hành tương tự. Các chương trình ứng dụng TCP/ IP và các giao thức TCP/IP đều chạy trên máy chủ. Kiểu kết nối này hoạt động được đối với một số kiểu máy tính độc lập, nhưng không phổ biến. 15
Chương 1: Tổng quan về Internet
¾ Kết nối cổng nối Một mạng cục bộ không sử dụng các lệnh và các giao thức TCP/IP, nó vẫn có thể cung cấp một số dịch vụ Internet, chẳng hạn như thư điện tử hoặc truyền tập tin. Các mạng như vậy sử dụng các cổng nối để chuyển đổi các lệnh, dữ liệu từ định dạng TCP/IP. ¾ Kết nối thông qua một LAN ( mạng cục bộ) Khi một LAN có một kết nối Internet, kết nối đó mở rộng tới mọi máy tính trên LAN. Dạng kết nối này thường được các tổ chức kinh doanh sử dụng để cung cấp khả năng truy cập Internet cho những người dùng của LAN. ¾ Kết nối thông qua một Modem Nếu không có LAN tại chỗ, một máy tính có thể kết nối tới Internet thông qua một cổng truyền thông dữ liệu và một Modem. Các nhà cung cấp dịch vụ (ISP) cung cấp các dịch vụ kiểu này cho những người dùng gia đình và các tổ chức kinh doanh muốn kết nối tới Internet. Đa số những người dùng riêng lẻ đều kết nối tới Internet bằng cách sử dụng một đường dây điện thoại, một modem và một tài khoản (account). Khi đó, tuỳ thuộc vào nhà cung cấp dịch vụ, máy tính của khách hàng có thể được gán một địa chỉ IP cố định, hoặc địa chỉ IP của nó và có thể thay đổi mỗi lần khách hàng đăng nhập vào máy phục vụ của ISP. 1.2.2. Địa chỉ IP và tên miền
1.2.2.1. Địa chỉ IP Các máy tính trên Internet phải làm việc với nhau theo giao thức chuẩn TCP/IP nên đòi hỏi phải có địa chỉ IP và địa chỉ này tồn tại duy nhất trong mạng. Cấu trúc của địa chỉ IP bao gồm 32 bit và được chia thành 4 nhóm; các nhóm cách nhau bởi dấu chấm (.), mỗi nhóm gồm 3 chữ số có giá trị 0 đến 255: xxx.xxx.xxx.xxx. Ví dụ: 206.25.128.123 Địa chỉ IP đang được sử dụng hiện tại là (IPv4) có 32 bit. Hiện nay một số quốc gia đã đưa vào sử dụng địa chỉ IPv6 nhằm mở rộng không gian địa chỉ và những ứng dụng mới, Ipv6 bao gồm 128 bit dài gấp 4 lần của IPv4. Version IPv4 có khả nǎng cung cấp 232 = 4 294 967 296 địa chỉ. Còn Version IPv6 có khả nǎng cung cấp tới 2128 địa chỉ. Hiện nay địa chỉ IP được một tổ chức phi chính phủ - InterNIC ( Internet Network Center) cung cấp để đảm bảo không có máy tính kết nối Internet nào bị trùng địa chỉ. (http://www.internic.net)
1.2.2.2. Tên miền Người sử dụng sẽ khó nhớ được địa chỉ IP dẫn đến việc sử dụng dịch vụ từ một máy tính nào đó là rất khó khǎn vì thế hệ thống DNS (Domain Name System - DNS) được giới thiệu ở phần tiếp theo) sẽ gán cho mỗi địa chỉ IP một cái tên tương ứng mang một ý nghĩa nào đó, dễ nhớ cho người sử dụng mà thuật ngữ Internet gọi là tên miền. 16
Chương 1: Tổng quan về Internet
Ví dụ: Máy chủ Web Server của VNNIC có địa chỉ là 203.162.57.101, tên miền của nó là www.vnnic.net.vn. Thực tế người sử dụng không cần biết đến địa chỉ IP mà chỉ cần nhớ tên miền này là truy cập được. Như vậy, tên miền là một sự nhận dạng vị trí của một máy tính trên mạng Internet. Nói cách khác, tên miền là tên của các mạng lưới, tên của các máy chủ trên mạng Internet. Mỗi địa chỉ dạng chữ này luôn tương ứng với một địa chỉ IP dạng số. a) Giới thiệu về hệ thống quản lý tên miền (Domain Name System-DNS) Mỗi máy tính khi kết nối vào mạng Internet thì được gán cho một địa chỉ IP xác định. Địa chỉ IP của mỗi máy là duy nhất và giúp máy tính xác định đường đi đến một máy tính khác một cách dễ dàng. Hệ thống DNS ra đời nhằm giúp chuyển đổi từ địa chỉ IP khó nhớ mà máy sử dụng sang một tên dễ nhớ cho người sử dụng, đồng thời giúp hệ thống Internet ngày càng phát triển. Hệ thống DNS sử dụng hệ thống cơ sở dữ liệu phân tán và phân cấp hình cây. Vì vậy, việc quản lý sẽ dễ dàng và thuận tiện cho việc chuyển đổi từ tên miền sang địa chỉ IP và ngược lại. Hệ thống DNS giống như mô hình quản lý công dân của một nước. Mỗi công dân sẽ có một tên xác định đồng thời cũng có địa chỉ chứng minh thư để giúp quản lý con người một cách dễ dàng hơn. - Mỗi công dân đều có số căn cước để quản lý, ví dụ: Ông Nguyễn Văn A có chứng minh thư: 111200765. - Mỗi một địa chỉ IP tương ứng với tên miền, ví dụ: trang chủ của nhà cung cấp dịch vụ ISP lớn nhất Việt Nam hiện tại là VDC có tên miền là: home.vnn.vn , tương ứng với địa chỉ IP là: 203.162.0.12. b) Hoạt động của hệ thống DNS : Giả sử người sử dụng muốn truy cập vào trang web có địa chỉ là http://www.google.com/ . Tiến trình hoạt động của DNS như sau: • Trước hết chương trình trên máy người sử dụng gửi yêu cầu tìm kiếm địa chỉ IP ứng với tên miền www.google.com tới máy chủ quản lý tên miền (Name Server) cục bộ thuộc mạng của nó (ISP DNS Server). • Máy chủ quản lý tên miền cục bộ này kiểm tra trong cơ sở dữ liệu của nó xem có chứa cơ sở dữ liệu chuyển đổi từ tên miền sang địa chỉ IP của tên miền mà người sử dụng yêu cầu không. Trong trường hợp máy chủ quản lý tên miền cục bộ có cơ sở dữ liệu này, nó sẽ gửi trả lại địa chỉ IP của máy có tên miền nói trên (www.google.com) • Trong trường hợp máy chủ quản lý tên miền cục bộ không có cơ sở dữ liệu về tên miền này, nó thường hỏi lên các máy chủ quản lý tên miền ở cấp cao nhất (máy chủ quản lý tên miền làm việc ở mức Root). Máy chủ quản lý tên miền ở mức Root này sẽ trả về cho máy chủ quản lý tên miền cục bộ địa chỉ của máy chủ tên miền quản lý các tên miền có đuôi .com. • Máy chủ quản lý tên miền cục bộ gửi yêu cầu đến máy chủ quản lý tên miền có đuôi (.com) tìm tên miền www.google.com. Máy chủ quản lý tên miền quản lý các tên miền.com sẽ gửi lại địa chỉ của máy chủ quản lý tên miền google.com. 17
Chương 1: Tổng quan về Internet
• Máy chủ quản lý tên miền cục bộ sẽ hỏi máy chủ quản lý tên miền google.com này địa chỉ IP của tên miền www.google.com. Do máy chủ quản lý tên miền google.com có cơ sở dữ liệu về tên miền www.google.com nên địa chỉ IP của tên miền này sẽ được gửi trả lại cho máy chủ quản lý tên miền cục bộ. • Máy chủ tên miền cục bộ chuyển thông tin tìm được đến máy của người sử dụng. • Máy tính của người dùng sẽ sử dụng địa chỉ IP này để mở một phiên kết nối TCP/IP đến máy chủ chứa trang web có địa chỉ http://www.google.com/. Tổ chức Hệ thống DNS theo sự phân cấp tên miền trên Internet được cho ở hình dưới đây.
khác
Domain com.vn
Domain sieuthi.com.vn la domain con của com.vn
Hình 1.8: Tổ chức của hệ thống quản lý tên miền
c) Cấu tạo tên miền (Domain Name): Để quản lý các máy đặt tại những vị trí vật lý khác nhau trên hệ thống mạng nhưng thuộc cùng một tổ chức, cùng lĩnh vực hoạt động… người ta nhóm các máy này vào một tên miền (Domain). Trong miền này nếu có những tổ chức nhỏ hơn, lĩnh vực hoạt động hẹp hơn… thì được chia thành các miền con (Sub Domain). Tên miền dùng dấu chấm (.) làm dấu phân cách. Cấu trúc miền và các miền con giống như một cây phân cấp. Ví dụ www.home.vnn.vn là tên miền máy chủ web của VNNIC. Thành phần thứ nhất ‘www‘ là tên của máy chủ, thành phần thứ hai ‘home‘ thường gọi là tên miền cấp 3 (Third Level Domain Name), thành phần thứ ba ‘vnn‘ gọi là tên miền mức 2 (Second Level Domain Name) 18
Chương 1: Tổng quan về Internet
thành phần cuối cùng ‘vn‘ là tên miền mức cao nhất (ccTLD - Country Code Top Level Domain Name). Hình ảnh mô tả sự phân cấp của tên miền
www. yahoo.com Æ 204.23.43.121 -> địa chỉ IP
tên miền
Phân loại theo tổ chức Cấp cao nhất
Theo vùng địa lý
: Gov edu mil com org net int
msn
investor
yahoo
vnn
vn
edu
fpt
onsale vnu
Hình 1.9: Sự phân cấp của tên miền
Qui tắc đặt tên miền: Tên miền nên được đặt đơn giản và có tính chất gợi nhớ, phù hợp với mục đích và phạm vi hoạt động của tổ chức, cá nhân sỡ hữu tên miền. Mỗi tên miền được có tối đa 63 ký tự bao gồm cả dấu “.”. Tên miền được đặt bằng các chữ số và chữ cái (a-z A-Z 0-9) và ký tự “-“. Một tên miền đầy đủ có chiều dài không vượt quá 255 ký tự
19
Chương 1: Tổng quan về Internet
Dưới đây là các tên miền thông dụng : Domain
Mô tả
com
Các tổ chức thương mại, doanh nghiệp (Commercial)
edu
Các tổ chức giáo dục ( Education)
gov
Các tổ chức chính phủ (Government)
int
Các tổ chức Quốc tế (International Organisations)
mil
Các tổ chức quân sự (Military)
net
Một mạng không thuộc các loại phân vùng khác (Network)
org
Các tổ chức không thuộc một trong các loại trên (Other orgnizations)
Ngoài ra, mỗi Quốc gia còn có một miền gồm hai ký tự. Ví dụ: “vn” (Việt Nam), “us” (Mỹ), “ca” (Canada)… Bảng sau là các ký hiệu tên vùng của một số nước trên thế giới: Domain
Quốc gia tương ứng
at
Áo
be
Bỉ
ca
Canada
fi
Phần Lan
fr
Pháp
de
CHLB Đức
il
Israel
it
Italia
jp
Nhật
vn
Việt Nam
* Chi tiết hơn tham khảo tại Website: http:www.iana.org/cctld/cctld-whois.htm 1.2.3. Web và HTML
1.2.3.1. Web World Wide Web (gọi tắt là Web hay WWW): là mạng lưới nguồn thông tin cho phép khai thác thông qua một số công cụ, chương trình hoạt động dưới các giao thức mạng. WWW là công cụ, phương tiện, hay đúng hơn là một dịch vụ của Internet. Một tài liệu siêu văn bản - được gọi phổ biến hơn là một trang web -, là một tập tin được mã hoá đặc biệt, sử dụng ngôn ngữ đánh dấu siêu văn bản -HTML (HyperText Markup Languages). 20
Chương 1: Tổng quan về Internet
Ngôn ngữ này cho phép tác giả của một tài liệu nhúng các liên kết siêu văn bản (còn được gọi là các siêu liên kết -hyperlink) vào trong tài liệu. Các liên kết siêu văn bản là nền móng của World Wide Web. Khi đọc một trang web, có thể nhấp chuột vào một từ hay một hình ảnh được mã hoá như một liên kết siêu văn bản và sẽ lập tức chuyển tới một vị trí khác nằm bên trong tài liệu đó hoặc tới một trang Web khác. Trang thứ hai có thể nằm trên cùng máy tính với trang đầu, hoặc có thể nằm bất kì nơi nào trên Internet. Một tập hợp các trang Web có liên quan được gọi là WebSite. Mỗi WebSite được lưu trữ trên trên một máy phục vụ Web, vốn là các máy chủ Internet lưu trữ hàng ngàn trang Web riêng lẻ. Việc sao chép một trang lên một Web Server được gọi là tải (hoặc nạp) lên (uploading) hay công bố ( publishing).
Hình 1.10: Hình ảnh của 1 trang Web Web cung cấp thông tin rất đa dạng bao gồm văn bản, hình ảnh, âm thanh, video. Hiện nay các trang Web sử dụng để phân phối tin tức, các dịch vụ giáo dục, thông tin, danh mục sản phẩm, cùng nhiều thứ khác. Các trang Web tương tác cho phép các độc giả tra cứu cơ sở dữ liệu, đặt hàng các sản phẩm và các thông tin, gửi số tiền thanh toán bằng thẻ tín dụng ….. Web là một phần của Internet, là một loại dịch vụ đối với những người truy cập tài nguyên của Internet. Dưới đây là một hình ảnh của một trang Web : Các trình duyệt Web Một trình duyệt Web là một phần mềm ứng dụng được thiết kế để tìm các tài liệu siêu văn bản trên Web rồi mở các tài liệu đó trên máy tính người sử dụng. Hiện nay, các trình duyệt thông 21
Chương 1: Tổng quan về Internet
Hình 1.11: Hình ảnh của cửa sổ trình duyệt Internet Explorer
Hình 1.12: Hình ảnh của cửa sổ trình duyệt Netscape Navigator. 22
Chương 1: Tổng quan về Internet
Ngôn ngữ của WWW được gọi là gọi là ngôn ngữ đánh dấu siêu văn bản - HTML. Vì vậy, chúng ta cần tìm hiểu HTML là gì và học cách sử dụng các thẻ (tag) của HTML trong phần tiếp theo.
1.2.3.2. Giới thiệu về HTML • HTML - Hyper Text Markup Language : ngôn ngữ đánh dấu siêu văn bản HTML cho phép tạo các trang Web phối hợp hài hoà văn bản thông thường với hình ảnh âm thanh, video, các mối liên kết đến các trang siêu văn bản khác … Tên gọi ngôn ngữ đánh dấu siêu dấu siêu văn bản phản ánh thực chất của công cụ này. Các thuật ngữ đó có thể được hiểu như sau: - Hyper - (siêu): HTML cho phép Internet. Nó có tác dụng che dấu sự phức Internet có thể đọc văn bản mà không cần xây dựng phức tạp như thế nào. HTML đã kinh điển.
liên kết nhiều trang văn bản rải rác khắp nơi trên tạp của Internet đối với người sử dụng. Người dùng biết đến văn bản đó đang nằm ở đâu, hệ thống được thực sự vượt ra khỏi khuôn khổ khái niệm “văn bản”
- Text –văn bản: HTML đầu tiên và trước hết là để trình bày văn bản và dựa trên nền tảng là một văn bản. - Language - Ngôn ngữ: HTML là một ngôn ngữ tương tự như các ngôn ngữ lập trình, tuy đơn giản hơn. Nó có cú pháp chặt chẽ để viết các lệnh nhằm thực hiện việc trình diễn văn bản. - Markup - đánh dấu: HTML là ngôn ngữ của các thẻ (Tag) đánh dấu. Các thẻ này xác định cách thức trình bày đoạn văn bản tương ứng trên màn hình. • Giới thiệu các thẻ HTML Trang mã nguồn HTML là văn bản bình thường bao gồm các kí tự ASCII, có thể được tạo ra bằng bất cứ bộ soạn thảo thông thường nào. Theo quy ước, tất cả các tệp mã nguồn của của trang siêu văn bản phải có đuôi là.html hoặc.htm Khi bộ duyệt (Browser) đọc trang mã nguồn HTML, diễn dịch các thẻ lệnh và hiển thị nó lên màn hình máy tính thì ta thường gọi là trang Web. Vậy trang Web không tồn tại nguyên gốc trên đĩa cứng của máy tính. Nó là cái thể hiện của trang mã nguồn qua xử lí của bộ duyệt. Như sau này ta sẽ thấy, các bộ duyệt khác nhau có thể hiển thị cùng một trang mã nguồn không hoàn toàn giống nhau. Nói soạn thảo siêu văn bản tức là tạo ra trang mã nguồn HTML đúng quy định để bộ duyệt hiểu được và hiển thị đúng. Hiện nay có nhiều công cụ soạn thảo siêu văn bản mạnh như Frontpage2003, Macromedia Dreamweaver MX,….với giao diện trực quan và tự động sinh mã cho phép soạn thảo siêu văn bản như soạn thảo thông thường. Tuy nhiên, việc tìm hiểu cú pháp của HTML, nắm vững ý nghĩa của các thẻ khác nhau vẫn rất cần thiết để tạo ra các trang Web động, để tương tác với người sử dụng, để phục vụ các ứng dụng Internet sau này. 23
Chương 1: Tổng quan về Internet
• Các thẻ HTML Các thẻ (Tag) dùng để báo cho trình duyệt cách thức trình bày văn bản trên màn hình hoặc dùng để chèn một mối liên kết đến các trang khác, một đoạn chương trình khác... Mỗi thẻ gồm một từ khoá - KEYWORD- bao bọc bới hai dấu "bé hơn" (<) và "lớn hơn" (>). Hầu hết các lệnh thể hiện bằng một cặp hai thẻ: thẻ mở () và thẻ đóng (). Dấu gạch xiên("/") kí hiệu thẻ đóng. Lệnh sẽ tác động vào đoạn văn bản nằm giữa hai thẻ. Đoạn văn bản chịu tác động của lệnh Một số thẻ không có cặp, chúng được gọi là các thẻ rỗng hay thẻ đơn. Chỉ có thẻ mở mà thôi. Cấu trúc của một trang văn bản HTML Mọi tài liệu HTML đều có khung cấu trúc như sau: <TITLE>