This document was uploaded by user and they confirmed that they have the permission to share
it. If you are author or own the copyright of this book, please report to us by using this DMCA
report form. Report DMCA
KHÁI NIỆM VÀ QUÁ TRÌNH RA ĐỜI CỦA HTML. 1. Khái niệm
HTML là viết tắt của cụm từ HyperText Markup Language, tức là ngôn ngữ đánh dấu siêu văn bản, nghĩa là một từ hay một cụm từ hay một câu trên trang web được dùng để liên kết đến trang web khác và các mẩu thông tin được trình bày trên World Wide Web. hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 2 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
HTML Ngôn ngữ đánh dấu: có thể bạn nghĩ rằng phải có gói phần mềm tinh vi để thu được tất cả những hiệu ứng trang trí đầy quyến rũ này. Mặc dù có một số công cụ dành cho những người say mê HTML thực sự, nhưng bạn có thể dùng một trình soạn thảo văn bản bất kỳ như Notepad của Windows để tạo ra những trang Web hấp dẫn. 2. Sự ra đời Mục đích định nghĩa riêng HTML là để phục vụ cho sự hình thành và phát triển của Web. Các phiên bản của HTML thể hiện sự biến động và sự phát triển liên tục của ngôn ngữ HTML.Web, một từ đại diện cho cụm từ World Wide Web, ra đời trong tháng 10 năm 1990, nhờ sự sáng tạo của Ông Tim Berners-Lee, một cán bộ làm việc tại CERN (Phòng thi nghiệm châu âu về vật lý Hạt cơ bản) gần Thành Phố Geneva (Thuỵ sĩ). Lúc đó Ông ta trình bày một đề án nhằm xây dựng một hệ thống tham khảo các văn bản và các tài liệu nghiên cứu phục vụ cho các nhà khoa học ở các nơi xa nhau có thể hợp tác với nhau thông qua Internet dựa trên kỹ thuật siêu liên kết. Kèm theo đề án, và để thuyết minh cho sự đề nghị, Ông Berners-Lee đã giới thiệu một trình duyệt các văn bản được soạn theo một ngôn ngữ đánh dấu văn bản (SGML) sẽ là hạt nhân cho sự phát triển của ngôn ngữ HTML sau này. Các tài liệu được di chuyển qua mạng Internet theo một giao thức giao dịch là HTTP hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 3 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
(HyperText Transfer Protocol) Hệ thống tham khảo các siêu văn bản thông qua các siêu liên kết nói trên được ông Berners-Lee gọi là World wide Web và đây cũng là tên của đề án nói trên. Sáng kiến của Ông Berners-Lee có lẽ được đón chào một cách nhiệt liệt, ít ra bởi cộng đồng các nhà khoa học đang sử dụng Internet để trao đổi với nhau. Lúc đầu những tài liệu siêu văn bản cũng đơn giản và chủ yếu chỉ hiển lên văn bản, vì vậy các trình duyệt đầu tiên cũng khá đơn giản và chỉ hiển lên văn bản như trình duyệt Lynx phổ biến trên các hệ thống UNIX (bạn cũng nên nhớ rằng các máy vi tính hiện đại và phổ biến, như máy PC, vào đầu thập niên 90 cũng chỉ là những loại máy AT 286-386 với một cơ cấu phần cứng khá khiêm tốn so với khả năng của một máy PC hiện giờ, và Internet lúc đó cũng chưa phát triển như bây giờ, đặc biệt thời đó còn dùng các loại modem tốc độ). Tuy nhiên khả năng kết hợp hình cùng với văn bản tạo thêm sự hấp dẫn đối với môi trường siêu văn bản, và chính khả năng đó đã càng ngày càng thu hút nhiều người sử dụng Web để tham khảo tài liệu cũng như để công bố trên Web. Trình duyệt đầu tiên có khả năng hiển lên hình màu gắn vào văn bản là Mosaic, được phát triển tại trung tâm NCSA, Đại học Illinois tại UrbanaChampaign (Bang Illinois, Hoa Kỳ). Tuy nhiên, để làm như vậy, những người đã lập trình duyệt Mosaic đã phải phát triển thêm cú pháp của ngôn ngữ đánh dấu siêu văn bản, tức là tạo thêm những yếu tố phần tử mới hoặc định nghĩa những thuộc tính (attributes) mới cho những yếu tố phần tử sẵn có. Bởi vì sự chấp nhận rộng rãi của trình duyệt Mosaic, cho nên cú pháp ngôn ngữ đánh dấu hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 4 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
siêu văn bản mà Mosaic xử lý được đương nhiên đã làm căn cứ cho sự định nghĩa của HTML. Sự thành công của Mosaic đã mở đường cho sự bùng nổ của Web, và đặc biệt cho sự nhân lên của số phần mềm trình duyệt web, trong đó nổi tiếng là Netscape Navigator do Công ty Netscape Communications Corporation làm ra. Tuy nhiên mỗi trình duyệt khác nhau có cách định nghĩa hoặc xử lý HTML một cách không hoàn toàn giống nhau, thậm chí là khác nhau. Do đó, để bảo đảm tính toàn thẻ của Web, các nhà tin học và các công ty sản xuất phần mềm liên quan đến việc khai thác Web đã họp lại với nhau và đã thành lập những nhóm làm việc có nhiệm vụ duyệt cú pháp chính thức mang tính toàn thể của ngôn ngữ HTML và đưa ra những tiêu chuẩn chính thức (gọi là HTML specifications) cần dựa vào khi muốn soạn một tài liệu dùng HTML hoặc khi muốn lập trình khai thác ngôn ngữ HTML. Đây ta cần phải nêu vai trò của IETF (Internet Engineering Task Force) trong việc định nghĩa HTML 2.0, là phiên bản HTML được tiêu chuẩn hoá đầu tiên, trong năm 1994 và của W3C (World Wide Web Consortium) đã xác định những đặc tính cú pháp của HTML 3.2 (tháng 05/1996) và của HTML 4.0 (tháng 12/1997). II. HTML và WEB BROWSER: Cuộc chiến tranh các vì sao Có lẽ các bạn biết, các phần mềm đang thống trị trình duyệt các trang web: Netscape Navigator cua Netscape Communications( kơ mju ni cei san) Corporation,Opera hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 5 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
Software ASA, Internet Explorer (IE) của Microsoft Corporation(ko pơ rei san) và Firefox của Mozilla. Netscape Navigator từng là một biểu tượng lẫy lừng hồi giữa thập niên 90, khi nó được hơn 90% dân số Internet sử dụng. Nhưng giờ đây, con số này đã giảm xuống còn vẻn vẹn... 0,6%. Netscape Navigator – trình duyệt đi tiên phong mở đầu cho trào lưu thế giới web thương mại – sẽ chính thức rút chân vào hậu trường kể từ ngày 1/2/2008 nhưng trên thực tế rất nhiều phiên bản khác nhau của ba trình duyệt này còn đang sử dụng Đối thủ khiến Netscape phải ngậm đắng nuốt cay, không ai khác, chính là Internet Explorer của Microsoft. Tuy là kẻ đến sau, nhưng IE đã nhanh chóng "chiếm đoạt" thị trường của Netscape và hiện nay, trình duyệt này đang kiểm soát khoảng 80% thị phần toàn cầu. Nhưng đối thủ của IE lại là FireFox đang từng bước chiếm cảm tình của cư dân mạng thay cho Internet Explorer cổ lỗ và nặng nề. Trong thế giới phương Tây, Mozilla “ăn đứt” thị phần của IE nhờ nguồn mở Firefox. Opera được bắt đầu phát triển vào năm 1994 trong một dự án nghiên cứu của Telenor, một công ty truyền thông lớn nhất Na Uy. Năm 1995 dự án trên tách ra thành lập một công ty độc lập với Telenor tên là Opera Software ASA Còn ở Việt Nam, tính thống trị của IE rất rõ bởi trên 90% người khai báo sử dụng IE để tra cứu thông tin trên Web. hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 6 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
Các trình duyệt Web phổ dụng đang được trang bị một bộ mặt mới và trở thành công cụ thực hiện các giao dịch trực tuyến và chạy các ứng dụng qua mạng hơn là chỉ đơn thuần hiển thị trang web. Vào ngày hôm nay (20/6), Opera Software ASA dự kiến sẽ công bố phiên bản trình duyệt Opera 9.0, trong khi trước đó (cuối năm 2005), Internet Explorer (IE) của Microsoft và Firefox đã có những nâng cấp quan trọng cho công cụ của mình. Những nâng cấp được đánh giá cao nhất là của Microsoft đối với IE (phiên bản IE 6.0) mà mỗi 5 năm hãng này mới tiến hành cải tiến lại một lần. Tuy nhiên, theo thời gian IE 6.0 cũng cho thấy sự già nua cần phải được thay thế trong lúc có nhiều sự trỗi dậy từ các trình duyệt đối thủ khác. Trong bối cảnh đó, Microsoft đã phải thẳng thắn nhìn nhận rằng IE 6.0 đang mất dần sức hấp dẫn và đành nhường thị phần cho Firefox. Chính vì vậy, với bản nâng cấp IE 7.0 mới, Microsoft hy vọng trình duyệt này sẽ vượt lên trên đối thủ nhờ được bổ sung nhiều tính hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 7 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
năng mới, trong đó có khả năng chống phishing, và mức độ bảo mật cao hơn. Ngày nay, e-mail, bản đồ, trình xử lý Word và nhiều ứng dụng độc lập truyền thống khác đang có xu hướng chuyển giao sang dạng sử dụng trực tuyến. Nhiều tập đoàn Internet quan trọng như Google, Yahoo và thậm chí cả Microsoft đang đầu tư nhiều nguồn lực để phát triển những ứng dụng Web loại này. Và tất nhiên, các nhà phát triển trình duyệt đều kỳ vọng chúng sẽ hoạt động một cách trơn tru để làm nền tảng cho các trình duyệt tạo ra. Với Opera 9, một trình duyệt nguồn mở, chạy độc lập, người dùng có thể tự viết các ứng dụng tích hợp cho riêng mình, chẳng hạn như dự báo thời tiết, kết quả các trận bóng đá, hoặc trạng thái giao dịch trên eBay... "Hầu hết các ứng dụng đầu cuối đang được phát triển hiện nay đều có ít nhất một chức năng chạy trên trình duyệt. Điều này khác hoàn toàn so với 10 hoặc 15 năm trước đây, khi trình duyệt chỉ đơn thuần là những trang thông cáo báo chí...", phát biểu của Christen Krogh, phó chủ tịch bộ phận thiết kế Opera. hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 8 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
Trong khi đó, phiên bản IE7 lần đầu tiên được tích hợp hộp tìm kiếm, cho phép người dùng có thể gõ trực tiếp các từ khoá truy vấn mà không phải truy nhập vào trang chủ tìm kiếm. Còn Firefox và Opera thì đã từ lâu đã có tính năng này. IE7 cũng sẽ cùng với các trình duyệt đối thủ khác hỗ trợ các tên miền không sử dụng ký tự tiếng Anh. Đồng thời, IE7 còn có tính năng duyệt thẻ "tab" - một tính năng rất quan trọng mà Opera và Firefox đã có từ cách đây rất lâu, và nhờ đó được đánh giá cao hơn IE. Phiên bản IE7 "thông thường", dự kiến sẽ kết thúc giai đoạn thử nghiệm vào nửa cuối năm nay để chuyển sang bản chính thức, sẽ khoá và cảnh báo những trang web "nguy hiểm". Thanh địa chỉ của những trang web kiểu này sẽ chuyển sang màu xanh khi một site thương mại điện tử đã trải qua các bước kiểm tra nghiêm ngặt về bảo mật cũng như các chứng nhận bảo mật số. Trong khi đó, phiên bản Firefox 2 (bản beta dự kiến vào mùa hè này và bản chính thức sẽ được công bố vào tháng 9 tới) sẽ được trang bị tính năng chống phishing, hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 9 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
cùng với các công cụ tự động phục hồi các trang web mà trình duyệt không thể hiện thị do bị lỗi. Mozilla cũng đã đôi lần nhắc tới kế hoạch công bố bản Firefox 3 trong năm tới. Phiên bản nâng cấp này sẽ cho phép người dùng chạy những ứng dụng trực tuyến ngay cả khi không có kết nối Internet. Về mức độ tương thích, IE7 yêu cầu các bản Windows mới nhất, ít nhất cũng phải là Windows XP SP2, trong khi Opera và Firefox chạy trên tất cả các bản Windows, và Linux. Về thị phần, theo thống kê của WebSideStory, trong vòng 2 năm trở lại đây, thị phần của IE đã tụt xuống 90% (từ 97%), trong khi Firefox tăng từ từ lên 9% (nhờ có sự đóng góp và cải tiến rất tích cực của Opera). Cũng theo WebSideStory, Firefox phải tiếp tục cải tiến hơn nữa nếu muốn giữ vững thị phần, bởi một lý do đơn giản là IE được tự động tích hợp vào các phiên bản Windows - người dùng sẽ chuyển sang sử dụng một trình duyệt khác chỉ khi cảm thấy không thoả mãn với IE. hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 10 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
Vậy mối liên quan đến việc học soạn HTML là như thế nào? Vấn đề ở đây là mỗi trình duyệt có cách hiểu và xử lý ngôn ngữ HTML riêng của nó và không hoàn toàn tuân theo những kiến nghị chính thức cho sự định nghĩa của HTML. Có nghĩa là mỗi trình duyệt nhận ra một số thẻ đánh dấu thuộc ngôn ngữ HTML một cách khác nhau và lại đưa ra những thẻ đánh dấu của riêng nó (tức là những thẻ đánh dấu không thuộc định nghĩa chính thức của HTML). Do đó, khi soạn một tài liệu HTML, phải chú ý đến ngữ pháp và không dùng những thẻ đánh dấu thuộc riêng một trình duyệt, nhất nếu nó không tuân theo định nghĩa chính thức cho phiên bản ngôn ngữ HTML đang hiện hành; đó là trừ khi ta có một lý do nào đó chỉ muốn công bố những trang web dành cho khách chỉ dùng IE hoặc cho khách chỉ dùng Netscape. Mà làm như vậy thì tự nhiên, ít hay nhiều, ta tự hạn chế số khách có tiềm năng tra cứu những trang của mình. Bạn có thể nghĩ rằng nếu 90% người Việt Nam sử dụng IE, thì cứ việc dùng ngôn ngữ HTML tương thích với chức năng của IE. Nhưng nếu như sau này tài liệu HTML của bạn lại được công bố trên Web, cho phép bất kỳ ai, nhờ Internet, truy cập vào trang của bạn thì bạn nghĩ như thế nào nếu như lúc đó những cách trang trí tài liệu của bạn lại trở thành vô dụng cho những người dùng một trình duyệt không có khả năng hiểu được những thẻ đánh dấu hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 11 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
riêng biệt mà bạn đã dùng? Thực tế làm như thế lại trái với tư tưởng ban đầu khi hình thành HTML và Web: cho phép mọi người tham khảo các tài liệu siêu văn bản với bất kỳ cấu hình máy điện toán (lạc hậu cũng như siêu hiện đại), với bất kỳ phần mềm trình duyệt web. Tuy nhiên, nhiều lúc chúng ta vẫn phải vi phạm quy luật trên, và phải dùng đến một số thuộc tính ngoài HTML chính thức, ví dụ để hiển lên các font tiếng Việt. Phải dùng Netscape Navigator 4.x và Internet Explorer 4.0 trở lên thì mới dùng được một yếu tố phần tử rất quan trọng đã được bổ sung vào HTML 4.0 mà chưa được hoàn chỉnh trong HTML 3.2 là những Style Sheets.Tuy nhiên các phần mềm trình duyệt chấp nhận các bản phóng mới nhất của HTML cũng phải chấp nhận những bản phóng cũ hơn để bảo đảm sự tương thích với những tài liệu HTML soạn theo những dạng HTML đã lạc hậu. Còn mức độ giữ được tương thích như thế nào? thì đây có lẽ nó còn phụ thuộc về các loại máy vi tính còn tồn tại trên Internet. Do đó, khi soạn tài liệu HTML, hãy có thói quen như sau (xếp theo thứ tự quan trọng nhất đi xuống): 1. Đặt những giá trị thuộc tính các yếu tố phần tử giữa dấu ngoặc kép. 2. Viết thẻ đánh dấu sự kết thúc yếu tố phần tử 3. Dùng chữ nhỏ để viết các thẻ đánh dấu Tuy nhiên bạn cũng có thể yên tâm là nếu tuân theo cú pháp soạn cơ cấu tài liệu và cách viết thẻ đánh dấu đúng theo tiêu chuẩn HTML 3.2 (hoặc HTML 4.0), việc biên hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 12 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
dịch tài liệu theo tiêu chuẩn XHTML trong tương lai sẽ không khó khi dùng các tiện ích biên dịch mà chắc chẵn sẽ có! A. Web có ba yếu tố: 1. Ngôn ngữ HTML, là ngôn ngữ được dùng để định nghĩa những yếu tố phần tử (element) hình thành một tài liệu theo tiêu chuẩn HTML. Để đánh dấu những yếu tố phần tử đó, ngôn ngữ HTML dùng những thẻ để đánh dấu sự bắt đầu và sự kết thúc của từng yếu tố phần tử một. 2. Phần mềm trình duyệt (web browser): là phần mềm khách biết đọc và hiểu ngôn ngữ HTML để hiển lên tài liệu ở dạng HTML trên màn hình máy vi tính khách. 3. Giao thức HTTP, là giao thức cho phép các máy tính khách (thông qua trình duyệt web) giao dịch với máy tính chủ phục vụ tài liệu web (web server) để chuyển tài liệu ở dạng HTML trên Internet. Nếu bạn soạn một tài liệu HTML, nó có thể được các trình duyệt Web xử lý và hiển lên màn hình vi tính một cách khác nhau. Nếu như giao thức HTTP khá ổn định, thì tất nhiên sự phát triển của ngôn ngữ HTML, việc định nghĩa những yếu tố phần tử mới, hoặc những thuộc tính (attributes) các yếu tố phần tử, đã chịu ảnh hưởng quan trọng của sự ra đời các thế hệ trình duyệt khác nhau. Đây là nguồn linh động thúc đẩy cho sự phát triển của hvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 13 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
ngôn ngữ HTML hiện đại và tương lai cũng như là nguồn gây thêm rắc rối trong việc soạn một tài liệu HTML theo đúng những tiêu chuẩn của nó vì lý do ba trình duyệt mà đang thống trị thị trường không thi hành đẩy đủ những tiêu chuẩn chính thức của HTML (các bản phóng khác nhau). B. Ngôn ngữ HTML liên tục phát triển Tiêu chuẩn hiện nay đến bản phóng 4.0 và W3C vừa công bố bản phác thảo HTML 5 ngày 23/01/2008. Tuy nhiên các trình duyệt web chấp nhận HTML 4.0 cũng chấp nhận HTML 3.2 và 2.0. Trong tương lai, tiêu chuẩn HTML sẽ chuyển sang một thế hệ ngôn ngữ đánh dấu siêu văn bản mới là XHTML, dựa vào một ngôn ngữ đánh dấu tài liệu mới là XML. Có lẽ các bạn đã học là mỗi tài liệu HTML đều phải có những thẻ đánh dấu như sau:
Trong tài liệu này có 4 yếu tố phần tử (element) là: Yếu tố phần tử HTML Yếu tố phần tử này cho biết đây là một tài liệu theo tiêu chuẩn HTML và nó được đánh dấu bởi thẻ đánh dấu (start tag) và thẻ kết thúc (endhvTH: Nguyễn Thị Hoa
Registration Number: 1.02.2
Page 14 of 32
REPORT ISAS
GVHD: Nguyễn Trọng Anh
tag) Yếu tố phần tử HTML chứa tất cả những yếu tố phần tử khác của tài liệu HTML Yếu tố phần tử HEAD Yếu tố này được đánh dấu bởi thẻ đánh dấu và thẻ kết thúc trong tài liệu trên yêu tố phần tử chứa một yêu tố phần tử khác là <TITLE> Yếu tố phần tử TITLE Yếu tố này chứa tên của tài liệu; nó được đánh dấu bởi hai cặp thẻ <TITLE> và Yếu tố phần tử BODY Yếu tố này chứa nội dung chính của tài liệu; nó được đánh dấu bởi 2 thẻ và . Yếu tố BODY chứa những yếu tố phần tử làm sườn cho cấu trúc lôgíc của tài liệu, như đoạn văn bản, bảng, vân vân. Cần phải phân biệt sự khác nhau giữa một yếu tố phần tử và thẻ đánh dấu của nó. Đối tượng của cú pháp HTML là cấu trúc của tài liệu. Cấu trúc của tài liệu được thể hiện bởi một sắp xếp lôgíc như trong bất kỳ một văn bản có phần đầu đề, mở đầu, nội dung chính, kết luận, tài liệu tham khảo, vân vân. Những bộ phận đó được HTML đặt tên là yếu tố phần tử (element). Do đó, những thẻ đánh dấu nhằm đánh dấu những yếu tố phần tử của tài liệu, tức là đoạn nào của tài liệu thuộc phần đầu đề, phần mở đầu, phần tham khảo, vân vân. Như bạn biết, mỗi yếu tố phần tử hvTH: Nguyễn Thị Hoa