作者:林月霞
寫作日期:2000/09/27
以前曾經簡單介紹過,WWW網頁的檔案格式是HTML,副檔名是.html。
HTML是HyterText Markup Language(超文件標示語言)的縮寫,聽起來似乎既複雜又拗口,其實沒有想像中那麼複雜。HTML是一種類似「文書處理」、「文字書寫編輯」的檔案,如同Word(打字機)的.doc檔案一般,是用來寫文章、編寫文字資料,撰寫文稿、文件、文書、文案等等的檔案格式。
一般常見的文字文書處理程式像是:
後兩者一般認為是用來「製作」網頁的程式,其實製作網頁和進行文書處理根本是同一件事情,只是檔案格式有.doc、.html的差別而已。
既然有像是Word這樣的文書處理程式以及.doc檔案格式,為什麼還需要HTML這種檔案格式呢?主要是資料交換的困難。我們應該都有這樣的經驗,常聽到有人這麼抱怨:
「辛辛苦苦在自己的電腦上用Word的97版打好的一篇文章,準備到另外一個地方交稿,結果用磁片或用網路拿到別人的電腦,同樣是打開Word,卻打不開自己辛苦打好的文章的.doc檔案,令人氣結,原來只是因為對方是Word程式95版。」
同一種程式版本不同檔案格式都不相容了,更不用說:同一個作業系統不同的文書處理程式彼此的檔案格式不相容,如Windows作業系統的Word程式和WordPerfect(完美的打字機,另外一種文書處理程式)的檔案不相容。不同的作業系統的文書處理程式檔案更不相容,如Windows作業系統的Word和Mac OS(麥金塔)作業系統的文書處理程式AppleWorks(蘋果辦公室,麥金塔作業系統下常用的文書處理程式),和Unix作業系統的WordPerfect…,沒有哪兩個檔案格式是相容的。
這樣,大家的電腦文件、文書資料要如何交換呢?為什麼有了電腦,有了網路,反而讓大家更不方便,一天到晚為檔案格式不相容的狀況所苦氣得半死?
所以HTML檔案格式、WWW發展的目的其實就是要制定一個全世界通用、共通的文件、文書檔案格式,這種檔案格式和應用程式的種類無關、和作業系統的廠牌無關、和任何電腦公司都無關,讓資料、資訊的交換、傳播更容易。在Windows作業系統裡寫好的HTML文章,在全世界任何一個地方的Windows作業系統、麥金塔作業系統、Unix作業系統,其他任何作業系統底下都可以打得開,而且資料、內容、格式都正確無誤。這就是HTML的目的。
那既然只是為了發展一個通用全世界的文書檔案格式,為什麼不從現成、還算好用的檔案格式來發展,如利用Word的DOC格式來發展呢?主要是因為這樣:
所以類似DOC這樣的私有檔案格式,有多少可能成為通行全球的檔案格式,是非常令人懷疑的。主要是因為大小公司為了商業利益,多少會有點私心,在你我的私心底下,大小公司的文書處理檔案到後來就變得通通不相容了。私心使得電腦難用,私心使得資料的交換、傳播變得困難。
HTML為了避免私心誤事,一開始發展的時候就訴諸公共版權,是完全免費、共享、一切技術細節公開的公共檔案格式。HTML檔案格式是公開、公共的,在實際的使用時反映在幾個面向:
HTML編輯程式即網頁編輯程式。前面曾經提到,因為HTML是公共檔案格式,任何人都可以為HTML檔案格式開發編輯程式,所以大大小小的HTML編輯程式非常的多,有商業的也有共享軟體的,有些瀏覽器也有網頁編輯的功能。
比較常見而且不錯的商業HTML、網頁編輯程式像是:
有很多HTML、網頁編輯程式除了提供網頁編輯的功能外,還附帶整個網站管理的功能。由於網站有可能由數個人共同完成,有些網頁編輯程式的網站管理功能還能容許數個人共同編輯、管理同一個網站的網頁檔案資料。
其實HTML、網頁編輯程式的好壞不是在於提供酷炫功能的多寡,而是在於是否能產生「乾淨的」、「嚴謹的」HTML原始碼。乾淨的原始碼是指HTML原始碼並不會「虛胖」,不該亂加設定、參數的地方不會亂加;嚴謹的原始碼是指HTML語法都依照HTML的公定標準來產生,不會亂用一套自己開發的HTML規格。
由於HTML原始碼隱藏在網頁的背後,一般人其實不知道原始碼其實是很「虛胖」的,是網頁的檔案資料的一部份,也會增加檔案的大小(File Size),只是一般在網頁中看不出來而已。由於偷懶、不認真、不專業等等因素,有不少的HTML、網頁編輯程式存檔時所產生的HTML原始碼非常的虛胖,有時候甚至會比網頁真正的內容還大得多。譬如有個網頁的檔案大小如果是100KB,原始碼可能就佔了80KB,實際的網頁內容只有20KB,這就是虛胖。你也可以試試另外一種很明顯的原始碼虛胖的例子,就是在Word裡面開一個全新的檔案,不要鍵入內容,然後存檔。結果空白的檔案大小竟然有20KB左右!而不是0KB。這20KB都是肥胖的DOC檔案格式原始碼。
網頁為什麼不能虛胖呢?因為越大的檔案在網路上傳得越久。你能想像等了好久,終於傳了一個檔案很大的網頁回來,結果內容只有一點點----竟然花了百分之80的時間在傳那原本可以很瘦的HTML原始碼,這種網頁傳回來只會令人氣結。
另外目前很多文書處理程式或是美編排版程式,可以很方便將各自專屬的檔案格式轉存成HTML檔案格式,如在Word中,就可以很容易的將DOC檔案轉存成HTML檔案。不過這類的轉存功能通常遇到的也是虛胖的HTML原始碼,有一個原因是不同的檔案格式其實要轉換並沒有那麼容易,用粗糙的方法轉換通常的結果就是虛胖的HTML原始碼。
在WWW中,我們除了看見檔案格式為HTML的網頁外,常常看到各類圖形、聲音、音樂、電影等類別的檔案格式。除了HTML為文件、文書類的公共的檔案格式外,WWW中影、音類的公共檔案格式如下:
| 格式 | 說明 | 副檔名 |
| GIF | 圖形壓縮檔案格式,專門用來壓縮圖案類的點矩陣影像,顏色最多只有256色。此格式亦可製作簡單的動畫形式。 | .gif |
| JPG, JPEG | 影像、圖形壓縮檔案格式,專門用來壓縮相片、繪畫、人物風景寫生等比較寫實的點矩陣影像。 | .jpg或是.jpeg |
| PNG | 新發展出的影像、圖形壓縮格式,類似JPG,但壓縮的方法比較進步。 | .png |
| MP3 | 聲音、音樂檔案壓縮格式,可以在幾乎不影響原來「CD音質」的情況下,將數位音樂檔案的資料量壓縮成只有十分之一的大小。 | .mp3 |
| MPG, MPEG |
電影、影片檔案壓縮格式,就是我們一般常見的VCD裡面電影檔案的格式。 | .mpg或是.mpeg |
青草湖社區大學出版
電話:03-5627570
傳真:03-5610968
地址:300新竹市南大路569號(育賢國中內)
網址:http://www.bamboo.hc.edu.tw/
E-mail:lake@mail.bamboo.hc.edu.tw