HTML檔案格式與其他檔案格式
作者:林月霞
寫作日期:2000/09/27
第一章、HTML檔案格式
以前曾經簡單介紹過,WWW網頁的檔案格式是HTML,副檔名是.html。
第1節、HTML也是一種「文書處理」的檔案格式
HTML是HyterText Markup Language(超文件標示語言)的縮寫,聽起來似乎既複雜又拗口,其實沒有想像中那麼複雜。HTML是一種類似「文書處理」、「文字書寫編輯」的檔案,如同Word(打字機)的.doc檔案一般,是用來寫文章、編寫文字資料,撰寫文稿、文件、文書、文案等等的檔案格式。
一般常見的文字文書處理程式像是:
Microsoft Word
Word Perfect
FrontPage
Dreamweaver
後兩者一般認為是用來「製作」網頁的程式,其實製作網頁和進行文書處理根本是同一件事情,只是檔案格式有.doc、.html的差別而已。
第2節、HTML是通用全球的檔案格式
既然有像是Word這樣的文書處理程式以及.doc檔案格式,為什麼還需要HTML這種檔案格式呢?主要是資料交換的困難。我們應該都有這樣的經驗,常聽到有人這麼抱怨:
「辛辛苦苦在自己的電腦上用Word的97版打好的一篇文章,準備到另外一個地方交稿,結果用磁片或用網路拿到別人的電腦,同樣是打開Word,卻打不開自己辛苦打好的文章的.doc檔案,令人氣結,原來只是因為對方是Word程式95版。」
同一種程式版本不同檔案格式都不相容了,更不用說:同一個作業系統不同的文書處理程式彼此的檔案格式不相容,如Windows作業系統的Word程式和WordPerfect(完美的打字機,另外一種文書處理程式)的檔案不相容。不同的作業系統的文書處理程式檔案更不相容,如Windows作業系統的Word和Mac OS(麥金塔)作業系統的文書處理程式AppleWorks(蘋果辦公室,麥金塔作業系統下常用的文書處理程式),和Unix作業系統的WordPerfect…,沒有哪兩個檔案格式是相容的。
這樣,大家的電腦文件、文書資料要如何交換呢?為什麼有了電腦,有了網路,反而讓大家更不方便,一天到晚為檔案格式不相容的狀況所苦氣得半死?
所以HTML檔案格式、WWW發展的目的其實就是要制定一個全世界通用、共通的文件、文書檔案格式,這種檔案格式和應用程式的種類無關、和作業系統的廠牌無關、和任何電腦公司都無關,讓資料、資訊的交換、傳播更容易。在Windows作業系統裡寫好的HTML文章,在全世界任何一個地方的Windows作業系統、麥金塔作業系統、Unix作業系統,其他任何作業系統底下都可以打得開,而且資料、內容、格式都正確無誤。這就是HTML的目的。
第3節、HTML是公共的檔案格式,屬於公共版權
那既然只是為了發展一個通用全世界的文書檔案格式,為什麼不從現成、還算好用的檔案格式來發展,如利用Word的DOC格式來發展呢?主要是因為這樣:
DOC檔案格式是Microsoft(微軟)公司的私有財產、私有版權----Microsoft當然是非常希望自己發展的檔案格式變成全球通用的檔案格式啦!不過Microsoft想的可能不是讓全世界免費共享DOC檔案格式,而是如何讓DOC格式通行全球後使得Word程式賣得更好。其他的公司、團體、個人當然是不能為DOC檔案格式發展另外幾套文書處理程式來和Word競爭的,因為DOC檔案格式是私有財產、私有版權。除此之外,DOC格式有很多技術細節是不公開的。如果需要技術細節的,除了需要付高昂的權利金,還會被綁手綁腳,哪些東西不能自由去發展云云。
更有趣的是,Microsoft可能是希望當新版的Word程式發表時,大家能趕緊丟掉手邊一兩年前才剛買的「舊版」的Word,多多花大錢買新版的Word,以致於新版的DOC檔案常常弄得舊版的Word打不開----不同版本的DOC檔案格式自己都不相容。就技術層面而言,要舊版的程式能打開新版的檔案,其實一點也不難的,像Photoshop(照片店)程式就是一個很好的榜樣。
所以類似DOC這樣的私有檔案格式,有多少可能成為通行全球的檔案格式,是非常令人懷疑的。主要是因為大小公司為了商業利益,多少會有點私心,在你我的私心底下,大小公司的文書處理檔案到後來就變得通通不相容了。私心使得電腦難用,私心使得資料的交換、傳播變得困難。
HTML為了避免私心誤事,一開始發展的時候就訴諸公共版權,是完全免費、共享、一切技術細節公開的公共檔案格式。HTML檔案格式是公開、公共的,在實際的使用時反映在幾個面向:
HTML編輯程式可自由開發。
編輯網頁時可編修HTML原始碼。
網頁出版時HTML原始碼也是公開的。
HTML原始碼資源共享。
第二章、HTML編輯程式
HTML編輯程式即網頁編輯程式。前面曾經提到,因為HTML是公共檔案格式,任何人都可以為HTML檔案格式開發編輯程式,所以大大小小的HTML編輯程式非常的多,有商業的也有共享軟體的,有些瀏覽器也有網頁編輯的功能。
比較常見而且不錯的商業HTML、網頁編輯程式像是:
FrontPage(招牌網):Microsoft(微軟)公司出品,FrontPage本來不是Microsoft的產品,是Microsoft買斷別家公司的產品成為自己的。
Dreamweaver(夢幻編織):Macromedia(巨大媒體)公司出品。
有很多HTML、網頁編輯程式除了提供網頁編輯的功能外,還附帶整個網站管理的功能。由於網站有可能由數個人共同完成,有些網頁編輯程式的網站管理功能還能容許數個人共同編輯、管理同一個網站的網頁檔案資料。
其實HTML、網頁編輯程式的好壞不是在於提供酷炫功能的多寡,而是在於是否能產生「乾淨的」、「嚴謹的」HTML原始碼。乾淨的原始碼是指HTML原始碼並不會「虛胖」,不該亂加設定、參數的地方不會亂加;嚴謹的原始碼是指HTML語法都依照HTML的公定標準來產生,不會亂用一套自己開發的HTML規格。
由於HTML原始碼隱藏在網頁的背後,一般人其實不知道原始碼其實是很「虛胖」的,是網頁的檔案資料的一部份,也會增加檔案的大小(File Size),只是一般在網頁中看不出來而已。由於偷懶、不認真、不專業等等因素,有不少的HTML、網頁編輯程式存檔時所產生的HTML原始碼非常的虛胖,有時候甚至會比網頁真正的內容還大得多。譬如有個網頁的檔案大小如果是100KB,原始碼可能就佔了80KB,實際的網頁內容只有20KB,這就是虛胖。你也可以試試另外一種很明顯的原始碼虛胖的例子,就是在Word裡面開一個全新的檔案,不要鍵入內容,然後存檔。結果空白的檔案大小竟然有20KB左右!而不是0KB。這20KB都是肥胖的DOC檔案格式原始碼。
網頁為什麼不能虛胖呢?因為越大的檔案在網路上傳得越久。你能想像等了好久,終於傳了一個檔案很大的網頁回來,結果內容只有一點點----竟然花了百分之80的時間在傳那原本可以很瘦的HTML原始碼,這種網頁傳回來只會令人氣結。
另外目前很多文書處理程式或是美編排版程式,可以很方便將各自專屬的檔案格式轉存成HTML檔案格式,如在Word中,就可以很容易的將DOC檔案轉存成HTML檔案。不過這類的轉存功能通常遇到的也是虛胖的HTML原始碼,有一個原因是不同的檔案格式其實要轉換並沒有那麼容易,用粗糙的方法轉換通常的結果就是虛胖的HTML原始碼。
第三章、WWW中的其他檔案格式
在WWW中,我們除了看見檔案格式為HTML的網頁外,常常看到各類圖形、聲音、音樂、電影等類別的檔案格式。除了HTML為文件、文書類的公共的檔案格式外,WWW中影、音類的公共檔案格式如下:
| 格式 | 說明 | 副檔名 |
| GIF | 圖形壓縮檔案格式,專門用來壓縮圖案類的點矩陣影像,顏色最多只有256色。此格式亦可製作簡單的動畫形式。 | .gif |
| JPG, JPEG | 影像、圖形壓縮檔案格式,專門用來壓縮相片、繪畫、人物風景寫生等比較寫實的點矩陣影像。 | .jpg或是.jpeg |
| PNG | 新發展出的影像、圖形壓縮格式,類似JPG,但壓縮的方法比較進步。 | .png |
| MP3 | 聲音、音樂檔案壓縮格式,可以在幾乎不影響原來「CD音質」的情況下,將數位音樂檔案的資料量壓縮成只有十分之一的大小。 | .mp3 |
| MPG, MPEG |
電影、影片檔案壓縮格式,就是我們一般常見的VCD裡面電影檔案的格式。 | .mpg或是.mpeg |
青草湖社區大學出版
電話:03-5627570
傳真:03-5610968
地址:300新竹市南大路569號(育賢國中內)
網址:http://www.bamboo.hc.edu.tw/
E-mail:lake@mail.bamboo.hc.edu.tw