XMLとは、 Extensible Markup Languageの略称です。日本語に直訳すれば、拡張可能なマークアップ言語となります。では、ここで言う「マークアップ言語」とは一体どのような言語なのでしょうか。XMLを理解するためには、まずマークアップ言語というものがどのようなものであるかということを理解する必要があります。そこで、ここでは皆さんが最も慣れ親しんでいる(であろう)HTML(Hyper Text Markup Laguage、これもマークアップ言語です)を例に、マークアップ言語について説明します。
HTMLとは、皆さんがWEBページを記述するためのマークアップ言語です。HTMLはemacsやメモ帳などのテキストエディタがあれば、誰でも記述することができます(これは、XMLについても同様です)。さて、私たちが実際に普段閲覧するWEBページは、テキストファイルのように単に文字が一様に並んだものではなく、文字のフォントや色が様々であったり、リンクが貼られていたりします。これは、そのWEBページを記述しているHTML文書において、「ここからここまでの文字を大きく」とか「ここからここまでの文字列を赤に」というようなマーク(印)が付けられていることによります。このようなマークをつけること、またはそのマークを、マークアップ(markup)といいます。WEBページを表示させるためのソフトウェアであるブラウザ(Internet ExploreやNetscapeなど)は、単にHTMLファイルに記述されている文字列を読み込むだけではなく、どのようなマークアップがなされているか(より厳密には、マークアップによってどのような情報が付加されているのか)ということを解釈し、それに応じたWEBページの表示を行ってくれるわけです。そして、HTMLのように、マークアップによってただのテキストデータに情報を付加するような言語を、マークアップ言語と呼びます。
HTML(やXML)では、タグと呼ばれる表現によってマークアップを実現しています。次のようなHTML文書があるとします。
〜以下略〜