5.4 WWWの仕組み

World Wide Webとは,インターネットを利用した広域情報交換システムです.略して WWW とかWebなどと言います.

World Wide Webシステムは,1989年にCERN(ヨーロッパ原子核研究所)のTim Berners-Leeらによって,研究者の間での効率的な情報共有を目指して開発されたものです.その後1993年に米国のNCSA(National Center for Super-computing Applications)で,情報を取り寄せるためのソフトとして Mosaic というブラウザが開発されると一気に普及しました.以後,ブラウザはNCSA Mosaicの開発メンバーらが起こしたNetscape Communications社が開発している ``Netscape Navigator'' など様々なものが普及しています.

WWWの基本構造を成しているのがハイパーテキスト(hyper text)と呼ばれる仕組みです.ハイパーテキストは単なる文章の羅列ではなく,文書中の任意の文字列から,リンク(link)によって他の場所にある情報を次々と結びつけることができるテキストです.

ハイパーテキストでは下線付きの青色の文字で表示されている部分をクリックすることで, 関連のある別のWebページを見ることができます.この青色の部分がリンクです.一度見たことのあるページへのリンクは,文字が青から紫に変わります.ただし,これらの色はWebページによっては別の色で表示されることがあります.

公開されている情報のひとまとまりをページ(page)といいます.ホームページという言葉もよく聞きますが,これは,ユーザのファイルがホームディレクトリの下にあるのと同じく,個人や組織が所有しているページの起点となるページを意味する場合と,その人が所有するページ全体を意味する場合があります.もっと一般にWWWを使って公開されている情報全般を指す場合には,WebページあるいはWebコンテンツと言う方が良いでしょう.

WWWでは誰もが情報を公開することができると同時に,世界中で公開されている,あらゆる種類の情報にアクセスすることができます.

WWWでの情報のやり取り

WWWでの情報のやり取りを,情報を公開する側(人)とそれを取り寄せる側(人)に分けて考えて見ましょう.

情報を公開する側とは,情報を保管しネットワークに公開するというサービスを提供しているウェブサーバ (web server)にあたります.WWWで情報を公開する人はウェブサーバにデータを置きます.

一方情報を取り寄せる側すなわちクライアント側が使うのが,皆さんが毎週使っている Mozilla のようなウェブブラウザ(web browser)です.ウェブブラウザは,情報の置き場所,すなわちURL (Uniform Resource Locator)を指定すると,そこから情報を取り寄せ,見やすい形に整形して表示してくれます.

URLを指定するとブラウザはウェブサーバに対して指定したURLの情報の送信を要求します.ウェブサーバはクライアント(ブラウザ)の要求に応じて情報を送信し,それをブラウザが受け取り表示します.

情報を取得する際の通信規約として一般には http(HyperText Transfer Protocol)というプロトコルを使用します.

● 練習問題

WWWの仕組みを第1週の1.5 電子メールの仕組みと比較し,次の表の空欄を埋めてみましょう.

サービスサーバクライアントプロトコル
電子メール     SMTP,POP,IMAP
WWW      

URL

WWW上に存在する情報の場所は全てURLによって指定されます.URL は次の3つの部分から成り立っています.

3つ目のサーバ内での情報の位置を表すのには第3週の3.3 ファイルパスと同じパスの概念が用いられており,ディレクトリ構造によって情報を階層化していくことが可能です.

例えば,SFC のホームページの URL は http://www.sfc.keio.ac.jp/ です. 最初の http が情報を取得する際に使うプロトコル名,次に www.sfc.keio.ac.jpが情報を提供するウェブサーバが動いているホスト名です.SFC の他のページの URL には,この後にウェブサーバ内でのファイルの位置を表すパス名が続きます.

つまりhttp://www.sfc.keio.ac.jp/sfc/index.html学部生へのお知らせのページの場合,

http://www.sfc.keio.ac.jp/sfc/index.html
プロトコルWebサーバのホスト名サーバ内のファイルの位置

ということになります.