XMLとは?IT初心者でもすぐわかるXML基礎知識 - XMLが電子カタログに適しているワケ

XML/XML DBのサイバーテック:XMLとは?IT初心者でもすぐわかるXML基礎知識 第9回

XMLは、文章の見た目や構造を記述するためのマークアップ言語の一種です。 主にデータのやりとりや管理を簡単にする目的で使われ、記述形式がわかりやすいという特徴があります。
Web技術で頻繁に登場する、HTMLをはじめ、SVG、XHTML、XSLT、RFTなども、 XML と同じマークアップ言語のひとつです。

XMLが電子カタログに適している理由を探るには、人間とコンピュータでは物事の捉え方が違うということを考えなくてはなりません。コンピュータにカタログの内容を理解させるためには、たとえばCSV形式のようにコンピュータにわかる形式でデータを記述する必要があります。しかしデータのみを羅列したのでは、今度は人間にとって理解できない内容になってしまいます。その点、XMLではタグ自体に意味を持たせることができるので、人間とコンピュータの双方が理解できます。そうなると電子カタログとして必要不可欠な検索や並べ替え、さらに異なるシステム間での電子カタログ交換も容易に行えるようになるのです。

▼目次

XMLが電子カタログに適しているワケ

世間ではXMLの良さがいろいろと喧伝されているものの、実際にXMLがどのような特徴を持ち、どのような利用方法があるのかと問われると、いまいちはっきりしたイメージが湧いてこないという方はまだまだ多いのではないでしょうか。XMLの応用分野としては、過去には企業間電子商取引や流通BMI、また本来のドキュメントフォーマットという観点では、データベース組版や電子カタログ、マニュアル(取扱説明書)などの用途や各種文書管理などがよく挙げられますが、今回は電子カタログへの適用を例にXMLの特徴を見ていくことにします。

人間とコンピュータでは物事の考え方が違う

XMLが電子カタログに適している理由――それを探るには、人間とコンピュータでは物事の捉え方が違うということを考えなくてはなりません。例として、ハードディスクのスペックを記したカタログを取り上げてみましょう。

まずは一般的なカタログ文書を見てみます。スペック表を見れば、太字で書かれている部分がそれぞれのハードディスクの製品名であり、その下にリスト形式で性能が記されていることは、たいていの人は一目で分かるでしょう。とくに記述がなくても、レイアウトやフォントの種類、サイズ、色などから、どの情報が何を指しているかはすぐに分かるのです。しかし、これはあくまで人間が見た場合の話。この文書をそのまま見せたところで、当たり前ですがコンピュータにはさっぱり理解できません。言うなれば、FAXのピ~ヒャララという音を聞いたところで、人間にはその内容がさっぱり理解できない(もちろんFAX機器には理解できる)のと同じことです。

人間とコンピュータでは物事の考え方が違う「一般的なカタログ文書」の場合

それでは次に、インターネットにおける標準的なドキュメント記述言語であるHTMLを用いて、先ほどのスペック表を記述してみましょう。現在ではデザイン的な要素も多分に含むものの、本来は文書構造を記すための言語であるHTMLを用いれば、ぱっと見た感じ、元の情報のままに電子カタログ(Webカタログ)化することができそうです。

人間とコンピュータでは物事の考え方が違う「HTMLソース」

人間がそのままソースを見た場合、H1やLIなど、あるいはテーブルを利用するとさらに不明な要素が多くはなりますが、だいたいの構造と意味は理解できます。ブラウザ等で表示すれば、元のカタログ文書とまったく同じように内容を把握できるでしょう。

一方でコンピュータにとっても、先ほどはまったく意味不明だったものが、HTMLで記述することできちんと読めるようになり、文書の構造も理解できるようになります。しかしながら、読めることと意味を理解できることには大きな隔たりがあります。コンピュータにとっては、「容量10GB」という内容に「ハードディスクの記憶容量が10GBあります」という意味は皆無で、あくまで「リストの一項目に『容量10GB』という文字が入っている」というだけのことなのです。したがって、「記憶容量が10GBのハードディスクを抽出して一覧表示せよ」という命令を出しても、コンピュータにはまったく理解できないことになります。

コンピュータにカタログの内容と同じ意味を理解させるためには、たとえばCSV形式のように、きちんとコンピュータにわかる形式でデータを記述する必要があります。しかしデータのみを羅列したのでは、今度は逆に人間にとって理解できない内容になってしまいます。

人間とコンピュータでは物事の考え方が違う「CSVデータ」の場合

人間とコンピュータの双方が理解できるXML。だから応用もカンタン

XMLの特徴のひとつとして、人間とコンピュータのどちらにも同じように理解可能な形式で記述できるという点が挙げられます。つまり、先ほど述べたような人間とコンピュータの間における認識の違いが生じないのです。 これは、XMLのタグ自体に意味を持たせることができることにあります。先ほどのスペック表をXMLで記述してみると、ハードディスクというレコードの中に型番や容量などの項目があり、それぞれがデータを保持している構造が人間から見ても一目で分かります。同様にコンピュータにとっても構造と意味が理解できるのです。

人間とコンピュータでは物事の考え方が違う「XMLデータ」の場合

意味が理解できるということは、電子カタログとして必要不可欠な検索や並べ替えなどが可能になるということでもあります。HTMLやCSVでは、たとえば「容量が8GBのディスク」といった検索は行えません。「8」という文字を含んでさえいれば、シークタイムだろうが型番だろうが構わずに検索してしまうのです。これに対してXMLならば、容量タグで囲まれたデータだけを検索対象とすることができるわけです。

そしてさらに、人間とコンピュータの双方に理解できる形式であるということは、データの交換や共有もカンタンに行えるということです。HTML文書を渡しても相手側のコンピュータには意味が理解できませんし、CSVデータも意味不明という点ではまったく同様。しかし、タグ自身が意味を持つXMLならば、異なるシステム間での電子カタログ交換も容易に行えるようになるのです。

共通のタグを決めておけば、カタログに対応したシステム開発も用意

もちろん、ここで説明したのはXMLのひとつの側面にすぎません。実際には、インターネットとの親和性の高さや将来性、システム側での対応のしやすさ、サービスイン後のシステム改修費用や改修期間の短縮など、XMLの採用にはさまざまな要因が絡んできます。しかし、技術面もさることながら、人間とコンピュータの双方に理解しやすい形式を取っているという点が、XMLの普及を強く後押ししていることは間違いないと言えるでしょう。

御相談、ご質問はこちら

サービスご案内資料や、特別資料「マニュアル作成の効率化とコストダウンを実現するポイントとは? 」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2003 CyberTech corporation ltd. All Rights Reserved.