W3C | Tõlked

Originaal: XML in 10 points (http://www.w3.org/XML/1999/XML-in-10-points.html.en). See dokument on tõlge ja võib sisaldada vigu. Originaalne inglise keelne dokument W3C saidi peal on ametlik. Raivo Ratsep

XML lühitutvustus kümnes punktis

XML, XLink, Namespace, DTD, Schema, CSS, XHTML ... Kui XML on teie jaoks uus, võib see alguses tunduda keeruline. Käesolev lühitutvustus esitab kümnes punktis piisava kokkuvõtte XML põhijoontest, võimaldamaks algajal sellest tervikpilti saada. Kui peate kunagi XML’ist presentatsiooni tegema, siis miks mitte alustadagi nende kümne punktiga?

1. XML on andmete struktureerimiseks

Struktureeritud andmete hulka kuuluvad arvutustabelid, aadressiraamatud, tehniliste andmete tabelid, pangaülekannete väljavõtted ja tehnilised joonised. XML on hulk reegleid (neist võib mõelda ka kui juhistest või tavadest), mis võimaldavad luua tekstiformaate andmete struktureerimiseks. XML pole programmeerimiskeel ning selle kasutamiseks või äraõppimiseks ei pea te olema programmeerija. XML abil saab arvuti lihtsalt andmeid luua ja lugeda ning garanteerib, et andmete struktuur pole juhuslik. XML’il ei ole tüüpilisi programmeerimiskeelte puuduseid: see on laiendatav, platvormist sõltumatu ning toetab rahvusvahelikustamist ja lokaliseerimist. XML on täielikult Unicode-ühilduv.

2. XML sarnaneb mõnevõrra HTML'le

Nagu HTML, kasutab ka XML märgendeid (sõnu, mis on '<' ja '>' sulgude vahel) ning atribuute (vormis nimi="väärtus"). HTML määrab ära, mida iga märgend ja atribuut tähendavad, ning tihti ka selle, kuidas nende vaheline tekst brauseriaknas välja näeb. XML seevastu kasutab märgendeid ainult selleks, et eraldada andmeüksusi ning jätab andmete tõlgendamise täielikult rakendusele, mis neid loeb. Teisisõnu, kui näete XML failis "<p>", siis ärge arvake, et see on paragrahv. Sõltuvalt kontekstist võib see olla pinnaühik, parameeter, pähklipuu, p... (ja kes ütleb, et see peaks olema p-tähega algav sõna?)

3. XML on tekst, kuid see pole mõeldud lugemiseks

Arvutustabeleid, aadressiraamatuid ning teisi struktureeritud andmeid loovad programmid salvestavad need andmed tavaliselt kettale kas binaarses- või tekstiformaadis. Üheks tekstiformaadi eeliseks on see, et vajadusel saavad inimesed andmeid vaadata ilma seda loonud programmita, ja soovi korral ka oma lemmik-tekstitöötlusprogrammiga. Tekstiformaat võimaldab arendusmeeskonnal ka paremini rakenduste vigu parandada (ingl. kl debug). Nagu HTML on ka XML puhul tegemist tekstifailidega, mis pole mõeldud inimeste poolt lugemiseks, kuid mida vajadusel saavad lugeda ka inimesed. Võrreldes HTML’iga võimaldavad XML failireeglid vähem variatsioone. Unustatud märgend või ilma jutumärkideta atribuut muudab XML faili kasutamatuks (HTML’is on sellised vead tihti teadlikult lubatud ). Ametlik XML spetsifikatsioon keelab rakendustel vigase XML faili koostanud tarkvara “ära arvamist” – kui fail on vigane, peab programm tegevuse lõpetama ning esitama veateate.

4. XML on loodud tekstiküllaseks

Kuna XML on tekstiformaadis ning kasutab andmete eraldamiseks märgendeid, on XML failid pea alati suuremad kui võrdväärsed binaarformaadis failid. See on XML’i loojate teadlik valik. Tekstiformaadi eelised on selged (vt punkt 3) ning puudused on kompenseeritavad teisel tasandil. Kettaruumi hind on võrreldes minevikuga oluliselt alanenud, ning pakkimisprogrammid nagu zip ja gzip suudavad faile väga kiiresti ja hästi kokku pakkida. Lisaks suudavad kommunikatsiooniprotokollid nagu näiteks modemiprotokoll ja HTTP/1.1 (veebi tuumprotokoll) andmeid kokku pakkida käigu pealt, säästes ribalaiust sama efektiivselt nagu binaarformaadi puhul.

5. XML on terve tehnoloogiate perekond

XML 1.0 on spetsifikatsioon, mis määrab ära “märgendid” ja “atribuudid”. Ülejäänud spetsifikatsioonid moodustavad “XML perekonna”, mis on sisuliselt kasvav hulk kasulikke mooduleid tähtsate ja sagedasti esiletulevate ülesannete täitmiseks. XLink kirjeldab standardviisi XML failile hüperlinkide lisamiseks. XPointer on arendamisel olev süntaks, mis võimaldab viidata XML dokumendi erinevatele osadele. XPointer sarnaneb URL’ile, kuid veebis olevatele dokumentidele viitamise asemel viitab see andmejuppidele XML failis. Stiililehtede puhul kasutatav keel CSS ühildub nii XML’i kui HTML’iga. XSL on täiustatud keel stiililehtede koostamiseks. See põhineb XSLT’l, mis on märgendite ja atribuutide reorganiseerimise, lisamise ja kustutamise transformatsiooni keel. DOM on standardne hulk funktsioonikutseid XML (and HTML) failide manipuleerimiseks programmeerimiskeelest. XML Schemas 1 ja 2 aitavad tarkvara-arendajatel täpselt defineerida oma XML’il põhinevate formaatide (andme)struktuure. Lisaks nimetatutele on saadaval või loomisel mitmeid teisi mooduleid ja tööriistu. Hoidke silm peal W3C tehniliste aruannete lehel.

6. XML on uus, aga mitte täiesti uus

XML väljatöötamine algas 1996 a. ning see on olnud W3C soovituslik standard alates 1998 a. veebruarist. See võib jätta mulje, et tegu on ebaküpse tehnoloogiaga. Tegelikult pole XML aga sugugi nii uus – sellele eelnes 80ndate alguses välja töötatud SGML (ISO standard alates 1986 a. ning laialdaselt kasutusel suurtes dokumentatsiooniprojektides). HTML’i väljatöötamine algas 1990 aastal. XML’i loojad võtsid lihtsalt parimad osast SGML’ist (ning juhindudes kogemustest HMTL’iga) ning tulemus ei jää võimsuselt kuidagi alla SGML’ile, olles samas oluliselt lihtsamini kasutatav. Mõningaid evolutsioone on aga raske revolutsioonidest eristada... Väärib märkimist, et kui SGML’i kasutatakse eelkõige tehnilises dokumentatsioonis (ja vähem teist tüüpi andmete töötlemisel), siis XML’i puhul on olukord täpselt vastupidine.

7. XML viib HTML’i XHTML’ini

On olemas oluline XML rakendus, mis on dokumendiformaat: W3C XHTML, HTML’i järglane. XHTML sisaldab palju samu elemente mis HTML. Süntaks on mõnevõrra muudetud, et see ühilduks XML reeglitega. “XML-põhine” formaat pärib XML’i süntaksi ning piirab seda teatud viisidel (näiteks XHTML võimaldab märgendit "<p>", kuid mitte "<r>"). Samuti lisab see süntaksile tähenduse (XHTML järgi tähistab "<p>" “paragrahvi”, ja mitte “parameetrit”, “pähklipuud” või midagi muud).

8. XML on modulaarne

XML võimaldab luua uut dokumendiformaati kasutades ja kombineerides teisi formaate. Kuna kaks üksteisest sõltumatult välja töötatud formaati võivad sisaldada samade nimedega elemente või atribuute, tuleb nende kombineerimisel olla hoolikas (Kas "<p>" tähendab esimese formaadi “paragrahvi” või teise formaadi “pähklipuud”?). Nimedest tekkiva segaduse ärahoidmiseks on XML puhul kasutusel nimeruumi mehhanism. XSL ja RDF on head näited XML’il põhinevatest formaatidest, mis kasutavad nimeruumi. XML Schema on loodud peegeldama seda modulaarsuse tuge XML dokumendi struktuuride defineerimise tasemel, hõlbustades kahe skeemi kombineerimist, et luua kolmas, mis katab ühend-dokumendi struktuuri.

9. XML võimaldab RDF’i ja semantilist veebi

W3C Ressursikirjeldusraamistik (RDF) on XML tekstiformaat mis toetab ressursikirjeldusi ja metadata rakendusi, nagu muusika playliste, fotokollektsioone ja bibliograafiaid. Näiteks RDF võimaldab teil tuvastada inimesi veebis olevast fotoalbumist, kasutades selleks teie personaalses kontaktide listis olevat informatsiooni, nii et teie meiliklient saaks automaatselt alustada sõnumi kirjutamist neile inimestele, teatades, et nende fotod on veebis üleval. Samamoodi nagu HTML integreeris dokumendid, pildid, menüüsüsteemid ja ankeetide või vormide rakendused (forms applications) tehes võimalikuks esialgse veebi, pakub RDF tööriistu, mis võimaldavad integreerida veelgi enam, muutes veebi üha rohkem semantiliseks veebiks. Nagu suhtlevatel inimestel on vaja nõustuda sõnade tähenduses, vajavad arvutid efektiivses suhtlemiseks mehhanisme, mis võimaldaks neil nõustuda terminite tähenduses. Formaalseid kirjeldusi mingis vallas (näiteks kaubanduses või tootmises) nimetatakse ontoloogiateks ning need on vajalik osa semantilisest veebist. Semantilise veebiaktiivsuse teemasse kuuluvad RDF, ontoloogiad ja tähenduse representeerimine, et arvutid saaksid aidata inimestel tööd teha.

10. XML on litsentsivaba, platvormist sõltumatu ja hästi toetatud

Valides projekti aluseks XML’i, saate enda käsutusse suure ning üha kasvava hulga tööriistu (millest mõned võivad juba teha täpselt seda, mida te vajate!) ning astute ühendusse selles tehnoloogias kogenud tarkvara-arendajatega. Valida XML on nagu SQL valimine andmebaaside jaoks: te peate küll ehitama oma andmebaasi ja oma programmid ja protseduurid mis seda muudavad, kuid saadaval on suur hulk tööriistu ning palju inimesi, kes teid aidata oskavad. Kuna XML on litsentsivaba, võite oma tarkvara luua selle baasilt, ilma et te peaksite kellelegi midagi maksma. Suur ning üha kasvav tugi tähendab ka seda, et te pole seotud ühegi konkreetse tootjaga. XML pole alati parim lahendus, kuid selle kasutamine on alati väärt kaalumist.


W3C Communications Team, w3t-comm@w3.org
Revised 13 Nov. 2001 (last update: $Date: 2003/06/02 19:08:30 $)
Created 27 Mar 1999 by Bert Bos
(Eelmine versioon)
php mysql st. louis