World Wide Web

Jari Multisilta
Tampereen teknillinen korkeakoulu
Matematiikan laitos, hypermedialaboratorio
PL 692, 33101 Tampere
Email: Jari.Multisilta@cc.tut.fi, URL: http://matwww.ee.tut.fi

1. Johdanto

World Wide Web on Internetissä toimiva maailmanlaajuinen hypermediadokumenttien verkosto, jossa yhdistyy hyperteksti, multimedia ja tietoverkot. Alunperin WWW kehitettiin CERN:issä fyysikoille, joiden tutkimusraportit ja projektien dokumentit olivat useissa eri laiteympäristöissä ja useilla eri ohjelmistoilla tehty. Kehitystyö on siirtynyt WWW konsortiumille, jonka tehtävänä on tuottaa standardeja ja referenssiohjelmistoja koko WWW käyttäjäkunnalle. WWW konsortium toimii MIT:n tietojenkäsittelyopin laboratorion ja The French National Institute for Research in Computer Science and Control -instituutin alaisena, ja sen johdossa on WWW:n kehittäjä Tim Berners-Lee.

Jotta voisi käyttää WWW:tä tarvitaan tietokone, jossa on verkkoyhteys, WWW selailijaohjelmisto (WWW browser) ja apuohjelmia (helper applications), joita tarvitaan näyttämään kuvatiedostoja, animaatiota ja ääntä.


2. Tekniikka WWW:n taustalla

WWW yhdistää useita erilaisia Internetin perinteisiä tiedonhankkimistapoja. WWW selailijalla voi lukea HTML dokumentteja, siirtää tiedostoja FTP:llä, lukea Gopher-sivuja, lukea uutisryhmiä, ja lähettää sähköpostia. WWW selailijat ovat yhteydessä WWW-palvelijoihin, jotka ylläpitävät HTML dokumenttien tietokantoja.

2.1. WWW selailijat eli browserit

Ensimmäisiä graafisia WWW selailijoita oli NCSA:ssa kehitetty Mosaic. Mosaic on saatavilla PC, Macintosh ja Unix-ympäristöihin. NCSA:ssa Mosaicia kehittämässä ollut ydinporukka perusti yrityksen, joka jatkoi Mosaicin kehitystä. Yritys tunnetaan parin nimenmuutoksen jälkeen nimellä Netscape Communications, ja selailijan nimi on Netscape Navigator. Netscapen nykyinen versio on 2.0, joka sisältää tuen myös Java-kielellä kirjoitetuille ohjelmille. Netscapen tulevat versiot sisältävät mahdollisuuden näyttää Adobe Acrobatilla tehtyjä PDF-tiedostoja sekä Macromind Directoryllä tehtyjä multimediadokumentteja suoraan Netscapen ikkunassa.

CERN:issä on kehitetty WWW palvelijaohjelmistoa ja sittemmin selailijaa, joka osaa lukea HTML 3.0 tiedostoja. Tämä Arena selailija on toistaiseksi saatavilla vain Unix-koneisiin.

Työasemavalmistaja Sun Microsystems on myös kehittänyt oman WWW selailijansa. HotJava on toistaiseksi saatavilla Unix-ympäristöön ja Windows NT:lle - Macintosh-versio on työn alla. HotJava tuo uuden elementin WWW dokumentteihin. Tavanomaiset HTML dokumentit voivat sisältää pieniä Java-kielellä kirjoitettuja ohjelmia (Applets), jotka suoritetaan paikallisesti asiakaskoneessa. Appletsien avulla voidaan esittää dynaamista informaatiota, kuten animaatiota, 3D-mallien pyöritystä jne. Java on olio-ohjelmointiin perustuva kieli - saman tapainen kuin esim. C++.

2.2. WWW palvelijat

WWW palvelija on ohjelmisto, joka kommunikoi WWW selailijan kanssa käyttämällä ns. HyperText Transfer Protocol (HTTP) yhteyskäytäntöä. Palvelija voi toimia Unix, Macintosh tai PC-koneessa. Palvelija tunnistetaan verkkonimestä, joka on kyseisen palvelijakoneen nimi TCP/IP verkossa. Palvelijaohjelmistoja on saatavilla ilmaisjakeluna, esimerkiksi CERN:issä kehitetty httpd. Netscape Communications myy omaan palvelinohjelmistoaan. Palvelijaohjelmisto hakee tiedostoja palvelijakoneen levyiltä ns. URL:n (Universal Resource Locator) perusteella. URL on muotoa http://computer.org.country/doc.html missä http on yhteyskäytännön nimi, computer.org.country on tietokoneen nimi ja doc.html on hakupolku dokumenttiin. Yhteyskäytäntö voisi olla myös esim. gopher tai ftp. Luettaessa asiakaskoneen paikalliselta levyltä yhteyskäytäntö on file.

HTTP yhteyskäytäntö käsittää neljä osaa: yhteyden avaus, "request", "response", ja yhteyden sulkeminen. HTTP in tilaton protokolla - eli se on aktiivinen vain silloin, kun HTML sivua siirretään. HTTP palvelijat käyttävät liikennöintiinsä useimmiten porttia 80, mutta sen voi määritellä myös joksikin muuksi. Request on esimerkiksi muotoa GET . Request voi olla myös POST tai PUT, joita käytetään esimerkiksi lomakkeiden toteutuksessa.

Haut toteutetaan GET viestin välityksellä. GET /document/index?Jari etsii hakusanaa Jari WWW-palvelijalta. WWW-palvelijan tulee olla konfiguroitu niin, että se tukee hakuoperaatiota. Jos halutaan käyttää useita hakusanoja, niin käytetään muotoa GET /document/index?Jari+Juha.

2.3. WWW Dokumenttien tekeminen

WWW selailijat lukevat tiedostoja, jotka on kirjoitettu HyperText Markup Language muodossa (HTML dokumentit). HTML perustuu Standard Generalized Markup Language (SGML) kieleen, ja sisältää kaiken tekstin formatoinnin ASCII muodossa. HTML dokumentteja on siis helppo siirtää eri tietokoneympäristöjen välillä. HTML dokumentit voivat sijaita eri puolilla maailmaa ns. HTTP-palvelijaohjelmistojen hakemistoissa.

Hypertekstilinkki perustuu ns. URL (Universal Resource Locator) määrittelyyn. URL on muotoa http://computer.org.country/doc.html missä computer.org. country on tietokoneen nimi ja doc.html on hakupolku dokumenttiin.

HTML kielen nykyinen versio on 2.0, joka tukee tekstin erusmuotoiluja sekä lomakkeita. Lomakkeet ovat interaktiivisia WWW-sivuja, jotka voivat sisältää editoitavia tekstilaatikoita, painikkeita, monivalintoja ja pop-up valikoita. Kuvat voidaan sijoittaa HTML dokumenttiin komennolla

<IMG SRC="http://matwww.ee.tut.fi/kuvat/JariM.gif">

Seuraavassa HTML versiossa (3.0) tuetaan mm. taulukoita ja matemaattisen tekstin esittämistä TeX:in kaltaisella syntaksilla. Esimerkiksi kaava

y = a xk + b sin x

esitetään HTML 3.0:ssa siten, että

<math>y = a x^k^ + b sin x</math>

ja TeX:ssä

$y=ax^{k}+b sin x$.

HTML dokumentteja voidaan tehdä monella tavalla. Hyvin HTML-kieltä osaava voi kirjoittaa dokumentin millä tahansa teksturilla ja tallentaa sen ASCII-muodossa. Lähes WYSIWYG editoreita on myös olemassa (esimerkiksi - HoTMetaL PRO). Verkosta löytyy myös koko joukko konverttereita, jotka tuottavat HTML dokumentteja muista formaateista (RTFtoHTML ja LateXtoHTML).

Jotkut tekstinkäsittelyohjelmat sisältävät suoraan option jonka avulla voidaan tallentaa dokumentti HTML-muotoon (esimerkiksi Microsoft Internet Assistant ja ClarisWorks).

Eräät Internet-yhteyksien tarjoajat ovat kehittäneet kotisivujen luontipalvelun omalle palvelijakoneelle. Ne toimivat lomakkeiden avulla siten, että käyttäjältä kysellään tarvittava informaatio, kuten millaista tekstiä sivulle tulee, painikkeet, taustakuvio jne.

Sellainen on esimerkiksi The Ohio State Universityn palvelu omille opiskelijoilleen. WWW-selailijalla avataan erityinen sivu, joka kyselee millaista tekstiä, otsikoita jne. sivulle halutaan. Sitten erityinen CGI-script generoi sivun, joka on välittömästi tekijänsä käytettävissä.

Hyperteksti linkkien generointi on HTML:ssä periaatteessa yksinkertaista mutta käytännössä hankalaa. Linkki ilmaistaan

<A HREF="http://matwww.ee.tut.fi/persons/JariM.html">Linkki Jarin kotisivulle"</A>

Esimerkiksi Matriisilaskenta I -kurssin jokaisella sivulla on keskimäärin 10 linkkiä. Sivuja puolestaan on 60 alilukua, 80 määritelmää ja 50 harjoitustehtävää. Linkkejä koko materiaalissa on siis arviolta 1900!

2.4. Hakupalvelut

WWW:n käyttäjämäärä ja WWW:stä saatavilla oleva tieodn määrä kasvaa räjähdysmäisesti joka kuukausi. Siksi on tärkeää, että WWW sisältää työkaluja, joilla tietoa voidaan tehokkaasti etsiä. Tälläisiä palveluita on esimerkiksi Netscapen kotisivulla. WWW-palvelijoissa olevaa tietoa indeksoidaan koko ajan esimerkiksi WWWW:n avulla. WWWW eli WWW worm toimii siten, että se "lukee" eri WWW-palvelijoiden dokumenttien sisältöä ja pyrkii seuraamaan löytämiään linkkejä. Löydetysitä sivuista tallennetaan indeksiin esimerkiksi 100 ensimmäistä sanaa.

Joihinkin WWW:n hakupalveluihin pitää itse ilmoittaa uusista WWW sivuista.


3. WWW:n käyttö

3.1. Digitaaliset kirjastot

Elektronisen julkaisemisen viimeisin "muotisana" on digitaalinen kirjasto. Perinteinen kirjasto tarjoaa käyttäjälleen informaatiota, joka on selkeästi luetteloitu ja järjestetty luokittain hyllyihin. Digitaalinen kirjasto tuo kirjaston palvelut elektronisessa muodossa käyttäjän lähelle. Digitaalinen kirjasto voi olla siis fyysisesti jakaantunut useaan eri pisteeseen, ja sen sisältämään materiaaliin voidaan viitata hypertekstilinkeillä. Toisaalta digitaaliset kirjastot tukevat etäopiskelua. USA:ssa on meneillään useita tutkimusprojekteja joissa kehitetään digitaalisia kirjastoja esimerkiksi tietojenkäsittelyopin ja kemian tutkimusraporttien hyödyntämistä varten. Monissa projekteissa käytetään WWW:tä käyttöliittymänä. Voidaankin sanoa, että WWW on kokonaisuudessaan digitaalinen kirjasto, jonka sisältöä tosin ei kukaan kokonaisuudessaan hallitse tai ylläpidä.

Eräs digitaalinen kirjasto WWW:ssä on Virtual Library, josta löytyy informaatiota useilta eri aloilta maataloudesta uskontoon ja tekniikkaan.

3.2. WWW opetuksessa

WWW:ltä löytyy paljon erilaista opetuksellista materiaalia, esimerkiksi ohjelmakoodiesimerkkejä tai kokonaisten kurssien luentomateriaalia. WWW:n etuna opiskelumateriaalin jakelussa on WWW:n kattavuus. Amerikkalaisessa yliopistossa tehtyä materiaalia on helppo saada käsiinsä vain muutamalla hiiren osoituksella. Toisaalta, verkkoyhteyden laatu vaikuttaa materiaalin saatavuuteen - suurien tiedostojen siirtäminen amerikkalaiselta koneelta ei ole mielekästä. TTKK:n matematiikan laitoksella on kehitetty Suomen ensimmäinen WWW:llä oleva etäopetuskurssi, Matriisilaskenta I. Kurssi on tarkoitettu 2-3 vuoden insinööriopiskelijoille, ja sisältää luentomonisteen hypertekstiversiona, vihjeistettyjä harjoitustehtäviä, animaatioita sekä interaktiivisia harjoitustehtäviä. Interaktiiviset harjoitustehtävät on toteutettu Mathematicaa hyväksikäyttäen. HTML dokumentti (lomake) kutsuu CGI-scriptiä, joka puolestaan kommunikoi Mathematica-ohjelman kanssa käyttäen MathLink-protokollaa. Animaatiot on tallennettu QuickTime-muodossa, koska sitä pystyy katselemaan Macintoshissa, PC:ssä (QuickTime for Windows) ja Unixissa (xanim).

WWW pohjaisia kursseja on kehitetty myös muissa yliopistoissa. Esimerkiksi Jyväskylän yliopiston matematiikan laitoksella kehitetään joidenkin kurssien WWW-versiota. Electronic Textbook for PFP4 on matematiikan, fysiikan ja kemian kurssi WWW:llä (laskuesimerkit Maplen syntaksilla). Transitional Mathematics Project on Imperial Collegessa (Lontoo) kehitetty matematiikan kurssi, joka hyödyntää Mathematicaa reaaliaikaisesti. Lisäksi esimerkiksi MathCadia voi käyttää WWW:n välityksellä MathBrowserin avulla, joka on MathSoftin kehittämä WWW selailija. Computer Science Department and the University of Idahon WWW-palvelijalla ylläpidetty Learning tool -sivu sisältää linkkejä muiden aineiden WWW-oppimateriaaliin. 2001: The Media Odyssey on

"...an attempt to explore the history, present state, and future of communication technology, both through information and interaction.

This project is the result of a collaborative effort of students studying the future of media technology at the Terry Sanford Institute of Public Policy at Duke University."

WWW:n ongelmat opetuksessa liittyvät materiaalin interaktiivisuuteen. Hyvä WWW kurssi tarjoaa oppijalle riittävästi palautetta siitä, miten oppiminen edistyy ja mihin suuntaan tulisi jatkaa. Tälläisen ympäristön tulisi sisältää myös "kognitiivisia työkaluja", eli ohjelmia tai ohjelman osia, jotka aikaansaavat ajatteluprosesseja. Interaktiivisuutta on yritetty esimerkiksi TTKK:lla lisätä yhdistämällä WWW-sivuille kurssin opettajille suora sähköposti sekä kurssiin liittyvä elektroninen ilmoitustaulu, jossa opiskelijat voivat käydä keskustelua kurssin aihepiiristä. Lisäksi TTKK:lla kokeillaan videokonferenssiohjelmiston ja WWW-kurssi mahdollisuuksia.

Käytönnänläheinen ongelma WWW:n hyödyntämisessä opetuksessa on resurssien puute. Kouluissa ei vielä ole nopeita (ethernet)yhteyksiä Internettiin. Toisaalta multimedian tuottaminen ja käsittely vaatii tehokkaita laitteistoja, joiden hankinnat ovat monessa peruskoulussa olleet täysin pysähdyksissä viime aikoina.

Millaisia kaupallisia intressejä liittyy WWW:n hyödyntämiseen opetuksessa? Oppikirjojen kustantaja eivät ehkä ole kovin kiinnostuneita mediasta, joka levitessään saattaa valloittaa perinteisen kirjan markkinat.

3.3. Palvelut ja viihde

Erilaiset palvelut ja viihde muodostavat keskeisen osan WWW:n tarjonnasta. Kunnat tarjoavat joitakin informaatiopalveluitaan WWW:llä, esimerkkeinä Tampere ja Kotka. Työministeriö ylläpitää WWW sivuja, joilta voi löytää vapaat työpaikat.

Paramount oli ensimmäinen elokuvateollisuuden yritys, joka jakoi WWW-sivujensa kautta QuickTime-muotoista esittelyä elokuvastaan StarTrek: Generations. Nyttemmin Paramountin palvelijalta löytyy TV-sarjaan Star Trek: Voyager liittyvä interaktiivinen ensyklopedia, esitysaikataulut ja kanavat, sekä katkelmia kunkin osan sisällöstä.

Cardiff Movie Database on tietokanta elokuvien näyttelijöistä, sisällöistä ja tekojöistä. Keltainen lehdistö on siirtynyt WWW:lle Iltalehti Onlinen myötä.

Useat palvelut ovat tällä hetkellä ilmaisia. Elektronisen rahan yleistyessä on varmaa, että palvelut muuttumat maksullisiksi. Tällä hetkellä yritykset investoivat teknologiaan ja totuttavat käyttäjät käyttämään ilmaisia palveluitaan.

3.4. WWW tutkimuksessa

WWW:n syntyjuuret ovat elektronisessa teknillisessä ja tieteellisessä julkaisussa. Tutkijat julkaisivat tutkimuksiaan sijoittamalla ASCII ja PS formaateissa dokumentteja ja niiden tiivistelmiä WWW:lle. WWW:ltä löytyy nykyisin jo useiden konferenssien kokoomajulkaisuja (proceedingseja), ja jotkut konferenssit edellyttävät esitelmänpitäjiltä tutkimusraportin tuottamista WWW-muodossa.

WWW:ltä on luettavissa myös joitakin tieteellisiä lehtiä. Esimerkiksi ACM Crossroads opiskelijalehti ja Amerikan Matemaattisen yhdistyksen Electronic Research Announcements of the AMS löytyvät verkosta. Vain verkossa julkaistava tietojenkäsittelyopin lehti on The Journal of Universal Computer Science.

WWW voi toimia erilaisten tietokantojen käyttöliittymänä. Tieteellisiä tietokantoja voi selailla WWW:n välityksellä esimerkiksi USA:n National Space Science Data Centerin (NSSDC) WWW-palvelijalta (Mathews ja Towheed, 1995). OMNIWeb on ns. "near-earth" heliosphere database" - tietokanta, joka sisältää tietoja aurinkotuulen magneettikentistä ja auringon aktiivisuudesta.

Etelä-Kalifornian (USC) yliopistossa toteutettiin Mercury-projekti, jonka tarkoituksena oli kokeilla robottikäsivarren ohjaamista WWW:n avulla (ns. tele-robotics). Robottikäsivarren operaattori saattoi liikuttaa käsivartta WWW:n avulla "hiekkalaatikon" päällä WWW:n avulla ja samalla ohjata ilmakompressoria, joka puhaltaa hiekkaa. Hiekkalaatikkoon oli piilotettuna esineitä, joiden löytymisen saattoi todeta jokaisen operaation jälkeen välitetystä kuvasta WWW-sivulla.

Vastaavanlaisia, esim. minuutin välein päivittyviä kameroita löytyy WWW.stä useita. Esimerkiksi sääsatelliittien kuvat, avaruussukkulalennot, auringonpimennykset ja komeetta Shoemaker-Levy ovat olleet esillä WWW:ssä automaattisesti päivittyvien kuvien avulla.

UCS:n uusi telerobotti keskittyy "tele-ekologiaan":

This tele-robotic installation allows WWW users to view and interact with a remote garden filled with living plants. Members can plant, water, and monitor the progress of seedlings via the tender movements of an industrial robot arm. Our purpose is toexplore what Neil Postman calls the "ecological effects of media".

3.5. WWW liike-elämässä

WWW sivujen ylläpito ei vielä ole tuottanut kovin monelle yritykselle suoranaista voittoa. Välillisesti yritykset kuitenkin hyötyvät jo nyt WWW.stä. WWW:n mainosarvo on huomattava ja sen avulla voidaan nostaa yrityskuvaa. Toisaalta mainos WWW:ssä on käyttäjän kontrolloitavissa - jos mainossivu ei kiinnosta, se voidaan nopeasti ohittaa tai sitä ei avata luettavaksi ollenkaan.

Tällä hetkellä kilpailu WWW-palvelijoiden, WWW-selailijoiden ja WWW-sivuja tuottavien yritysten kesken on kovaa. On arvioitu, että WWW-selailijan ikä tuotteena on kuusi kuukautta. Sen jälkeen selailija on jo auttamatta vanhentunut. WWW-alueella toimivien yritysten tuleekin olla innovatiivisia ja koko ajan uusia tuotesuuntauksia etsiviä - dynaamisia.

Yritysten tarjoamia palvelija ovat esimerkiksi ilmaiset ohjelmistopäivitykset. Monet ohjelmistofirmat jakavat WWW-palvelijansa kautta uusimpia versioita ja demoja tuotteistaan. Lisäksi joidenkin yritysten WWW-palvelijoiden kautta voi tilata yrityksen tuotteita ilmoittamalla yhteystietonsa ja luottokorttinsa numeron tilauksen yhteydessä. Elektronisen (digitaalisen) rahan yleistyessä entistä useammat yritykset alkavat tekemään kauppaa WWW-sivuillansa.

Olemmeko siirtymässä palveluyheiskunnasta tietoyhteiskuntaan siinä mielessä, että pääkauppatavarana tulevaisuudessa on esimerkiksi WWW:n kautta ostettava tieto: pörssikurssit, ohjelmistot, elektroniset aikakauslehdet jne?


Liitteet


A. WWW:n etuja ja haittoja

+ maailmanlaajuinen hypertekstisysteemi
+ tukee monia erilaisia dokumenttimuotoja eri laiteympäristöissä

- HTML dokumentit vaikeita tuottaa
- hypertekstilinkkien tekeminen hankalaa
- verkkoinfrastruktuurin rakenne - grafiikan siirtyminen hidasta
- WWW jakaa ihmiset niihin jotka osaavat ja niihin jotka eivät
- Dynaamisen informaation esittäminen WWW:ssä

? Salaus WWW:ssä
? Toistaiseksi suurin osa palveluista ilmaisia, mutta kuinka tulevaisuudessa
? Lisääkö WWW demokratiaa

B. Lyhenteitä ja käsitteitä

HTML
HyperText Markup Language. SGML:ään perustuva dokumenttien merkkauskieli.

GIF, JPEG
Kuvaformaatti, jota voidaan lukea eri laiteympäristöissä

MPEG
Video- ja animaatiotiedostojen formaatti

CGI

C. Lähteet

Berners-Lee Tim, Cailliau Robert, Luotonen Ari, Nielsen Henrik Frystyk, Secret Arthur (1994) The World Wide Web. Communications of the ACM, Vol. 37, No. 8.

Mathews Jason ja Towheed Syned (1995) Interactive data vizualization comes to the World Wide Web. Scietific Computing World, October, Issue 12.

Porttikivi Anssi (1995) Verkon kaupankäynti ja maksutavat. Internet, lokakuu, No 2-3.

Fox Edward, Akscyn Robert M., Furuta Richard, Legget John J. (eds) (1995) Digital Libraries. Communications of the ACM, teemanumero, April 1995, Vol. 38, No. 4.