3. Opetusdokumentin tuottamisprosessin määrittely

Opetusdokumentin rakenteen muodostuttua on tarkasteltava syntynyttä opetusmateriaalia sekä testattava laaditun DTD:n toimivuutta ja valittujen SGML-työkalujen toimivuutta. SGML on eräänlainen metakieli esimerkiksi HTML:lle, joka määrittää valitun dokumentin ulkoasun ja muotoilun valitulle selaajaohjelmalle selaimen tukemista ominaisuuksista riippuen. SGML:llä laaditulle DTD:lle muokattu materiaali on käännettävissä tukemaan esimerkiksi HTML:ää valittuja SGML-työkaluja käyttäen. SGML:ää on tutkittu jo useita vuosia, mutta saatavilla ei ole yksiselitteisiä ohjeita tai kuvauksia siitä, mitkä SGML-työkalut ovat parhaita tiettyihin laiteympäristöihin tai sisällöltään tietyntyyppisen materiaalin käsittelyyn. Tämän vuoksi projektissa tulee testata erilaisia saatavilla olevia SGML-työkaluja, ja tämän pohjalta valita esimerkiksi pilotoinnissa käytettävät työkalut.

On myös mahdollista, että tiettyjä materiaaleja muunnetaan suoraan esim. Word- tai WP-muodoista suoraan HTML:ksi. Siksi tässä esitetään rinnakkain sekä SGML-prosessi, että tekstimuotoisen materiaalin suora konvertointi alkuperäisistä tekstitiedostomuodoista, jotka tässä raportissa määritellään. On myös huomattava, että esimerkiksi relaatiotietokantoja ei ole järkevää muuttaa SGML-muotoon. Tällöin ne joudutaan esittämäään SGML-tietokannalle rinnakkaisena kantana tietokantarakenteessa.

On huomattava, että kuvia, animaatioita, ääntä tai videoita ei sinällään voi "rakenteistaa". SGML-tietokannan kannalta ne ovat omia entiteettejään, jotka voivat liittyä dokumenttirakenteeseen. Tämän vuoksi kyseisten elementtien esittäminen HTML-muodossa on tarkastettava ja määriteltävä suositeltavat ja projektissa käytettävät tavat kysessä olevien entiteettien esittämiseen.

3.1 Tekstit

Opetusdokumentin runko on nykyään yleisesti jollakin tekstinkäsittelijällä kirjoitettu kuten WP (DOS ja Windows), Word ja PageMaker (Windows ja Macintosh), TeX ja LaTeX (Unix) sekä FrameMaker. Vaihtoehtoisia ohjelmia nykyään melko harvassa. Myös pelkällä tekstieditorilla voidaan dokumentit luoda samoin kuin ohjelmilla, jotka on tarkoitettu ensisijaisesti muuhun kuin tekstinkäsittelyyn, mutta nämä ovat nykyään kuitenkin vähemmistönä.

Mikäli opetusdokumentti on jo valmiiksi kirjoitettu tiedostoiksi, on se suhteellisen helppo muuttaa tietoverkoissa levitettävään muotoon. Teksti saattaa vaatia pieniä muutoksia ja useimmat nykyiset tekstinkäsittelijät tukevat monia eri talletusmuotoja ja siten siirrettävyys on helppoa. Jos luentomonisteen kaltaisesta tekstistä halutaan kuitenkin selkeä tietoverkossa selattava opetusdokumentti, on sen sisältöön ja ulkonäköön kiinnitettävä enemmän huomiota.

Word

Microsoftin Word 6 on hyvin laaja ja tehokas tekstinkäsittelijä, jossa pystytään hyvin tehokkaasti hallitsemaan isojakin tekstimääriä, kuvia, kaavoja ja taulukoita. Tekstin muokkaus on tyylien ansiosta hyvin tehokasta ja joustavaa, mikäli esimerkiksi paperikoon tai kirjaintyylin suhteen halutaan tehdä korjauksia.

Microsoft on määritellyt tekstitiedostoille talletusmuodon RTF (Windows: Rich Text Format, Macintosh: Interchange Format) ja esimerkiksi Word dokumentit voidaan tallettaa RTF muodossa, jolloin teksti säilyy siirrettävänä esimerkiksi eri Microsoftin ohjelmien välillä. Siirrettävyyden ongelmana saattaa kuitenkin tulla vastaan eri laiteympäristöjen merkistöt kuten ä:n ja ö:n osalta, sillä Macintosh käyttää pohjana eri merkistöä (mac) kuin Windows (ansi). Muita merkistöjä ovat IBM PC (pc) ja IBM PS2 (psa).

RTF tiedostoja voidaan muuttaa HTML tiedostoksi ohjelmalla RtfToHtml, joka muuttaa muotoiltua tekstiä varsin tehokkaasti. Kaikkia mahdollisia tekstinkäsittelijän ominaisuuksia ei kuitenkaan voida automaattisesti konvertoida, vaan on syytä tarkistaa, miten erikoismerkit (symbolit ja laajennettu ASCII), erilaiset korostukset ja kirjasinkoot sekä tyylit siirtyvät HTML:ksi.

Toinen mahdollisuus Word-tiedostojen muuttamiseksi HTML 2.0(+) -muotoon on Microsoftin Internet Assistant for Word. Se on dokumenttipohja (template), joka lisätään muiden olemassa olevien dokumenttipohjien listalle. Uutta dokumenttia luodessa voidaan käyttää suoraan tätä pohjana. Vanhoja muunnettaessa olemassa oleva teksti muunnetaan HTML:ksi. Ohjelma mahdollistaa myös tekstin talletuksen HTML tiedostoksi. Kuvat tallennetaan automaattisesti GIF-formaattiin. Tämän ongelmina ovat kuitenkin muun muassa ala- ja yläindeksit, symbolit sekä kaavat.

WP

Wordin tapaan WP on hyvin laaja vaikoimaltaan ja vain tietyin paikoin on suurempia eroja, näitä on muun muassa taulukoiden käsittely ja kaavojen luonti. Konvertterin Wp2Html avulla voidaan WP 6:n tiedostoja muuttaa HTML 3 muotoon. Tuotettuja tiedostoja joutuu RtfToHtml ohjelman tapaan korjaamaan luonnin jälkeen, sillä kaikkia tageja ei tunneta ja linkit ja kuvat on itse lisättävä, mutta ohjelman aputiedostojen avulla voidaan tehdä erilaisia lisämäärityksiä.

TeX, LaTeX

TeX ja LaTeX ovat erityisesti korkeakoulumaailmassa laajalti käytettyjä Unix ympäristön tekstinkäsittelijöitä. Teksti, tyyli ja layout-tiedot kirjoitetaan tavallisella editorilla tiedostoon, josta se voidaan tulostaa näytölle tai paperille. TeX sisältää runsaasti erilaisia valmiita pohjia, joita käyttävät hyväksi myös tieteelliset julkaisulehdet. TeX ja LaTeX koodia voidaan eri ohjelmilla muuttaa joko suoraan HTML muotoon (LaTeXtoHtml) tai TeX:n rakenteellisuudesta johtuen myös suhteellisen helposti SGML:ksi.

3.2 Tekstinkäsittelijän kaavat

Vielä tämänhetkisillä HTML 2:n määrityksillä kaikkia kaavoja ei ole mahdollista esittää tavallisen tekstin tapaan. Jos kaava sisältää erikoismerkkejä, osamääriä, integraaleja ynnä muuta, on kaavat tehtävä erilaisilla kaavaeditoreilla ja siirrettävä kuvina. Tästä aiheutuu joitakin ongelmia. Ensinnäkin kuvana olevien kaavojen kirjasintyyli on kiinteä, eikä muutu selaimessa käytetyn tyylin kaltaiseksi. Siksi teksti ja kaavat voivat erota merkistöltään toisistaan. Toisena ongelmana on yleisesti kuvien sijoittuminen tekstiin, lähinnä pystykohdistus. Kolmantena ongelmana on siirrettävän tiedon määrä, sillä jokainen kuva vie huomattavasti enemmän tilaa kuin vastaava määrä tekstiä.

HTML 3 ja 3.2 tuovat parannusta, joskin myös selaimien on pystyttävä näyttämään uuden määrittelyn mukaiset asiat. Kaavojen esittämiseksi on runsas valikoima erilaisia komentoja, mutta tämän hetkisistä selaimista ainoastaan Arena (Unix) pystyy kaavat näyttämään. Tulevista ratkaisuista eri selaimille ei ole vielä tietoa.

Word Equation Objects

Word 6.0:n mukana on kaavaeditori Microsoft Equation Editor 2.0 tai vaihtoehtoisesti voidaan käyttää tätä hieman laajempaa editoria MathType 3.0:a. Käytettäessä RTF talletusmuotoa, lisätään kaavat WMF (Windows Meta File) tai PICT (Macintosh Picture) muodossa talletustiedostoon. Samoin toimitaan yleisestikin erilaisten tekstin mukaan linkitettyjen objektien kanssa, kuten esimerkiksi kuvat.

Käytettäessä RtfToHtml ohjelmaa tekstin seassa olevat kuvat ja kaavat erotetaan omiksi tiedostoiksi. Jos esimerkiksi alkuperäisen tiedoston nimi on muotoa NIMI.RTF, niin siitä syntyy tiedosto NIMI.HTML ja sen sisällä olevista kuvista tiedostoja NIMI1.WMF, NIMI2.WMF jne. tai vastaavasti NIMI1.PICT, NIMI2.PICT. Kuvat on erikseen muutettava GIF (Graphics Interface Format) tai JPEG / JPG kuviksi.

DOS ympäristössä HTML tiedostossa eivät kuvien viittaukset ole valmiina, vaan niiden kohdalle tulee viittaus:
<A href="nimi1.gif">Click here for Picture </A>

Näihin kohtiin on vaihdettava joko

tai riippuen käytetystä kuvien konvertointimuodosta.

Kokeiltu RtfToHtml ohjelma (versio 2.7.5) ei ole täysin virheetön, vaan sitä käytettäessä saattaa koodista yllättäen puuttua yksittäisiä merkkejä. Esimerkiksi

Nämä voidaan korjata käsinkin, mutta se vaatii melko runsaasti työtä.

WP kaavat

Wp2Html pystyy muuttamaan kaavat HTML 3 muotoon, mutta koska Netscape ja Mosaic eivät vielä tue tätä piirrettä, on tästä hyötyä vasta tulevaisuudessa, sensijaan Unixiin saatava Arena tukee HTML 3:n esitysmuotoa.

LaTeX kaavat

Uusimmat LeTeXtoHtml konvertterit osaavat automaattisesti muuttaa TeX:n kaavat HTML 3:ksi, vanhempien ohjelmien kanssa jouduttiin käyttämään ohjelmaa MathToHtml.

3.3 Matemaattiset ohjelmat

Erilaisiin laskennallisiin ongelmiin voidaan käyttää matemaattisia ohjelmia. Matlab on hyvin tehokasta numeerisen laskenta ohjelma, symboliseen laskentaan sopivat Mathematica ja Maple. Siistin ulkoasun saa aikaiseksi Mathcadilla. Vaikka näitä ohjelmia tuskin käytetään yksinään opetusdokumentin tekoon, voidaan niitä kuitenkin käyttää tehokkaasti oheismateriaalin tuottamiseen, kuten kaavoihin, käyrien piirtämiseen ja animaatioihin.

Matlab

Matlab on tehokas suurien numerotiedostojen käsittelyyn käytetty ohjelmisto, erityisesti signaalien käsittely ja matriisilaskenta on hyvin tehokasta. Unix ympäristössä on saatavilla ohjelma, joka muuttaa m- tiedostot HTML muotoon. Ohjelman nimi on Mat2Html ja se on Unix koodia.

Mat2Html muodostaa hakemiston kaikista m- tiedostoista rakenteen, jonka avulla voidaan käydä läpi kaikkien funktioiden syntaksi ja myös niiden opastusteksti, johon on mukaan hyperlinkkeinä myös saman hakemiston eri funktioiden tiedot. Tämän avulla on helppo tarkistaa funktioiden tarkoitus ja käyttöperusteet ja yleisesti ottaen tarkastaa käytettävissä olevat funktiot.

Mathematica

Mathematica on laajasti käytetty matemaattinen ohjelma, sillä siinä on muun muassa sisäiset grafiikan ja animaation esittämismahdollisuudet. Mathematicaa voidaan käyttää interaktiivisten tehtävien esittämiseen ja tarkistamiseen WWW:ssä.

Mathematican tiedostojen (notebook) muuttamiseksi HTML koodiksi on luotu muun muassa Unixissa toimiva ohjelma Nb2Html ja sama myös C- koodina. Tämä muuttaa tiedoton tekstin ja animaatiot HTML:ksi ja kuvat GIF kuviksi.

Maple

Ilmeisesti Maplen esityksiä ei voida muuttaa HTML muotoon, ainakaan sellaista ohjelma en ole löytänyt. Maplen komentoja voidaan suorittaa tietoverkossa, joten jonkinlainen tuki niille on.

Mathcad

Mathcad eroaa edellä olleista matemaattisista ohjelmista siinä, että sen esitystapa pyrkii olemaan dokumentin kaltainen, jossa tekstiä, kuvia ja kaavoja voidaan sijoittaa toisiinsa nähden helposti. Mathcadia ei ilmeisesti voi suoraan esittää HTML:nä, mutta selaimella Mathbrowser on mahdollista selata tietoverkkojen välityksellä MCD -tiedostoja, jotka on luotu Mathcad versiolla 6.0. Itse Mathcadin tiedostoja ei siis muutella HTML muotoon, vaan selainohjelmaa laajennetaan näyttämään Mathcadin alkuperäiset tiedostot.

3.4 Taulukot

Taulukoitu aineisto voi olla tekstin seassa olevaa aineistoa, joka on luotu tekstinkäsittelijän omilla ohjelmilla. Toisaalta aineisto saattaa olla taulukkolaskentaohjelmilla luotua tietoa joko omaan tiedostoon tai oliona tekstin joukossa.

TeX, Word ja WP taulukot

Wordilla kirjoitettuja taulukkoja voidaan konvertoida tietyin rajoituksin RtfToHtml, mutta muun muassa taulukon viivoja ei tule lainkaan esille. WP:llä kirjoitettuja taulukkoja voidaan konvertoida tehokkaasti Wp2Html ohjelmilla.

Excel

Excel-taulukoiden muuttamiseksi HTML-muotoon on olemassa Microsoft Internet Assistant for Excel. Se on Windowsin wizard-tyyppinen sovellus, joka opastaa askel askeleelta taulukoiden muuntamisessa. Taulukot voi muuttaa omaksi HTML-tiedostoksi tai liittää suoraan johonkin olemassaolevaan tiedostoon.

3.5 Tietokannat

Käytettävissä on monenlaisia tietokantaratkaisuja. On olemassa ohjelmia, joiden tiedot tallentuvat peräjälkeen ohjelman tietokantaan, tai joiden tietokanta muodostuu tiedostorakenteesta (vertaa tekstinkäsittelyohjelmien tietokanta). Mikäli tietokannan tiedot ovat tämän muotoisia, on yleensä kyse tekstimuotoisesta tiedosta. Tekstimuotoinen tieto voidaan indeksoida. Tähän tarvitaan yleensä työkaluohjelma. Indeksoidusta tiedosta voidaan hakea esim. tiettyä tiedostoa vaikkapa antamalla hakusanoja. Indeksointityökaluja on erilaisia: jotkin indeksoivat koko dokumentin eli tiedoston, joka kannassa on, jotkin indeksoivat vain dokumentin alun tai pyytävät käyttäjää määrittelemään hakusanat dokumentille. Tällaisiin tietokantoihin voidaan operoida indeksointi- ja hakuohjelmilla. Näitä työkaluja on käytössä esimerkiksi kirjastoympäristöissä. Tietoverkoissa on mahdollista käyttää esimerkiksi WAIS-hakuja.

On myös olemassa tietokantoja, jossa tieto on edellista hieman rakenteisemmassa muodossa. Tietokanta voi koostua tietokentistä, jotka on tallennettu peräjälkeen tai tietyn kriteerin mukaisesti tietokantaan. Tällaisista tietokannoista voi tehdä hakuja antamalla hakuavaimeksi tietyn kentän nimen, jolloin haetaan kaikki ko. kentissä oleva tieto, tai hakemalla kentän tietyn arvon omaavaa ilmentymää. Esimerkiksi Lotus Notes -ohjelman tietokanta on rakennettu kuvatulla tavalla. Tällaisiin kantoihin voidaan operoida tietoverkoissa esimerkiksi tekemällä CGI-liittymään ohjelmointiskriptejä PERL- tai C-kielellä.

Lotus Notes

Lotus Notes on nopeasti suosiotaan kasvattava väline, jonka erityisominaisuutena on ryhmätyön tukeminen. Notes tallentaa tiedot erillisiin kenttiin, joista esitettävät dokumentit (formit) muodostuvat. Notes tallentaa dokumentit peräkkäin tietokantaan, joten suurten tietokantojen kyseessäollessa voi haku kannasta olla hidasta. Hakua nopeuttaa mahdollisuus hakea vain tiettyjen kenttien tietoja, jolloin muiden kenttien tietoja ei tarvitse käsitellä, mutta koko kannan joutuu silti selaamaan läpi. Tämä on sekä hyöty että haitta: Notes tukee relaatiotietokantoja vapaamuotoisemman tiedon, kuten tekstidokumenttien ja joissain määrin multimediatiedon hallintaa.

InterNotes WebPublisher on Lotus Notes -järjestelmän osaksi liitettävä väline, jonka avulla Notes-järjestelmässä olevat tiedot saadaan automaattisesti julkaistua myös Internet-verkossa. Tällöin dokumenttikannan ylläpito hoidetaan Notes-järjestelmällä. Ohjelman saa ilmaiseksi osana Lotus Notesia. Notes mahdollistaa myös WWW-dokumenttien selailun Notesin mukana tulevalla selaimella. Verkosta löytyviin dokumentteihin voidaan liittää myös muistiinpanoja, jotka haluttaessa näkyvät muille työryhmän jäsenille.

Relaatiotietokannat

Relaatiotietokannat soveltuvat hyvin määrämuotoisen tiedon tallentamiseen. Relaatiotietokanta poikkeaa yksinkertaisesta kortistopohjaisesta tietokannasta (esimerkiksi Microsoft Works) siten, että siinä kaikki toistuva tieto pyritään tallentamaan vain kerran. Tällöin säästetään tallennustilaa. Lisäksi haku pienemmästä tietokannasta on nopeampaa kuin suuresta. Relaatiomuotoinen tietokanta on erityisen tehokas siksi, koska siinä tieto on jaoteltu erillisiin, pieniin "tauluihin". Tietyn tiedon hakemiseksi tietokoneen tarvitsee selata vain kyseisen hakuavaimen käsittävä taulu. Tietokantaohjelmaan voidaan asettaa myös ehtoja, joiden mukaan esim. tietoa syötettäessä kaikki relaation kentät on pakko täyttää ja kenttiin syötettävä tieto täyttää määrätyt ehdot, esimerkiksi "on kokonaisluku". Relaatiotietokannat voivat myös usein käyttää toisissa relaatiotietokannoissa olevia tietoja.

Relaatiotietokantoihin voidaan tehdä kyselyjä esim. sitä varten suunniteltuja lomakkeita varten tai SQL- (Structured Query Language) kyselykieltä käyttäen. Yritysten tietokannoista valtaosa on tiedostomuodossa, mutta uusista tietokantasovelluksista valtaosa on relaatiotietokantapohjaisia. Relaatiokantoihin voidaan tallentaa myös esimerkiksi kuvatietoa. Vapaamuotoisen tiedon ja dokumenttien tallentamiseen relaatiotietokanta ei ole välttämättä paras vaihtoehto, koska tiedon rakenne on määriteltävä tarkasti etukäteen ja sitä on myöhemmin enää vaikea muuttaa.

Relaatiotietokannan tietojen esittäminen WWW-selaimessa on periaatteessa helppoa. Samassa käyttöliittymässä voidaan esittää tietoa tietokannasta sekä oheen kuuluvaa teksti-, kuva- tai äänitietoa. Mikäli relaatiotietokantoja esitetään vain WWW:n avulla, ei työasemiin tarvita erillisiä ohjelmia relaatiotietokannan käyttöön. Mikäli relaatiotietokantaan on tallennettu esimerkiksi kuvia, myös näitä voidaan esittää selaimen tukemalla kuvaformaatilla. Relaatiotietokannassa olevaa tietoa voidaan myös päivittää HTML-lomakkeiden avulla.

Tietokannan ja WWW-palvelimen välille tarvitaan muunnosohjelma. Muunnosohjelman avulla relaatiotietokantaan HTML-sivuilta kohdistuvat kyselyt esitetään muodossa, jota tietokanta ymmärtää. Muunnosohjelmaan otetaan yhteys WWW-palvelimen CGI (Common Gateway Interface) -liitynnän avulla. Muunnosohjelma luo HTML-dokumentin virtuaalisesti tietokannalle suoritetun kyselyn tulosten perusteella. Muunnosohjelma palauttaa muodostetun HTML-dokumentin WWW-palvelimelle, joka lähettää sen edelleen sitä pyytäneelle selaimelle.

Relaatiotietokannan ja WWW-palvelimen välisen yhteyden voi rakentaa vaikkapa esim. C- tai PERL-kielellä ohjelmoiden. Ohjelmointi on aikaavievää ja hankalaa sekä kallista. Yhteyden helpottamiseksi on tullut ja tulossa uusia välineitä. Tällaisia ovat esimerkiksi Macromedia Backstage, Microsoft Internet Database Connector ja CorelWEBDATA.

ODBC

Windows-ympäristössä tietokantaohjelmien liityntärajapinta ODBC (Open Database Connectivity) toimii välineenä, joka mahdollistaa tietokantakyselyjen suorittamisen. ODBC:tä tukeva muunnosohjelma mahdollistaa HTML-sivuilta tapahtuvat tietokantakyselyt ODBC:tä tukeviin relaatiotietokantoihin. ODBC:tä tukevat muun muassa Oracle, Microsoft Access, Sybase ja Borland Paradox. Oracle on esittänyt oman WebSystem-ratkaisun, johon kuuluu Oraclen oma selainohjelma. Ratkaisu tukee suojattua tiedonsiirtoa selaimen ja tietokannan välillä. Macromedia Backstage on WWW-palvelun kehittämistyökalu, jossa on valmiudet liittymän rakentamiseen Windows-ympäristössä toimivaan relaatiotietokantaan.

SGML-tietokannat

SGML-tietokannat voivat olla rakenteeltaan joko tietokantoja, joissa yksittäiset dokumentit on ensin merkitty SGML-rakenteen mukaisilla tunnisteilla ja tallennettu tiedostoihin, tai tietokantoja, joissa tieto on tallennettu rakenneosien mukaisesti. Jälkimmäinen vaihtoehto mahdollistaa linkitys- ja hakutyökaluohjelmien monipuolisemman ja tehokkaamman käytön.

Esimerkki puhtaasti rakenteisen tietokannan koostumuksesta:

Tietokanta

3.6 Kuvat

Kuvien talletus voidaan tehdä kahdella eri periaatteella: voidaan tallettaa bittikartta (BMP (Bitmap), PCX, TIFF (Tagged Image File Format), GIF (Graphics Interchange Format), JPEG (Joint Photographic Exports Group)) tai käyttää geometistä- eli vektorigrafiikkaa (EPS, DXF, WPG). Jälkimmäisen etuja bittikarttaan on kuvien täydellinen uudelleen skaalattavuus tarkkuutta menettämättä, mutta kuvatiedostojen koko saattaa kasvaa melko suureksi.

Bittikartta (BMP, TIFF) saattaa viedä huomattavan suuriakin määriä tilaa, mutta tietoa voidaan pakata eri asteisesti (PCX, GIF) tai hiukan tinkiä tarkkuudesta ja pakata tehokkaammin (JPEG). Selaimet yleensä tukevat GIF ja JPEG kuvien esitystä, mutta myös uusia, tehokkaampia pakkausmenetelmiä ovat eri yhtiöt esitelleet tietoverkoissa käytettäväksi.

Erilaisilla kuvien käsittely ja piirtämisohjelmilla voidaan yleensä kuvat tallettaa tai siirtää (export) usealla vaihtoehtoisella kuvaformaatilla. Vaikka ohjelma ei tukisikaan GIF tai JPEG talletusmuotoja, voidaan kuvat usein muuttaa muodosta toiseen eri ohjelmien avulla. Esimerkiksi AutoCAD:in oma talletusmuoto ei ole kuvien käsittelyyn yhteensopiva, mutta kuvat voidaan siirtää DXF muodossa ja sopivalla muunto-ohjelmalla edelleen muuttaa GIF muotoon. Tämä saattaa kuitenkin olla työlästä suurien kuvamäärien käsittelyssä.

3.7 Slideshow -esitykset

Selkeän kalvomateriaalin tuottamiseksi voidaan nykyään käyttää erilaisia valmisohjelmia, jotka automaattisesti asemoivat tekstin ja valitsevat sille tarkoituksen mukaisen kirjasin- ja esitystyylin.

PowerPoint

Microsoft on tehnyt PowerPoint -tiedostoille muunnostyökalun Internet Assistant. Se tekee jokaisesta PowerPoint-sivusta kaksi versiota. Toinen sisältää ainoastaan sivujen sisällön tekstinä. Toisessa versiossa sivut muunnetaan kuviksi ja ne on sisällytetty HTML-dokumenttiin sellaisenaan. Kuvat ovat joko GIF tai JPEG-muodossa.

Ohjelma säilyttää PowerPointin linkit tehden niistä HTML-linkkejä. Kuvallisessa versiossa linkit ovat client side image map:ina.

3.8 Luennoitsijan "analoginen" materiaali

Pelkän tekstitiedoston muuttaminen tietoverkkoja varten onnistuu melko vaivattomasti. Sensijaan oppikirjan siirtämisessä tulevat vastaan tekijänoikeudelliset seikat. Myös paperimuistiinpanojen ja erityisesti niissä olevat kuvat ja kaaviot on ennen tietoverkkoihin siirtämistä saatava sähköiseen muotoon.

Jotta luento tai harjoitustilaisuus saataisi kunnolla esitettyä tietoverkoissa, saattaa esitys vaatia äänen ja elävän kuvan käyttöä, joko videona tai animaationa. Näiden esittämistä tarkastellaan luvuissa 3.9 ja 3.10. Myös erilaisten simulaatioiden käytöllä voidaan selventää esimerkiksi kemiallisen prosessin etenemistä, mutta näitä tuottamista ei kuitenkaan tarkastella tämän tekstin puitteissa.

3.9 Ääni

Äänen välittämiseen tietoverkossa HTML-dokumentin liitteenä on olemassa useita muita apuohjelmia kun tässä mainitut. Ohjelmia on saatavissa useisiin eri ympäristöihin. Ääntä voidaan periaatteessa koodata kahdella tavalla, joko signaalipohjaisella menetelmällä tai koodaamalla musiikin nuotit ja niiden ympäristöt (alku- ja loppuhetket, kesto, voimakkuus...).

AIF

Äänen esittäminen voidaan tehdä verkossa liittämällä ääntä sisältävä tiedosto osaksi HTML-dokumenttia (embedding). Esimerkiksi Netscape 2.0 selainta käytettäessä tarvitaan useimmiten selaimen yhteyteen lisäohjelma äänen esittämiseksi. Tällaisia lisäohjelmia on saatavissa useista eri lähteistä ilmaiseksi. Ongelmaksi näiden kanssa tulee lähinnä käytettävän lisäohjelman (plug-in) valinta sekä tällöin mahdollisesti tarvittava muunnos ko. ohjelman käyttämään formaattiin. Esimerkiksi RealAudion kotisivulta on saatavilla RA-player. Ohjelma soittaa omassa RealAudio-ohjelmaformaatissa olevaa ääntä. Ohjelmaan saa myös muunnosohjelman, joka muuntaa muissa ääniformaateissa olevia tiedostoja RealAudio-muotoon.

WAV, AU

Signaalipohjaisia menetelmiä ovat esimerkiksi WAV ja AU, joilla ääntä voidaan siirtää tietoverkoissa. Telen Medianet käyttää äänen välittämiseen verkossa Xing StreamWorks -ohjelmaa. Kyseinen ohjelma välittää myös digitaalista videokuvaa. NAPlayer-lisäohjelmalla (Netscape audio-player) voi soittaa muun muassa WAVE- ja AU-muodossa olevaa musiikkia.

MIDI

Merkkipohjaisista äänensiirtoohjelmista MIDI (Musical Instrument Digital Interface) protokolla on laajassa ja yleisessä käytössä muusikoiden ja säveltäjien keskuudessa sekä myös erilaisissa multimediasovelluksissa. Äänisyntetisaattori tuottaa MIDIn ohjeiden mukaisesti todelliselta kuulostavaa ääntä. Koska tieto soitettasta musiikista on hyvin tiivistä, voidaan MIDIä siirtää hitaillakin yhteyksillä.

3.10 Video

Videolla tarkoittaa analogisen videon ohella digitaalista videota sekä animaatiota.

Video

MPEG-1 (Motion Picture Expert Group) määrittelee video- ja äänisignaalin kompressoinnin mikro- ja CD-sovelluksia varten, jolloin video ei ole täysvideo. Se tuottaa hyvän videolaadun ja standardin tavoitteena on ollut saada digitaalinen vastine analogiselle VHS-videolaadulle nopeudella 1.5 Mbit/s kuva ollessa 320  240 pikseliä luminanssille.

MPEG-2 standardin tavoitteena on jakaa ja tallettaa digitaalista broadcast-TV täysvideoa ja synkronoitua ääntä korkealla laatutasolla siten, että siirtonopeus on 2-20 Mbit/s kuva maksimikoon ollessa 1920  1152 pikseliä.

Telen kokeellisessa Mediamaailmassa käytetään videoiden ja äänen välittämiseen Xingin StreamWorks -ohjelmaa, jossä voidaan esittää MPEG-1 ja MPEG-2 -muodoissa olevaa videota sekä LBR-muotoista audiota.

Macintosh käyttäjille video voidaan välittää esimerkiksi QuickTime -muodossa. Windows käyttäjä voi katsella videoita Media Player -ohjelmalla, joita katsellaan Video For Windows / Audio Video Interleaved (AVI) muodoissa. Myös eri selaimilla on omia lisäohjelmia (esimerkiksi Netscape plug-ins) tarjolla, jonka avulla voidaan katsella tietyssä muodossa olevia videoita.

VDOLive-ohjelmalla voi katsella .vdo-muotoista videota. VDO-esitteen mukaan VDO-muunninohjelmalla voidaan AVI-, QuickTime-, WAV-muotoisia tiedostoja kääntää vdo-muotoon, sekä tulevaisuudessa myös AIF- ja MPEG-videoita.

Videoita ja animaatiota voi periaatteessa välittää myös siten, että kuljettaa materiaalin ensin Director-ohjelmaan, ohjelmoi siellä tarvittavat toiminnot Lingo-kielellä, ja käsittelee sitten luodun materiaalin Afterburner for Director-ohjelmalla. Näin luodun ohjelman katselemiseen tarvitaan Shockwave -lisäohjelma selaimen yhteyteen. Director tukee ainakin Adobe Premierillä laadittuja MOV- ja AVI-formaatteja.

Animaatio

Yksinkertaisimmillaan animaatio on kuvien esittämistä peräkkäin, esimerkiksi Mathematican animaatio on toteutettu tämän avulla. Selaimilla animaatio voidaan esittää käyttämällä Adobe Premieriä, joka esittää GIF kuvia peräkkäin.

3.11 Esitysmuodot

WWW ja Internet

Erilaisten tietoverkkojen yleisin käytetty talletusmuoto on HyperText Markup Language eli HTML. Versiossa 2 on hyvin vähän erilaisia rakenteellisia elementtejä. Teksti voi sisältää pääotsikon, kuusi eri tasoista otsikkoa, erilaisia listoja ja tekstikappaleita ja jokusen tekstin ulkoasuun vaikuttavan elementin. Versio 3 on vasta valmistumassa, mutta siihen on saatu joitakin hyviä lisäyksiä, kuten taulukot, kaavojen tekoon komentoja ja tekstin asemointia on tehostettu. Myös esitystyyliin, kuten värien valintaan, voidaan vaikuttaa (Style Sheets).

SGML-työkaluja

SGML-työkaluja tarvitaan DTD:n tekemiseen, lähdetiedoston tuomiseen SGML-merkittyyn tietokantaan joko rakenneosien mukaiseen tiedostorakenteeseen tai SGML-merkityksi dokumentiksi SGML-tietokantaan, SGML-syntaksin tarkastamisen (parser) sekä SGML-dokumenttien ulkoasun muokkaamiseen.

Erilaisia työkaluja on runsaasti saatavilla erilaisiin käyttöympäristöihin. Saatavilla olevilla työkaluilla on mahdollista muuntaa ainakin Word-, WP-, TeX- ja LaTeX-muotoisia tiedostoja SGML:ksi. SGML- tiedostoja voidaan myös muuntaa ainakin HTML:ksi tai Ventura- ja Quark-tekstin taitto-ohjelmiin. Tämän lisäksi voidaan määritellä erikseen haluttu tulostusasu esimerkiksi HTML-dokumenttien tulostamiseksi tekstiksi paperille.

Alkuperäinen tiedosto
SGML
HTML
Paperituloste

Kuva3. Tiedoston muunnosvaiheet WWW- ja paperimuotoisessa esityksessä.

Etäkamu-projekti puitteissa on tähän mennessä testattu Near & Far -ohjelmistoa sekä DTD:n laatimiseksi että Word-muotoisen tekstin tuomiseksi laadittuun rakenteeseen Near& Far Authorilla. Near & Far soveltui DTD:n laatimiseen hyvin. Word- muotoisen tekstin tuominen laadittuun rakenteeseen ei ollut niin sujuvaa, että kyseistä ohjelmaa kannattaisi harkita suurten tietomäärien käsittelyyn. Projektissa tullaan tutustumaan myös Dynatext- ohjelmistoperheeseen, jonka eri ohjelmilla pitäisi pystyä käsittelemään koko konvertointiprosessi, sekä myös laatimaan hypertekstilinkkejä. Lisäksi tutustutaan saatavilla oleviin muihin ohjelmiin, sekä käynnissä olevien muiden SGML-projektien käyttämiin muunnostyökaluihin.

Koska SGML-työkaluja on useita kymmeniä, ei niitä ole tässä erikseen listattu. Eritelty lista on saatavilla esimerkiksi lähdeaineistossa mainitussa http-osoitteessa.

Java

Java- ja JavaScript-kielet soveltuvat rakenteisen informaation kuvaamiseen ja rakenteiden koodaamiseen. Tämän lisäksi niillä voidaan ohjelmoida hajautettuja multimediasovelluksia. Java-ympäristö koostuu kolmesta komponentista: Java-kielestä ja JavaScriptistä on muodostumassa Internetin ohjelmointikieli. Java-ohjelmat (applets) ovat nykyisen Webin kiinteällä HTML:n DTD-rakenteella toteutettujen 2-dimensioisten sivujen sijasta 3-dimensioisia. Appletit voivat sisältää 3-D animaatiota, ääntä, videoa ja yksinkertaisia virtuaalitodellisuuden sovelluksia tai muita älykkäitä piirteitä esimerkiksi TV-ympäristöön. Javan ongelma on kuitenkin se, että sitä ei ole standardoitu.

VRML

Opetuksessa voi olla tarvetta kuvata objektien muotoja ja rakennetta tarkemmin. Tämän voi tehdä käyttämällä Shockwawe for Directoria välineenä 3D-ohjelmien materiaalin (Strata Studio) esittämiseen, tai esimerkiksi käyttämällä VRML:ää (Virtual Reality Modeling Language), jolla kuvataan objektin ominaisuudet interaktiivisesti 2- tai 3-ulotteisina. VRML on laiteriippumaton, laajennettava ja soveltuu käytettäväski myös hitaiden verkkojen kautta.

VRML-dokumentin katselemiseen tarvitaan selaimeen yleensä myös laajennus tai oma ohjelmansa, esimerkiksi Netscape Navigator 3 (beta) ja WorldView 1.0 (Win dowsNT), WbFX, WebSpace, Virtual Explorer tai Virtus Voyager (Macintosh).

3.12 Konversiotyökalut

Hypertekstin linkitystyökalut

Hypertekstilinkit voidaan generoida manuaalisesti tai automaattisesti. Manuaalisessa linkityksessä jokainen linkki koodataan HTML-tiedostoon kirjoittamalla linkin määrittelevä komento linkin alkukohtaan. Automaattinen linkitys voidaan toteuttaa esimerkiksi siten, että materiaalin tekijä luetteloi linkitettävät sanat/ilmaukset ja linkkien loppukohdan. Ohjelmallisesti voidaan sitten käydä läpi jokainen HTML-tiedosto, ja etsiä tiedostoista linkitettäviä sanoja/ilmauksia.

Automaattisen linkityksen ongelmia ovat sanojen taivutusmuotojen löytäminen linkitettävästä tekstistä (esimerkiksi sanan "matriiseilla" linkittäminen "matriisi" sanan määritelmään), sanan merkityksen ymmärtäminen (esimerkiksi sanaa "jälki" käytetään matriisilaskennassa matemaattisena käsiteenä) ja pitkien ilmaisujen tunnistaminen. (Willet)

Taivutettujen sanojen löytäminen voidaan toteuttaa käyttäen ns. conflation-algoritmia. Algoritmi muodostaa laskennallisesti taivutetusta sanasta perusmuodon. Tällaiset algoritmit ovat usein melko yksinkertaisia toteuttaa, mutta eivät välttämättä toimi kaikissa tapauksissa oikein. Ne voivat perustua sanan päätteen eliminomiseen, ns. stemming-algoritmi tai sanan runkojen vertailuun (sanan alusta verrataan tiettyä määrää merkkejä, truncation-algoritmi).

Kehittyneemmät menetelmät perustuvat lauseen morfologiseen analyysiin (Koskenniemi). Yksi morfologista analyysiä soveltava tavutusohjelma on Morfo. Hypertekstin linkittämiseen voi käyttää

Käytettävissä on erilaisia mahdollisuuksia hakujen suorittamiseksi, esim. Hakujen käyttäminen ja kombinointi vaatii työkalujen valitsemista valitun tietokantarakenteen mukaisesti. Lisäksi tulee päättää, halutaanko hakea koko tekstitiedostosta millä tahansa hakusanoilla tai nimikkeillä, halutaanko käyttää boolean- tai sumean logiikan hakuja. Linkityksen ja hakumekanismien tutkiminen on jo sinänsä eritättäin laaja tutkimusaihe.

LaTeXtoHtml, MathToHtml

TeX ja LaTeX muotoisen tekstin muuttaminen HTML:ksi. Vanhemmissa versioissa kaavojen kenvertoiminen oli tehtävä erikseen, uudemmilla konverttereilla muuttaminen onnistuu suoraan.

Mat2Html

Matlabin m-tiedostojen esittäminen HTML muodossa. Sisältää funktion syntaksin, opastustekstit ja hyperlinkkejä muihin funktioihin.

Microsoft Internet Assistant

Microsoft Internet Assistant (IA) on sarja Microsoftin Office-tuotteilleen tekemiä konversiotyökaluja, joiden avulla on suhteellisen helppo luoda, muuttaa ja selata dokumentteja tietoverkkoja varten. Saatavana on tällä hetkellä työkalut Word, Excel, PowerPoint ja Access -ohjelmiin. Osa ohjelmista on vasta beta-asteella ja ne yleisesti tukevat vasta HTML 2:n määrityksiä, eivätkä vielä HTML 3:a.

Wordin IA on saatavana Word for Win 3.11 versioihin 6.0a ja 6.0c (IA 1.0z) sekä Word for Win95 ja Word for WinNT 6.0 (IA 2.0z). Lisäksi saatavana on beta-versio Word for Mac 6.0.1 varten.

Wordin IA on dokumenttipohja (.dot), joka lisätään muiden jo olemassa olevien lisäksi. Se lisää tunnistettaviin tiedostomuotoihin html-tiedostot. Dokumentteja konvertoitaessa ja editoitaessa on käytössä kaksi eri tilaa: editointi ja katselu. Tämä aiheuttaa jonkin verran hankaluuksia ainakin aluksi ennen kuin ominaisuuteen tottuu.

Testaus osoitti ainakin version 1.0z toiminnan jokseenkin epävarmaksi. Kaikkia tekstielementtejä ei muunnettukaan niin kuin asetustiedostoissa oli määritelty. Lisäksi IA hukkaa olemassaolevista html-tiedostoista kaikki elementit joita se ei tunnista, joten se ei sovellu kovinkaan hyvin pelkästään editointiin. Version 2.0z pitäisi tunnistaa useampia tekstielementtejä.

Excelin IA toimii Win3.x, WinNT ja Mac Excel 5.0 version sekä Win95 Excel 7.0 kanssa. Se on wizard-tyyppinen apuohjelma, joka käy vaihe vaiheelta muunnoksen läpi ohjaten käyttäjää. Taulukosta voi tehdä oman html-tiedoston tai sen voi liittää johonkin olemassaolevaan tiedostoon. Liitettäessä taulukko tekstissä pitää lukea jossakin kohtaa ##Table##, joka kertoo mihin kohtaan tiedostoa taulukko liitetään.

PowerPointin IA toimii ainoastaan PowerPoint 95 (tällä hetkellä vain englanninkielisen version) kanssa. Se tekee PowerPoint-esityksistä kaksi erilaista html-versiota. Toinen sisältää jokaisen näytön kuvana omalla sivullaan säilyttäen ulkonäön saman laisena, kun taas toinen versio sisältää ainoastaan esityksen tekstit omina sivuina. IA osaa muuttaa PowerPointin linkit html:n linkeiksi. Kuvissa olevat linkit muunnetaan client-side-image-map:eiksi. Kuvat muunnetaan gif tai jpeg -muotoon. IA lisää haluttaessa myös esityksiin liitetyt muistiinpanot html-tiedostoihin.

NbToHtml

Mathematican tiedostojen (notebook) muuttamiseen HTML muotoon.

RtfToHtml

Muuntaa RTF tiedostot HTML tiedostoiksi. Versio 2.7.5 toimii tehokkaasti lähinnä vain pelkää tekstiä sisältäville Word tiedostoille, mutta pienellä korjailulla suuremmat tekstit voidaan konvertoida oikein. Kaikkia symboleja ja merkkejä ei välttämättä pystytä oikopäätä näyttämään oikein, vaan ohjelman alustustiedostoja on tarpeen vaatiessa muunneltava.

VrmlConvert

Konvertoi Mathematican 3D grafiikkaa VRML kielelle.

Wp2Html

Muuttaa WP:n tiedostot HTML tiedostoiksi. Ohjelmasta on olemassa kaupallinen versio, joka tukee ainakin jonkin verran HTML 3:n määrityksiä ja se on tarkoitettu WP:n versiolle 6. Ohjelmasta on olemassa vapaasti saatavilla vaillinainen versio, joka on tarkoitettu demo-käyttöön.

3.13 Tuottamisprosessin ongelmat

Staattiset dokumentit on kohtuullisen helppo tuottaa, mutta pedagogisesti mielekkäiden interaktiivisten dokumenttien luominen ja käyttäjän pohjatiedot huomioiva rakenne on vielä hankala toteuttaa. Adaptiivisen dokumentin luomiseen kaivattaisi tietoa käyttäjäprofiilista, joka kuitenkin saattaa olla hankalaa kerätä ja ylläpitää.

Hyvä kirja tai moniste ei välttämättä ole hyvä WWW teksti, sillä jo näytön koko ja resoluutio tuovat omat ongelmansa. Siksi olemassa olevan tekstin siirto saattaa olla ongelmallista ja vaatia tekstin muokkausta. Ongelmana voi kuitenkin olla myös esitysasun valinta, eli mikä on selkeä tapa esittää tekstit, kuvat, kaavat... Tähän ei liene yksiselitteistä vastausta.

Käytetyistä ohjelmista riippuen konversion nopeus vaihtelee suuresti. Itse muutos on yleensä nopeaa, mutta esimerkiksi esitysasun tarkistus, linkkien ja kuvien lisäys voivat viedä suuriakin määriä aikaa. Siksi pienet virheet korjaa mieluummin suoraan HTML tiedostoon. Tällöin alkuperäinen teksti saattaa olla eri, kuin HTML tiedosto.

Pelkän tekstin tilan tarve ei ole suuri, mutta kuvan ja äänen esitys vaatii jo suurempia tilamäärä. Erityisesti tämä on ongelmana tiedon siirrossa, jossa hitailla linjoilla ei kannata siirtää muuta kuin vain välttämättömimmät asiat. Laajat kuvalliset materiaalit ilman animaatiota ja ääntäkin saattavat viedä useita megatavuja levytilaa.

Virheitä ei pitäisi korjata (paitsi kääntäjän tekemät roskat) HTML-formaatiin vaan alkuperäiseen dokumenttiin, koska konversioprosessi tulisi automatisoida niin pitkälle kuin mahdollista. Opetusmateriaalin laadintaa tulisi voida tukea toimivalla versiointijärjestelmällä. Versiointiin on mahdollista käyttää Dattolon ja Loian (Dattolo, Loia 1995) tekemää hypertekstin versiointiin kehitettyä menetelmää.

Hypertekstiin linkkien tekeminen automaattisesti on mahdollista erilaisilla valmisohjelmilla, jolloin tietokantana kerrotaan, mitä sanoja halutaan linkittää ja mille sivuille. Tällöin ohjelma käy tekstin automaattisesti läpi ja lisää löydettyihin sanoihin linkityksen eteenpäin. Ongelmana on kuitenkin sanan taivutus, joka ei niinkään tule vastaan esimerkiksi englannin kielessä, mutta selvästi suomenkielisessä tekstissä. Myös yhteydestä riippuen saatetaan haluta linkitys suorittaa eri paikkoihin, esimerkiksi sanan 'tulo' linkitys saattaa olla skalaari-, vektori- tai matriisilaskentaan. On kuitenkin tehokkaampaa käyttää linkitysohjelmia kuin luottaa kirjoittajan kykyyn löytää tekstistään kaikki linkitettävät sanat ja osoittaa linkit oikeisiin paikkoihin.

Osa linkitystyöstä jää kuitenkin aina kirjoittajalle, sillä vaikka teksti olisi hyvin toteutettu rakenteellisessä mielessä, niin siitä huolimatta linkitettävien sanojen ja linkityskohteiden luettelointi on kuitenkin kirjoittajan tehtävä.

Sanan taivutukseen on käytettävissä erilaisia ohjelmia, mutta näidenkään avulla ei välttämättä löydetä kaikkia linkitykseen tarvittavia sanan muotoja ja jotkut muodot saattavat olla vääriä.