<< >> Otsikko

3 Etäopetusmateriaali ja elektronisen dokumentaation erityispiirteet informaatioteknologian näkökulmasta


Viime vuosina on koettu kasvavaa tarvetta tekstimuotoisen dokumentaation hallintaan. Määrämuotoista, kooltaan pieniä tietoelementtejä sisältävää tietoa on hallittu menestyksekkäästi kehitetyillä tietokannanhallintajärjestelmillä. 1990-luvulla tietokannanhallintajärjestelmien käsittelyyn kehitetyille kielille (kuten esimerkiksi SQL), saatiin laadittua ensimmäiset standardit (Lep96b ). Tämä helpottaa ja yhtenäistää eri tietokannanhallintasovellusten käyttöä. SQL- kyselykieltä käytetään relaatiotietokantojen hallinnassa. Relaatiotietokannat ovat olleet tähänasti tehokas ratkaisu määrämuotoisen tiedon hallintaan ja ne ovatkin esittäneet pääosaa tehdyissä tiedonhallintaratkaisuissa tietojärjestelmiä rakennettaessa.

Tilanne on kuitenkin radikaalisti muuttunut. Organisaation dokumenttien ja niiden elinkaaren hallinta aletaan yhä useammin nähdä toiminnalle kriittisenä resurssina ([T]yr96 . Tarve monimediaisen (multimedia; tietoa esitetään kuvin, äänellä, videona jne.) tiedon tallettamiseen kasvaa. Koko maailman "hyödyllisestä" tiedosta on arvioitu olevan elektronisessa muodossa 10 - 15 % (1991). (Lep96b, [K]oF95 , Tyr96). Useiden eri mediamuotojen hallintatarpeen lisäksi myös tarve tekstimuotoisen tiedon hallintaan ja uudelleenkäyttöön kasvaa räjähdysmäisesti.

Tietoverkkojen ja Intranetin käytön kasvun myötä informaation jakaminen, vaihtaminen ja hallinta korostuvat entisestään. Teksti- ja multimediatiedon hallitseminen on hankalaa (hidasta ja kapasiteettia vaativaa) toteuttaa esim. relaatiotietokannan hallintaohjelmilla. Vaikka näiden ominaisuuksia ja kapasiteettia pyritään kehittämään, on myös ryhdytty etsimään uudentyyppisen tiedon hallintaan tämän tiedon olemukseen paremmin soveltuvia ratkaisuja.

3.1 SGML-standardi ja dokumentin oma looginen rakenne

SGML on standardi, joka mahdollistaa dokumentin sisäisen rakenteen ja semantiikan esittämisen. Tämä tehdään analysoimalla dokumenttien merkityssisältöä, ja laatimalla tämän perusteella dokumentille rakennekuvaus eli DTD (document type description). Dokumentin semanttiset eri rakenneosat merkitään tämän jälkeen DTD:ssä määritellyillä elementtinimikkeillä. Tämä mahdollistaa tekstitiedon käsittelyn tekstin sisällön ja merkityksen perusteella. Dokumentin jakaminen rakenneosiin mahdollistaa edelleen yksittäisten elementtien muuttamisen ja uudelleenkäytön muussa yhteydessä.

SGML-standardin DTD:n elementit ovat perinteisesti olleet varsin pieniä. Syynä tähän on se, että esimerkiksi semanttiseen kokonaisuuteen "Koira" kuuluu vähintään kaksi eri DTD-osaa: otsikko (koira) ja selitys asialle. Selitys voi olla kuva, teksti, ääni tai vaikkapa video. Tarve jakaa dokumentti näin pieniin osiin johtuu siitä, että tekstiin ja otsikkoon tullaan todennäköisesti liittämään erilainen ulkoasu. Elleivät nämä ole erillisinä osina, ei muotoilua voida tehdä, koska SGML- standardin mukainen tekstitiedon säilytysmuoto on ASCII ilman muotoiluja. SGML-standardin mukainen teksti muotoillaan tilannekohtaisesti, tieto pyritään säilyttämään "puhtaana".

Dokumentin jakaminen rakenne-osiin voidaan myös suorittaa etsimällä tekstistä ns. informaatioelementtejä ([L]in96). Tällöin tulee etsiä sen kokoista informaatioyksikköä, joka on itsessään hyödyllinen (ts. informaatio kuvaa jonkin pienen asiakokonaisuuden, vaikkapa käsitteen) ja jota voi käyttää muiden informaatioyksiköiden kanssa yhdistellen. Informaatioyksikön piirteitä ovat (Lin96):

Informaatioelementtejä voi myös kutsua (Lin96) informaatio-olioiksi tai informaatiokomponenteiksi. Toisin kuin dokumenttien ylläpidossa, jossa tarvitaan yhä nopeampia tietokoneita ja lisää levytilaa, voidaan informaatioelementtien ylläpidossa toimia tehokkaasti päivittäen tai muuttaen vain tarpeellisia elementtejä kerrallaan. Lisäksi elementit ovat uudelleenkäytettävissä.
Informaatioelementtejä voidaan ajatella eräänlaisena informaatioavaruutena, jossa eri olioita (elementtejä) liitetään toisiinsa (vaikkapa hyperlinkeillä ) kulloisenkin käyttötarpeen mukaan. Tällöin niistä voi muodostaa dokumentin, joka on olemassa esim. ajan tai käyttäjän funktiona. Se luodaan pyynnöstä ja hajoitetaan tarpeen rauettua uudelleen elementeiksi uutta käyttöä varten.

Kuvio 3. Rakenneosien tyyppien ja granulariteetin välisiä suhteita

Granulariteetilla tarkoitetaan tässä rakenneosan semanttisen merkityksen laajuutta (granulariteetti=raekoko).

3.2 Dokumenttisemantiikan hyödyntäminen

Vaikka etäopetusmateriaalin laadinnassa, ylläpidossa ja käytössä ei aiottaisikaan soveltaa SGML- standardia, on ajatus dokumentin jakamisesta uudelleenkäytettäviin rakenneosiin käyttökelpoinen esimerkiksi oppilaan hakumahdollisuuksien kannalta. Lisäksi

dokumenttianalyysin tuloksesta eli dokumentin semantiikan mukaisesta rakennemallista voidaan johtaa loogiset tiedosto- ja tietokantaratkaisut. Itse asiassa dokumenttien semantiikkaan perustuvaa tiedosto- ja tietokantaratkaisusuunnittelua on toteutettu jo aiemmin. Esimerkiksi ER -mallin perusidea tiedon jakamisesta entiteetteihin joiden välillä on suhteet, tukee tätä perusideaa. ER -mallia käytetään mm. relaatiotietokantaratkaisujen suunnittelussa.

Lep96b Leppänen, Mauri, Tietokannanhallintajärjestelmät. Tietojenkäsittelytieteiden laitos, Jyväskylän yliopisto, Syksy 1996.

[Tyr96] Tyrväinen, Pasi. Organisaation dokumenttien hallinta. Luentomateriaali. Digitaalinen Media, Informaatioteknologian maisteriohjelmat, tietojenkäsittelytieteiden laitos. Jyväskylän yliopisto, syksy 1996.

[KoF95] Koulopolos; Thomas, Frappaolo, Carl, Electronic Document Management Systems - Portable Consultant, McGraw-Hill,1995.

[Lin96] Lindgren, Lars-Olof, Bild, Gillis, Information Elements-The Key to Successful Information Management based on SGML structures. Proceedings of SGML Finland 1996, 4-5.10.1996 Espoo. SGML User's Group Finland 1996.


<< >> Otsikko