Thema Datagedreven assetmanagement
Linked Data, SPARQL-endpoint, Publicist, LDP, RDF-OWL, CSPEC... er zijn heel wat termen die de ronde doen.
Eindelijk, een teken van leven. Na drie maanden werken bij CROW begin ik eindelijk een beetje mee te praten. Want wat doet mijn nieuwe team, Basisspecificaties, eigenlijk? Wat een berg termen: Linked Data, SPARQL-endpoint, Publicist, LDP, producent, CDOC, open data, objecttypebibliotheken, Producent, open standaarden, turtle-file, autorisatie, API, Consument, ProContract, aanleverspecificaties, Linked Data Platform, BIM...
Wie meteen weet wat bovenstaande termen betekenen, mag ophouden met lezen. Dan kan ik in mijn onnozelheid een poging doen het uit te leggen aan gewone stervelingen. Want in de basis is dit natuurlijk de grote uitdaging: We willen dat steeds meer van ons werk automatisch door computers gebeurt. Dit in plaats van zelf steeds lijsten bij te houden, informatie in verschillende programma's te vergelijken, informatie over te typen en ander dodelijk saai werk. Mensen begrijpen elkaars teksten en tekeningen heel gemakkelijk en door te overleggen halen we de grootste misverstanden er wel uit. Maar ja, een computer begrijpt níet zomaar dat die weg op jouw tekening, dezelfde weg is die in je rapport staat. En dat is nog één computer bij één bedrijf. Je wilt dat de computer van een ander, bij een ander bedrijf, jouw informatie ook kan begrijpen. En dus moet je ineens, in plaats van verhalen schrijven en tekeningen maken, data maken, structuur aanbrengen en allemaal ingewikkelde technologie gebruiken. Mensen zouden bovendien geen mensen zijn, als er dan geen jargon en verwarring over termen en definities ontstaan.
En hypes. Waar je op de website van CROW nog informatie kunt vinden over een 'Bouwwerk Informatie Model' spreekt men in de industrie over een 'Digital twin'. Waar CROW praat over 'Linked Data' zoeken recruiters mensen met ervaring met 'Knowledge Graphs'.
Zo, genoeg termen, nu de verklaring. Maar niet alles tegelijk, dat wordt een beetje veel. Laat ik nu beginnen met het plaatje van ons dataplatform, dat ons team al zo vaak heeft gedeeld:
Meteen duidelijk, of niet? Ik begin links, waarbij ik onderstaande definities van Wikipedia heb geleend.
De producent
De producent: een overheidsinstelling, aannemer, ingenieursbureau of kennisplatform die informatie wil delen met andere partijen, of wil uitwisselen tussen afdelingen. CROW is zelf ook een producent. En zoals eerder gezegd: als je de informatie deelt door er een verhaal of een tekening van te maken, begrijpt de mens jou wel, maar een computer niet. Die informatie moet daarom worden opgedeeld in door een computer behapbare brokjes, data dus.
Data
- Data = gegevens
- Gegevens = de vastgelegde uitdrukking van een feit
- Een feit is een gebeurtenis of omstandigheid waarvan de werkelijkheid vaststaat, doordat het ofwel zintuiglijk waargenomen ofwel instrumenteel gemeten kan worden.
Dat is een lekker ingewikkelde, bijna filosofische manier van beschrijven dat je je tekst hebt opgeknipt in kleine brokjes informatie, zoals getallen, formules of woorden, en in een computer hebt gezet. Nou, mooi, al je kennis, kunde en informatie is Data geworden. Maar ja, wat is nu het verband tussen al die data? Daarom maak je een dataset.
Dataset
Een dataset is een gegevensverzameling. Oftewel, een samenhangend geheel van gegevens waar zowel een mens als een computer in kan zoeken. En handig, want je informatie kan in de loop van de tijd wijzigen, dan kan je een nieuwe set publiceren die een ander weer kan gebruiken. Dat is in het onderhoud een stuk makkelijker dan elk brokje informatie afzonderlijk laten vervallen en vervangen.
Om automatisch (dus zonder overtypen of correcties door de mens) gegevens te kunnen uitwisselen tussen verschillende partijen, met verschillende software applicaties, is meer nodig.
Linked data
Linked Data is een slimme methode om informatie op te slaan. Onderdelen en relaties tussen onderdelen worden heel precies gedefinieerd. De technologie hierachter is die van het internet en gebruikt open standaarden die ontwikkeld worden door het World Wide Web Consortium. Het voordeel hiervan is dat je informatie maar een keer hoeft op te slaan en op meerdere manier kan gebruiken. Daarnaast wordt zoeken naar informatie makkelijker omdat de informatie gestructureerd en geordend is. Het grote, krachtige voordeel van automatisering is dat met Linked Data verbanden kunnen worden gelegd tussen datasets die ook automatisch begrepen en verwerkt kunnen worden door computers. Hiermee kan een computer begrijpen dat de weg op je tekening en de eisen aan de weg in je contract van een provincie hetzelfde zijn.
Nu heb je, als Producent, dus een of meerdere Datasets, in de vorm van Linked Data, die je aan wilt bieden aan CROW (Je Publicist), zodat andere partijen ook bij je data kunnen. Helaas, je bent er nog niet: ook al zijn er open standaarden om informatie te kunnen uitwisselen, je hebt ook goede definities nodig van welke data het betreft en welke verbanden er bestaan. Die definities, die heeft de Publicist gemaakt, staan in de Aanleverspecificaties.
Over de Publicist en de Aanleverspecificaties een volgende keer meer.
Elisabeth Klören
Delen via