Digitaliseringsflyt og filopplasting

0. Noen nyttige definisjoner

Entitet - Definisjon av en type arkivobjekt. Eksempler kan vĂŠre arkiv, serie, stykke, mappe, fil osv.

Objekt - Et arkivobjekt. En entitet fylt med informasjon. Eksempler pĂ„ serieobjekt og stykkeobjekt kan vĂŠre henholdsvis “Aa, MĂžtebĂžker, 1995-1994” og “L0004, Bestillinger pĂ„ banan, 1980-1985”. Hvis en entitet er en oppskrift pĂ„ lĂžksuppe, er et lĂžksuppeobjekt en faktisk kjele med lĂžksuppe.

Template - En systemmal. Definerer entiteter, felter i entitetene, og sammenhengen mellom entitetene. Eksempler kan vÊre ISADG eller Noark5. Et prosjekt i Asta7 bygges pÄ én template. Man kan mao. ikke ha ulike systemer i samme prosjekt. Man kan dog ha flere prosjekter i én Asta-instans.

 

1. Filopplasting, teknisk forklaring

NĂ„r man trykker “Behandle” i PixEdit, sendes filen til PixEdit-serveren i skyen. Her prosesseres filen (OCR-lesing, fjerning av baksider osv.). Mens filen prosesseres, ligger den i en arbeidsmappe pĂ„ PixEdit-serveren. Arbeidsmappene er navngitt etter Asta7-instans, prosjektID og bruker (feks. “/arbeidsmapper/kunnskaps.stiftelsen-asta.no/k11/peder”). NĂ„r filen arkiveres, flyttes den til import-mappen for Asta7 pĂ„ PixEdit-serveren. Importmappene har samme oppbygning som arbeidsmappene (feks. “importmapper/kunnskaps.stiftelsen-asta.no/k11/peder “). Vi har med andre ord til enhver tid oversikt over hvem som har skannet hvilke filer, og hvilket prosjekt de tilhĂžrer.

Importmappene er koblet opp mot Asta File-Poster. File-Poster er et lite program som lytter til de ulike importmappene og sender filer som dukker opp der videre til riktig entitet, i riktig prosjekt pÄ riktig Asta7-instans. Hvert Asta7-prosjekt har en egen konfigurasjon.

Konfigurasjonen for et prosjekt i File-Poster bestÄr av fÞlgende parametere:

  • Asta7-instans (f.eks. “kunnskaps.stiftelsen-asta.no”)

  • ProsjektID (f.eks. “k11”)

  • Hvilken entitet i templaten filobjektet skal ligge under (f.eks “mappe”, “stykke” eller “noarksak”). NB: Det er pr. i dag bare mulig Ă„ knytte filer under en enkelt entitet pr. prosjekt. Det betyr at hvis “mappe” er definert som det overliggende entitet, mĂ„ alle filer i dette prosjektet knyttes til en mappe. Hvis man forsĂžker Ă„ knytte en fil til f.eks. et stykke, vil importen til Asta7 feile, og filen vil bli liggende i en “error”-mappe pĂ„ PixEdit-serveren.

  • Navnet pĂ„ fil-entiteten i template (f.eks. “fil”)


Fileposter gjÞr to ting nÄr filen sendes til Asta7

  • Det opprettes et filobjekt i Asta7. Her lagres filnavnet, informasjon om nĂ„r objektet ble opprettet osv.

  • Filen lastes opp til fildatabasen.


2. Om filobjekt og digital fil

Det er viktig Ä vÊre klar over forskjellen mellom fil og filobjekt. Filen er den faktske filen, mens filobjektet er registreringen i Asta7. I prinsippet kan den ene eksistere uten den andre. Det betyr at det kan finnes filobjekter uten filer, og filer uten filobjekt. I slike tilfeller er det som regel noe som har gÄtt galt. Filer heter Digitale filer eller Digital files i Asta7. Filobjektet heter som regel fil (avhengig av template).

Man kan se antall filobjekter (“fil” i eksempelet under) pĂ„ et prosjekt under statistikk i detaljvisningen for det aktuelle prosjektet:


Man kan se antall filer (“Digitale filer”) lengre ned i samme vindu:


I detaljvisningen for filobjekt (“fil”) ser vi filobjektet þverst, og den digitale filen nederst (under “Digitale filer”):

 

NB: Hvis det finnes flere filobjekter enn digitale filer betyr det at det finnes filobjekter uten filer. Da har sannsynligvis noe gÄtt galt. Filer kan vÊre slettet eller noe kan ha gÄtt galt under opplasting. Det kan ogsÄ vÊre at samme fil er referert til i ulike filobjekter. Hvis det finnes flere digitale filer enn filobjekter, betyr det at det ligger digitale filer og flyter i fildatabasen uten Ä vÊre knyttet til registreringene i Asta7. Her kan et filobjekt vÊre slettet uten at den tilhÞrende digitale filen er slettet.

NB: Per i dag slettes ikke den tilhÞrende digitale filen nÄr et filobjekt slettes. Dette er fordi en fil (med rette) kan vÊre knyttet til flere filobjekter.

 

3. Om knytning mellom overliggende enhet, filobjekt og digital fil

Som nevnt er angivelsen av overliggende enhet en viktig del av konfigurasjonen i Asta FilePoster. Dette er fordi ID’en til den overliggende enheten utgjþr knytningspunktet mellom overliggende enhet, filreferanse og digital fil. Alle objekter i Asta7 har en unik ID kalt “AM-ID” (kort for “Archive Manager ID”, skrives “_amid” i databasen). AM-ID er skjult for brukeren i Asta7, men den ligger i databasen.

NĂ„r man skriver ut et separatorark fra en overliggende enhet, eksempelvis en mappe, har separatorarket en QR-kode og en UUID (f.eks. “123e4567-e89b-12d3-a456-426614174000”). UUID’en pĂ„ separatorarket er den unike ID’en (AM-ID’en) til mappen i Asta7. Den skannede filen leser separatorarket og bruker UUID’en til Ă„ navngi PDF-filen (altsĂ„ “123e4567-e89b-12d3-a456-426614174000.pdf”). Filen ender opp i import-mappen pĂ„ PixEdit-serveren.

Som nevnt, lytter Asta FilePoster pĂ„ import-mappen. FilePoster leser filnavnet, og bruker UUID’en til Ă„ finne den overliggende enheten. I et tenkte tilfelle hvor FilePoster er konfigurert mot ISADG-prosjektet pĂ„ Ta Norge Hjem, og overliggende enhet er definert som mappe, vil FilePoster lete etter en mappe med AM-ID “123e4567-e89b-12d3-a456-426614174000” pĂ„ prosjekt med id “isadg” pĂ„ asta-instans “tnh.stiftelsen-asta.no”. Her vil den opprette et filobjekt under mappen med AM-ID “123e4567-e89b-12d3-a456-426614174000”. Filobjektet vil inneholde referansen til den digitale filen (“123e4567-e89b-12d3-a456-426614174000.pdf“) og en skjult referanse med AM-ID’en til den overliggende mappen. Hvis FilePoster ikke finner den aktuelle AM-ID’en, vil importen feile, og filen blir liggende i en error-mappe pĂ„ PixEdit-serveren.

NB: Hvis man skanner en fil, trykker arkivĂ©r i PixEdit, og filen ikke dukker opp, kan det skyldes at FilePoster ikke finner den aktuelle AM-ID’en ihht. gjeldende konfigurasjon. Dette kan f.eks. vĂŠre fordi man har brukt feil skilleark, eller at man prĂžver Ă„ skanne under en annen enhet en det som er oppgitt i konfigurasjonen (i dette eksempelet, entitet mappe). Hvis en fil ikke dukker opp i Asta7, har som regel filen strandet pĂ„ PixEdit-serveren. Den er ikke borte, og det er som regel ikke nĂždvendig Ă„ skanne pĂ„ nytt. Kontakt support!

NB: Hvis man bruker samme separatorark to ganger, vil den nye filen overskrive den gamle hvis den blir postet av FilePoster til Asta7. Dette gjelder generelt for import av digitale filer i Asta7. Hvis du laster opp en fil med samme filnavn som en eksisterende fil, vil den nye filen overskrive den gamle.

 

 

Â