Segédletek importálása Microsoft Excel-ből XML EAD formátumban
(Az oldal tartalmának eredetije, és az Excel fájlok Koltai András munkái, forrás: Arca)
Javaslom, hogy a levéltári egységeket inkább az AtoMmal hozzátok létre, de ha valaki szeretné inkább az xml importálást használni, azok számára itt egy rövid leírása annak, amit Koltai András az AtoM oktatáson is megmutatott.
[Excel-ben]
1. A minta Excel fájlok itt találhatók:
• AtoM_EAD_importminta-fondallagj-20160107.xlsx. (A hozzá tartozó minta XML EAD fájl pedig itt.) Fond- és állagjegyzékek konvertálására (tárolóeszközök/dobozok adatai nem beírhatók, a méretek csak ifm-ben szerepelhetnek)
• AtoM_EAD_importminta-teteliratj-20160107.xlsx. (A hozzá tartozó minta XML EAD fájl pedig itt.) Egy fond (esetleg néhány fond) és az alá tartozó levéltári egységek leírásának konvertálására (tárolóeszközök/dobozok adatai is beírhatók, de csak „doboz” és „csomó” típusúak)
2. Megjegyzések a jelzetekről:
• A jelzet után NE legyen pont!
• A többjegyű arab számok helyes sorba rendezéséhez az szükséges, hogy a jelzet tartalmazza a „kezdő nullákat" (001, 002, stb.). Erre két megoldás lehetséges:
a. Az egyszerűbb: az Excel fájl EAD átalakító táblájában a SZÖVEG([cella];"00") függvényt alkalmaztam, így a 10-nél kisebb számok is mindig kétjegyűként jelennek meg. (Három-vagy négyjegyű számok esetén bele kell nyúlni az átalakító táblába, és az idézőjelek közé három ill. négy nullát írni.)
b. A másik megoldás, hogy a jelzetet tartalmazó cellákat (oszlopot) az Excelben „szöveg" vagy "szövegként tárolt szám” formátumra kell alakítani. Utóbbi esetben működik az automatikus kitöltés (AutoFill) is. Úgy érhető el legegyszerűbben, ha aposztrófot írunk a szám elé (pl. '001, '002, stb.).
• A római számok I-VIII. között normálisan használhatók, a továbbiakat viszont a rendszer egyelőre nem tudja sorba rendezni.
• A szövegben úgy látom, hogy nem jó, ha „&” karakter szerepel, mert ekkor hibaüzenetet ad, illetve kihagyja („et”-tel kell pótolni).
3. Kiimásolás Excelből
Az Excel-fájlból az "EAD-konvertáló" tábla szövegét átmásolni Notepad++-ba (CTRL+C > CTRL+V), a piros cellától fölfelé balra.
[ Notepad++-ban]
• Az Excelből kimásolt szöveget illesszük be.
• A kódolást UTF-8-ra állítani (Menü > Kódolás > Átalakítás UTF-8 kódolásra).
• A formátumot XML-re állítani (Menü > Nyelv > XML). Ezután színes kiemelések segítenek, ha ellenőrizni akarjuk a fájl szerkezetét
• Törölni kell az legfelső szintek utáni utolsó záró elemet. (Az importálás ezzel a hibával is működik)
• Elmenteni a fájlt