Metadane wizytówką dostępności

Illustration on a pink background showing a large tablet with books on its screen. A woman holding a magnifying glass examines one of the books, while a man stands to the right, reading from a mobile device.

Autor

Monika Zarczuk-Engelsma

Opublikowano

19 lis 2024

Category

Dostępność

Dobrze skonstruowane metadane są kluczem do odkrywalności i dostępności publikacji cyfrowych. Tworzą pierwsze wrażenie o książce zachęcając potencjalnych czytelników do zapoznania się z nią lub do jej zakupu.

Znaczenie metadanych rośnie wraz z rosnącą liczbą e-booków w obrocie, a w kontekście dostępności wzrośnie skokowo w czerwcu 2025 roku wraz z wejściem w życie Dyrektywy o Dostępności (EAA). Nie bez znaczenia jest fakt, że wydawcy wykorzystują metadane do analizy rynku i planowania produkcji.

Na koniec dnia warto zrozumieć kto jest odpowiedzialny za tworzenie poprawnych metadanych oraz które elementy metadanych są kluczowe w kontekście dostępności, na przykład dla niewidomych czytelników i czytelniczek.

Co to są metadane

Metadane to dane o danych. Najprościej mówiąc metadane to “etykietka” opisująca książkę, gdzie znajdują się wszystkie podstawowe informacje jak ISBN, autor, tytuł, data oraz format czy gatunek (im bardziej szczegółowo, tym lepiej). To właśnie one stanowią drogowskaz dla czytelników, bibliotekarzy i wyszukiwarek, prowadząc ich do konkretnych tytułów w oczekiwanej, optymalnej, dostępnej postaci. Zbiór informacji, które powinny znaleźć się w metadanych książki elektronicznej zależy od wielu czynników. Na przykład w przypadku streamingowanego audiobooka warto wiedzieć, czy książka jest czytana przez lektora czy przez AI, a jeśli jest to lektor – to kim on/ ona jest? (Można podać wiele przypadków z rynku książki w Polsce, gdzie w opisie audiobooka brak tej podstawowej informacji). W przypadku e-booka często znajdujemy informację, że możemy zakupić go w formacie EPUB, ale w przypadku dostępności występuje istotna różnica pomiędzy formatem EPUB2 oraz EPUB3. (Tylko EPUB3 gwarantuje – a przynajmniej w teorii - pełną dostępność).

Dlaczego metadane są ważne

Metadane są kluczowe dla identyfikacji e-booka, odnalezienia, zrozumienia i ponownego wykorzystania.

  • Dzięki precyzyjnym metadanym czytelnik łatwiej odnajdzie interesującą go książkę, korzystając z wyszukiwarek internetowych lub katalogów bibliotecznych.

  • Poprawnie zdefiniowane metadane z góry definiują możliwość dostępu do książek osobom z niepełnosprawnościami.

  • Dokładne metadane ułatwiają zarządzanie ogromnymi zbiorami cyfrowymi.

  • Standaryzowane metadane umożliwiają wymianę informacji między różnymi systemami i platformami. Pamiętajmy, że na rynku są setki tysięcy, jeśli nie miliony tytułów e-booków (w zależności od języka, na przykład po polsku mniej, po angielsku więcej).

Standardy dotyczące stosowania metadanych

Zacznijmy od tego, że książki są nie tylko bardzo liczne – mamy kilkadziesiąt milionów tytułów książek w obiegu, ale także bardzo różne: książki akademickie czy naukowe są często dostępne na innych zasadach (creative commons, open-access) a podręczniki szkolne na innych (najczęściej podlegają swoistym krajowym regulacjom). Chcielibyśmy, aby wszystkie były dostępne dla osób niewidomych i powinniśmy wiedzieć z góry, czy faktycznie są dostępne. Powieści wyglądają inaczej niż bajki dla dzieci, a kolorowanki dla dzieci to odrębny kosmos, który zapewne nie będzie analizowany pod kątem dostępności e-booków dla osób niewidomych. Słowem świat e-booków jest złożony.

Istnieją co najmniej trzy główne kierunki, z których przychodzą wytyczne na temat tworzenia dostępnych e-booków: od wydawców (głównie standard ONIX), od twórców formatów zapisu e-booków (jak PDF, EPUB), od twórców wytycznych na temat dostępności jako takiej: WCAG & W3C.

Nakładając na siebie bogactwo tytułów na rynku i bogactwo wytycznych dochodzimy do metadanych od innej strony, po prostu różnorodność formatów danych i systemów informacji wymaga ujednoliconych standardów, które zapewnią interoperacyjność i efektywność zarządzania informacją. W praktyce nie ma jednego konkretnego zbioru wytycznych, którego mogliby się trzymać wydawcy.

Kto standaryzuje metadane

Wybór odpowiednich standardów metadanych zależy od konkretnych potrzeb i wymagań. W rezultacie mamy kilka podmiotów, które podpowiadają, jak ich zdaniem ma to wyglądać. Ważne jest, aby zrozumieć różnice między poszczególnymi standardami. Najbardziej rozpoznawalne organizacje to:

1. World Wide Web Consortium (W3C)

Międzynarodowa organizacja non-profit, która skupia się na tworzeniu standardów, umożliwiających tworzenie, publikowanie i łączenie treści w sieci Web.

W3C opracowuje szereg standardów związanych z metadanymi, w tym standardy dla RDF (Resource Description Framework), który jest językiem opisu zasobów w sieci Web.

Dla osób niewidomych najważniejsze są wytyczne WCAG (Web Content Accessibility Guidelines) w wersji 2.1, implementowane w wielu aktach prawnych w Unii Europejskiej.

2. EDItEUR

EDItEUR to międzynarodowa organizacja non-profit standaryzująca rynek książki, odpowiedzialna za rozwój specyfikacji ONIX.

ONIX to standard wymiany informacji o produktach wydawniczych. Jest szeroko stosowany w branży wydawniczej i umożliwia wymianę danych między różnymi systemami.
Dla dostępności kluczowe znaczenie ma lista 196, którą można odnaleźć pod likiem poniżej. Co ważne korzystając z tego liku otrzymamy wgląd w specyfikację ONIX w sposób dostępny dla osób niewidomych.

3. Schema

Schema (https://schema.org/) stworzona przez światowych gigantów zajmujących się wyszukiwaniem informacji w Internecie: Google, Inc., Yahoo, Inc., Microsoft Corporation, Yandex. Cztery wymienione podmioty są sponsorami specyfikacji, która mówi o tym, jak należy tworzyć opis dowolnego bytu (jednostki) tak, żeby roboty przeszukujące strony www rozumiały, co jest czym.

Dla wielbicieli wyzwań: warto zacząć od zrozumienia elementu specyfikacji “accessModeSufficient”.

4. Dublin Core Metadata Initiative (DCMI)

Międzynarodowa organizacja non-profit, która opracowuje i utrzymuje zbiór prostych, interoperacyjnych metadanych, które można zastosować do dowolnego zasobu cyfrowego. DCMI skupia się na tworzeniu podstawowych elementów metadanych, które są na tyle uniwersalne, że mogą być stosowane w różnych dziedzinach i środowiskach. Oferuje szereg standardów, w tym Dublin Core, które jest jednym z najbardziej rozpowszechnionych zestawów metadanych na świecie stosowanych powszechnie przez biblioteki. W ostatnich latach wielką popularnością cieszy się także standard MARC.

MARC (Machine-Readable Cataloging) to międzynarodowy standard służący do zapisu i wymiany danych bibliograficznych w formie elektronicznej. Można go porównać do uniwersalnego języka, którym komunikują się ze sobą biblioteki na całym świecie, umożliwiając im wymianę informacji o zasobach, które posiadają. Format ten pozwala na zapisanie wielu szczegółowych informacji o książce, takich jak tytuł, autor, wydawca, rok wydania, ISBN, słowa kluczowe, a także co ważne, informacje o dostępności dla osób z niepełnosprawnościami. Dzięki MARC dane bibliograficzne mogą być łatwo przesyłane między różnymi systemami komputerowymi, co umożliwia tworzenie dużych baz danych i katalogów zbiorów.

5. International Organization for Standardization (ISO)

Skupia się na tworzeniu standardów, które ułatwiają międzynarodową wymianę dóbr i usług. Opracowuje szereg standardów związanych z metadanymi, dla różnych dziedzin, takich jak bibliotekarstwo, archiwistyka i zarządzanie informacją. Dla tworzenia dostępnych e-booków podstawowe standardy ISO to ISO PDF/UE, ISO EPUB, jeśli chodzi o metadane będą to standardy ISO ISBN, ISO DOI

Można wymienić jeszcze co najmniej dwie organizacje: OASIS (Organization for the Advancement of Structured Information Standards), która skupia się na tworzeniu standardów, które ułatwiają wymianę informacji między różnymi systemami i aplikacjami i opracowuje standardy metadanych, w tym dla katalogów, archiwów i innych systemów zarządzania informacją oraz METS (Metadata for e-books) standard opracowany przez organizację OCLC, który służy do opisywania złożonych obiektów cyfrowych takich jak e –booki dla środowisk bibliotecznych.

Kryptonim “ONIX List 196”

Wybór odpowiedniego standardu zależy od celów (np. dystrybucja w sklepach internetowych, katalogowanie w bibliotekach), od tego jakie systemy będą wykorzystywane do zarządzania i publikowania e-booków, a nawet złożoność książki - im bardziej złożona jest książka, tym bardziej będzie potrzebny szczegółowy opis.

Dobra wiadomość jest następująca: to wydawca jest odpowiedzialny za stworzenie pliku oraz metadanych na potrzeby rynku, a biblioteki tworzą wyłącznie metadane na potrzeby wypożyczeń. W przestrzeni Internetu oba standardy się powinny spotkać, zatem im lepszy opis pochodzący od wydawcy, tym większa szansa na to, że zostanie uwzględniony przez inne systemy.

Najczęściej używanym standardem w branży wydawniczej jest ONIX, dlatego warto go przyjąć jako podstawę. W każdym wydawnictwie sytuacja powinna być zatem następująca. W przypadku pytania o metadane musi być jedna osoba (właściciel, dyrektor, szef produkcji, redaktor naczelny, szef marketingu, specjalista ds. Dostępności - w świecie idealnym), która wie, że w organizacji jest jakaś inna osoba, która zna założenia ONIX lub zna kogoś, kto zna założenia ONIX. (Specjalista ds. ONIX może być osobą na zewnątrz wydawnictwa, byle znaną w wydawnictwie).

Niemal kluczowe jest to, że standard ONIX oraz WCAG są ze sobą “zsynchronizowane” czy “kompatybilne”, zatem mamy do czynienia z pomostem między światem wydawniczym i światem dostępności.

Następnie specjalista ds. ONIX (wewnętrzny lub zewnętrzny) powinien w pełni zrozumieć bogactwo możliwości występujące na wspomnianej liście 196 ONIX dotyczącej dostępności.

W efekcie powinno dojść do połączenia podstawowych i “dostępnościowych” elementów opisu e-booka, jak:

  • ISBN (Międzynarodowy Standardowy Numer Książki), a jeśli e-book nie posiada numeru ISBN to inny rozpoznawalny identyfikator jak DOI (Digital Object Identifer)

  • Precyzyjny i jednoznaczny tytuł książki, najlepiej, jeśli jest podawany odrębnie od numeru tomu czy nazwy serii wydawniczej (jeśli występuje numeracja, to powinna być podawana w odrębnych polach, a nie w polu tytuł. Tak samo w polu tytuł nie powinniśmy wpisywać na przykład formatu typu Mobi czy ePub)

  • Imię i nazwisko autora lub autorów.

  • Imię i nazwisko innych współtwórców, jeśli występują (tłumaczy, redaktorów, ilustratorów)

  • Nazwa wydawnictwa

  • Data publikacji i data udostępnienia na rynku (jeśli są inne, a często są różne daty wydania dla książek drukowanych i wersji e-book)

  • Krótki i treściwy opis zawartości.

  • Dokładne określenie gatunku literackiego, tematyki, a jeśli to możliwe, podgatunków. Jeśli stosujemy ONIX, to najlepiej także od razu zapoznać się i zastosować opis w schemacie Schema, stanowiącym podstawowy schemat branży wydawniczej.

  • Słowa kluczowe, które opisują treść książki i ułatwiają jej wyszukiwanie.

  • Język, w jakim została napisana książka.

  • Cena, za jaką możemy takiego e-booka nabyć

Z punktu widzenia dostępności

  • Format pliku elektronicznego z dokładnym wyjaśnieniem (jeśli jest to PDF, czy plik posiada zabezpieczenie DRM, jeśli jest to EPUB, z którą wersją EPUB mamy do czynienia EPUB2 czy EPUB3). Warto zacząć od analizy list 79 oraz 150 ze specyfikacji ONIX

  • Dane dotyczące dostępności książki dla osób z niepełnosprawnościami, jak czy jest dostępna w formacie tekstowym, czy ma alternatywne opisy obrazów, czy spełnia wytyczne A lub AA WCAG 2.1, czy jest zgodna z wytycznymi ISO np. PDF – UA-2 , czy posiada przeszukiwalne indeksy, czy posiada przeszukiwalny spis treści, czy wzory matematyczne są zgodne z wymaganiami MathML, czy numeracja stron z wersji drukowanej jest także dostępna w wersji cyfrowej), czy są zsynchronizowane wersje audio i e-booka (jeśli występują oba formaty), czy są stosowane znaczniki ARIA. Do tego istnieje sporo wytycznych dla osób słabowidzących dotyczące kontrastu, kolorystyki, rodzaju fontu. Wszystko to mieści się pod kryptonimem “ONIX list 196”.

  • Dane dotyczące wyłączeń spod regulacji prawnych. Pamiętajmy, że mikroprzedsiębiorstwa są wyłączone spod wymagań Dyrektywy o dostępności, z którą - notabene - muszą zapoznać się wszyscy sprzedawcy e-booków na terenie UE. Obowiązek wprowadzania dostępnych e-booków i poprawnych metadanych na temat e-booków dotyczy też wydawców brytyjskich czy amerykańskich sprzedających e-booki w UE.

Podsumowanie: wydawco pamiętaj, że...

Jest wiele powodów, dla których warto zadbać o dobrze skonstruowane metadane. Nie tylko będą wymagane przez Dyrektywę ds. Dostępności UAA już od czerwca 2025 roku w odniesieniu do e-booków. Są one kluczem do satysfakcjonującego wyszukiwania książek elektronicznych. Dzięki nim każdy czytelnik niezależnie od swoich potrzeb i ograniczeń może łatwo znaleźć i korzystać z interesujących go publikacji. Również silniki wyszukiwania, takie jak Google, korzystają z metadanych, aby indeksować i klasyfikować książki. Im lepiej to zrobisz, im lepiej wykorzystasz kategorie, hasła kluczowe, opis książki, tym większa szansa, że Twoja książka pojawi się na pierwszych stronach wyszukiwania. Im lepiej zrozumiesz metody przeszukiwania metadanych, tym lepiej się przygotujesz. Algorytmy rekomendacyjne wykorzystywane przez sklepy z e -bookami także opierają się na metadanych. Im dokładniej opiszesz swoją książkę, tym bardziej trafne będą sugestie dla czytelników, którzy już kupili podobne pozycje. Metadane to system naczyń połączonych.

 

Źródła:

https://www.editeur.org/files/ONIX%203/APPNOTE%20Accessibility%20metadata%20in%20ONIX%20(advanced).pdf

https://w3c.github.io/publ-a11y/UX-Guide-Metadata/draft/principles/

https://w3c.github.io/publ-a11y/UX-Guide-Metadata/draft/techniques/onix-metadata/index.html 

https://w3c.github.io/publ-a11y/UX-Guide-Metadata/draft/techniques/epubmetadata/index.html

https://www.w3.org/TR/WCAG21/

https://www.editeur.org/83/overview/

https://www.editeur.org/files/ONIX%20for%20books%20-%20code%20lists/ONIX_BookProduct_Codelists_Issue_67.html

https://schema.org/accessModeSufficient