Pełna funkcjonalność audiobooka: od pliku MP3 do prawdziwej dostępności

Autor
Monika Zarczuk-Engelsma
Opublikowano
21 paź 2025
Kategoria
Dostępność
Dla wielu czytelników audiobook to po prostu nagranie lektora — dla osoby z niepełnosprawnością wzrokową „dostępność” oznacza znacznie więcej. W pełni dostępny audiobook daje równą kontrolę nad treścią: pozwala na precyzyjne nawigowanie, odnajdowanie cytatów, przeskakiwanie rozdziałów, korzystanie z zakładek, regulację prędkości bez utraty jakości, a tam gdzie trzeba — zapewnia synchronizację z tekstem i nadmiarowe opisy elementów nienarracyjnych. Innymi słowy: dostępność to nie tylko „mówiony tekst”, lecz kompletna funkcjonalność, porównywalna z dobrze przygotowanym plikiem tekstowym.
Kto czyta audiobooki
Jeszcze kilkanaście lat temu audiobooki były kojarzone głównie z książkami mówionymi wydawanymi przez biblioteki dla osób niewidomych. Z czasem pojawiły się w komercyjnych księgarniach, a wraz z rozwojem smartfonów i platform streamingowych stały się jedną z najpopularniejszych form obcowania z literaturą. Dziś audiobooków słuchają wszyscy — w drodze do pracy, podczas biegania czy gotowania. To już nie nisza, lecz pełnoprawny segment rynku wydawniczego, który stale rośnie. Wraz z tym rozwojem rośnie też świadomość, że audiobook powinien być dostępny dla każdego, nie tylko w sensie technicznym, ale i funkcjonalnym.
Pierwsze audiobooki powstały już w latach 30. XX wieku? Biblioteki w Stanach Zjednoczonych i Wielkiej Brytanii nagrywały wtedy książki na płytach gramofonowych, aby osoby niewidome mogły mieć dostęp do literatury. Jedna książka zajmowała czasem kilkadziesiąt płyt! Dziś, w dobie cyfrowej, całe biblioteki mieszczą się w kieszeni, a audiobooki są słuchane masowo.
Zgodnie z oficjalnym wpisem Guinness World Records, najdłuższy audiobook to Shree Haricharitramrut Sagar, który trwa 146444 minuty i 52 sekundy (2240 godzin i 44 minuty , ponad 101 dni słuchania). Nagranie zostało zrealizowane przez Gyanjivandasji Swami i Ishwarcharandasji Swami z Indii w 2017 roku, a jego celem było upowszechnienie biografii Lorda Swaminarayana. Jest to wyjątkowy przypadek w historii audiobooków, ponieważ dzieło to nie jest typową książką literacką, lecz religijnym tekstem duchowym. Nagranie to jest dostępne w formie audio, co stanowi interesujący przykład zastosowania technologii w kontekście duchowości i religii.
Typowa powieść w wersji audio trwa zwykle od 8 do 20 godzin. Takie ekstremalne przykłady pokazują, jak bardzo różnorodny może być świat audiobooków.
Dział Zbiorów dla Niewidomych Głównej Biblioteki Pracy i Zabezpieczenia Społecznego w Warszawie posiada około 31 tysięcy książek na kasetach, 6500 na płytach CD, 15 tysięcy tytułów we formacie Czytak oraz 16500 tytułów w formacie DAISY
Warto dodać, że biblioteki publiczne w Polsce również zwiększają dostępność audiobooków również z myślą o osobach niewidomych i słabowidzących. Na przykład, w Bibliotece w Wiśle dostępnych jest 2141 audiobooków, a w Cieszynie 3667 tytułów.
Co musi mieć w pełni dostępny audiobook — lista kluczowych elementów
Zwykle wydaje się, że audiobook, to podzielona na części, przeczytana głośno i nagrana w studiu książka. Ten format ma jednak dużo więcej możliwości, kryje w sobie duży potencjał, również pod kontem pełnej dostępności. O co trzeba zadbać, by audiobook stał się funkcjonalny i naprawdę przydatny?
Nawigowalna struktura
Użytkownik powinien móc szybko skakać między poziomami struktury: rozdział → podrozdział → sekcja → paragraf → strona (jeśli ma sens). To znacznie wykracza poza „ciągłe odtwarzanie” i wymaga odpowiedniego oznaczenia struktury w pliku (np. nagłówki, spisy treści, mapy nawigacyjne). Format DAISY i EPUB 3 oferują mechanizmy umożliwiające taką nawigację.
Skoordynowane/ synchronizowane audio i tekst (gdy istnieje tekst)
Publikując E-booki, takie jak np. podręczniki, poradniki lub audiobook z możliwością śledzenia tekstu), warto użyć mechanizmów synchronizacji (SMIL / Media Overlays w EPUB 3). Dzięki temu czytelnik może przejść do konkretnego zdania lub akapitu i usłyszeć je natychmiast. To ułatwia naukę, cytowanie i szybkie odszukiwanie fragmentów.
Wysoka jakość nagrania i czytelny sposób narracji
Technika nagrania i mastering mają wpływ na zrozumiałość. Należy: nagrywać w dobrych warunkach (niski poziom tła), stosować klarowną dykcję, odpowiednie tempo i naturalne przerwy; zadbać o prawidłowy poziom głośności, niski szum tła i brak kompresji, która zniekształca przyspieszenia/zwolnienia odtwarzania. Wskazówki dotyczące jakości audio znajdziesz w wytycznych W3C.
Pełne meta-dane i oznaczenia dostępności
W metadanych publikacji powinny znaleźć się informacje o formatach dostępnych dla danej publikacji (np. EPUB 3 z Media Overlays, DAISY/DTBook, MP3 + SMIL, wersja tekstowa), o dostępności treści ilustracji (czy opisów) oraz o ewentualnych ograniczeniach (np. DRM). Dobre metadane ułatwiają wyszukiwanie i dystrybucję do bibliotek dla osób z dysfunkcjami (Bookshare, biblioteki dla niewidomych).
Obsługa odtwarzaczy i interfejsów pomocniczych
Nawigacja, zakładki, szybkość odtwarzania i dostęp do spisu treści muszą być dostępne zarówno z poziomu aplikacji/odtwarzacza, jak i przez technologie wspomagające (czytniki ekranu, klawiatura, sterowanie głosowe). Tworząc audiobook, myśl o tym, jak będzie on odtwarzany — czytelnicy korzystają z rozmaitych aplikacji i urządzeń, a nie wszystkie odtwarzacze poprawnie obsłużą „niestandardowe” mechanizmy. Istnieją wytyczne i wymogi odtwarzania Media Overlays.
Treści dodatkowe: opisy, tabele, grafiki, równania
Jeśli audiobook zawiera ważne treści wizualne (diagramy, tabele, wykresy, zdjęcia), nie wystarczy pominięcie ich — trzeba zapewnić alternatywną (słowną) wersję: skrócone opisy w narracji lub odsyłacze do pełnych opisów w wersji tekstowej. W przypadku matematyki lub skomplikowanych tabel warto rozważyć dodatkowe pliki tekstowe z opisami (lub wykorzystanie MathML w połączeniu z synchronizacją), aby informacje były dostępne dźwiękowo i przedstawione w logicznej, zrozumiałej strukturze.
Wersje i formaty „born accessible” oraz konwersje
Najlepiej tworzyć audiobook „od początku” z myślą o dostępności (born accessible) zamiast dopiero adaptować zwykły plik audio. Gdy jednak adaptujesz istniejący audiobook, upewnij się, że dodajesz warstwę nawigacji i metadanych (np. produkcja DAISY, EPUB3 z Media Overlays, albo paczka MP3 + SMIL). Projekty, które publikują poradniki dla wydawców, pokazują, że workflow „z dostępnością w procesie” oszczędza czas i koszty.
Przykłady rozwiązań i standardów, które warto znać
DAISY / NISO Z39.86 — standard dla cyfrowych książek mówionych, stworzony z myślą o użytkownikach z problemami w dostępie do druku; oferuje rozbudowane poziomy nawigacji.
EPUB 3 + Media Overlays (SMIL) — współczesny sposób synchronizacji audio z treścią HTML/EPUB; pozwala tworzyć zarówno „tekst z narracją”, jak i „audio-only EPUB” z rozbudowaną nawigacją.
W3C WAI — wytyczne dotyczące audio i wideo — praktyczne zalecenia dotyczące jakości audio, metadanych i zgodności z WCAG (np. dostarczania redundantnych informacji sensorycznych).
Bibliografia:
https://www.w3.org/publishing/epub3/epub-mediaoverlays.html
https://www.w3.org/WAI/media/av/
https://daisy.org/info-help/navigable-audio-only-epub3/
https://daisy.org/activities/standards/media-overlays-playback-requirements/
https://daisy.org/activities/standards/daisy-niso-z39-86/
https://inclusivepublishing.org/accessible-audiobook-workflow-guide/
https://eboundcanada.org/cnib-accessible-audiobook-production/
https://dequeuniversity.com/checklists/web/audio-video