Введение

Древнерусские тексты — нелинейны, содержат большое количество выносных элементов. Часто также встречаются лигатуры, а деление на слова может отсутствовать вовсе. Работа над переводом текстов житий была начата в конце в конце XX века, задолго до появления кодировки символов Unicode которая позволила бы отобразить все детали рукописного текста. Было принято решение использовать 8-битную кодировку на базе ASCII и специальные правила транслитерации, чтобы компенсировать недостающие символы, которые появились в блоке Cyrillic Extended-B формата Unicode 6.1 только в 2012 году.

Представление текста в различных форматах

Рукопись Транслитерация Unicode
Z -88 ПPEДAXOMЪ. W ПOЗДHOXO&
ЖEHIИ CTAГO#. WБЫ&
ЧAИ ЖE ИMRШE ПPП(Д)БHЫИ.&
B BE(ч)PЪ ГЛUБOKЪ MЛЪKOMЪ&
K+ЛIИ WБXOДИTИ. CЛU&
ШAR KTO ЧTO TBOPRШE.&
И AЩE KIИXЪ OЩDЩAШE&
W(Т) БPATEИ HA MЛTB+# CTO&
RЩИ(X). ИЛИ KHИГИ ПOЧИTA&
ЮЩИXЪ. ИЛИ BЪ QЛM+(X)#&
ПOUЧRЮЩИXCR. ИЛИ ПЛA&
ЧЮЩИXCR O ГPEC+(X) CBOИXЪ.&
ИЛИ ПOKЛOHЫ TBOPRЩИ(X).&
W CИ(X) БЛГOДAPRШE# БГA# MО(л)KO(M)&
W(Т)XOЖAШE. AЩE ЛИ KЫ&
R OБP+TAШE БEC+ДUЮ Z 89
предахомъ. ѡ позднохо
женїи ст҃аго. ѡбы
чаи же имѧше прпⷣбныи.
в ве҇ⷱръ глѹбокъ млъкомъ
кѣлїи ѡбходити. слѹ
шаѧ кто что творѧше.
и аще кїихъ ощꙋщаше
ѿ братеи на мл҃твѣ сто
ѧщиⷯ. или книги почита
ющихъ. или въ ѱл҃мѣⷯ
поѹчѧющихсѧ. или пла
чющихсѧ о гресѣⷯ своихъ.
или поклоны творѧщиⷯ.
ѡ сиⷯ бл҃годарѧше бг҃а мо҇ⷧкоⷨ
ѿхожаше. аще ли кы
ѧ обрѣташе бесѣдѹю