Древнерусские тексты — нелинейны, содержат большое количество выносных элементов. Часто также встречаются лигатуры, а деление на слова может отсутствовать вовсе. Работа над переводом текстов житий была начата в конце в конце XX века, задолго до появления кодировки символов Unicode которая позволила бы отобразить все детали рукописного текста. Было принято решение использовать 8-битную кодировку на базе ASCII и специальные правила транслитерации, чтобы компенсировать недостающие символы, которые появились в блоке Cyrillic Extended-B формата Unicode 6.1 только в 2012 году.
Представление текста в различных форматах
| Рукопись | Транслитерация | Unicode |
![]() |
Z -88 ПPEДAXOMЪ. W ПOЗДHOXO& ЖEHIИ CTAГO#. WБЫ& ЧAИ ЖE ИMRШE ПPП(Д)БHЫИ.& B BE(ч)PЪ ГЛUБOKЪ MЛЪKOMЪ& K+ЛIИ WБXOДИTИ. CЛU& ШAR KTO ЧTO TBOPRШE.& И AЩE KIИXЪ OЩDЩAШE& W(Т) БPATEИ HA MЛTB+# CTO& RЩИ(X). ИЛИ KHИГИ ПOЧИTA& ЮЩИXЪ. ИЛИ BЪ QЛM+(X)#& ПOUЧRЮЩИXCR. ИЛИ ПЛA& ЧЮЩИXCR O ГPEC+(X) CBOИXЪ.& ИЛИ ПOKЛOHЫ TBOPRЩИ(X).& W CИ(X) БЛГOДAPRШE# БГA# MО(л)KO(M)& W(Т)XOЖAШE. AЩE ЛИ KЫ& R OБP+TAШE БEC+ДUЮ Z 89 |
предахомъ. ѡ позднохо женїи ст҃аго. ѡбы чаи же имѧше прпⷣбныи. в ве҇ⷱръ глѹбокъ млъкомъ кѣлїи ѡбходити. слѹ шаѧ кто что творѧше. и аще кїихъ ощꙋщаше ѿ братеи на мл҃твѣ сто ѧщиⷯ. или книги почита ющихъ. или въ ѱл҃мѣⷯ поѹчѧющихсѧ. или пла чющихсѧ о гресѣⷯ своихъ. или поклоны творѧщиⷯ. ѡ сиⷯ бл҃годарѧше бг҃а мо҇ⷧкоⷨ ѿхожаше. аще ли кы ѧ обрѣташе бесѣдѹю |
