Введение
ANNIS — это платформа с открытым исходным кодом, представляющая собой веб-ориентированную систему для поиска и визуализации многослойных корпусов, разработанная Берлинским университетом имени Гумбольдта, Джорджтаунским университетом и Потсдамским университетом.
Данное руководство содержит обзор системы ANNIS, а также обучающий материалы по формированию запросов, экспорту данных и проведению частотного анализа. Эта инструкция — адаптация оригинального руководства на английском языке, с которым Вы можете ознакомиться здесь.
Интерфейс
Интерфейс ANNIS состоит из нескольких областей, наиболее важными из которых являются форма поиска слева и вкладка результатов справа.

Форма поиска
Форма поиска расположена в левой части окна интерфейса. В её нижней части отображается список доступных корпусов. Нажав на строку с названием корпуса, можно выбрать, по каким корпусам будет выполняться поиск.
Поле "Please enter AQL query" в верхней части формы используется для ручного ввода запросов. Как только выбран один или несколько корпусов и введён или изменён запрос, он автоматически проверяется, а возможные ошибки синтаксиса отображаются в поле "Status" ниже.
После ввода корректного запроса нажатие кнопки "Search" приводит к отображению в поле Status количества найденных совпадений и документов в выбранных корпусах, а также открывает вкладку "Query Result", где отображаются первые результаты поиска.
Для более точной настройки поиска можно нажать "Search Options", чтобы раскрыть дополнительные параметры. Контекст вокруг найденных совпадений в списке результатов задаётся параметрами "Left Context" и "Right Context" и может изменяться с каждой стороны (по умолчанию — до 20 токенов). Также можно настроить количество результатов на странице и порядок их отображения (по возрастанию, по убыванию или случайным образом).
Окно результатов
Окно результатов по умолчанию отображает результаты поиска постранично — по 10 совпадений на странице (это можно изменить в "Search Options"). Панель инструментов в верхней части окна позволяет переходить между страницами. Вы можете делиться ссылками на свои запросы, копируя текущий URL браузера — это удобно для отправки по электронной почте или цитирования, что позволяет другим пользователям воспроизвести ваш запрос.
Список результатов изначально отображает конкорданс KWIC (key word in context) найденных позиций в выбранных корпусах: совпадающие фрагменты выделяются цветом, а контекст по обе стороны отображается чёрным цветом. Цвета совпадений соответствуют цветам поисковых выражений в поле запроса (красный для элемента поиска №1, фиолетовый для №2 и т.д.).
Контекст можно настраивать для каждого отдельного результата поиска вплоть до максимального значения, допустимого для текущего корпуса. Грамматическая разметка у токенов отображается серым цветом под каждым токеном; при наведении курсора мыши показывается название аннотации и пространство имён. Лишние аттрибуты можно скрыть: для этого откройте "Token Annotations" и выберите теги, которые не должны отображаться. Нажав на значок "+" рядом с "Text structure", можно увидеть теги структуры текста, такие как заголовки ("head"), главы ("div1"), подразделы ("div2"), цитаты ("q") и другие.