Общее число репрессированных за веру православных христиан является исключительно важной характеристикой гонений, обрушившихся на Церковь в XX веке. Именно оно интегрально определяет масштаб явления. Однако это число до сих пор остается дискутируемым, поскольку для его оценки применяются различные методики. Автором опубликована работа [1], в которой предложен метод подсчета, основанный на динамике наполнения Базы данных "За Христа пострадавшие". Эта База данных функционирует в ПСТГУ с 1993 г., и в настоящий момент содержит более 36 тыс. имен (в дальнейшем База). В статье [1] дано описание метода и приведена оценка общего числа репрессированных за веру. В настоящей работе описывается развитие этого метода и дается новая уточненная оценка, полученная после учета высказанных замечаний. Об условиях корректности оценки и методике подсчетов В работе [1] приводится основная формула для подсчета, которая имеет вид: N=Nb*K/Kb. (1)
где:
N - искомая оценка общего числа новомучеников;
О последнем условии необходимо сказать подробнее. Под репрезентативностью понимается свойство некой выборки сохранять любые пропорциональные отношения меду подмножествами генеральной совокупности. Как База, так и список ввода являются выборками, и, следовательно, должны обладать репрезентативностью. Нарушение репрезентативности означает, что при формировании выборки совершалась систематическая ошибка ("перекос") по какому-то аспекту. Эта ошибка может исказить результаты, даже если выборка обладает большой представительностью. Например, если перекос сделан в сторону не мирян, то это означает, что мы в списке и Базе теряем часть мирян, и тогда вычисления по формуле (1) приведут к занижению N. Пропорциональность должна сохраняться и по любым другим аспектам. Ясно, что построить абсолютно репрезентативную выборку нельзя, но нужно постараться обеспечить пропорциональность для наиболее важных аспектов. Как показал опыт, к сожалению и База и список ввода, построенный по Базе Мемориала, создавались без учета репрезентативности - у них имеется перекос в сторону не мирян (т.е священников и монахов). Относительно Базы ПСТГУ этот перекос объясняется тем, что в списки ввода, приходящие из епархий, в первую очередь попадали именно священники и монахи - о них имелось больше всего информации. Данные же о мирянах выявлялись только во вторую очередь после более тщательного изучения следственных дел. Но как выяснить действительное соотношение между числами репрессированных мирян и не мирян? Это можно приближенно сделать по заранее известному репрезентативному списку, который мы будем называть "образцовым списком". Таким списком, по мнению известной исследовательницы Нины Павловны Зиминой, может служить книга: о. Алексия Скала "Церковь в узах: история Симбирско-Ульяновской епархии в советский период (1917-1991 годы)" [3]. В ней приведено описание всех связанных с новомучениками следственных дел в Симбирско-Ульяновской епархии. Исчерпывающая полнота анализа дел, изученных о. Алексием, позволяет надеяться, что этот список имеет высокую репрезентативность. Именно поэтому в данной работе он выбран в качестве образцового. Но поскольку книга "Церковь в узах" посвящена только одной епархии, то степень этой репрезентативности не следует преувеличивать ( искажения репрезентативности этой выборки . будут обнаружены на стадии экспериментов). В книге выявлено 896 репрессированных православных христиан, из их мирян 422; что составляет 47%, т.е. действительный процент "не мирян" составляет 53%. В Базе ПСТГУ процент мирян составляет 32%, а в списке ввода ("Мемориал") - только 18%. Это доказывает, что База и список являются нерепрезентативными выборками, и следовательно прямое вычисление N по формуле (1) может дать искаженный результат. Обойти эту трудность можно следующим способом. Ясно, что если оставить в Базе и списке ввода только "не мирян", то число персон в ней N будет числом "не мирян", которые по[3] составляют 53% общего числа. То есть полное число всех новомучеников Na составит N*100/53. Такой метод вычисления числа репрессированных только по какому-то подмножеству, с дальнейшей корректировкой этого числа в соответствии с долей этого подмножества в действительном пространстве новомучеников, позволяет избавляться и от других "перекосов". Базы и входного потока. В общем случае N вычисляется по формуле N=(Nsb*Ks/Ksb)*(100/Proc) (2) где:- Nsb. Ks и Ksb - соответственно количество в Базе, во входном потоке и пересечении Базы и потока, но уже для некоторого подмножества (что обозначено с помощью буквой s - subset); - Proc - доля подмножества в процентах в общем пространстве новомучеников. Тогда, рассчитывая N для разных подмножеств, мы можем с помощью (2) получать оценки числа новомучеников. Результаты расчетов Для проведения компьютерных экспериментов был модифицирован использовавшийся в [1] программный комплекс. Подсчет пересечений Базы и списка Ksb осуществлялся с помощью программы подсчета "двойников", т.е. дублей в Базе одной и той же персоны. Для сопоставления результатов с (1) в качестве входа использовался тот же самый материал -репрессированные верующие, программным путем выявленные из базы данных Мемориала [2], однако по сравнению с [1] их число было увеличено примерно вдвое. Процент Proc рассчитывался вручную по книге [3]. Для расчетов были выбраны следующие подмножества:
ПН - Подмножество новомучеников, % - Доля подмножества (по Скала [3]) Nbs (число элементов в базе данных) Ks (число элементов списка ввода) Ksb (число обнаруженных двойников) Ns (общее число новомучеников в подмножестве) N (общее число новомучеников) ПН % Nbs Ks Ksb Ns N 1. все новомученики 100% 31785 14255 4743 95529 95529 2. "не миряне" 53% 21206 11561 4017 61031 115152 3. все миряне 47% 10579 2736 521 55554 118200 4. священники 37.5% 12960 8560 3070 36136 96362 4. старосты 6.2% 1357 812 148 7445 120080 6. псаломщики 4.3% 1107 758 178 4714 109627 7. диаконы 2.6% 1379 772 273 3899 149961 Читать, например, четвертую строку таблицы надо читать следующим образом: всего в участвовало в эксперименте 12960 священников из Базы, входной поток содержал 8560 священников, причем из него уже содержится в Базе 3070 священников, оценка числа репрессированных священников 36136, оценка общего числа всех репрессированных за веру 96362 человека. Обсуждение результатов В первой строке представлены данные по всем репрессированным, что аналогично вычисленному в [1]. Небольшие расхождения объясняются лучшей наполненностью Базы по сравнению с версией 2012 года, на которой проводились обсчеты в [1]. Представляется, что наиболее достоверной является оценка по второй и третьей строкам: соответственно N=115152 чел. и 118200 чел., поскольку они были целенаправленно разработаны с целью устранение реального "перекоса" в Базе по священникам и монахам. Кроме того, тот факт, что по мирянам и "не мирянам" получены близкие результаты, говорит о репрезентативном соотношении между этими подмножествами. Таким образом, оценка числа новомучеников в данной работе составляет 115 -119 тыс. человек. Результаты строк 5, 6 и 7 дают значительный разброс оценок. Видимо, это связано с очень малыми долями (6.2%, 4.3%, 2.6%) данных подмножеств, величины которых скорее всего неточны в силу недостаточной репрезентативности образцовой выборки [3]. Особого объяснения требует несколько заниженный по сравнению с другими результат строки 4 ("священники") -96321 чел. Видимо, его можно объяснить тем, что фамилии имена, отчества и годы рождений у священников часто совпадают, и программа подсчета двойников принимает таких персон за "двойников" (хотя в действительности это разные личности), в результате чего выдается завышенное значение Nsb. Дать оценку погрешности метода представляется затруднительным - он существенно зависит от качества "образцовой выборки", которое оценить крайне проблематично. Поэтому в дальнейшем, в качестве развития метода представляется желательным получить более достоверную "образцовую выборку", репрезентативность которой выше используемой в настоящей работе. Литература
|