-Цитата от a_b Везде пишут про форумскую мафию, что она, дескать, тащит "своих". Это можно легко проверить. Обычно, чтобы выявить фракции людей, кто голосует сообща (или имеет одинаково отличные от других вкусы), используется иерархическая кластеризация. Для каждой пары судей измеряется дистанция между ними -- в нашем случае, количество разногласий в парах, она варьируется от 0 до 16 (в 6 раунде). Потом тех судей, которые ближе всех друг к другу, объединяешь в один кластер, и так дальше: выбрав какой-то норм критерий кластеризации, объединяешь кластеры один с другим. И по итогу получаешь дерево(иерархию), где видно, какие группы на каком уровне соединились. Если есть какая-то группа, которая быстро объединилась на низовых уровнях, но соединилась с остальными только на самом верху, то эта группа является фракцией с большой вероятностью.
Я что-то видел, что тут в прошлом раунде предлагали метрики с адекватностью судей. Почему бы и фракции теперь не выявить? Я бы сам сделал, будь у меня база оценок, а вручную лень переписывать.
у меня есть данные по 5 и 6 раундам. могу поделиться, либо готов поучиться твоей метрике.)