Показать сообщение отдельно
ЭйсМэн
ниндзютсу в действии
Аватар для ЭйсМэн
Сообщения: 2,707
Регистрация: 12.07.2012
Старый пост, нажмите что бы добавить к себе блог 28 мая 2020, 19:40
  #16681 (ПС)
-Цитата от a_b Посмотреть сообщение
-Цитата от pozypozy Посмотреть сообщение
-Цитата от a_b Посмотреть сообщение
Везде пишут про форумскую мафию, что она, дескать, тащит "своих". Это можно легко проверить. Обычно, чтобы выявить фракции людей, кто голосует сообща (или имеет одинаково отличные от других вкусы), используется иерархическая кластеризация. Для каждой пары судей измеряется дистанция между ними -- в нашем случае, количество разногласий в парах, она варьируется от 0 до 16 (в 6 раунде). Потом тех судей, которые ближе всех друг к другу, объединяешь в один кластер, и так дальше: выбрав какой-то норм критерий кластеризации, объединяешь кластеры один с другим. И по итогу получаешь дерево(иерархию), где видно, какие группы на каком уровне соединились. Если есть какая-то группа, которая быстро объединилась на низовых уровнях, но соединилась с остальными только на самом верху, то эта группа является фракцией с большой вероятностью.
Я что-то видел, что тут в прошлом раунде предлагали метрики с адекватностью судей. Почему бы и фракции теперь не выявить? Я бы сам сделал, будь у меня база оценок, а вручную лень переписывать.
у меня есть данные по 5 и 6 раундам. могу поделиться, либо готов поучиться твоей метрике.)
Мне кажется естественным тут метод центроидов. Центроид это центр тяжести кластера. Например, если есть 2 пары локдог-крид и джони-окси, судья1 голосует за локдога и джони, судья2 голосует за крида и окси. Судье1 соответствует точка (0, 0), судье2 -- (1, 1). Центроид это точка, у которой координаты это средние арифметические, (0.5, 0.5).

В 5 раунде у тебя будет 64(?) участника, 32 пары, значит каждому судье соответствует точка с 32 координатами, где на каждом месте либо 0 либо 1. Изначально у тебя каждый судья это отдельный кластер, и точка центроида совпадает с точкой судьи. Затем считай расстояния между каждым центроидом(на первом шаге между судьями например), те, что ближе всех, объединяй в одну группу(в один кластер), и пересчитывай центроид у получившегося объединения. Дальше снова ищи пару самых ближних центроидов и объединяй и т.д. до тех пор, пока все не объединятся.

На выходе ты получишь красивое дерево, по которому наглядно можно увидеть фракции.

Есть много написанных программ для этого вроде в матлабе, в пайтоне, в р, наверное.
нихуя не понял но задумка интересная

offline