хе, идея прикольная, интересно было бы почитать результаты добротного семантического анализа, но здесь интерпретация, к сожалению, выполнена на очень слабом уровне.
весь мат у автора отнесен к негативным словам, например. хотя «бухать» и «ебать» вполне позитивный смысл могут иметь, ничуть не хуже, чем слова «видеть» и «спать» (Например:
не хочу это больше видеть; не могу теперь спать). «никогда» - вполне нейтральное слово, а не негативное ну и так далее.
Добавлено через 3 минуты 28 секунд
-Цитата от dimethylmercury -Цитата от Февраль Вроде и нехилая статистика собрана, но она не говорит вообще ни о чем, имхо.
потому что она собрана от балды
у Носа возьмем 160 треков, а у Фараона в два раза меньше
еще сравним с Кастой, которая вообще-то группа (и в которой изменения происходили)
к тому же непонятно были ли выброшены гостевые куплеты
делал подобную хуйня для треков с семнашки, но забросил
количество треков может быть разным, можно взвешивать данные относительно количества всех слов каждого артиста. здесь на мой взгляд нужно добавить к количественному качественный анализ текстов. нужно бы вначале кодировать вручную смысловые куски текста, а уже потом их подсчитывать статистически