Сообщения

Сообщения за март, 2025
Изображение
1. MDS-модель на мой взгляд точнее, там они хоть как-то по реальной схожести объединились, нежели в  Image Grid. 2. Для фото была выбрана вампирская тематика, по результатам наглядно видно, что  Image Grid разделила буквально одинаковые именно по смыслу картинки, возможно эта система опиралась на свет\цвет\качество, но на мой взгляд она тут не справилась.
Изображение
  За основу были взяты статьи про отношения. Тексты поделились на группы C3, C4, C5. Остались в одиночке текст 3 и 9. Я думаю, что были выделены именно такие группы из-за большей схожести в тематике и стилю описания, также, возможно, по эмоциональному окрасу они могли соединиться в группы. А тексты, которые не объединились, могут сильно отличаться по характеристикам, нежели остальные.  Число групп по общности текстов при изменении уровня кластеризации будет меняться  в  сторону меньшего числа групп. Опять же, из-за какой-то общей ключевой темы (например, проблемы отношений)
Изображение
 Для анализа были взяты стихотворения Пушкина о природе (Зимнее утро и Осень) 1 стихотворение Осень. 2 стихотворение Зимнее утро Выводы: на мой взгляд  модель текста точно отражает содержание, но возможно, брать стихотворения для таких анализов не очень хорошая идея. Понравилась схема в  word cloud, если брать какие-то большие тексты по теме, то отлично выделяет основные слова и темы, хороший инструмент. Эта методика на мой взгляд легче.
Изображение
Для анализа я выбрала бренды косметики:   Vivienne   Sabo ,  Loreal, Clarins 1.  У  Vivienne Sabo   соотношение позитива и негатива 6:0.  Негативных постов сервис не нашел, в основном они нейтральные или положительные, связанные с новинками продукта или инфоповоды.  Чаще встречается на фото или в видео, а поиск в интернете связан с тушью для ресниц (их самый популярный продукт) 2. Loreal У этого бренда соотношение негатива и позитива 4:1, негативные связаны с  помощью в судебном процессе по иску о борьбе с раком краски для волос для пострадавших стилистов и о сомнительном качестве продукции. Но нейтральных опять больше. Чаще всего встречаются фото и видео, статьи тоже присутствуют в большом количестве. По типу контента это обзоры, отзывы, рекомендации. В интернете больше всего ищут информацию про шампуни 3. Clarins Негативные и позитивные 4:1. Тут негативных уже больше, если сравнивать с предыдущими, негатив связан с подделками, испорчен...
Изображение
текст 1    текст 2 Вывод: Я считаю, что  с задачей точнее справилась вторая модель, потому что она оценила эмоциональность текста так, что результаты соответствуют действительности. Она более предпочтительна. За основу брала стихи Цветаевой.