Сообщения

Сообщения за март, 2024
Изображение
  В качестве анализа я выбрала тексты связанные общей темой - тренды весны 2024. Тексты действительно связаны одной темой, но в связи с тем, что каждый автор указывает те тренды, которые с читает ну жным, материалы получаются очень разные. В каждой статье есть пару схожестей, но в основном автор закладывает своё виденье. Возможно, поэтому на первый план вышли предлоги, а только потом слова мода, тренд, цвет и тд. Я считаю, что с помощью t opic modelling легче анализировать текст, так как приводится меньше ключевых слов, чем в облаке.
Изображение
Я выбрала 2 текста, которые описывают наилучшие способы того, как провести 8 марта. По скриншотам видно, что в в список значимых слов не попало ни одно слово, которое как-то было бы связано с 8 марта. Что в облаке слов, что в рейтинге, на первый план выходят предлоги. Скриншоты второго текста уже содержательнее. Видно, что в списки попали слова: март, день и тд. Анализ подтверждает, что первый текст несет в себе много ненужной информации, нежели чем второй, который не отходит от темы и прямо повествует о празднике. 1 текст 2 текст                                                                                1 текст 2 текст