Экспресс-анализ текста

Включить/выключить визуальный редактор

Анализ текста
Информация о тексте



Поскольку сайт "по долгу службы" содержит встроенные алгоритмы анализа текстов, не составило труда дополнить его и отдельным небольшим сервисом, сообщающем информацию о тексте. Просто введите текст и нажмите "Анализ текста".
Разберемся в том, что получили.
Водность текста означает процентное отношение значимых слов к словам-"пустышкам" (стоп-словам). Например, введем тескт "Какой чудесный день". Значимое слово - только одно, "день", всего слов 3 - получим водность 67%.
Тошнота - отношение в процентах числа вхождений самого частого слова к общему числу слов (исключая стоп-слова). В приведенном выше примере - 100%. Чтобы было понятнее, введем другой пример: "Какой это был чудесный праздник - Сонгкран". Значимых слов - два. Самое частое слово встречается 1 раз. Тошнота - 50%.
Более подробный пример: допустим, вы пишете текст, рекламирующий анализ текста, и у вас начал получаться вот такой "шедевр":
Анализ текста - самый лучший только здесь и у нас! Только здесь анализ текста такой удобный! Для анализа вашего текста перейдите сюда и введите ваш текст для анализа.
Получим: "Водность" текста: 62%, "тошнота": 44%. И так было понятно, что текст никуда не годен. Но он наглядно демонстрирует, как работают эти параметры. Для нормального текста обычно "водность" должна быть на уровне 10-40%, "тошнота" - не превышать 10%, хотя это все очень индивидуально.
Параметр в скобках подсмотрен на сайте istio.com. Он рассчитывается по формуле 10*корень квадратный(max(7, кол-во самого частого слова на странице)). Таким образом, максимальное значение, которое примет этот параметр - 26 (десять умножить на корень из семи)
Чаще всего встречаются - список из пяти наиболее частых слов в тексте, за исключением стоп-слов.
Проверка на уникальность. Конечно же, сайт умеет искать и копии текста интернете. Но так как алгоритм поиска довольно сложный, чтобы им воспользоваться, нужно зарегистрироваться и сохранить текст на сайте в разделе "мои статьи". Служба сайта регулярно проводит поиск копий текста, выбирая из него разные значимые фрагменты, найденные копии будут отражены в истории текста, и информация о них будет отправлена вам по электронной почте (если вы включили эту опцию)
Регистрация (единая с форумом)    Вход