НовоВики. «Мой Новосибирск родной!»
Песочница Загорулько Альбина
Работа с текстом
Что такое семантический анализ текста?
Каждый сайт занимает какое-то определенное место в Интернете. От того, насколько близок сайт к началу списка в поисковой выдаче основных поисковых систем, зависит посещаемость сайта, а значит, количество подписчиков и в конечном итоге, заработок на сайте. Мы уже знаем, что основной трафик (до 90%) приходит из поисковых систем, значит, главной задачей веб мастера является продвижение своего сайта, как можно ближе к началу названного списка. Считаю, что главным и основным методом продвижения и повышения посещаемости является качественный оригинальный и полезный людям контент http://fobos12.ru/?p=1636. В то же время, поскольку продвижение зависит от индексации в поисковых системах, может сложиться так, что самый полезный людям контент не будет индексироваться или индексироваться с большим замедлением, если текст не будет отвечать определенным правилам и особенностям поисковых систем. Другими словами, существует определенный список показателей с допустимыми нормами. Определение таких показателей, сопоставление их с допустимыми и является задачей и сутью семантического анализа. Удачным можно считать текст, не только интересный по содержанию, но и показатели которого не превышают допустимого предела.
Основные показатели:
«Вода» — часть текста, в которой суть вопроса и смысловая нагрузка отражены минимально или вообще не отражены. Показателем является процентное отношение незначимых слов к их общему количеству. Считается, что «воды» в тексте должно быть не более 40%. В то же время текст совсем без «воды» будет сухим и неживым. В стилистически грамотно написанном тексте «воды» может быть и 60%.
«Стоп-слова» — к ним можно отнести предлоги, союзы, слова-связки. Поисковыми роботами они не распознаются и не воспринимаются. Показателем является количество и процентное соотношение стоп-слов. В статье их не должно быть более 5%.
«Тошнота» — считается основным показателем. Это не что иное, как тавтология, или оценка степени «заспамленности» текста самым частым словом, т.е. наиболее часто встречающимся. Обычно – это ключевое слово. Поисковый робот может зациклиться на нем и остальные ключевые слова не воспринимать. Различают классическую тошноту и академическую тошноту. Классическая тошнота характеризуется коэффициентом заспамленности самым повторяющимся словом, и определяется, квадратным корнем из количества повторений самого тошнотного слова. Оптимальное значение указанного показателя равно 7, максимальное – 10. Показатель академической тошноты растет при увеличении количества различных повторяющихся слов.
Семантический анализ ключевых слов — основа оптимизации, необходимой для продвижения сайтов при помощи статей. Позволяет определить более популярные запросы, является основой привлечения целевой аудитории.
Семантическое ядро — список ключевых слов и фраз, по которым продвигается проект и используется пользователем для поиска нужной информации. Оптимизируя текст под определенное количество ключевых слов, мы можем получить большее число посетителей по запросам в поисковиках.
Уникальные слова – слова, встречающиеся в тексте хотя бы один раз без учета повтора.
Значимые слова – слова, определяющие значимость текста (только существительные), обычно, редко встречающиеся в интернете.
Количество символов - общее количество символов в тексте с пробелами.
Количество символов без пробелов - количество символов без пробелов.
Количество слов — количество слов в тексте с предлогами.
Для семантического анализа текста существует много программ и онлайн-сервисов, используемых в SEO, которые помогают математическими методами определять качество текста. Рассмотрим основные из них.