Spark in me - Internet, data science, math, deep learning, philo

snakers4 @ telegram, 1166 members, 1156 posts since 2016

All this - lost like tears in rain.

Internet, data science, math, deep learning, philosophy.
No bullshit.

На чай
- goo.gl/zveIOr
- Договор ТКС 5011673505

Сайт spark-in.me
Файл goo.gl/5VGU5A
Чат goo.gl/IS6Kzz

June 20, 04:00

По итогу голосования выше проще написать про семантическое ядро. Но вот незадача, я сделал анализ на работе, но не могу поделиться его копией на других данных, т.к. сейчас у меня нет доступа к google search console более менее крупного сайта (на нашем сайте SEO только начинает работать). Если у вас - есть - пришлите пожалуйста выгрузку impressions по ключевым словам. А без слов - анализ в jpn будет неинформативен.

А так вкратце. В онлайн маркетинге процент буллшита в гайдах достигает 90%. Одновременно с этим как бы Гугл использует 200+ метрик для ранжирования сайтов. Но ключевые слова в первую очередь полезны для понимания спроса на ваш веб-продукт и того какие страницы вообще востребованы.

- Выгрузить ключевые запросы из Google Search console

- Разбить на слова, посчитал частотность слов (можете тут поизвращаться с n-граммами)

- Через google keyword planner получить в 10 раз больше комбинаций слов связанных с вашими

- Разбить их на кластеры (тут извращений может быть бесконечное число, можно скачать какие-нибудь вектора для слов и работать с ними, например)

- Для каждого кластера построить опять частотность слов (или n-грам) путем перемножения матриц популярности слов в гугле на встречаемость в датасете

- Дальше думать, а что же реально хотят ваши клиенты?

Одна проблема такого подхода в ваккууме - если ориентироваться только на спрос и не думать про прекрасное, то может получиться не очень.

#internet

Занятная статья про распределения вероятности. Жаль только, что перевод

- Картинка - goo.gl/pgxsvA

- habrahabr.ru/post/331060/

- На практике в 90% случаев встречаются нормальные и вариации распределения пуассона

- Вообще простейшими преобразованиями (логарифм, степень) многие данные можно привести к нормальным

#data_science

4f65f4edb921715dbb56a320a65b101e.png