Иван А. Ильин (illyn) wrote,
Иван А. Ильин
illyn

Categories:

Know-how: Искать – не «слово». Искать – «сюжет»

Слушай Яндекс — а ведь ты совершенно не то — мне в блогах предлагаешь искать. Ты посмотри, что творится!

Захожу я сегодня ночью к тебе в Новости и ввожу в поиск слово: «электрон». Получаю, в результате. Аккуратно — комплект выделенных, сгруппированных сюжетов. Про траулер, про физику, про одноимённый кинотеатр… И иду, читаю — то, что мне нужно. В один «клик». Ну, в два. Если захочу посмотреть: какой-нибудь «сюжет полностью» и выбрать наиболее приятное мне издание с фактически похожей информацией.

Дальше. Теперь я попробую нажать на твою новую ссылку: «Поискать „электрон“ в блогах» — и — что я увижу? Да, плохо всё станет. Порядок рассыплется. Чего только из блог-поисковика не повылезет. И траулер (1 раз), и про физику, и всё что угодно, даже какие-то: «Сучки-Дегенератки. Псих-портрет» найдутся. Но бессистемно и, главное, без учёта того, что я пришёл из Новостей. А ведь там был порядок! Хотя и слово, казалось бы, было введено только одно…

Ну, понятно, ты ведь просто взял — да и перекинул моё ключевое слово из Новостей в другой свой поисковый механизм. Понятно… Засыпал меня мусором, спасибо. На этом месте я, конечно, начну вводить какие-нибудь дополнительные ключевые слова в блог-поиск, стану уточнять запрос… В общем — найду. Потом. То, что мне нужно. Но — ты! Ты, ведь, секунды не прошло — забыл про меня! Ты забыл про то, что я пришёл из твоих же — Яндекс! Новостей

А теперь внимание, фокус.

Давай я зайду «внутрь сюжета» про траулер, и посчитаю: «какие тут слова употребляются чаще всего?» (при помощи букмарклета «word frequency») — окажется, что за вычетом предлогов, аббревиатуры «ru», цифр… два, самых часто употребляемых, в данном сюжете слова будут:

  • «электрон» и 
  • «траулера»

Следующий шаг. Уже эти вычленённые 2 главных слова — я веду в твой блог-поисковик. И — красота! Ожидаемо получу ссылки на обсуждение — именно «сюжета» про траулер. Понял к чему я клоню? Ага, точно.

Слушай, Яндекс, может быть — ты сам? Будешь? Заходить внутрь «сюжетов», выбирать парочку (или троечку) ключевых слов, скармливать их в свой блог-поисковик и… Как бы это могло в итоге выглядеть — а допустим, как в Newsweek сделано:

Newsweek, ссылки на статью и на её обсуждение в блогосфере

Есть какой-нибудь сюжет: ЦРУ предположим в лужу село. У сюжета:

  • Есть — название (красное)
  • Есть — ссылки на обсуждение в блогосфере (зелёное)
  • Есть — краткая аннотация: А что случилось? Где стреляли? (серое, чёрное)

В этом примере, внутренняя (серверная) технология у американцев совсем иная, не такая, как твои, но — ты, Яндекс, главное пойми. Будь хитрее!

Ты мне «слова» — больше не ищи. Это архаизм жуткий. Ты мне «сюжеты» ищи! В них вся сила, Брат.

P. S. Ты мне не рассказывал, но я подозреваю, что тебе и ключевые слова, собственно, вычленять — и не нужно будет. Они уже выявлены на этапе формирования Яндекс.Новостей. Остаётся только подходящее их количество автоматически ввести в блог-поиск, и — вычесть из результатов, записи в блогах датированные временем более ранним, чем время начала твоего «сюжета». И всё.

Tags: blog, know-how, search, сми
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 16 comments