Тег

контент

10 российских компаний, которые делают интересный контент

Мы уже советовали, что почитать, чтобы писать нормально. Сегодня показываем блоги компаний, которые хорошо пишут. Подсматривайте идеи.


Блог сервиса по подбору вина Invisible

inv_summercoming_fb
Invisible пишет о вине не нудно и понятным нормальным людям языком. Наконец-то кто-то рассказывает о вине так, что можно во всем разобраться и не чувствовать себя невеждой.

Ребята сразу объясняют, почему в основном о вине пишут по-идиотски, и что с этим делать:

«Многие из тех, кто хочет начать разбираться в вине или просто осознанно его выбирать, сталкиваются с одной и той же проблемой: куда ни сунься — образовательные проекты про вино, сайты виноторговых компаний, модные блоги — везде страшно. При этом большинство авторов уверены, что делают все правильно, и писать в 2016 году «волшебные танины одуряют» — вполне нормально».

Инструкция «Как выбрать вино в супермаркете»:

«Вечная проблема: забегаешь в окрестный супермаркет за вином и застреваешь там на добрые полчаса, бутылок куча, что где — непонятно. А хочется выбрать вино быстро, элегантно и уйти получать удовольствие. Учимся решать эту проблему».


Нетология

1cNQy_croper_ru

Онлайн университет предлагает программы по интернет-маркетингу, управлению проектами, дизайну и веб-разработке. А параллельно с этим публикует колонки своих преподавателей.

Почитайте колонку директора по спецпроектам 101XP Олега Доброштана о том, как сделать партнерский проект:

«В двух компаниях, в которых я отвечал за партнерство, результат появлялся примерно после 5 месяцев напряженной работы — все эти месяцы вы готовите встречи, ездите на них и и всем рассказываете о себе, нарабатываете базу контактов. Сейчас, когда дело уже пошло, мы формируем очередность запусков партнерских проектов в очередь — они расписаны на пару месяцев вперёд».

А здесь объясняют, как избежать типичных ошибок веб-аналитики:

«Веб-аналитики очень часто оперируют числами и не переводят их на возможные паттерны поведения пользователей. В итоге получаются странные выводы: если увеличить вот это число, то снизится вот это число. Думаю, что качественный подход к веб-аналитике на выходе должен иметь описание цели и поведения пользователей и рекомендаций к тому, как возможно в будущем повлиять на этих пользователей».


«Тинькофф Журнал»

cont_tinkoff_huykoff
Пишут об управлении деньгами: как не быть обманутым и научиться экономить. Не стесняются угорать по картинкам и объясняться человеческим языком.

Ровные пацаны берут трубы с рук, но не хотят быть кинутыми, поэтому для них инструкция «Как покупать Айфон с рук»:

«Айфон с рук можно купить в полтора-два раза дешевле, чем в магазине. При этом можно сохранить гарантию и получить аппарат в отличном состоянии на много лет. Те, кто умеют покупать с рук, вызывают у меня восторг».

Каждый родитель задается вопросом, как научить ребенка копить и не стать ему врагом:

«Самодисциплина — важный фактор успеха для детей. Умение отказаться от сиюминутной выгоды в пользу будущей награды определяет дальнейшую судьбу».

Если хотите понять, как выглядит информационный стиль в тексте — вам на «Тинькофф Журнал». Здесь главредствует Максим Ильяхов — гуру коммерческих писателей.


Рассылка Лиги читающих компаний и блог «МИФ»

cont_mif
Издательство «Манн, Иванов и Фербер» ведет блог и делает рассылки. Для компаний, которые закупают книги сотрудникам, у них отличная рассылка «Лиги читающих компаний».

В седьмом письме менеджер издательства рассказала об учебе в Беркли и лучшем вложении денег:

«Вот моя позиция. Книги — это венчурные инвестиции, то есть высокорисковые. Венчурные инвесторы вкладывают миллионы в 10 стартапов и смотрят, какой из них выстрелит. Они прекрасно знают, что 9 из 10 даже не выйдут в ноль, но продолжают вкладывать деньги. Они не дураки».

А вот статья из блога о 5 пороках рабочих команд и способах их устранения:

«Зачастую работники ставят личные цели выше командных. В этом случае сотрудники могут отлично справляться со своей работой и ладить с другими людьми, однако общий результат, который стремиться достигнуть команда, их почти не интересует».

«МИФ» делает хорошие выжимки из книг, сразу понятно, покупать книгу или нет.


Портал biz360 от «1С»

cont_biz360
Медиа о малом бизнесе. Помогают предпринимателям разобраться в тонкостях управления компанией и поиске идей для бизнеса.

Вот статья о фальшивых отзывах в интернет-магазинах. Так, Кирстен Данст закупила полиэтиленовые пакеты и поставила пластиковые окна в Брянске.

А в агентстве «Собака Павлова» рассказали, как расстаться с сотрудником, даже если отпускать его не хочется.


Рассылка и блог «Мегаплана»

VJk5t_croper_ru
«Мегаплан» — сервис для совместной работы сотрудников: управления задачами, проведения согласований и решения других бизнес-задач. Три года назад запустили рассылку о личной эффективности, маркетинге и бизнесе. У рассылки 100 тыс. Подписчиков и вы наверняка о ней уже слышали.

Статья о том, как важно уметь отстаивать свои идеи:

«Отстаивать идею — часть профессионализма. Если вы делаете что-то замечательное, кроме вас, скорей всего, никто не знает, насколько это замечательно. Убедить в этом всех — ваша работа. Не менее важная, чем работа над самой задачей».

Статья о хорошем слоге поможет строить складные предложения и объясняться в деловой переписке:

«За сложные предложения нас хвалили на уроках русского языка. Если написали много таких предложений и не ошиблись с запятыми, получайте «пятерку». Проблема в том, что в информационных текстах читатель не готов пробираться сквозь сложные конструкции. Мы вряд ли из-за них закроем художественную книгу, но слишком сложную статью не дочитаем».

Время от времени слышим, что рассылка «Мегаплана» уже не та, что раньше, но продолжаем читать.


Рассылка «Финолога»

cont_finolog
Сервис «Финолог» от основателя «Мегаплана», Михаила Смолянова. Помогает малому бизнесу управлять финансами. Делают рассылку об управлении деньгами, людьми и собой. Пишут понятно, иллюстрируют задорно.

В каком-то смысле — это наследница рассылки «Мегаплана». Но это не мешает подписаться на обе:

«Мы не умеем и не хотим писать о новых бизнес-инсайтах, стратегиях креативного дизайн-мышления, синергии, стартап-этике, холакратии, эджайле и прочей туфте. Сорри гайз, мы про деньги и тупые рабочие принципы. Лучше пусть бизнес будет совковым и прибыльным, чем ультралиберальным и планово убыточным».

Отличное письмо о стимулах и мотивации:

«В долгосрочной перспективе мотивация всегда борет стимулы. Вы не сможете долго давать пинок под зад человеку, который идет с вами в разных направлениях».


Блог «Мосигры»

Z4hTm_croper_ru
Производитель настольных игр «Мосигра» ведет блог на Хабрахабре благодаря физмат и физтех прошлому руководства. А еще они верят в веб 2.0, и развивают так сеть магазинов в реале.

Пишут об управлении, разработке, дизайне и работе с клиентами.

Читателям Хабрахабра будет интересно, как ведут себя покупатели с Хабрахабра:

«Магазин успевал приходовать книгу – и тут же колл-центр разбирал всё. На Тверской из-за последней книги чуть не началась драка. Это, конечно, эпично, но я не этого хотел. Урок простой – IT-специалисты – не хикки, и не сидят дома».

Не стесняются рассказывать, как обрабатывают свои косяки и баги.


Журнал Five o`clock от «2Гис»

m609q_croper_ru
Бизнес-истории от предпринимателей. Победы, поражения и нестандартные решения.

Почитайте интервью с основателем «Модульбанка»:

«Модульбанк» заявил о себе, как о первом банке исключительно для предпринимателей — ИП и ООО, на которых в банковской сфере принято не обращать внимания».

Там не только об успехах, Fit Service рассказал, как зря снизил цены:

«Компания, никогда не делавшая ставку на низкие цены, предложила клиентам огромные скидки и едва ли не самые дешёвые запчасти в городе. В Fit Service рассчитывали, что смогут компенсировать низкую наценку за счёт увеличения продаж и клиентской базы. Реакция покупателей застала компанию врасплох».


Блог «Додо пиццы»

YF0ui_croper_ru
Здесь можно следить за развитием сети пиццерий «Додо пицца» с момента ее основания.

Серия заметок, как основатель «Додо пиццы» работал в Макдоналдсе и других ресторанах быстрого питания:

«Менеджеры “Макдоналдс” сразу вычисляют тех, кто может уволиться впервые дни. Меня к таким уже не относили. Я бодро мыл полы, жарил картошку и проявлял всяческое рвение в работе. За день до увольнения заместитель директора попросила меня принести фото, чтобы разместить на стенде “Знакомьтесь, наши новички!”. Я уже отработал к тому времени 10 дней в ресторане».

18 бесплатных фотостоков, которые спасут вашу рекламу

Зачем спасать?

Мы размещаем нативную рекламу на крупных сайтах: РИА Новости, AdMe, Лайфхакере, Drive2.ru и других. И делаем так, чтобы реклама была такой же полезной, так же хорошо выглядела и так же нравилась пользователям, как статьи на сайте.

Реклама становится единым продуктом с медиа

Бренды получают более вовлеченных клиентов, а медиа — деньги и положительный UX на сайте.


htrkfvf

Реклама Relap.io

Причем тут фотостоки?

За время работы мы сделали однозначный вывод, что изображения могут сильно повлиять на результат рекламной кампании.

image03

Креативы для баннерной рекламы не работают в нативной

Это пример того, как мы изменили фото и заголовок и улучшили результат.

image06

Если клиент не знает, какое изображение лучше взять, мы подбираем для него фотографии и пишем заголовки. Вот креативы, которые мы создали для нативных кампаний.

image02

Поискать в фотостоке — самый быстрый способ найти картинку для нативной рекламы, если у вас ее нет

Список сайтов, которыми пользуемся сами:

Stock Up

Unsplash

Pexels

IM Free

Startup Stock Photos

Moveast — подойдет для рекламы путешествий, много местных жителей из солнечных стран.

Foodies Fest на тему еды.

Gratisography

Stocksnap

Splitshire

ISORepublick  

Raumrot — не очень удобный, потому что нет поиска. Можно смотреть только по категориям, которые, как нам кажется, не всегда хрошо составлены. Но хорошие изображения есть.

Imagefinder

BARN IMAGES

Travel Coffee

Visualhunt

Freerangestock — большой сток, похож на гугл картинки: можно найти любую тему, но придется разгрести много неподходящих изображений.

Например, мы нашли тут фото круизных лайнеров. В хипстерских фотостоках такое бывает редко.

Kaboompics

Как вообще там можно что-то найти?

Пользоваться поиском. Например, вы продаете курсы дистанционного обучения. Для этого вбиваете в поиск laptop, потому что дистанционное обучение, скорее всего, проходит за ноутбуком — и выбираете фотографию.

image04

На IM Free есть раздел «Образование». Смотрим, что там:

image00

После 2-3 запросов по разным стокам у вас набирается 3-5 фотографий, которые можно использовать.

2 совета о том, как выбрать фото:

  1. Фотография должна органично смотреться в ленте или плитке. Помните, нативная реклама — это значит, что реклама и медиа становятся единым целым.
  2. Люди лучше предметов (чаще всего). В 83% наших рекламных кампаний смена изображения предметов на фото людей дала прирост CTR в 2 раза и больше.

image01

Чем стратегия распространения контента отличается от постинга в Facebook

Когда Иэн Коуэн (Ian Cohen), разговаривает со своими клиентами, самая трудная часть беседы касается закладки в бюджет средств на платное распространение. Иэн — президент по созданию контента и инновациям в одной из ведущих мировых фирм по связям с общественностью Weber Shandwick.

ws

Иэн Коуэн (слева) и вице-президент креативного и стратегического направления Weber Shandwick Патрик Чопэм (справа)

Одна из главных ошибок, которую совершают сегодня маркетологи, — это полная сосредоточенность на создании контента без внимания или выделения бюджета на распространение этого самого контента. И, в некотором смысле, нельзя обвинить их в этом.

Изначально SMM позиционировался как недорогой инструмент.

Евангелисты социальных медиа продавали брендам идею о том, что если вы потратите немного времени на производство контента на «острую тему», то сможете достигнуть своего «Oreo moment», и достучаться до массовой аудитории по всему миру буквально за бесценок.

Oreo-Dunk-in-the-Dark


Комментарий Relap.io

Твит компании Oreo: «Нет света? Никаких проблем. Полакомиться можно и в темноте» (дословно «макать можно и в темноте») опубликован 3 февраля 2013 года. Вошёл в топы лучших SMM кейсов.

Во время отключения света на арене матча Суперкубка-2013 по американскому футболу Oreo опубликовала твит, который за считаные минуты собрал больше 15 000 «ретвитов». Кейс Oreo вошёл в 10 лучших SMM-кейсов десятилетия. И стал примером конвергенции Twitter с телевидением. Twitter даже включил его в свой проспект к IPO.


Но в последние годы ландшафт резко изменился. Социальные каналы так насыщены контентом, что уже практически невозможно пробиться без платного распространения. Изменения алгоритмов Facebook стали огромным препятствием на пути любого бренда, который хочет получить органический вирусный охват. Иэн Коуэн объясняет, что для брендов теперь неэффективно создавать отличный контент, если они ещё не разработали план его распространения и не заложили деньги на платное продвижение.

У нас есть клиенты, которые говорят: «Бейонсе собирается твитнуть это». Поздравляем, вы только что получили три просмотра!

«Когда алгоритмы построены таким образом, вы не можете быть настолько наивными, чтобы думать, что это будет работать».

relap_content_beyonce

В компании Weber Shandwick Коэн управляет командой из более чем 100 человек — продюсеров, авторов, редакторов, операторов, аниматоров и специалистов по распространению. Перед тем как создатели контента снимут первый кадр видео, они сначала обсуждают со специалистами по связям со СМИ и по платному распространению, каким образом этот контент достигнет своей аудитории.

Стратегия распространения может диктовать содержание контента.

casper

Люк Шервин, сооснователь Casper

Люк Шервин (Luke Sherwin), один из основателей и креативный директор компании по продаже матрасов и кроватей Casper. Casper создает сайт о культуре сна Van Winkle’s. Шервин закладывает небольшой бюджет на платное распространение. В основном, чтобы делать замеры, какой именно контент работает лучше. Если публикация начинает хорошо работать сама по себе, он вкладывает небольшую сумму в платное продвижение.

Стратегия распространения Van Winkle’s заточена на то, чтобы публикации сайта перепечатывали крупные издания вроде The New York Times, The Huffington Post и The Wall Street Journal.

На внешние площадки приходится примерно 80% просмотров.

Van Winkle’s производит качественные журналистские материалы, которые привлекут внимание редакторов авторитетных изданий.


Комментарий Relap.io

О других способах размещать брендированный контент в СМИ почитайте наш текст о нативной рекламе.
Как делать нативную рекламу в России?


«Мы хотим, чтобы нам доверяли и делаем все вдумчиво. И это раскрепощает. Поэтому можем потратить несколько тысяч долларов на статьи о посттравматическом расстройстве сна. Конечно, мы беспокоимся о просмотрах, но реально создаём контент в расчете на то, что мы получим перепечатки в СМИ и публикации в блогах,» — говорит Шервин.


Комментарий Relap.io

Похожего эффекта удалось добиться KIA на российской площадке BigPicture.ru. Текст американского писателя о том, как он впервые приехал в Россию собрал 600–700 тысяч просмотров. Из них на BigPicture.ru. 160 тысяч прочтений. Остальные просмотры пришли за счёт репостов в блогах.

Эту историю рассказали основатели BigPicture.ru Сергей Барышников и Александр Кукса в интервью редакции блога Relap.io. Почитайте полный текст о том, как им удаётся продавать лонгриды на 160 тысяч знаков и о том, что трафик устроен сложнее, чем показывает Google Analytics.

Как команда блога BigPicture.ru продаёт лонгриды на 1 млн просмотров и открывает агентство SALO


xerox

Джош Голден, руководитель международного маркетинга Xerox

Независимо от того, в какой сфере вы работаете, все, что вы выпускаете, должно отражать принципы компании. Джош Голден (Josh Golden) из компании Xerox называет их «Полярной звездой». Он советует брендам ещё до того, как стратегия дистрибуции или производства контента разработана, определить единую ценность, вокруг которой смогут объединиться все, кто работает для компании.

Даже отличный контент и блестящий план распространения, полученные в результате просмотры и репосты в соцсетях не особо отразятся на вашей прибыли, если никто не знает, что стоит за вашим брендом.

«В компании Xerox мы работали с шестью агентствами и старались делать так, чтобы все они думали в одном ключе. И как только у нас появилась «Полярная звезда», мы бесконечно стремимся к ней. Поэтому, когда мы делаем работу, будь то реклама, пост в соцсетях или контент, все это отражает те особые выгоды и преимущества, которые потребители ожидают получить от нашего бренда».

Мы перевели самое интересное из материала Why Your Creative Will Fail Without the Right Distribution Strategy. Блог The Content Strategist, где опубликован этот текст, пишет о том, как брендам привлекать клиентов в медиа. Много историй об опыте западных компаний. Рекомендуем почитать.

Пользователи читают текст о вашей компании: Как это происходит на самом деле


Вы написали статью или сделали посадочную страницу. Рассказываем, что вас ждет, когда на нее придут пользователи.

Люди делят текст на блоки и сканируют только их

Если вы написали статью, скорее всего, ее не прочитают внимательно. В интернете люди предпочитают не читать, а «сканировать» текст — пробегаться по нему и цепляться за интересные отрывки. Это обнаружила Nielsen Norman Group еще в 2008 году.


circle (18)

Герри МакГоверн

консультант по клиентоориентированности Microsoft, Cisco и VMware

Мы попросили 15 человек найти задачу, которую мы поместили в центр страницы. Нашел ее только один, остальные начали искать в левой части экрана и в поле поиска. По прошествии лет я понял, что люди не сканируют всю страницу — они делят ее содержимое на блоки и просматривают только их.


Эффект сканирования распространяется и на печатные издания: книги, журналы, брошюры. Об исследовании этой особенности рассказал Washington Post. Нейробиологов беспокоит то, что альтернативный способ чтения уже конкурирует с классическим глубоким погружением в текст, который формировался тысячи лет.

Беспокоит не столько то, что людям стало сложнее сосредоточиться на чтении художественной литературы, а то, как это влияет на способность усваивать новую информацию на работе и в школе. Человеческий мозг изначально не предназначен для чтения, поэтому мы быстро переучиваемся воспринимать текст. На бумаге мы читали страницу за страницей, а в интернете урываем текст кусками из разных сайтов, переключая внимание с одной темы на другую.

Эта тепловая карта из исследования Chartbeat и Slate.com демонстрирует области статьи, которые читают больше и меньше всего (результаты исследования). Читатели внимательнее всего в красной области.

Читать дальше

Как нельзя делать рекомендации контента

Во время общения с медиа мы часто сталкиваемся с массой заблуждений, в которые все верят, потому что так сложилось исторически. На сайте есть блоки типа «Читать также» или «Самое горячее» и т.п. Словом все то, что составляет обвязку статьи и стремится дополнить UX дорогого читателя. Мы расскажем, какие заблуждения есть у СМИ, которые делают контентные рекомендации, и развеем их цифрами.

Рекомендовать по тегам

Самое большое и самое популярное заблуждение. Чаще всего СМИ делают рекомендации в конце статьи по тегам. Так поступает Look At Me и РБК, например. Есть материал с тегами: трактор, Путин, сыр. К нему выводятся тексты про трактора, про Путина и сыр. На первый взгляд, логично:

вилладж

Подобная механика рекомендаций в реальной жизни выглядела бы так. Вы идете в магазин за продуктами. И кладете в корзину сливочное масло. К вам подходит консультант с потными от волнения ладошками и говорит: «О, я вижу, вы взяли масло и это значит, что вам нужно масло. Возьмите еще пять видов сливочного деревенского и подсолнечного и козьего масла». Максимум, что может случиться из ряда вон выходящее — вам предложат трансмиссионное, если вы читали что-то про автомобили. И это уже будет считаться rocket science.

Но ситуации когда можно рекомендовать по тегам существуют: например какой-нибудь сайт с обзорами товаров – тут вполне можно предположить, что человек захочет прочитать несколько обзоров похожих скороварок или телефонов. Но доверять редактору, который проставляет теги, не стоит: разные люди по-разному воспринимают тексты, и, если редакторов больше одного, многообразие тегов описывающих более-менее одно и то же поражает.

Лучше положиться на машину и вычленить ключевые слова из текста автоматически. В таком случае мы получаем только те слова (а еще лучше устойчивые словосочетания, коллокации, но это немного другая история), которые важны для конкретного текста, а не список имен/торговых знаков, которые скорее всего встречаются еще в миллионе статей совсем на другие темы.

Самый простой (и, во многих случаяx, весьма действенный) cпособ вычленить ключевые слова из текста это использование tf-idfи его многочисленных вариантов.

tf-idfterm frequency-inverse document frequency. Мы смотрим какие слова и как часто употребляются в документе и даем больший вес тем словам, которые встречаются в корпусе редко. Иными словами, даже если слово «cепулька» встречается в тексте всего один раз, у него гораздо выше вероятность оказаться значимым тегом, чем, например, у слова «масленица» (кроме случаев когда мы индексируем сайт посвященный торговле сепулькариями).
Для тех кто не помнит, обратная частота по корпусу (idf) рассчитывается так

где inline_formula собственно корпус (множество документов inline_formula), а inline_formula терм. Брать логарифм от отношения в общем-то необязательно, сойдет любая монотонная функция (в википедии можно посмотреть на многочисленные варианты этой формулы), главное «наказывать» за излишнюю популярность слова. Логарифм имеет смысл использовать если корпус достаточно большой.
Частота терма еще проще:

где inline_formula число вхождений терма в документ inline_formula, а сумма в знаменателе просто общее число слов в документе.
Для ранжирования слов по важности мы просто перемножаем эти два числа:

Нетрудно заметить, что обратная частота рассчитывается по всему корпусу, а частота терма зависит от документа, который мы хотим проанализировать. В случае русского языка, неплохо бы (на самом деле обязательно) привести все слова в тексте к словарным формам или хотя бы лемматизировать, но об этом речи в данный момент не идет (интересующиеся могут начинать знакомство с процессом с алгоритма Портера).

Если обсчитать какой-то корпус и ранжировать слова в каждом документе по нисходящему значению, inline_formula
первые несколько слов будут давать довольно адекватное представление о содержании документа. Такие слова можно использовать как теги, но, как мы уже говорили, не стоит делать такого в новостных сайтах – в конце концов, одной новости о пробках из-за снегопада вполне достаточно. Вспоминать, как шоссе ххх стояло в пробках в 2012 – нет никакой необходимости.

Шокирующая правда

Мир устроен чуть сложнее. На самом деле, все работает так: пользователь приходит на сайт, смотрит курс доллара, обзор нового айфона и фотографии панд. Значит, другой человек, который уже посмотрел курс доллара и айфон, скорее всего, захочет посмотреть на панд, как бы это странно не звучало. Это называется коллаборативная фильтрация. Есть кластеры пользователей и закономерности с помощью которых можно максимизировать вовлеченность читателя в ваш контент.

Результаты тестирования

По результатам А/В тестов коллаборативная фильтрация, без дополнительных настроек, дает на 20-30% больше кликов, чем подборка по тегам. И это означает, что никто не должен составлять блоки «Читать также» на основе тегов.

image
Коллаборативная фильтрация это в какой-то степени продолжение идеи использования tf-idf для вычленения значимой информации, но вместо частоты слов мы используем по-разному взвешенные «голоса» читателей. Под голосом мы понимаем какие-то действия: просмотр страницы, доскролливание до конца, что-то еще – набор событий зависит исключительно от фантазии математиков и свободного времени программиста на js (который пишет код все это великолепие учитывающий).

Просто считать количество событий неправильно, поэтому мы опять рассчитываем веса голосов. Поскольку читатели не ставят оценок (более того, они даже не знают или не задумываются о том, что читая статью про мухомор выросший на опушке около сельсовета они помогают собрать статистику читательских предпочтений «Вестника Несреднечерноземного брусникода»), нам нужно определить «важность» голосов используя только анонимную и довольно ограниченную информацию.

Важность голоса читателя зависит от того, насколько он активен, правда с отрицательным знаком: чем больше статей читает пользователь за какой-то период времени (например 12 часов), тем дешевле стоит его голос. Вес голоса это убывающая функция числа прочитанных статей на ресурсе. Более того, имеет смысл ставить отсечку сверху: человек прочитавший более 100 статей на одном и том же сайте в течение одного дня либо редактор этого сайта, либо маньяк или бот и скорее всего нам не нужны его рекомендации.

Веса можно посчитать например так:

где inline_formula вес голоса inline_formula-го пользователя, а inline_formula число голосов этого пользователя. Опять-таки, никто не заставляет нас использовать логарифмы — любая монотонно убывающая функция от inline_formula сойдет, так же можно избавиться и от единички в знаменателе: строго говоря читателей с нулем голосов учитывать тоже не стоит (убрали же графу «против всех» из избирательных бюллетеней). Сюда же можно добавить, что-то еще: например не просто считать число прочитанных статей, а учитывать время проведенное за их чтением, поставленную оценку (если такая информация есть), все что угодно.

Рекомендовать контент из того же раздела

Вторая инкарнация предыдущего заблуждения — сегментировать рекомендации по разделам.
Представьте, что консультант отдела сливочного масла берет вас в заложники со словами: «Сегодня ты купишь только маслице, о да, ты купишь много маслица!» Вы с криком выламываете двери, и никогда больше не возвращаетесь в этот магазин.

Результаты тестирования

Мы показали одной группе юзеров сегментированные рекомендации: человек читает новость из раздела «Общество» — рекомендуем ему статьи только из раздела «Общество». Другая группа получала рекомендации со всего сайта (кросс-сегментные рекомендации). CTR виджета с рекомендациями без учета разделов — в 2 раза выше, процент отказа ниже на 16% и время проведенное на сайте было на 23% выше. Нет никакого смысла ограничивать читателя рамками одного раздела. Будьте разнообразны в своих рекомендациях.

image
Несложно заметить, что и коллаборативная фильтрация и автоматический расчет тегов в пределах одного сегмента будут работать хуже – ведь разбивая содержимое сайта на сегменты и рассчитывая рекомендации внутри каждого сегмента, мы просто применяем тот же самый подход на меньшей выборке. Более того, мы получаем искаженную картину активности пользователей.

В конце концов, при ранжировании пользователей нам интересно насколько человек активен в сети, а не сколько статей про погоду он/она читает за день. Ну и про корреляцию интересов в таком случае можно забыть: мы же не интересуемся условными вероятностями перехода из одного раздела в другой (вернее возможно и интересуемся, но не собираем статистики для их расчета), так что не запирайте свои рекомендации в клетках разделов, они этого не любят.

Рекомендовать популярное

Рекомендовать популярные новости — значит рекомендовать ненужные новости, которые все уже видели. Популярное — это материалы, которые посмотрело много людей. Именно так популярное становится популярным. Каждый раз, когда вы хотите сделать у себя на сайте такой блок, вспоминайте это предложение, потому что именно так это и работает. Это новости, которые видели все.

Результаты тестирования

Мы сравнивали в A/B тестах популярное и коллаборативную фильтрацию. CTR виджета с коллаборативной фильтрацией выше в 7 раз. Это совсем не значит, что вот наши алгоритмы такие классные. Это значит, что блок популярное на сайте — отстой и не нужен вообще никому. Мы понимаем, что блок «Популярное» на сайте — это must have для большинства медиа, но пора попрощаться с этим заблуждением.

image
Популярной новости нужно некоторое время для того, чтобы превратиться в баян и рекомендовать что-то, что многим интересно именно сейчас не самая плохая идея. Просто нужно четко понимать – когда читательский интерес начинает затухать, в противном случае мы бы до сих видели только «лабутенов» и подобное при попытке найти свежие приколы на YouTube – а что? Этот ролик набрал миллиард просмотров, значит он хороший!

Как несложно догадаться, убывающая функция от возраста события поможет нам точно так же, как убывающая функция от числа действий совершенных пользователем, помогла отсеять ботов и маньяков. Правда, в случае с возрастом просмотров вес каждого голоса должен убывать намного быстреe: пользователей много и тысяча просмотров с утра не значит, что кто-то захочет читать про утренние пробки в обед. Обратная зависимость от логарифма просмотров неплохо работает при взвешивании голосов одного пользователя, для определения популярности лучше работает отрицательная степень возраста: inline_formula, где inline_formula вес голоса inline_formula для статьи inline_formula, inline_formula время прошедшее с момента прочтения, а inline_formula какая-то константа. Новости нужно отранжировать в соответствии с inline_formula и делать это довольно часто, иначе релевантность рекомендаций пропадет.

Если посмотреть на последнюю формулу больше трех секунд то несложно прийти к выводу о том, что собственно сумма весов не так уж и важна, важна скорость с которой она растет. Поэтому еще лучше не ранжировать новости по «совокупности заслуг», а по скорости набора этих самых заслуг. Собственно, если считать эту скорость аккуратно, то можно в научиться предсказывать виральность поста и делать другие космические вещи (с оговоркой впрочем, что в таком случае виральность все-таки не предсказывается, а детектируется на ранней стадии).

Не ставить ограничение по времени

Почему новостные издания рекомендуют новости полугодичной давности, понять сложно. Такой подход порождает дикие примеры типа этого:

сноб
Медиа думают, что пользователь хочет знать, что было на эту тему раньше. Нет, не хочет! Ему это неинтересно, и никому это неинтересно.

Результаты тестирования

Во время тестов на новостных СМИ мы выясняли наиболее оптимальный возраст новостей, которые стоит рекомендовать посетителям. Было протестировано три варианта: 72, 48 и 24 часа с момента публикации. Тестовая выборка составляла 2.7 миллиона читателей и проводилась месяц. Большая часть наших коллег ставила на 24 часа, потому что им казалось, что новости очень быстро устаревают, и никто не будет читать вчерашние новости. Чуть меньше людей верило в 48 часов. Видимо, потому, что не все успевают прочесть актуальное за день и, скорее всего, они что-то пропустили за вчера и хотят наверстать упущенное. Никто не верил в 72 часа…

Да, 72 часа победили. В этом диапазоне пользователи находят больше всего интересующих материалов и блоки, собранные из таких новостей, кликабельны на 4,2% больше чем 48 часов и на 10,9% больше чем 24 часа. Вероятно, это происходит потому, что люди не успевают (или просто не хотят) потребить весь объем информации, который генерируют медиа. Поэтому новости, вышедшие позавчера, для них еще актуальны. Исключение составляют breaking news.

image
Чтобы не быть голословными давайте посмотрим на статистику посещений страниц на сравнительно большой выборке (но меньшей чем описанная в предыдущем абзаце), например в один миллион событий (переходов на страницу) и посмотрим на возраст читаемых статей.

Сначала просто посмотрим сколько разных страниц попало в нашу выборку (все события собраны на одном большом новостном сайте. Получается следущее:

Возраст (часы) Число страниц
0-24 719
24-48 841
48-72 581
72-96 368
96-120 238
120-144 73
144-168 85
168-192 147
192-216 141
216-240 110
>240 8152
Всего 11455

Довольно очевидно что старых урлов много, но также очевидно что нужно считать не просто посещенные урлы, а распределение трафика. Посмотрим на количество посещений:

Возраст статьи (часы) Число событий
0-24 771 435
24-48 130 431
48-72 26 233
72-96 21 536
96-120 5 214
120-144 673
144-168 287
168-192 965
192-216 1 001
216-240 1 642
>240 40 583
Всего 1000 000

Как и ожидалось, больше 90% трафика приходится на статьи опубликованные за последние 72 часа.
Это 5 универсальных правил для всех медиа. При этом на каждой площадке есть свои собственные поведенческие паттерны. В зависимости от них настраиваются алгоритмы. Такой же набор законов и запретов можно было бы сформулировать для любой из наших площадок.

Мы очень рады, если эта статья помогла в работе вашей редакции и проектировании интерфейсов. Если есть вопросы, безумные гипотезы и идеи, которые вы хотите реализовать вместе с нами — напишите на lab@relap.io

Если хотите использовать наши технологии, вовлекать читателей и вообще автоматизировать рекомендации контента на сайте, мы с радостью в этом поможем. Пишите на support@relap.io

Задавайте вопросы. Мы обязательно ответим на них в комментариях.

Пишем статьи о медиа, нативной рекламе и публикуем кейсы
Вопрос
Как с вами связаться?

На почту supportrelap.io@vk.team можно задавать любые вопросы о нашей рекомендательной системе

Если вы хотите запустить нативную рекламу в СМИ с помощью Relap.io или узнать детали пишите на relap.io@vk.team